哪种数据库运维能力矩阵工具采用矩阵方式来存储数据

满分17春学期南开《商务智能方法与技术》在线作业答案
17春学期南开《商务智能方法与技术》在线作业&
需要答案加QQ联系
一、单选题(共 12 道试题,共 24 分。)
&OLAP系统应能处理与应用有关的任何逻辑分析和统计分析,此描述是指OLAP的哪个特性。
B. 可分析性
2. &选择供应商一般以满足时间约束的条件下()为目标
A. 最小化物流成本
B. 最大化物流成本
C. 最小化维护成本
D. 最大化维护成本
3. &()是人们观察数据的特定角度,是考虑问题时的一类属性。
B. 维的层次
C. 维的成员
D. 数据单元
4. &归咎(imputation)是处理()的一种方法。
A. 数据分析
B. 数据准备
C. 数据质量
&数据仓库的前端工具集中,哪个工具是通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。
A. 查询/报表工具
B. 数据挖掘工具
C. OLAP工具
D. 前端开发工具
&()中知识管理活动可看成知识流的组成单元,由特定的角色负责,产生、存储、应用和发布与业务活动相关的知识对象
A. 知识视图
B. 信息化管理
C. 方法管理
D. 业务流程管理
7. &OLAP分析属于哪种驱动型发现。
A. 验证驱动型
B. 经验驱动型
C. 事实驱动型
D. 发现驱动型
&()针对包括Web页面内容、页面结构和用户访问信息等在内的各种Web数据,应用数据挖掘方法发现有用的知识帮助人们从大量Web文档集中发现隐藏的模式
A. 内容挖掘
B. 结构挖掘
C. 文本挖掘
D. 使用挖掘
&从源数据中提取数据,转换成数据仓库所要求的格式后存储在数据仓库的()中。
A. 数据缓冲区
B. 数据转换区
C. 数据存储区
D. 数据准备区
10. &()是结构化、可以用语言、文字进行口头或书面表达的
A. 显性知识
B. 隐形知识
C. 两者皆可
D. 两者都不可
&()存储格式一般比较适合于需要总结数据的查询有较快的响应时间,同时基数据的量又比较大的场合。
D. ServerOLAP
12. &知识和信息最主要的区别是
A. 知识比信息重要
B. 信息系统比知识系统昂贵
C. 信息是某种事实而知识是某种经验
D. 知识比信息更容易被组织
17春学期南开《商务智能方法与技术》在线作业&
二、多选题(共 11 道试题,共 22 分。)
1. &知识管理的主要困难有()
A. 知识的内隐性
B. 员工无分享知识的动机
C. 知识的投资效益难评价
D. IT难以全面支持
2. &WHInmon所下的定义中,数据仓库是具有哪些特点的数据集合。
A. 面向主题
3. &数据挖掘是指从数据中提取()信息并用它进行决策的过程。
&Web挖掘主要处理()等半结构、非结构化的数据,这些数据分布在Web文档、Web服务器的日志、用户cookies等
5. &商务智能技术可以分析哪些数据类型。
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 静态的历史数据和动态数据流
6. &数据分析技术的发展包含哪些阶段。
A. 数据收集
B. 报表查询
C. 在线分析处理(OLAP)
D. 数据挖掘
7. &数据仓库系统结构中主要参与人员有哪些。
A. 决策人员
B. 管理人员
C. 分析人员
D. 业务人员
8. &业务流程管理包括()
A. 流程分析
B. 流程定义与重定义
C. 资源分配
D. 流程质量与效率测评和流程优化
9. &数据清理处理包括哪些内容。
A. 格式标准化
B. 异常数据清除
C. 错误纠正
D. 重复数据清除
10. &工作流的生命周期包括()
A. 模型设计
B. 模型实现
C. 模型运行
D. 模型维护
11. &Web挖掘是从大量Web文档的集合C中发现()模式P的过程:C→P
17春学期南开《商务智能方法与技术》在线作业&
三、判断题(共 27 道试题,共 54 分。)
&在原始数据库中,类似于标识符、姓名、地址和喜好等数据作为用户的隐私应该被保护
&当一定数量的参与者都有某些权限的组合时,可以把这些权限组合视为一个备选角色
&有效认识和解决数据质量相关问题的唯一办法,就是企业对内部处理流程进行监视、分析和报告。
4. &数据仓库与知识管理系统的结合就是商务智能系统。
&Web媒体挖掘是指挖掘Web链接结构模式,即通过分析页面链接的数量和对象,从而建立Web的链接结构模式
6. &Web上的IR是Web挖掘的一个方面,仅是对信息有序化
7. &如何对数据进行集成也是构建数据仓库的一个重要方面。
&利用工作流管理系统日志信息或其他基于流程的系统日志挖掘工作流模型是近年来新出现的研究领域
9. &客户智能是商务智能的主要组成部分。
10. &当某属性出现空缺值时,应丢弃这个属性。
11. &知识的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
12. &数据集市是部门级数据仓库
13. &根据流程要素相关性将角色协作区分为长相关角色协作和短相关角色协作
&隐性知识是指存在于人头脑中的隐性的、非结构化、不可编码的知识,是关于个人的思想、经验等
15. &隐性知识可以被当做显性知识进行获取
&数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。
17. &对结果的解释完全依赖于数据挖掘步骤的可视化输出。
&知识管理的一个重要任务就是引导这种新的个人隐性知识显性化,使它从个人所有转变成组织所有
19. &Web是一个动态性较弱的信息源
20. &基于角色识别问题,角色挖掘是比较有效的方法
&如果偏离点不在现实中存在的话,可以将包含这些值的记录除去,或者将所有记录中的相关属性除去。
&当事务型处理环境和分析型处理环境在同一个数据库系统中,事务型处理对数据的存取操作频率高,操作处理的时间短。
23. &数据仓库与知识管理系统的结合就是商务智能系统
24. &人力资源在高科技公司中属于次要地位
25. &Web数据的复杂性高于传统的文本文档
26. &隐性知识和显性知识之间是不可以相互转化的
27. &显性知识是指具有规范化、系统化的特点,易于整理、沟通和分享的知识
17春学期南开《商务智能方法与技术》在线作业&
一、单选题(共 12 道试题,共 24 分。)
1. &归咎(imputation)是处理()的一种方法。
A. 数据分析
B. 数据准备
C. 数据质量
&()将会对以后步骤中必须的数据转换提供一个初步的了解,比如数据清理和整合。
A. 业务分析
B. 领域分析
C. 数据分析
D. 专业分析
3. &()是基于网页内容或其描述中抽取知识的过程
A. 内容挖掘
B. 结构挖掘
C. 个性挖掘
D. 使用(日志)挖掘
4. &()根据文本的不同特征划分为不同的类
A. 文本概括
B. 文本分类
C. 文本聚类
&数据仓库系统组成中,哪个部件是把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。
A. 元数据库及元数据管理部件
B. 数据转换部件
C. 数据集成部件
D. 数据仓库管理部件
&数据仓库的哪个特性可保证在较高层次上对分析对象的数据给出完整、一致的描述,能完整、统一的刻画各个分析对象所涉及的企业的各项数据以及数据之间的联系。
A. 面向主题
7. &()是结构化、可以用语言、文字进行口头或书面表达的
A. 显性知识
B. 隐形知识
C. 两者皆可
D. 两者都不可
&()目标就是将恰当的知识在恰当的时候传递给恰当的人,以便使他们能够作出最好的决策
A. 知识处理
B. 知识创造
C. 知识管理
D. 知识储存
&知识管理将信息处理能力和人的创新能力相互结合,增强组织对环境的适应能力是哪个知识管理学派的说法()
A. 行为学派
B. 技术学派
C. 管理学派
D. 综合学派
&()中知识管理活动可看成知识流的组成单元,由特定的角色负责,产生、存储、应用和发布与业务活动相关的知识对象
A. 知识视图
B. 信息化管理
C. 方法管理
D. 业务流程管理
11. &知识管理就是对信息的管理是哪个知识管理学派的说法()
A. 行为学派
B. 技术学派
C. 管理学派
D. 综合学派
12. &哪种数据库工具采用矩阵方式来存储数据。
A. 多维数据库工具(MOLAP)
B. 关系型数据库工具(ROLAP)
C. 桌面型数据库工具
17春学期南开《商务智能方法与技术》在线作业&
二、多选题(共 11 道试题,共 22 分。)
1. &Web挖掘是从大量Web文档的集合C中发现()模式P的过程:C→P
2. &传统的建模方法注意力主要集中于()两个阶段
A. 模型设计
B. 模型实现
C. 模型运行
D. 模型维护
3. &知识管理的关键要素有()
&以下哪些显示了数据挖掘最小要求,可以用它来评价数据挖掘是否对业务环境增加了附加的价值。
5. &商务智能技术可以分析哪些数据类型。
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 静态的历史数据和动态数据流
6. &知识管理的主要困难有()
A. 知识的内隐性
B. 员工无分享知识的动机
C. 知识的投资效益难评价
D. IT难以全面支持
&数据导向型决策支持系统,可以用等()分析得到隐藏对决策有用的模式和规则。
A. 统计方法
C. 数据挖掘
D. 知识分析
8. &工作流的生命周期包括()
A. 模型设计
B. 模型实现
C. 模型运行
D. 模型维护
9. &数据仓库系统结构中数据的处理流程主要分为哪几步骤。
A. 数据获取
B. 数据管理
C. 数据分析
D. 数据展现
10. &多库系统的限制主要表现在哪些方面?
B. 响应速度
C. 系统性能
D. 系统开销
11. &WHInmon所下的定义中,数据仓库是具有哪些特点的数据集合。
A. 面向主题
17春学期南开《商务智能方法与技术》在线作业&
三、判断题(共 27 道试题,共 54 分。)
1. &钻取、切片和切块操作是为了完成对真实数据的汇总分析。
2. &Web数据的复杂性高于传统的文本文档
&有用的知识不仅存在于Web页面间的链接结构和Web页面内部结构,而且也存在于URL中的目录路径结构
&信息化的本质是根据企业战略,分析企业现有流程和组织结构中存在的问题,利用准时制管理、供应链管理和流程重组等先进管理理论实践的过程,也是管理变革与流程创新的过程
&数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。
&当事务型处理环境和分析型处理环境在同一个数据库系统中,事务型处理对数据的存取操作频率高,操作处理的时间短。
7. &基于角色识别问题,角色挖掘是比较有效的方法
8. &隐性知识可以被当做显性知识进行获取
&对用户的敏感的原始数据进行变换,以便数据的使用者不能对用户的原始数据进行查看,以此保护用户的私有数据
10. &虽然可能有授权多样和噪声等影响,角色最终的确定还是无需借助专家确认的
11. &数据仓库与知识管理系统的结合就是商务智能系统。
&知识网络是指人们沟通形成“知识活动”的网络,它既是知识活动的场所,又是知识活动的结果
13. &人力资源在高科技公司中属于次要地位
14. &元数据是数据仓库中非常重要的数据
&如果偏离点不在现实中存在的话,可以将包含这些值的记录除去,或者将所有记录中的相关属性除去。
16. &Web上的IR是Web挖掘的一个方面,仅是对信息有序化
&在原始数据库中,类似于标识符、姓名、地址和喜好等数据作为用户的隐私应该被保护
18. &给定一组权限集,通过逐步组合这些权限,就可以得到一个初步的角色层次图
19. &数据仓库的功能是支持管理层进行科学决策,而不是事务处理。
20. &星型结构是实体关系模型的一种结构类型
21. &如何对数据进行集成也是构建数据仓库的一个重要方面。
&知识管理的一个重要任务就是引导这种新的个人隐性知识显性化,使它从个人所有转变成组织所有
23. &多媒体挖掘包括图像挖掘、视频挖掘和音频挖掘等类别
24. &信息也是数据,数据是信息的载体, 信息是对数据的解释。
25. &数据集市是部门级数据仓库
26. &对结果的解释完全依赖于数据挖掘步骤的可视化输出。
&Web媒体挖掘是指挖掘Web链接结构模式,即通过分析页面链接的数量和对象,从而建立Web的链接结构模式
17春学期南开《商务智能方法与技术》在线作业&
一、单选题(共 12 道试题,共 24 分。)
1. &()根据文本的不同特征划分为不同的类
A. 文本概括
B. 文本分类
C. 文本聚类
&数据仓库的前端工具集中,哪个工具是通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。
A. 查询/报表工具
B. 数据挖掘工具
C. OLAP工具
D. 前端开发工具
3. &知识和信息最主要的区别是
A. 知识比信息重要
B. 信息系统比知识系统昂贵
C. 信息是某种事实而知识是某种经验
D. 知识比信息更容易被组织
&数据仓库系统组成中,哪个部件是把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。
A. 元数据库及元数据管理部件
B. 数据转换部件
C. 数据集成部件
D. 数据仓库管理部件
5. &()是基于网页内容或其描述中抽取知识的过程
A. 内容挖掘
B. 结构挖掘
C. 个性挖掘
D. 使用(日志)挖掘
&()就是对一个企业集体的知识与技能的捕获,是为增强组织的绩效而创造、获取和使用知识的过程
A. 知识处理
B. 知识创造
C. 知识储存
D. 知识管理
7. &哪种数据库工具采用矩阵方式来存储数据。
A. 多维数据库工具(MOLAP)
B. 关系型数据库工具(ROLAP)
C. 桌面型数据库工具
8. &OLAP分析属于哪种驱动型发现。
A. 验证驱动型
B. 经验驱动型
C. 事实驱动型
D. 发现驱动型
&知识管理将信息处理能力和人的创新能力相互结合,增强组织对环境的适应能力是哪个知识管理学派的说法()
A. 行为学派
B. 技术学派
C. 管理学派
D. 综合学派
&()是一种以规范化的方式构造端到端的业务流程为中心,以持续地提高组织绩效为目的的系统化方法
A. 知识管理
B. 信息化管理
C. 方法管理
D. 业务流程管理
&()目标就是将恰当的知识在恰当的时候传递给恰当的人,以便使他们能够作出最好的决策
A. 知识处理
B. 知识创造
C. 知识管理
D. 知识储存
&()针对包括Web页面内容、页面结构和用户访问信息等在内的各种Web数据,应用数据挖掘方法发现有用的知识帮助人们从大量Web文档集中发现隐藏的模式
A. 内容挖掘
B. 结构挖掘
C. 文本挖掘
D. 使用挖掘
17春学期南开《商务智能方法与技术》在线作业&
二、多选题(共 11 道试题,共 22 分。)
1. &数据挖掘是指从数据中提取()信息并用它进行决策的过程。
2. &商务智能技术可以分析哪些数据类型。
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 静态的历史数据和动态数据流
3. &数据预处理包含哪些步骤。
A. 数据清理
B. 数据集成
C. 数据变换
D. 数据归约
4. &数据仓库系统结构中主要参与人员有哪些。
A. 决策人员
B. 管理人员
C. 分析人员
D. 业务人员
&以下哪些显示了数据挖掘最小要求,可以用它来评价数据挖掘是否对业务环境增加了附加的价值。
6. &工作流的生命周期包括()
A. 模型设计
B. 模型实现
C. 模型运行
D. 模型维护
&Web挖掘主要处理()等半结构、非结构化的数据,这些数据分布在Web文档、Web服务器的日志、用户cookies等
8. &WHInmon所下的定义中,数据仓库是具有哪些特点的数据集合。
A. 面向主题
9. &数据分析技术的发展包含哪些阶段。
A. 数据收集
B. 报表查询
C. 在线分析处理(OLAP)
D. 数据挖掘
10. &多库系统的限制主要表现在哪些方面?
B. 响应速度
C. 系统性能
D. 系统开销
11. &传统的建模方法注意力主要集中于()两个阶段
A. 模型设计
B. 模型实现
C. 模型运行
D. 模型维护
17春学期南开《商务智能方法与技术》在线作业&
三、判断题(共 27 道试题,共 54 分。)
&知识网络是指人们沟通形成“知识活动”的网络,它既是知识活动的场所,又是知识活动的结果
2. &数据仓库与知识管理系统的结合就是商务智能系统。
3. &隐性知识可以被当做显性知识进行获取
&当一定数量的参与者都有某些权限的组合时,可以把这些权限组合视为一个备选角色
5. &数据挖掘过程是循环的过程。
6. &对结果的解释完全依赖于数据挖掘步骤的可视化输出。
7. &信息也是数据,数据是信息的载体, 信息是对数据的解释。
&信息化的本质是根据企业战略,分析企业现有流程和组织结构中存在的问题,利用准时制管理、供应链管理和流程重组等先进管理理论实践的过程,也是管理变革与流程创新的过程
9. &知识的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
&数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。
11. &Web是一个动态性较弱的信息源
&隐性知识是指存在于人头脑中的隐性的、非结构化、不可编码的知识,是关于个人的思想、经验等
&Web日志挖掘是从用户访问日志(包括搜索引擎日志等)中获取有价值的信息
14. &根据流程要素相关性将角色协作区分为长相关角色协作和短相关角色协作
&在原始数据库中,类似于标识符、姓名、地址和喜好等数据作为用户的隐私应该被保护
16. &基于角色识别问题,角色挖掘是比较有效的方法
&业务流程是知识积累的重要工具,其运作过程是信息积累并转变为有用知识的过程
18. &数据仓库与知识管理系统的结合就是商务智能系统
19. &Web上的IR是Web挖掘的一个方面,仅是对信息有序化
20. &数据仓库的功能是支持管理层进行科学决策,而不是事务处理。
&构件检索是构件库研究中的重要问题,有效的构件检索机制能够降低构件复用成本
22. &数据集市与数据仓库在本质上是一样的
&知识管理是将动态信息转化为知识、利用这些知识进行企业行为决策,并且在组织内实现知识共享的过程
&对用户的敏感的原始数据进行变换,以便数据的使用者不能对用户的原始数据进行查看,以此保护用户的私有数据
25. &基于关联挖掘的自适应构件检索指把关联规则挖掘方法引入构件检索
26. &星型结构是实体关系模型的一种结构类型
27. &显性知识是指具有规范化、系统化的特点,易于整理、沟通和分享的知识
需要答案加QQ联系
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。文档分类:
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,
下载前请先预览,预览内容跟原文是一样的,在线预览图片经过高度压缩,下载原文更清晰。
您的浏览器不支持进度条
下载文档到电脑,查找使用更方便
还剩?页未读,继续阅读
播放器加载中,请稍候...
该用户其他文档
下载所得到的文件列表南开(本部)15春《商务智能方法与技术》在线作业【推荐】.doc
文档介绍:
南开(本部)15 春《商务智能方法与技术》在线作业试卷总分:100 测试时间:--一、单选题(共 12 道试题,共 24 分。)1.()是基于网页内容或其描述中抽取知识的过程A. 内容挖掘B. 结构挖掘C. 个性挖掘D. 使用(日志)挖掘满分:2 分2.()针对包括 Web 页面内容、页面结构和用户访问信息等在内的各种Web 数据,应用数据挖掘方法发现有用的知识帮助人们从大量 Web 文档集中发现隐藏的模式A. 内容挖掘B. 结构挖掘C. 文本挖掘D. 使用挖掘满分:2 分3.()是人们观察数据的特定角度,是考虑问题时的一类属性。A. 维B. 维的层次C. 维的成员D. 数据单元满分:2 分4.()存储格式一般比较适合于需要总结数据的查询有较快的响应时间,同时基数据的量又比较大的场合。A. ROLAPB. MOLAPC. HOLAPD. ServerOLAP满分:2 分5.()是结构化、可以用语言、文字进行口头或书面表达的A. 显性知识B. 隐形知识C. 两者皆可D. 两者都不可满分:2 分6.()就是对一个企业集体的知识与技能的捕获,是为增强组织的绩效而创造、获取和使用知识的过程A. 知识处理B. 知识创造C. 知识储存D. 知识管理满分:2 分7.哪种数据库工具采用矩阵方式来存储数据。A. 多维数据库工具(MOLAP)B. 关系型数据库工具(ROLAP)C. 桌面型数据库工具D. 都不是满分:2 分8.知识和信息最主要的区别是A. 知识比信息重要B. 信息系统比知识系统昂贵C. 信息是某种事实而知识是某种经验D. 知识比信息更容易被组织满分:2 分9.数据仓库的前端工具集中,哪个工具是通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。A. 查询/报表工具B. 数据挖掘工具C. OLAP 工具D. 前端开发工具满分:2 分10.知识管理就是对信息的管理是哪个知识管理学派的说法()A. 行为学派B. 技术学派C. 管理学派D. 综合学派满分:2 分11.OLAP 分析属于哪种驱动型发现。A. 验证驱动型B. 经验驱动型C. 事实驱动型D. 发现驱动型满分:2 分12.()是一种以规范化的方式构造端到端的业务流程为中心,以持续地提高组织绩效为目的的系统化方法A. 知识管理B. 信息化管理C. 方法管理D. 业务流程管理满分:2 分二、多选题(共 11 道试题,共 22 分。)1.WHInmon 所下的定义中,数据仓库是具有哪些特点的数据集合。A. 面向主题B. 集成性C. 稳定性D. 时变性满分:2 分2.Web 挖掘是从大量 Web 文档的集合 C 中发现()模式 P的过程:C→PA. 隐含的B. 明显的C. 相关的D. 有用的满分:2 分3.知识管理的主要困难有()A. 知识的内隐性B. 员工无分享知识的动机C. 知识的投资效益难评价D. IT 难以全面支持满分:2 分4.传统的建模方法注意力主要集中于()两个阶段A. 模型设计B. 模型实现C. 模型运行D. 模型维护满分:2 分5.数据清理处理包括哪些内容。A. 格式标准化B. 异常数据清除C. 错误纠正D. 重复数据清除满分:2 分6.知识运转的环节有()A. 知识沉淀B. 知识共享C. 知识应用和学习D. 知识创新满分:2 分7.数据分析技术的发展包含哪些阶段。A. 数据收集B. 报表查询C. 在线分析处理(OLAP)D. 数据挖掘满分:2 分8.以下哪些显示了数据挖掘最小要求,可以用它来评价数据挖掘是否对业务环境增加了附加的价值。A. 正确的B. 有用的C. 未知的D. 综合的满分:2 分9.多库系统的限制主要表现在哪些方面?A. 可用性B. 响应速度C. 系统性能D. 系统开销满分:2 分10.数据仓库系统结构中数据的处理流程主要分为哪几步骤。A. 数据获取1
内容来自淘豆网转载请标明出处.
浏览:17次商品图片,用户上传的头像,其他方面的图片。目前业界存储图片有两种做法:
1、& 把图片直接以二进制形式存储在数据库中
一般数据库提供一个二进制字段来存储二进制数据。比如mysql中有个blob字段。oracle数据库中是blob或bfile类型
2、& 图片存储在磁盘上,数据库字段中保存的是图片的路径。
一、图片以二进制形式直接存储在数据库中
第一种存储实现(php语言):
大体思路:
1、将读取到的图片用php程序转化成二进制形式。再结合insert into 语句插入数据表中的blob类型字段中去。
3、& 从数据库取出图片展示的时候。则是直接发送图片内容
$row=mysql_fetch_object($result);
Header( "Content-type: image/gif");
echo $row-&this_
实现代码如下:
$PicturePath = &/tmp/xxxjgjgj.jpg&;//假设这是上传的图片,php放在一个临时文件夹。脚本执行完毕后自动删除了。
$imgStream = fread(fopen($PicturePath,
$blob_img = fread(fopen($imgStream,
"r"), filesize($PicturePath));
$sql =& INSERT INTO Images
(this_image) VALUES ($blob_img)";
注:this_image就是数据表中一个blob字段类型的字段
================取出展示图片代码
$result=mysql_query("SELECT
* FROM Images WHERE PicNum=$PicNum") or die("Cant perform
$row=mysql_fetch_object($result);
Header( "Content-type: image/gif");
echo $row-& this_
总结:处理代码感觉还真比较麻烦。其实,我从来没用过在数据库中以二进制存储图片的做法。我们用得更多的是存储图片的路径,实际图片是在磁盘上保存的(图片二进制放到数据库,把数据库的负担弄重了)。
据我了解,互联网环境中,大访问量,数据库速度和性能方面很重要。一般在数据库存储图片的做法比较少,更多的是将图片路径存储在数据库中,展示图片的时候只需要连接磁盘路径把图片载入进来即可。因为图片是属于大字段。一张图片可能1m到几m。
有个原则:图片尽量不要存储在数据库中(是指不要二进制形式保存到字段,而只保存图片的路径)。这样的大字段数据会加重数据库的负担,拖慢数据库。在大并发访问的情况下很重要。这是一个经验。去看看dba对数据库性能调优方面的分析都能得到这个答案的:就是图片不要存储在数据库中。
就像这个规则一样:文章分为标题、作者、添加时间、更新时间、文章内容、文章关键字
文章内容一般是比较长的。经常使用text字段去存储。文章的内容就属于大字段。一般文章内容可以拆分到单独一个表中去。不要与文章信息存储在一张表里面。
我理解的原理是:mysql中一张表的数据是全部在一个数据文件中的。如果大字段的数据也存储在里面。程序展示列表,比如文章列表。这个时候根本不需要展示文章内容的。但是仍然会影响速度,数据库查找数据其实就是扫描那个数据文件,文件容量越小,速度就会越快(为什么单表的容量在1g-2g的时候基本上要分表了)。拆分出去到一张单独的表,就是单独的文件了。我觉得,举一反三,相互独立,分离的思想不仅在系统开发中用到,在现实生活中经常存在的。相互混合,就会造成相互影响。小巧,简洁是一种思想。
可以看看这篇翻译的文章,
作者建议,三种东西永远不要放到数据库里,图片,文件,二进制数据。作者的理由是,
对数据库的读/写的速度永远都赶不上文件系统处理的速度
数据库备份变的巨大,越来越耗时间
对文件的访问需要穿越你的应用层和数据库层
把图片缩略图存到数据库里?很好,那你就不能使用nginx或其它类型的轻量级服务器来处理它们了。
给自己行个方便吧,在数据库里只简单的存放一个磁盘上你的文件的相对路径,或者使用S3(备注:亚马逊云服务)或CDN之类的服务。
============================================================
关于mysql中的blob类型
bolb像int型那样,分为blob、MEDIUMBLOB、LONGBLOB。其实就是从小到大,
blob 容量为64KB ,MEDIUMBLOB 容量为16M,LONGBLOB 容量为4G。
说实话,图片用这样子存储用得还真少。使用php函数serialize进行序列化的值,我看到有人存入这个字段中去。
php手册:serialize返回字符串,此字符串包含了表示 value 的字节流,可以存储于任何地方。
mysql中blob字段存储图片有个通信大小的设置:
图片要传输给mysql存储起来,那么需要涉及到数据通信。mysql中有个配置是限制通信数据大小的。
my.conf配置文件中的max_allowed_packet,mysql默认的值是1M。
好多图片尤其是原始图可能不止1m。传输的数据(也就是图片)超过这个设置大小。结果就会出错
呵呵,限制挺多。感觉好麻烦。这样子明显占用与mysql交互的通信时间嘛。延长响应时长了。我直接丢个图片路径&images/xxxx&给mysql。没这么耗费资源。
其实所谓的性能,最关键是数据库性能。因为随着数据库数据量增大,大部分时间耗费是在php,java等语言等待数据库返回数据的过程中耗费时间。
网站访问量大了后,具体的语言不是瓶颈,瓶颈都在数据库。用c,,php,java,net都能操作mysql数据库获取数据。语言之间可能存在速度执行差异,但是其实这种差别已经很小了。至少我觉得,给予用户感觉不到明显。执行相差0.0001秒用户感觉并没有明显的区别。可能说,大并发(很多用户同时访问)的时候,就会体现到差别了。其实我觉得,大并发访问是数据库瓶颈。等待数据库给予数据。没达到一定级别实在体现不了差别。数据库数据量达到一定级别。语言相差0.001s会给予用户体验上的差别。我想,这也是为什么php很适合做web开发了。解析页面速度快(解释型语言,不需要编译)。可以用java来与数据库打交道获取数据。php不直接操作数据库,而是调用java提供的数据接口,获取数据,马上展示在页面中。这是利用了php的页面执行速度快的一个优势。
备份图片数据和迁移数据方便
图片以二进制形式存储在数据库,有一个好处:备份的时候方便。直接备份数据库,图片也跟着备份。换句话说,迁移环境的时候是方便。
而图片放在磁盘上的话,数据库中存储的只是图片路径。备份数据库后。磁盘上的图片也要跟着备份才行。
不过我觉得,备份这个好处不是很明显。图片在磁盘上,备份磁盘也没很大的事情。打包压缩也可以了。互联网环境毕竟与传统的软件开发不同,web开发比较关注网站速度。也就是数据库的速度。就像互联网开发中,有时候为了速度,用空间换时间的做法比较普遍,所以往往在设计数据库的时候并不一定遵循传统数据库设计三大范式。
数据库中保存的是图片路径的话,在web开发环境下,其实有个更好处,就是cdn加速。就是下面要进行总结的地方。
二、数据库中保存图片路径
一般是这样子的:
按照年月日生成路径。具体是按照年月日还是按照年月去生成路径,根据自己需要(不一定是按照日期去生成)。
理解为什么要分散到多个文件夹中去才是关键,涉及到一个原理就明白了:
操作系统对单个目录的文件数量是有限制的。当文件数量很多的时候。从目录中获取文件的速度就会越来越慢。所以为了保持速度,才要按照固定规则去分散到多个目录中去。
图片分散到磁盘路径中去。数据库字段中保存的是类似于这样子的&images// 3.jpg&
原来上传的图片文件名称会重新命名保存,比如按照时间戳来生成,3. jpg。这样子是为了避免文件名重复,多个人往同一个目录上传图片的时候会出现。
反正用什么样的规则命名图片,只要做到图片名称的唯一性即可。
比如网站的并发访问量大,目录的生成分得月细越好。比如精确到小时,一个小时都可以是一个文件夹。同时0.001秒有两个用户同时在上传图片(因为那么就会往同一个小时文件夹里面存图片)。因为时间戳是精确到秒的。为了做到图片名称唯一性而不至于覆盖,生成可以在在时间戳后面继续加毫秒微秒等。总结的规律是,并发访问量越大。就越精确就好了。
我现在还没碰到需要这么精细的。概率比较少。
有个方面总结一下:为什么保存的磁盘路径,是&images//3.jpg&,而不是& /images//
3.jpg&(最前面带有斜杠)
我的理解:
连那个斜杠都不要。这里也是做到方便以后系统扩展。
在页面中需要取出图片路径展示图片的时候,如果是相对路径,则可以使用&./&+&images//3.jpg&进行组装。
如果需要单独的域名(比如做cdn加速的时候)域名,,这样的域名,
&/&+&images//3.jpg&
当然数据库是可以在前面加斜杠/保存起来,/images// 3.jpg
其实不方便统一。比如相对路径载入图片的时候,则是&.&+& /images// 3.jpg&
可能我还没体会到坏处,以后会遇到问题的。不过,遵循惯例不加斜杠& images// 3.jpg&就对了。
涉及到一个新问题:为什么大部分系统都不会域名保存进去,像这样子保存到数据库中
曾经与一个上海的网友聊天,他也是习惯不会把域名保存数据库中过去。但当时我们两聊的时候,他对&域名保存进去的做法&与&不保存域名进去&也没有一个明确利弊。他就觉得,没有什么明显的区别啊。
了解的知识越多,越有利于我们做决定。可能就是一个&感觉区别不是很大&的影响下,去做一个决定,反而对后面是比较大的影响的。至少是增加自己的工作量了。
其实把域名保存进去,也不是什么滔天大罪的事情。但凡是经验丰富的开发人员都不会这样子做。这是一个经验积累出来的,所以上海那个网友也对此并没有明显的概念很正常,他说他不知道cdn方面的(当然觉得存个域名进去没什么大不了的)。需要了解cdn知识,什么情况下会用到cdn知识。
虽然是做开发人员,不需要关注运维和服务器之类的知识。不过了解一些就有利于理解了。
这里涉及到cdn加速。
关于cdn原理(就是内容分发网络)
cdn,我理解其本质就是为了解决距离远产生的速度问题,使用就近的服务。
从中国请求美国一台服务器上的图片。一般比较慢,因为距离这么远,网络传输是存在损耗的,距离越远,传输的时间就越长。一般会看到浏览器左下角显示:&已响应,正在传输数据..&。这不是服务器本身问题了。实际上服务器早就响应请求,把数据发给客户端,但是网络问题,就一直在传输,没传完了。
在中国,是南北距离远的问题。南北还会涉及到跨网,南方用户使用电信居多,北方用户网通居多。两个线路需要跨越,会有时间延迟。北京到广州的距离,如果直接请求
cdn加速就是适应这个需求产生的:现在不请求美国的服务器。直接在中国安放节点(节点是比较笼统的词语,可以理解成一台服务器,也可以理解成一个机房,就是一个点嘛),请求距离近的节点。这样子就不需要那么远的距离了。
记得以前在长沙的网站,团购以城市分站的形式。北京和长沙用的是同一套程序。服务器在长沙。北京用户访问北京站的时候,实际上需要远距离访问长沙的服务器。速度怎么都快不起来。跟服务器性能完全没关系。当时不懂这些。不清楚怎么折腾。看那本《前端优化技巧》,想办法去做js代码压缩,浏览器缓存之类的。实际上瞎折腾。不是说这些前端优化不重要,哲学上有主次矛盾之分,瓶颈在哪里就去突破哪里。没解决主要矛盾,问题并不会迎刃而解。当时也不是数据库瓶颈。如果去优化数据库。也不会明显改善。就那点数据量。根本就达不到瓶颈。哪里谈得上主要矛盾。随着后来去其他公司工作,接触一些东西,类似不找瓶颈的优化例子发生在身边好几次了,先没找到瓶颈就瞎去优化。我的同事可能是抱着多多益善的心态去做的,但主要矛盾(技术上说是瓶颈)没找到,也没改善。
当时如果没想到是距离问题。也就不会想到cdn,当时其实我根本不知道cdn服务。我只知道,google这些网站肯定在中国部署的服务器,要不然,中国用户还去访问美国的服务器,那再好的服务器都会速度慢的。
由于自己搭建cdn环境和机房的资金比较大(需要大量的服务器),也需要人力维护。反正一般的公司弄不起,其实根本不划算。淘宝以前用商用的cdn服务,后来商用的扛不住了,就搭建了自己的cdn网。我不知道新浪有没有自己搭建,但其实我觉得跟淘宝的特点有关,店铺很多,无论是商品还是交易记录总计起来商品很多的图片,图片都是静态的部分,cdn本来就是用来做静态的(图片,css,js等)请求分发用的。
我之前在网上看到一句话,cdn网络不是一般的公司玩得起的。
一般的公司自己搭建cdn网络成本高,所以就有商业的cdn提供付费租用服务,这是一项很成熟的业务,很多这样的公司,大部分全国性的互联网公司都会使用到cdn。
总结:cdn服务。对于静态内容是非常适合的。所以像商品图片,随着访问量大了后,租用cdn服务,只需要把图片上传到他们的服务器上去。
例子:北京访问长沙服务器,距离太远。我完全可以把商品图片,放到北京的云服务(我觉得现在提供给网站使用的云存储其实就是cdn,给网站提供分流和就近访问)上去。这样子北京用户访问的时候,实际上图片就是就近获取。不需要很长距离的传输。
自己用一个域名来载入图片。这个域名解析到北京的云服务上去。
做法:数据库中保存的是& images//3.jpg&,
这些图片实际上不存储在web服务器上。上传到北京的cdn服务器上去。
我从数据库取出来,直接&/&+& images//3.jpg&
比如如果还有多个,就命名、
反正可以随便。所以如果把域名直接保存进去。就显得很麻烦了。迁移麻烦。
像淘宝,凡客,亚马逊这些电子商务网站,我们看到请求的时候,下面往往会有
其实他们保存在数据库中的是相对路径。有些是不需要在数据库保存的,缩略图可以实时访问的时候用程序生成(节省很多存储空间)
实际上,把域名保存在数据库中,非常不利于系统迁移。一旦换个域名的话,原来保存在数据库中的是&www.abc.om/images/xxxxxx&,因为路径都在数据库中写死了。下回换个域名就用不了了。那个时候自己去写sql语句批量更新字段吧。
几个术语:
icp,Internet Content
Provider,也就是网络内容提供者。联想到我们运营一个网站需要icp备案了吗?你自己运营网站,你就是icp服务商
IDC(Internet
Data Center),互联网数据中心。IDC的概念,目前还没有一个统一的标准。通俗点,就是提供机房托管(服务器租用和托管),域名注册之类的。
关于淘宝的图片存储
了解到:淘宝以前使用了商用的存储。但是没法满足需求。据说,到2010年,淘宝网后端保存着286亿张图片。商用的系统系统没法满足需求的时候。他们就自己开发了一个tfs。大规模的小文件在磁盘上读取,需要磁盘磁头频繁的寻道和换道。大并发情况下和大量的操作确实很麻烦。其实借鉴了当时google公布的gfs设计论文。google有相册服务。为每个用户提供上传图片存储。
估计,google是率先实现这种小文件网络存储系统的。
有个观点比较好:对于老板们而言,往往觉得,用钱能解决的都不算问题。但问题在于,你遇到的问题,别人都没遇到过。那这个时候你就没有经验可以参考或者直接拿来使用。只有自己参考一些思路去创造技术了。
三、关于图片进行云存储(cdn加速)
曾经看过这个,这个是比较适合创业公司的。价格相对便宜
介绍提到,我们在全国各地部署了55个CDN节点,500多台服务器,电信,联通,移动和教育网的4线带宽。
其实,现在的云存储本质就是一个cdn服务商。你把静态的图片上传到他提供的服务器上去(ftp方式上传或者api形式编写程序上传)。他为你做就近节点访问。
计费方式:按照流量付费,99元购买100g。怎么算流量。每次访问文件的大小累加,比如一个1m的文件,访问一次流量就加1m。
我个人理解,对于图片的量不大的情况下,使用这种云服务,好处不是节省存储空间。你自己的服务器100g的空间可能创业型公司都没用完,不是什么存储空间不够用,然后去用云存储。以前我对cdn比较模糊,有这么点理解,或者以为是分散网站web服务器流压力,服务器分流。这些好处是有的。但是,只要理解了cdn产生的背景和解决的关键问题后,就会明白云存储关键好处在于:给用户就近节点访问,加速。
我觉得,如果不是出于这个考虑,或者达不到这样的目的。用其他方案也完全可以替代。何必使用云存储呢?就是你无非有实力做到全国多个节点去部署服务,才需要租用cdn来帮你,毕竟他们是规模产生的效益,专注于解决这个领域。
还有:腾讯云、阿里云
阅读(...) 评论()}

我要回帖

更多关于 列存储数据库 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信