1.建立数据仓库不是简单的把企业嘚各种应用集中在一起而是利用企业系统生成的数据,以面向主题、集成的方式合理组织数据解决数据分析应用的性能冲突。
2.数据库應用系统设计包括:
概念设计:采用自下而上的ER设计
逻辑设计:设计视图和关系模式的完整性约束完成数据库关系模式设计;
(数据库邏辑结构设计是指从数据库概念模型出发,设计表示为逻辑模式的数据库逻辑结构数据库逻辑设计的主要步骤包括:ER图转换为初始关系模式、对初始关系模式进行优化等)
物理设计:将关系模式转换为具体DBMS平台支持的关系表;数据库物理设计的目的是将数据的逻辑模式转換为实现技术规范,其目标是设计数据存储方案以便提供足够好的性能并确保数据库数据的完整性、安全性和可恢复性,通常并不包括攵件和数据库的具体实现细节
(数据库物理设计包括:数据库逻辑模式调整;文件组织与存取设计;数据分布设计;安全模式设计;确萣系统配置;物理模式评估)
每个步骤的设计活动按照数据组织与存储、数据访问与处理、应用设计等几个方面进行。
3.数据库应用系统的需求包括:
数据需求分析:主要工作是从用户视图出发分析与辨识应用领域所管理的各类数据项和数据结构,形成数据字典的主要内容
业务需求分析及其在性能、存储、安全、备份和恢复等方面的要求:
在需求分析阶段,系统需求分析员与用户充分沟通并形成文档化嘚需求描述;
通过需求分析过程,需要系统的描述整个应用系统的功能特征、性能特征和约束并形成需求规范说明文档;
数据操作响应時间、系统吞吐量和最大并发用户数都是性能需求分析的重要指标。
4.ORDER BY 语句用于对结果集进行排序:
①ORDER BY 语句用于根据指定的列对结果集进行排序;
②ORDER BY 语句默认按照升序对记录进行排序;
③ORDER BY 可以对多个列进行排序此时的排序是嵌套的;
④ORDER BY 语句只能作为其他子句之后的最后一个孓句出现;
⑥子查询语句中是不能使用ORDER BY 子句的。
5.关于优化查询在保证数据库一致性的前提下,将频繁操作的多个可以分割的处理过程放茬多个存储过程中这样可以大大提高系统的响应速度。
使用游标会占用较多的系统资源尤其对于大规模并发量的情况下,很容易使得系统资源耗尽而崩溃而使用临时表能够加速查询,相关子查询的不可加速查询
6.在UML类图中,常见的有以下几种关系:
①泛化(箭头及指姠):带三角箭头的实线箭头指向父类;泛化关系也称为概括关系;
②实现(箭头及指向):带三角箭头的虚线,箭头指向接口;
③关联(箭头及指向)带普通箭头的实心线指向被拥有者;
④聚合(箭头及指向):带空心菱形的实心线,菱形指向整体;
⑤组合(箭头及指向):带实心菱形的实线菱形指向整体;
⑥依赖(箭头及指向):带箭头的虚线,指向被使用者;
组合是部分与整体共存如果整体不存茬,部分也会消失
聚合关系是整体与部分的关系,且部分可以离开整体而单独存在
7.在SQL Server 2008中,常常会发生数据库数据过多的情况此时则需要对表进行处理,通常可采用人工分割表的方法优化性能
水平分割后,得到的子表结构相同查询数据需要使用UNION操作;
垂直分割后,所有表中均需保留原有表的主码查询数据需要使用JOIN操作;
当查询表中所有数据时,使用分割表方法会增加查询表达式的复杂度;
8.结构图指以 模块的调用关系为线索用自上而下的连接表示调用关系并注明参数传递的方向和内容,从宏观上反映模块层次结构的图形
结构图包括:用例图、类图、组件图、对象图、部署图。
9.常见的数据挖掘任务包括:分类、估计、预测、相关性分组或关联规则、聚类和描述、鈳视化以及复杂数据类型挖掘(Text、Web、图形图像、视频和音频等)等
10.关系表在逻辑上由一系列元组组成,元组由多个属性组成
每个元组鈳以用数据库磁盘文件中的一个逻辑记录来存储,记录包括多个域
元组的每个属性对应于文件记录中的一个域。
11.在C/S结构中应用业务规則主要是在客户端实现的,客户端属于“胖客户端”客户端需要专门开发;
在B/S结构中,应用业务规则主要是在WEB服务器端实现的客户端屬于“瘦客户端”,客户端一般只需要安装浏览器;
12.RecordSet 对象用于操作来自提供者的数据使用ADO时,通过RecordSet对象几乎可对所有数据进行操作所囿RecordSet对象均使用记录(行)和字段(列)进行构造。RecordSet的常用方法为:
Addnew 创建一条新纪录;
Delete 删除一条记录或一组记录;
MoveNext 把记录指针移动到下一条記录;
13.在SQL Server 2008中只有创建某个临时表的连接中才能查询到当前临时表的数据,并当U1创建的该表的连接还未断开时才能访问这个表的数据。
14.當经常进行范围查询时在范围列上建立索引可以提高该类查询的效率。
根据索引的实线方式索引技术被分为:有序索引和散列索引。
①在经常要搜索的列上可以加快搜索的速度;
②在经常使用连接的列上(这些列主要是一些外键)可以加快连接的速度,在经常需要根據范围进行搜索的列上创建索引因为索引已经排序,其指定的范围是连续的;
③在经常使用WHERE子句中的列上面创建索引加快条件的判断速度;
⑥经常需要排序的列上;
①对于那些在查询中很少使用或者参考的列不应该创建索引;
②对于那些只有很少数据值的列也不应该创建索引;
③经常进行更新的列不适宜创建索引。
④经常使用LIKE操作符且字符串前后均带有%的列;
稀疏索引:只是一部分查找码的值有对应的索引记录;
稠密索引:数据文件中的每一个查找码值在索引文件中都对应一个索引记录;
聚集索引:对于数据文件和它的一个特定的索引攵件如果数据文件中的数据记录的排列顺序与索引文件中索引项的排列顺序相一致,或者说索引文件按照其查找码指定的顺序与数据攵件中数据记录的排列顺序相一致,则该索引文件称为聚集索引否则为非聚集索引。聚集索引的键值可以重复
利用存储过程封装频繁使用的SQL语句;
对数据库逻辑和物理结构的调整:
重新安排数据存储,整理回收碎块;
16.DBAS生命周期模型中时间最长的阶段是运行管理与维护其时间一般是以年为单位,其成本消耗也是巨大的
17.两端锁协议是指所欲事务必须分为两个阶段对数据项加锁和解锁:
①在对任何数据进荇读、写操作之前,要申请并获得对该数据的封锁;
②在释放一个封锁之后事务不再申请和获得其它任何封锁;
每个事务的执行程序划汾为两个阶段,加锁阶段和解锁阶段;
加锁阶段事务可以申请获得任何数据项上的任何类型的锁但不允许释放任何锁;
在解锁阶段,事務可以释放在任何数据项上任何类型的锁但是不能再申请任何锁;
每个事务开始执行后就进入了加锁阶段;
18.数据挖掘采用适当的算法,從数据仓库的海量数据中提取具有潜在价值的信息和知识;
19.分布式数据库系统按不同层次提供的分布透明性有:
分布透明性:位于全局概念模式与分片模式之间最高层次
19.关于操作型和DSS型数据特征:
操作型数据更新频率高,DSS型数据一般不更新;
操作型数据是详细的DSS型数据昰综合的;
操作型数据处理需求事先可知,DSS型数据处理需求事先不明确;
20.数据仓库特点:面向主题、集成、稳定的、反映历史变化
21.在分布式数据库中查询处理和优化比集中式数据库要复杂的多,其中查询优化需要考虑的主要因素包括I/O代价、CPU代价和通信代价一般而言,分咘式数据库查询优化的首要目标是使查询执行时通信代价最省
分布式数据库采用数据分片对数据进行管理,分片有以下三个原则:
①完整性原则即全局关系的所有数据项必须包含在某个片段中,否则将导致数据库不完整造成某些片段数据丢失:
②重构性原则:所有片段必须能够还原全局关系:
③不相交原则(对垂直分片的主键除外),对于一个全局关系要保证数据不丢失,则必须要属于某个片段即不允许不属于任何一个片段,也不允许一个全局关系的某些数据既属于该全局关系的某些片段又属于该全局关系的另一个片段(垂直关系中的码属性除外)
22.事务的四大特性:原子性、一致性、隔离性、持久性。
调度分为串行调度和并发调度;
串行调度的特点是一个事务嘚所有操作都执行完后才开始执行另一事务不存在实务操作的交叉执行;
不同事务操作的交叉执行称为并发调度,DBMS交叉执行来自多个事務的各个操作以提高数据库系统的性能。
并发调度中不同的事务的操作可以交叉执行
23.事务日志用于保存对数据的更新操作。
事务日志昰一个与数据库文件分开的文件它存储对数据库进行的所有更改,并记录全部插入、更新、删除、提交、回退和数据库模式变化等操作
事务日志是数据备份和数据恢复的重要文件,也是使用SQL Remote 或(复制代理)复制数据所必需的
24.对数据库系统的监控分为手动监控机制和自動监控机制两种。
手动监控机制:数据库管理员要随时观察数据库的动态变化并在数据库出现错误、故障或者产生不适应的情况时能随時采取有效措施保护数据库。
25.在数据库应用系统设计中如果在事务中存在和用户的长时间交互,会降低系统的并发度增加死锁的数量,影响检查点的效果
26.在SQL中,用DISTINCT关键词消除重复出现的元祖
27.数据库的一致性指的是事务执行成功则全部提交,必须使所有数据都具有一致的状态如果一个事务提交失败,所有做过的更新全部撤销
28.数据仓库是一个面向主题、集成的、时变的、非易失的数据集合,支持管悝部门的决策过程数据仓库通过数据转移从多个数据源提取数据,为了解决不同数据源格式上的不统一需要进行的数据操作是转换。
29.堆文件也称为无序文件在堆文件中,记录随机地存储在文件物理空间中新插入的记录存储在文件的末尾。
如果数据库中的一个基本表Φ的数据量很少且插入、删除、更新等操作频繁,改基本表最佳采用的文件结构是堆文件
30.在UML模型中,用于表达一系列的对象、对象之間的联系以及对象间发送和接受消息的图是通信图/协作图
31.数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外蔀实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明
数据字典一般由数据库管理系统本身管理和维护。
日志攵件记录数据库系统运行时数据库操作情况的日志信息
数据库系统是由计算机软硬件组成的复杂系统,其体系结构与系统硬件平台密切楿关
数据库管理系统提供了查询、插入、删除、更新等通用数据操作,但没有提供各种面向具体应用领域的业务处理
数据库中的数据昰按照一定的数据模型组织和存储的、可供多个用户共享的、具有最小冗余度的相关数据集合。
①数据操作响应时间数据访问响应时间;
②系统吞吐量,即指系统在单位时间内可以完成的数据库事务或查询的数量;
③允许并发访问最大用户数;
33.信息系统需求分析的常用建模方法:
①DFD:自顶向下逐步细化的结构化分析方法
34.数据库的三级模式:
外模式(用户模式/子模式):用户可见可以有多个,局部模式數据库用户(应用程序员和最终用户)能看见和使用的局部数据的逻辑结构和特征描述,是数据库用户的数据视图是与某一应用有关的數据逻辑表示,视图是其实现方式之一;
模式(逻辑模式):主体数据的逻辑结构用户不可见
内模式(存储模式/物理模式):物理结构囷存储方式,只有一个处于最底层,
外模式和模式:保证数据与程序的逻辑独立性;
内模式和模式:保证物理独特性;
35.如果希望用户u1在DB1數据库中具有查询T1表的权限授权语句为:
36.在标识实体集的基础上分类抽象,将具有相同属性特征的同类对象抽象为实体集然后归纳整悝,用一个有意义的名词式短语为每一个实体(不是实体集中的每一个实例)命名
37.数据独立性不仅简化数据库应用程序的开发,同时因為屏蔽了物理结构的差异也简化了用户维护数据的代价;
数据库系统三级模式和两层映像的系统结构保证了数据库系统中能够具有较高嘚逻辑独立性和物理独立性。
38.硬件容错最完全的方法是设计两套相同的数据库系统同时工作数据的变化也同步,空间有一定的距离因此同时破坏两套的概率几乎为零,这样能达到数据库的完全安全
系统故障指数据库在运行过程中,系统突然停止运转所有正在运行的倳务以非正常的方式终止,需要重新启动
在数据库系统中,事务日志能够实现数据恢复(不是数据转储)
39.触发器使用场合为完成比CHECK约束更复杂的数据约束,为保证数据库性能而维护的非规范化数据实现复杂的业务规则,CHECK只能实现同一个表的列之间的取值约束
40.数据库應用系统总体设计的主要内容包括:确定DBAS体系结构、软硬件选型和配置设计、应用软件总体设计和业务规则初步设计。
41.行为视图包括顺序圖、交互图、状态图描述系统的活动;
部署视图描述物理部署情况;
42.数据库备份分为:完整备份和差异备份
完整备份:将数据库的全部內容均备份下来;
差异备份:备份自上一次完全备份之后有变化的数据文件、日志文件以及数据库中其他被修改的内容等。
日志备份:备份洎前一次备份之后的日志内容日志备份仅仅备份日志,不备份数据;日志备份的执行效率通常比差异备份和完整性备份高日志备份的時间间隔通常比差异备份短。
43.联机事务处理OLTP:面向交易的处理系统基本特征是顾客的原始数据可以立即传送到计算机中心进行处理,并在佷短的时间内给出处理结果可以即时的处理输入的数据,及时回答系统要求必须具有很高的响应速度,企业中下层使用
联机分析处悝OLAP:是数据仓库系统的主要应用,支持复杂的分析操作侧重决策支持,并且提供直观易懂的查询结果实时性要求不是很高、数据量大、決策支持,查询动态随时提出查询的要求。由企业中上层使用安全性比OLAP低。典型的应用就是复杂的动态的报表系统
44.数据粒度划分标准可以将数据仓库中的数据划分为详细数据、轻度总结、高度总结三级或更多级。
细化程度越高粒度越小;细化程度越低,粒度越大綜合程度越高。
如果数据仓库不保存低粒度的数据而只有粗粒度的数据则需要存储的数据量就较少。
45.时间序列分析也可以称为数据演变汾析描述行为对象随时间变化的规律或趋势,并进行建模的数据挖掘方法
46.分布式数据库总的数据分布策略可以从数据分片和数据分配兩个角度来考虑,一般先数据分片再数据分配。
分片是对关系的操作而分配是对分片结果的操作;
分片模式是描述每个数据片段以及铨局关系到片段的映像,分配模式是描述各片段到物理存放场地的映像
①触发器的声明,指定触发器定时事件,表名和类型;
②触发器的执行PL/SQL块或对过程的调用;
③触发器的限制条件,通过where子句实现;
49.GRANT:允许一个数据库用户或角色执行所授权限指定的操作;
DENY:拒绝一个数據库用户或角色的特定权限并且阻止它们从其他角色中继承这个权限;
REVOKE:收回已经授予的权限。
50.在动态转储中利用转出文件只能将数据庫恢复到转储过程的某个状态,且转储文件中的数据可能不一致只有和日志文件综合起来使用,才能使数据库恢复到一致状态
52.数据库應用系统逻辑设计阶段工作内容:数据库逻辑结构设计、数据库事务概要设计、应用程序概要设计。
数据库概念设计:系统总体框架设计
數据库概念设计的目标:
定义和描述应用领域涉及的数据范围;
获取应用领域或问题域的信息模型;
描述清楚数据的属性特征;
描述清楚數据之间的关系;
说明数据的安全性要求;
支持用户的各种数据处理要求;
保证信息模型方便地转换成数据的逻辑结构(数据库模式)哃时也便于用户理解。
53.不同数据库管理系统有着不同的逻辑实现结构数据库空间管理办法随数据库管理系统不同而不同;
数据库管理员需要通过历史数据分析并根据应用系统情况,对数据库所使用的空间情况进行预测;
应重点监控空间增长比较快的表当数据量超过存储能力前及时增加存储空间;
当硬件存储空间无法满足数据库需求时,可以考虑部分不使用的历史数据转移到其他廉价存储中
54.SQL的集合操作苻:
IN:确定给定的值是否与子查询或列表中的值相匹配,选择与列表中的任意一个值匹配的行;
EXCEPET:指在第一个集合中存在但是不存在于第二個集合中的数据;
INSERSECT:指在两个集合中都存在的数据;
UNION:操作符用于合并两个或多个SELECT语句的结果集,UNION内部的SELECT语句必须拥有相同数量的列列也必須拥有相似的数据类型,每条SELECT语句中的列的顺序必须相同
55.从功能上讲,数据库应用系统设计包括:
表示层:位于最外层离用户最近,鼡于显示数据和接受用户输入的数据;一般为Windows或Web应用程序
业务逻辑层:表示层和数据访问层之间通信的桥梁,主要负责数据的传递和处悝例如数据有效性的检验、业务逻辑描述相关功能。
(业务逻辑层概要设计包括:结构、行为、数据接口、故障处理、安全设计、系统维護与保障等方面的内容)
数据访问层:主要实现对数据的保存和读取操作;可以访问关系数据库、文本文件或XML文档等
数据持久层:以程序为媒介把表现层或服务层的数据持久化,它位于物理层和数据访问层之间
56.分布式数据达到的目标:本地自治、非集中式管理、高可用性、位置独立性、数据分片独立性、数据复制独立性、分布式查询处理、分布式事务管理、硬件独立性、操作系统独立性、网络独立性、數据库管理系统独立性;
并行数据库的目标:高性能和高可用性,通过多个处理节点并执行数据库任务提高整个数据库系统的性能和可鼡性。
57.数据库系统实施活动包括:创建数据库、装载数据、应用程序的编码和调试以及数据库的试运行
集中式:所有数据片段都安排在哃一个场地上;
分割式:所有数据只有一份,它被分割成若干逻辑片段每个逻辑片段被指派在一个特定的场地上;
全复制式:数据在每個场地重复存储,也就是每个场地上都有一个完整的数据副本;
混合式:全局数据被分为若干个数据子集每个子集都被安排在一个或多個不同的场地上,但是每个场地未必保存所有数据这是一种介乎于分割式和全复制式之间的分配方式。
59.ODS(Operational Data Store)是数据仓库体系结构中的一个可選部分它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。
第一类ODS数据更新频率是秒级;
第二类ODS数据更新频率是小时級;
第三类ODS数据更新频率是天级;
第四类ODS是根据数据来源方向和类型划分的不仅包含来自操作型环境的数据,也包含由数据仓库层和数據集市层的应用反馈给ODS的一些决策结果或一些报表信息
60.用于数据库完整性保护:创建触发器、定义事务隔离性级别;
数字签名用于数据防篡改;
定义主码用于实体的完整性;
61.协作图:用于描述对象在空间中如何交互,即除了动态交互它也直接描述了对象如何链接在一起嘚情形;
状态图:用于描述一个对象在其声粗空间的动态行为,表现为一个对象所经历的状态序列引起状态转移的事件,以及因状态转迻而伴随的动作一般可以用状态机对一个对象的生命周期建模,状态图用于显示状态机重点在于描述状态图的控制流。
顺序图:用于描述指定的一组对象是如何交互的它着眼于消息队列,也就是在消息间如何发送和接收信息
部署图:描述的是系统运行时的结构,展礻了硬件的配置及其软件如何部署到网络结构中一个系统结构只有一个部署图,通常用来帮助理解分布式系统
62.数据库管理员的职责:
數据库的安全性、完整性控制;
数据库性能的检测和改善;
63.触发器通常用于保证业务规则和数据完整性,主要优点是用户可以用编程的方法来实现复杂的处理逻辑和业务规则增强了数据完整性约束的功能。
64.数据库镜像优点:
①增强数据保护功能数据库镜像提供完整或接菦完整的数据冗余,具体取决于运行模式是高安全性模式还是高性能模式;
②提高数据库的可用性发生灾难时,在具有自动故障转移功能的高安全性模式下自动故障转移可快速使数据库的备用副本在线(而不会丢失数据)。在其他运行模式下数据库管理员可以选择强淛服务(可能丢失数据),以替代数据库的备用副本;
③提高生产数据库在升级期间的可用性
65.在内联表值函数中,没有相关联的返回变量;
内联表值函数通过SELECT语句填充函数返回的表值;
内联表值函数的作用类似于带参数的视图;
调用内联表值函数时只能将内联表值函数放在FROM子句中。
66.公共云指的是云以即用即付的方式提供给公众;
私有云是指不对公众开放的企业或组织内部数据中心的资源
67.UML(建模语言)的語句是定义在一个四层建模概念框架中的,这四层分别是:元元模型层、元模型层、模型层和用户模型层
68.在UML中,聚集是一种特殊形式的關联它表示类至今是整体与部分的关系。
69.在衡量数据库应用系统的性能指标中数据吞吐量指的是系统在单位时间内可以完成的数据库倳务数量。
70.加锁协议中两阶段加锁协议可以保证事务调度可串行性
71.并行数据库中一维数据的划分方法:
轮转法:最适合于扫描整个关系;
散列划分法:比轮转法更适合点查询,也适合顺序扫描关系;
范围划分法:明显利于范围查询和点查询
72.在SQL Server 2008中,对于更新操作的触发器系统将产生两张逻辑工作表,DELETED表用于存储更新前的数据INSERTED用于更新后的数据。
73.Google的云数据库是一个分布式的结构化数据存储系统称作Bigtable.
74.知識发现由三个阶段组成:数据准备、数据挖掘、结果的解释评估。
75.分布式数据库系统按不同层次提供的分布透明性有:
位置透明性:指数據分片的分配位置对用户是透明的用户编写程序时只需要考虑数据分片情况,不需要了解各分片在各个场地的分配情况
76.日志文件是用來记录事务对数据库的更新操作的文件,日志文件主要有两种格式:以记录为单位的日志文件和数据块为单位的日志文件
77.数据库完整性包括:
参照完整性:在CREATE TSBLE 中用FOREIGN KEY 短语定义哪些列为外码,用REFERENCES短语指明这些外码参照哪些表的主码;
用户自定义完整性:在CREATE TSBLE 中定义属性的同时也鈳以根据应用要求定义属性上的约束条件,即属性值限制包括:列值非空NOT NULL ,列值唯一 UNIQUE,检查列值是否满足一个布尔表达式CHECK 短语。
数据处理需求分析:从对数据组织与存储的设计角度辨识应用领域所管理的各类数据项和数据结构,与数据处理需求分析结果一起组成数据字典,形成“数据规范说明书”;
功能需求分析(数据处理需求分析与业务规则需求分析):主要针对DBAS应具有的功能进行分析是DBAS需求分析嘚核心环节,总体上可分为数据处理需求分析与业务规则需求分析
性能需求分析:描述系统应当做到什么程度,分析DBAS应具有的性能指标;
其它需求分析:存储需求、安全性需求等
存储需求分析指估计DBAS系统需要的数据存数量,如DB所存储的数据总量;
安全性需求分析用于数據库安全设计避免被非法使用和攻击。
79.安全性保护:用户身份鉴别、权限控制、视图机制;
双机热备属于数据库恢复技术内容;
①散列攵件:利用散列存储方式组织的文件也称为直接存取文件。
优点:文件随机存放记录不需进行排序;插入、删除方便;存取速度快;鈈需要索引区,节省存储空间
缺点:不能进行顺序存取,只能按关键字随机存取且询问方式只限于简单询问,并且在经过多次插入、刪除后也可能造成文件结构不合理,需要重新组织文件
如果数据库中的一个基本表的数据量很少,并且插入、删除、更新等操作非常頻繁该基本表可以采用堆文件组织形式。
因为堆文件无需建立索引维护代价非常低。
虽然堆文件的数据访问效率较低但在数据量很尐时,定位文件记录的时间非常短
指的是文件信息存放在若干连续的物理块中。
优点:简单支持顺序存取和随机存取,顺序存取速度楿对较快
缺点:文件不能动态增长,不利于文件插入和删除
如果用户的查询条件定义在查找码上,则顺序文件是比较合适的文件结构
将不同关系表中有关联关系的记录存储在一起。
如果某些重要而频繁的用户查询经常需要进行多表连接操作可以考虑聚集文件,来改善查询效率
①各个事务应顺序访问共享资源,将复杂的、大的事务分解成多个简单、小的事务;
②按同一顺序访问对象;
⑤灵活使用显礻加锁技术等
82.关系模式描述关系的静态结构,它是静态的、稳定的而关系是动态、随用户对数据库的操作而变化的。
83.数据库系统设计汾为:需求分析、概念结构设计、逻辑结构设计和物理结构设计等
84.一个属性的值必须属于唯一的域,属性的取值必须为同一域标识属性的值不能重复且不可以为空。
85.人机界面的设计可采用原型迭代法首先进行初步设计,再进行用户界面细节设计最后是原型设计与改進。
86.数据库应用系统物理设计阶段的主要活动有:
确定存储结构、存取路径的选择和调整、确定数据存放位置和确定存储分配
87.ER图向关系模式转换涉及到两个方面:①实体的转换;②实体间联系的转换。
实体的转换:在从ER图转换为关系模式时一个实体就转换成一个关系模式,实体的属性就是关系模式的属性实体的键就是关系的主键。
实体间联系的转换:实体间存在三种联系即1:1(一对一),1:m(一对多)m:n(多对多)。
88.DFD的主要组成包括
外部实体(外部项):指系统之外又和系统有联系的人或者事务说明了数据的外部来源和去处;
处理過程:指对数据逻辑处理,也就是数据变换用来改变数据值;
数据存储和数据流:指处理功能的输入输出数据存储表示数据保存的地方,用来存储数据
89.数据库实施阶段包括:建立数据库结构、数据加载、事务和应用程序的编码及测试、系统集成、测试与试运行、系统部署。
90.主文件组是系统定义好的一个文件组它包含主要数据文件和任何没有明确分配给其它文件组的其它数据文件。如果次要数据文件没囿分配给其它文件组也是可以放在主文件组中的。
91.分离数据库时需要停用被分离的数据库但是不需要停用SQL Server 服务。
92.是否创建分区表主要取决于表当前的数据量大小以及将来的数据量大小同时还取决于对表中的数据如何进行操作。
95.数据库运行时维护包括:日常维护监控與分析,性能优化与调整系统进化。
96.数据库的重组并不修改原设计的逻辑和物理结构而数据库的重构则要部分的修改数据库的模式和內模式。
97.如果业务空闲时数据库服务器的CPU使用率达到90%说明服务器的cpu资源已经严重不足,如果工作高峰时CPU使用率仍然很低则说明服务器CPU資源充足。
98.事务故障包括预期内的事无故障和非预期的事务故障两种事务故障的恢复都是由系统自动完成的,对用户是透明的
99.SQL Sever2008支持三種恢复模式:简单恢复模式、完整恢复模式、大容量日志恢复模式。
简单恢复模式只用于测试和开发数据库或用于主要包含只读数据的數据库(如数据仓库)。
100.①共享内存的优势是实现简单缺点是由于共享内存,如果处理器数量过多容易造成访问内存冲突。
②共享磁盤结构所有的处理机拥有独立的主储存器通过互联网共享磁盘。这种结构可以克服共享内存结构但是由于是通过互联网实现处理器之間的信息交换,会产生一定的通信代价
③无共享结构每个处理机拥有独立的主存储器和磁盘,不共享任何资源它被认为是支持并行数據库系统的最好并行结构,比较适用于银行、出纳、民航售票等OLEP类应用
④分布式数据库系统的主要目的是实现场地自治和数据全局透明囲享。
101.分片透明性是最高级别的透明性位于全局概念模式与分片模式之间。
102.在T-SQL中能够实现分情况显示不同类型数据的函数是CASE.
104.通过在视圖上创建唯一聚集索引的方式可使视图的结果集保存到数据库中。
106.增加派生性冗余列的调优方法是典型的以空间换时间的调优方法
107.SQL Sever 2008数据庫中,索引视图是存储一个查询结果的数据库对象
对视图创建唯一聚集索引后,视图的结果集将存储在数据库中建有唯一聚集索引的視图称为索引视图,也称物化视图
108.非预期的事务内故障包括:运算溢出故障、并发事务死锁故障、违反了某些完整性限制而导致的故障。
109.在分布式数据库中垂直分片从列的角度将关系分为不同的片段。
110.在并行数据库中无共享结构被认为是支持并行数据库系统的最好并荇结构,适用于银行出纳之类的应用
113.系统规划和定义的具体内容包括:任务陈述、确定任务目标、确定系统范围和边界、确定用户视图。
114.DFD中的箭头表示的数据的流向不能表示控制流和约束。
116.稀疏索引所指向的数据文件一定是有序的
117.元元模型层组成了UML的最基本的元素“倳物”,代表要定义的所有事物
118.标量函数的返回值可以是除了timestamp类型以外的所有数据类型。
119.一个数据库的日志文件的大小和数据文件的大尛之间没有联系
120.视图返回的结果集的格式与基本表相同,所以可以在视图上再定义视图
123.数据库运行维护包括数据库的转储和恢复、数據库的安全性和完整性控制,数据库性能的监控分析和改进数据库的重组和重构。
124.索引一般会提高查询的效率而不会提高插入、删除囷更新操作的执行效率。
在组合索引中索引属性的顺序一般按照属性的区分度进行排列。
126.分布式数据库最基本的特征是本地自治、非集Φ式管理、高可用性
127.一般分布式数据库查询优化的首要目标是通信代价。
128.轮转法对于点查询和范围查询的处理较复杂由于不知道所要查找的元组具体分布在哪个磁盘上,必须对所有磁盘进行查找明显降低了查询效率,不适合点查询散列划分和范围划分方法均利于点查询。
129.决策支持系统一般是指企业中以数据为基础对重要业务或事务实施辅助决策的信息系统
130.K-means算法模型无法直接用于分类。
131.数据库性能優化中存储优化包括建立物化视图和聚集。
132.数据库应用系统的性能需求分析包括数据操作响应的时间或数据访问响应时间系统吞吐量、允许并发访问的最大用户数、每TPS代价值。
133.在DFD中数据流用箭头表示,处理用矩形框表示数据存储用圆角矩形框表示,外部项用圆角框戓者平行四边形框表示
134.从功能角度可以将数据库应用系统划分为4个层次:
表示层:进行人机界面设计
业务逻辑层:梳理DBAS的各项业务活动,将其表示为各种系统架构
数据访问层:针对DBAS的数据处理需求设计用于操作数据库的各类事务
数据持久层:进行应用系统的存储结构设计
135.不能再视图上定义AFTER型触发器。
137.数据库应用系统的环境安全设计包括漏洞与补丁、计算机病毒防护网络环境安全和物理环境安全。
138.关于強制存取控制:
仅当主体的许可证级别不低于客体的密级时该主体才能读取相应的客体;
仅当主体的许可证级别不高于客体的密级时,該主体才能写相应的客体
139.分布式数据库系统是物理上分散、逻辑上集中的数据库系统。
140.范围划分:范围查询、点查询
轮转法:扫描整个關系的应用充分发挥并行性;
141.将oltp系统中数据利用抽取程序抽取出来的主要原因是 解决OLTP应用于分析型应用之间的性能冲突问题。
142.在UML提供的圖中活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序,并行次序
143.分布式数据库最基本的三个特征:非集中式管悝、高可用性、本地自治
完成数据库关系模式设计的阶段
利用哈希函数快速访问的文件是
VB6.0数据绑定控件必须
ADO数据控件用于连接数据源的属性是
不是建立数据仓库的合理理由
从OLTP中抽取数据,建立新的数据分析环境的最初出发点是
用二维表结构在计算机中存储数据及数据之间联系的数据模型被称为
为避免活锁现象数据库管理系统采用 策略处理事物的加锁请求
搜索引擎在用户输入一个关键词后,会向用户推荐最菦一段时间其他关键词达到 挖掘算法
数据库镜像分为三种模式
用户身份鉴别、权限控制、视图机制
双机热备属于数据库恢复技术内容
类圖是展现一组类、接口和协作以及它们之间的关系的一种静态视图
协作图是交互图的一种,其中包含一组对象、对象之前的联系以及对象間发送和接收的信息
状态图主要用来描述一个实体在发生事件时的状态变化情况用于展示该实体处于不同状态时对不同事件做出响应后嘚状态变化情况
顺序图是用来描述对象自身及对象间信息传递顺序的视图
活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执荇次序、并行次序。
150.COUNT()函数用于统计元祖的个数或者某个字段中值的个数
SUM()则用来计算某个字段值得总和
151.前触发型触发器是在引发该触发器执行的操作语句执行之前激活的触发器而后触发器就是在语句执行之后激活的触发器。
152.每个数据库有且仅有一个主要的数据文件可鉯有多个次要数据文件,每个数据库必须至少有一个日志文件也可以有多个日志文件
153.分离数据库时不仅分离数据文件,还要一起分离日誌文件
154.分区表的本质是把符合不同标准的数据子集存储在某个数据库的一个或多个文件组中,通过元数据来表述数据存储的逻辑地址
155.數据库的重组并不修改原设计的逻辑和物理结构,而数据库的重构则要部分的修改数据库的模式和内模式
156.检查点应当由数据库恢复子系統自动的定期或者不定期的建立,而不应当由数据库管理员手动建立
158.分布式数据库中,传输的代价是:I/O代价+CPU代价+通信代价
分布式数据庫中查询优化的首要目标是:使查询执行时通信代价最省。
160.混合式数据分配是一种介于分割式和全复制式的分布方式
161.局部数据模型透明性指用户或应用程序要了解分片及片段存储的场地,但不必了解场地上使用的是何种数据模型
163.DFD即数据流图,它是由数据流、(对数据的加工)处理、数据存储和外部项组成
165.在进行数据库模式调整使用分割表进行数据库优化时,一般有两种表分割方式:水平分割和垂直分割
166.新增汇总表的调优方法是一种以空间换时间的调优方法。
169.数据挖掘方法中关联规则挖掘就是用于发现数据库中数据间的关联性的。
170.系统规划与定义的内容包括:任务陈述、确定系统范围和边界、确定用户视图
171.数据库应用系统实现与部署内容包括:①建立数据库结构;②数据加载;③事务和应用程序的编码及测试;④系统集成、测试与试运行;⑤系统部署。
172.数据库逻辑设计的目标是得到实际的数据库管理系统可处理的数据库模式各模式结构合理,数据之间不存在不合理的数据依赖关系且满足各类应用的处理和使用要求,为数据库嘚物理设计及数据库高效、正确地运行打下基础
173.事务概要设计内容包括:事务名称、事务所访问的关系表及关系属性、事务处理逻辑、倳务用户(指使用、启动、调用该事务的软件模块或系统)
174.降低事务隔离级别可以提高事务的吞吐量,提高活锁的可能性降低发生死锁、发生阻塞的可能性。
175.存储过程可以接受多个输入参数也可以接受多个输出参数。
176.唯一索引的作用是保证索引键值的不重复
177.Oracle 的安全控淛可分为数据库级、表级、行级和列级
178.很多情况下,数据库性能优化需要研发人员和DBA共同配合完成
179.数据库设计过程中,数据库的一致性設计往往以牺牲效率为代价
180.事务日志备份并不备份数据库本身它只备份日志记录,而且只备份从上次备份之后到当前备份发生变化的日誌内容
181.分布式数据库最基本特征是本地自治、非集中式管理以及高可用性。
182.在并行数据库中的数据划分与并行算法中范围划分会引起數据分布不均匀,导致并行处理能力下降
直接组装 “/”+”images//来载入图片这個域名解析到北京的云服务上去。
反正可以随便所以如果把域名直接保存进去。就显得很麻烦了迁移麻烦。
像淘宝凡客,亚马逊这些电子商务网站我们看到请求的时候,下面往往会有
其实他们保存在数据库中的是相对路径有些是不需要在数据库保存的,缩略图可鉯实时访问的时候用程序生成(节省很多存储空间)
实际上把域名保存在数据库中,非常不利于系统迁移一旦换个域名的话,原来保存在數据库中的是“www.abc.om/images/xxxxxx“,因为路径都在数据库中写死了下回换个域名就用不了了。那个时候自己去写sql语句批量更新字段吧
icp,Internet Content Provider也就是网络内嫆提供者。联想到我们运营一个网站需要icp备案了吗你自己运营网站,你就是icp服务商
IDC(Internet Data Center)互联网数据中心。IDC的概念目前还没有一個统一的标准。通俗点就是提供机房托管(服务器租用和托管),域名注册之类的
了解到:淘宝以前使用了商用的存储。但是没法满足需求据说,到2010年淘宝网后端保存着286亿张图片。商用的系统系统没法满足需求的时候他们就自己开发了一个tfs。大规模的小文件在磁盘上讀取需要磁盘磁头频繁的寻道和换道。大并发情况下和大量的操作确实很麻烦其实借鉴了当时google公布的gfs设计论文。google有相册服务为每个鼡户提供上传图片存储。
估计google是率先实现这种小文件网络存储系统的。
有个观点比较好:对于老板们而言往往觉得,用钱能解决的都鈈算问题但问题在于,你遇到的问题别人都没遇到过。那这个时候你就没有经验可以参考或者直接拿来使用只有自己参考一些思路詓创造技术了。
三、关于图片进行云存储(cdn加速)
曾经看过这个这个是比较适合创业公司的。价格相对便宜
介绍提到我们在全国各地部署叻55个CDN节点,500多台服务器电信,联通移动和教育网的4线带宽。
其实现在的云存储本质就是一个cdn服务商。你把静态的图片上传到他提供嘚服务器上去(ftp方式上传或者api形式编写程序上传)他为你做就近节点访问。
计费方式:按照流量付费99元购买100g。怎么算流量每次访问文件嘚大小累加,比如一个1m的文件访问一次流量就加1m。
我个人理解对于图片的量不大的情况下,使用这种云服务好处不是节省存储空间。你自己的服务器100g的空间可能创业型公司都没用完不是什么存储空间不够用,然后去用云存储以前我对cdn比较模糊,有这么点理解或鍺以为是分散网站web服务器流压力,服务器分流这些好处是有的。但是只要理解了cdn产生的背景和解决的关键问题后,就会明白云存储关鍵好处在于:给用户就近节点访问加速。
我觉得如果不是出于这个考虑,或者达不到这样的目的用其他方案也完全可以替代。何必使用云存储呢就是你无非有实力做到全国多个节点去部署服务,才需要租用cdn来帮你毕竟他们是规模产生的效益,专注于解决这个领域
每个java程序都运行于某个具体的java虚擬机实现的实例上,当启动一个java程序的时候,一个虚拟机实例也就诞生了.不同的程序,将得到不同的虚拟机实例!
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。