数据库系统概论第7章数据库设计-课件

PPT
  • 阅读 98 次
  • 下载 0 次
  • 页数 95 页
  • 大小 1.023 MB
  • 2022-12-05 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档30.00 元 加入VIP免费下载
此文档由【小橙橙】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
数据库系统概论第7章数据库设计-课件
可在后台配置第一页与第二页中间广告代码
数据库系统概论第7章数据库设计-课件
可在后台配置第二页与第三页中间广告代码
数据库系统概论第7章数据库设计-课件
可在后台配置第三页与第四页中间广告代码
数据库系统概论第7章数据库设计-课件
数据库系统概论第7章数据库设计-课件
还剩10页未读,继续阅读
【这是免费文档,您可以免费阅读】
/ 95
  • 收藏
  • 违规举报
  • © 版权认领
下载文档30.00 元 加入VIP免费下载
文本内容

【文档说明】数据库系统概论第7章数据库设计-课件.ppt,共(95)页,1.023 MB,由小橙橙上传

转载请保留链接:https://www.ichengzhen.cn/view-92470.html

以下为本文档部分文字说明:

1第7章数据库设计7.1数据库设计概述7.2需求分析7.3概念结构设计7.4逻辑结构设计7.5数据库的物理设计7.6数据库实施7.7数据库运行与维护7.8小结27.1数据库设计概述数据库设计:指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使

之能够有效地存储数据和管理数据,满足各种用户的应用需求.7.1.1数据库和信息系统☆信息系统是提供信息、辅助人们对环境进行控制和进行决策的系统。☆数据库是信息系统的核心和基础。☆数据库设计是信息系统开发和建设的重要组成部分。3

进行数据库设计应具备的技术和知识:①数据库的基本知识和数据库设计技术;②计算机科学的基础知识和程序设计的方法和技巧;③软件工程的原理和方法;④应用领域的知识;47.1.2.数据库设计的特点★数据库建设是硬件、软件和干件的结合※三分技术,七分管理,十二分基础数

据※技术与管理的界面称之为“干件”★数据库设计应该与应用系统设计相结合※结构(数据)设计:设计数据库框架或数据库结构※行为(处理)设计:设计应用程序、事务处理等5现实世界数据分析概念模型设计逻辑数据库

设计物理数据库设计子模式设计建立数据功能分析功能模型事务设计程序说明应用程序设计程序编码调试功能说明67.1.3.数据库设计方法•手工试凑法–设计质量与设计人员的经验和水平有直接关系–缺乏科学理论和工程方法的支持,工程的质量难以保证–数据库运行一段时间后常常又不同程

度地发现各种问题,增加了维护代价•规范设计法–手工设计方法–基本思想:过程迭代和逐步求精•计算机辅助设计–ORACLEDesigner2000–SYBASEPowerDesigner77.1.4.数据库设计的基本步骤数据库设计的准备工作:选定参加设计的人员数据库设计的人员组成①系统分析人员

②数据库设计人员③程序员④用户⑤数据库管理人员自始至终参与数据库设计参与系统实施阶段参与需求分析和数据库的运行维护8①需求分析;②概念结构设计;③逻辑结构设计;④物理结构设计;⑤数据库实施;⑥数据库运行和维护;数据库设计的过程:9需求收集和分

析设计概念结构设计逻辑结构数据模型优化设计物理结构评价设计,性能预测物理实现试验性运行使用、维护数据库不满意不满意P202图7.210设计特点:•在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起

来•将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计•设计过程各个阶段的设计描述:P204图7.311IPO表……输入:输出:处理:Creat……Load……Main()……if……then……end分区1分区2……概念结构设计逻辑结构

设计物理设计设计阶段设计描述数据处理需求分析数据字典、全系统中数据项、数据流、数据存储的描述数据流图和判定表(判定树)、数据字典中处理过程的描述概念模型(E-R图)数据字典系统说明书包括:①新系统要求、方案和概图②反映新系统信息流的数据流图某种数据

模型关系非关系系统结构图(模块结构)存储安排方法选择存取路径建立模块设计IPO表实施阶段编写模式装入数据数据库试运行程序编码、编译联结、测试运行、维护性能监测、转储/恢复数据库重组和重构新旧系统转换、运行、维护(修正性、适应性、改善性维护)12数据库的各级模式图:应用要求1应用

要求2应用要求3应用要求4概念模式逻辑模式外模式1外模式2外模式3外模式4内模式综合转换映象映象137.2需求分析7.2.1需求分析的任务需求分析就是分析用户的需要与要求:–需求分析是设计数据库的起点–需求分析的结果是否准确地反映了用户

的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用(1)通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求.(2)在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能

仅仅按当前应用需求来设计数据库.14需求分析的重点:调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。(1)信息要求–用户需要从数据库中获得信息的内容与性质–由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据(2)处理要求–对处理

功能的要求–对处理的响应时间的要求–对处理方式的要求(批处理/联机处理)(3)安全性与完整性要求新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。15需求分析的难点:确定用户的最终需求–用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什

么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。–设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。–新的硬件、软件技术的出现也会使用户需求发生变化。解决方法:–设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐

步得以确定用户的实际需求16⑴调查组织机构情况–组织部门的组成情况–各部门的职责等⑵调查各部门的业务活动情况。调查重点之一。–各个部门输入和使用什么数据–如何加工处理这些数据–输出什么信息–输出到什么部门–输出结果的格式是什么⑶在熟悉业

务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。–信息要求–处理要求–完全性与完整性要求一、调查用户需求的具体步骤:7.2.2需求分析的方法17⑷确定新系统的边界•确定哪些功能由计算机完成或将来准备让计算机完成•确定哪些活动由人工完成由计算机完成的功能就是新系统应

该实现的功能。二、常用调查方法⑴跟班作业通过亲身参加业务工作了解业务活动的情况能比较准确地理解用户的需求,但比较耗时⑵开调查会通过与用户座谈来了解业务活动情况及用户需求⑶请专人介绍18⑷询问–对某些调查中的问题,可以找专人询问⑸设计调查表请用户填写–如

果调查表设计合理,则很有效,且易于为用户接受⑹查阅记录–查阅与原系统有关的数据记录三、进一步分析和表达用户需求•分析和表达用户的需求的常用方法–自顶向下的结构化分析方法(StructuredAnalysis,简称SA

方法)•SA方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。191.首先把任何一个系统都抽象为:数据流数据流数据存储信息要求数据来源处理数据输出处理要求2.分解处理功能和数据(1)分解处理功能•将处理功能的具体内容分解为若

干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止(2)分解数据•在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图(DFD)数据流图表达了数据和处理过程的关系系统高层抽象图20(3)表达方法•处

理过程:用判定表或判定树来描述•数据:用数据字典(DD)来描述3.将分析结果再次提交给用户,征得用户的认可21需求分析过程22实例:假设我们要开发一个学校管理系统。1.经过可行性分析和初步需求调查,抽象出

该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。2.进一步细化各个子系统。其中学生管理子系统开发小组通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管

理,包括学生报到、入学、毕业的管理,学生上课情况的管理。通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。237.2.3数据字典一、数据字典的用途•数据字典是各类数据描述的集合•数据字典是进行详细的数据收集和数据分析所获得的主要结果•

数据字典在数据库设计中占有很重要的地位24•数据字典的内容–数据项–数据结构–数据流–数据存储–处理过程•数据项是数据的最小组成单位•若干个数据项可以组成一个数据结构•数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。二、数据字典的内容25•数据项是不可

再分的数据单位•对数据项的描述数据项描述={数据项名,数据项含义说明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系,数据项之间的联系}⒈数据项例:学生学籍管理子系统的数据字典。数据项,以“学号”为例:数据项名:学号含义说明:唯一标识每个学生别名:学生编号类型:字符型长度:8取

值范围:00000000至99999999取值含义:前两位标别该学生所在年级,后六位按顺序编号与其他数据项的逻辑关系:26⒉数据结构•数据结构反映了数据之间的组合关系。•一个数据结构可以由若干个数据项组成

,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。•对数据结构的描述数据结构描述={数据结构名,含义说明,组成:{数据项或数据结构}}数据结构以“学生”为例“学生”是该系统中的一个核心数据结构:数据结构名:学生含义说明:是

学籍管理子系统的主体数据结构,定义了一个学生的有关信息组成:学号,姓名,性别,年龄,所在系,年级27⒊数据流•数据流是数据结构在系统内传输的路径。•对数据流的描述数据流描述={数据流名,说明,数据流来源,数据流去向,组成:{数据结构},平

均流量,高峰期流量}–数据流来源是说明该数据流来自哪个过程–数据流去向是说明该数据流将到哪个过程去–平均流量是指在单位时间(每天、每周、每月等)里的传输次数–高峰期流量则是指在高峰时期的数据流量28数据流“体检结果”可如下描述:数据流名:体检结果说明:学生参加体格检查的最终结果数据流来源:体检数据

流去向:批准组成:{学生,医生}平均流量:……高峰期流量:……29⒋数据存储•数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。•对数据存储的描述数据存储描述={数据存储名,说明,编号,输入的数据流,输出的数据流,组成:{数据结构},数据量

,存取频度,存取方式}–输入的数据流:指出数据来源–输出的数据流:指出数据去向–数据量:每次存取多少数据–存取频度:每天(或每小时、每周等)存取几次等信息–存取方法:批处理/联机处理;检索/更新;顺序检索/随机检索30数据存储“

学生登记表”可如下描述:数据存储名:学生登记表说明:记录学生的基本情况输入数据流:学生信息维护模块输出数据流:学生信息维护模块、学生信息查询模块…组成:{学生}数据量:每年3000张存取方式:随机存取31⒌处理过程•处理过程的具体处理逻辑一般用判定表或判定树来描述

。数据字典中只需要描述处理过程的说明性信息•处理过程说明性信息的描述处理过程描述={处理过程名,说明,输入:{数据流},输出:{数据流},处理:{简要说明}}–简要说明:主要说明该处理过程的功能及处理要求•功能:该处理过程用来做什么•处理要求:处理频度要求

(如单位时间里处理多少事务,多少数据量);响应时间要求等•处理要求是后面物理设计的输入及性能评价的标准32处理过程“分配宿舍”可如下描述:处理过程名:分配宿舍说明:为所有新生分配学生宿舍输入:学生数据流,宿舍数据流,输出:宿舍安排数据流处理:在新生报到后,为所有新生分

配学生宿舍。要求同一间宿舍只能安排同一性别的学生,同一个学生只能安排在一个宿舍中。每个学生的居住面积不小于3平方米。安排新生宿舍其处理时间应不超过15分钟。337.3概念结构设计7.3.1概念结构现实世界机器世界信息世界需求分析概念结构设计34概念结构的特点:(

1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。

(4)易于向关系、网状、层次等各种数据模型转换。概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。描述概念模型的工具:–E-R模型357.3.2概念结构设计的方法与步骤设计概念结构的四类方法:–自顶向下•首先定义全局概念结构的框架,然

后逐步细化–自底向上•首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构–逐步扩张•首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构–混合策略•将自顶向下和自底向上相结合,用自顶向下策略设计一个全局

概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。36自顶向下方法图37自底向上方法图38逐步扩张方法图39常用策略:–自顶向下地进行需求分析–自底向上地设计概念结构(P211图7.8)自底向上设计概念结构的步骤:–第1步:抽象数据并设计局部视图–第2步:集成局部视图,得到全

局概念结构(P211图7.9)407.3.3数据抽象与局部视图设计•概念结构是对现实世界的一种抽象–从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节–把这些特性用各种概念精确地加以描述–这些概念组成了某

种模型•三种常用抽象1.分类(Classification)现实世界中一组对象,这些对象具有某些共同的特性和行为注:它抽象了对象值和型之间的“ismemberof”的语义在E-R模型中,实体型就是这种抽象例:P212图7.10定义某一类概念412.聚集(Aggregation)–定义某一类型的

组成成分–它抽象了对象内部类型和成分之间“ispartof”的语义–在E-R模型中若干属性的聚集组成了实体型,就是这种抽象例:P212图7.11,图7.123.概括(Generalization)–定义类

型之间的一种子集联系–它抽象了类型之间的“issubsetof”的语义–概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。例:P213图7.1342•概念结构设计的第一步:–对需求分析阶段收集到的数据进行分类

、组织(聚集),形成•实体•实体的属性,标识实体的码•确定实体之间的联系类型(1:1,1:n,m:n)设计分E-R图。具体做法:⒈选择局部应用•需求分析阶段,已用多层数据流图和数据字典描述了整个系统。如:P216图7.18•设计分E-R图首先需要根据系统的具体情况,在多层的

数据流图中选择一个适当层次的数据流图,让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分E-R图。通常以中层数据流图作为设计分E-R图的依据。43例:由于学籍管理、课程管理等都不太复

杂,因此可以它们入手设计学生管理子系统的分E-R图。如果局部应用比较复杂,则可以从更下层的数据流图入手。2.逐一设计分E-R图将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体

的码,确定实体之间的联系及其类型(1:1,1:n,m:n)如何抽象实体和属性:–实体:现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和实体之间是“ismemberof"的关系。例:在学校环境中,可把张三、李四等对象抽象为学生实体。

44–属性:对象类型的组成成分可以抽象为实体的属性。组成成分与对象类型之间是“ispartof"的关系。例:学号、姓名、专业、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码。如何区分实体和属性:–实体与属性是相对而言的。同一事物,在一种应用环境中作为“属性”,在另一种应用环境中就必须作

为“实体”。例:学校中的系,在某种应用环境中,它只是作为“学生”实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。45一般原则:•属性不能再具有

需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。•属性不能与其他实体具有联系。联系只发生在实体之间。–符合上述两条特性的事物一般作为属性对待。–为了简化E-R图的处置,现实世界中的事物凡能够

作为属性对待的,应尽量作为属性。举例:例1:“学生”由学号、姓名等属性进一步描述,根据准则1,“学生”只能作为实体,不能作为属性。例2:职称通常作为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,也就是说职称与住房实体之间有联系,根据准则2,这时把职

称作为实体来处理会更合适些。(教程P214图7-15)46例3:(p215图7.16)病人住院号姓名病房号病人住院号姓名住在病房医疗医生1m1m例4:(p215图7.17)货物货号单价存放仓库号存量货物货号单价存放仓库存量mn仓库号面积货物货号单价存放仓库存量m

1仓库号面积管理职工1m47需求分析DFD(数据流图)DD(数据字典)概念结构设计(1)选择局部应用(2)逐一设计分E-R图(3)合并,消除各种冲突,形成初步E-R图。(4)修改和重构,消除不必要的冗余,形成基本E-R图。第1步:抽象数据

并设计局部视图第2步:集成局部视图,得到全局概念结构分E-R图总E-R图48实例:销售管理子系统分E-R图的设计。某工厂信息管理系统物资管理子系统销售管理子系统人事管理子系统销售管理子系统需求分析第一层数据流图第二层数据流图数据字典接收订单处

理订单开发票支付过帐销售管理子系统概念结构设计分E-R图总E-R图49销售管理子系统的E–R图:顾客支付应收账1n订货订单1m产品??调整顾客支付应收账1n订货订单1m组成产品订单细节参照1参照2折扣规则1m1m1m50顾客支付应收账1n订货订单1m组成产品订单细

节参照1参照2折扣规则1m1m1m每个实体的属性和主码:顾客()订单()订单细节()应收账()产品()折扣规则()P223517.3.4视图的集成视图集成的两种方式:–一次集成(P219图7.25(a))•一次集成多个分E-R图•

通常用于局部视图比较简单时–逐步累积式(P219图7.25(b))•首先集成两个局部视图(通常是比较关键的两个局部视图)•以后每次将一个新的局部视图集成进来集成局部E-R图的步骤:1.合并2.修改与重构52视图集成步骤图53一、合并分E-R图,生成初步E-R图冲突的种类:–属性冲突–命名冲突–结

构冲突1.属性冲突(1)属性域冲突:属性值的类型、取值范围或取值集合不同。例1,由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用参与运算,因此另一些部门(即局部应用)将学号定义为字符型形式。例2,某些部

门(即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。54(2)属性取值单位冲突。例:学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。属性冲突的解决方法:通常用讨论、协商等

行政手段加以解决。2.命名冲突(1)同名异义:不同意义的对象在不同的局部应用中具有相同的名字例,局部应用A中将教室称为房间局部应用B中将学生宿舍称为房间(2)异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字例,有的部门

把教科书称为课本有的部门则把教科书称为教材55命名冲突的解决方法:通过讨论、协商等行政手段加以解决。3.结构冲突(1)同一对象在不同应用中具有不同的抽象例,“课程”在某一局部应用中被当作实体在另一局部应用中则被当作属性解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的抽象

。变换时要遵循两个准则。(2)同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同。产生原因:不同的局部应用关心的是该实体的不同侧面。解决方法:使该实体的属性取各分E-R图中属性的并集

,再适当设计属性的次序。564.实体间联系类型的冲突例1,实体E1与E2在局部应用A中是多对多联系,而在局部应用B中是一对多联系例2,在局部应用X中E1与E2有联系,而在局部应用Y中E1、E2、E3三者之

间有联系。解决方法:根据应用语义对实体联系的类型进行综合或调整。P221页图7.2757二、消除不必要的冗余,设计生成基本E-R图初步E-R图分E-R图基本E-R图消除不必要的冗余消除冲突两种冗余:(

1)冗余数据:是指可由基本数据导出的数据,(2)冗余联系:是指可由其他联系导出的联系。消除冗余的方法:(1)分析法(2)规范化理论P222图7.28P223图7.3058数据库的设计过程:–需求分析–概念结构设计–逻辑结构设计–物理数据库设计–实施–运行维护设计过程中往往

还会有许多反复。59概念结构设计小结:现实世界机器世界信息世界需求分析概念结构设计概念结构设计的步骤:(1)选择局部应用(2)逐一设计分E-R图(3)合并,消除各种冲突,形成初步E-R图。(4)修改和重构,

消除不必要的冗余,形成基本E-R图。607.4逻辑结构设计逻辑结构设计的任务:概念结构是各种数据模型的共同基础,为了能够用某一DBMS实现用户需求,还必须将概念结构进一步转化为相应的数据模型,这正是数据库逻辑结构设计所要完成的任务。逻

辑结构设计的步骤:(1)将概念结构转化为一般的关系、网状、层次模型。(2)将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换。(3)对数据模型进行优化(4)设计用户子模式61逻辑结构设计转化为一般数据模型转化为特定DBMS支持

下的据模型优化模型概念结构设计数据库物理设计基本E-R图转换规则特定DBMS的特点与限制优化方法如规范化理论逻辑模型逻辑结构设计的三个步骤图627.4.1E-R图向关系模型的转换E-R图由实体、实体的属性和实体之间的联系三个要素组成关系模型的逻辑结构是一组关系模式的集

合将E-R图转换为关系模型:将实体、实体的属性和实体之间的联系转化为关系模式。转换原则:(1)一个实体型转换为一个关系模式。关系的属性:实体型的属性关系的码:实体型的码63(2)一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。1)转换为一个独立的关系模式关系的属

性:与该联系相连的各实体的码以及联系本身的属性关系的候选码:每个实体的码均是该关系的候选码2)与某一端对应的关系模式合并合并后关系的属性:加入对应关系的码和联系本身的属性合并后关系的码:不变例子:部门和职工1:1领导联系的转换。部门(部门号,部门名,……)职工(职工号,职工

名,年龄,……)领导(部门号,职工号)部门领导职工1164部门(部门号,部门名,……)职工(职工号,职工名,….,领导部门的部门号)部门领导职工11部门(部门号,部门名,……部门领导的职工号)职工(职工号,职工名,年龄,……)部门(部

门号,部门名,……)职工(职工号,职工名,年龄,……)领导(部门号,职工号)65(3)一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。1)转换为一个独立的关系模式关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的码:n端实体的

码2)与n端对应的关系模式合并合并后关系的属性:在n端关系中加入1端关系的码和联系本身的属性合并后关系的码:不变例子:部门和职工1:n属于联系的转换。部门属于职工1n66部门(部门号,部门名,……)职工(职工号

,职工名,年龄,……)属于(部门号,职工号)部门属于职工1n部门(部门号,部门名,……)职工(职工号,职工名,….,部门号)方法二:方法一:67(4)一个m:n联系转换为一个关系模式。关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的码:各实

体码的组合例子:职工和产品m:n参加联系的转换。职工参加产品nm天数职工(职工号,职工名,年龄,……)产品(产品号,产品名,…….)参加(职工号,产品号,工作天数,….)68(5)三个或三个以上实体间的一个多元联系转换为一个关系模式。关系的属性:与该多元联系相连的各

实体的码以及联系本身的属性关系的码:各实体码的组合例子:供应商、产品和零件三者m:n供应联系的转换。(1)供应(供应商号,产品号,零件号,数量,….)69(6)具有相同码的关系模式可合并。目的:减少系统中的关

系个数。合并方法:将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的同义属性(可能同名也可能不同名),并适当调整属性的次序。实例:P225部门()职工()产品()供应商()零件()领导属于参加负

责供应职工工作()供应()70⒊按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。⒋按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是

否要对它们进行合并或分解。注意:并不是规范化程度越高的关系就越优。⒌对关系模式进行必要的分解,以提高数据操作的效率和存储空间的利用率。常用分解方法:水平分解——把(基本)关系的元组分为若干子集合,定义每个子集合为一个子关系,以提高系统的

效率。垂直分解——把关系模式R的属性分解为若干子集合,形成若干子关系模式。717.4.2向特定DBMS规定的模型进行转换7.4.3数据模型的优化得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模

型的优化。关系数据模型的优化通常以规范化理论为指导。优化数据模型的方法:⒈确定数据依赖按需求分析阶段所得到的语义,分别写出每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间数据依赖。⒉对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。727.4.4设计用户子模式

定义用户外模式时应该更注重考虑用户的习惯与方便。包括三个方面:(1)使用更符合用户习惯的别名例:负责学籍管理的用户习惯于称教师模式的职工号为教师编号。因此可以定义视图,在视图中职工号重定义为教师编号(2)针对不同级别的用户定义不同的外模式,以满足系统对安全性的要求。例:教师关系模式中包括

职工号、姓名、性别、出生日期、婚姻状况、学历、学位、政治面貌、职称、职务、工资、工龄、教学效果等属性。学籍管理应用只能查询教师的职工号、姓名、性别、职称数据;课程管理应用只能查询教师的职工号、姓名、性别、学历、学位、

职称、教学效果数据教师管理应用则可以查询教师的全部数据。73(3)简化用户对系统的使用如果某些局部应用中经常要使用某些很复杂的查询,为了方便用户,可以将这些复杂查询定义为视图。例子:经常查询所选课程中有四门以上不及格或所选课程平均分小于70分的学生姓

名。selectsno,sname,ssex,sdeptfromsc,studentwheresc.sno=student.snoandgrade<60groupbysnohavingcount(*)>

4unionselectsno,sname,ssex,sdeptfromsc,studentwheresc.sno=student.snogroupbysnohavingavg(grade)<70createviewxuwei-

sas….….747.5数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计。数据库物理设计的步骤:(1)确定数据库的物理结构

(2)对物理结构进行评价,评价的重点是时间和空间效率。如果评价结果满足原设计要求则可进入到物理实施阶段,否则,就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修改数据模型。75数据库物理设计步骤图数据库物理设计确定数据库的物理结构评价

数据库的物理结构逻辑结构设计数据库实施物理模型逻辑模型767.5.1数据库的物理设计的内容和方法设计物理数据库结构的准备工作:1.充分了解应用环境,详细分析要运行的事务,以获得选择物理数据库设计所需参数。对于数据库查询事务,要得到如下信息:查询的关系查询条件所涉及的属性连接条件所涉及的属性查询的投

影属性对于数据更新事务,要得到如下信息:被更新的关系每个关系上的更新操作条件所涉及的属性修改操作要改变的属性值每个事务在各关系上运行的频率和性能要求2.充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构。77关系数据库物理设计的内容:1.为关系模式选择存取方法(

建立存取路径)。2.设计关系、索引等数据库文件的物理存储结构。787.5.2关系模式存取方法选择DBMS常用存取方法:索引方法,目前主要是B+树索引方法;聚簇(Cluster)方法;HASH方法;一、索引存取方法的选择Sb.dbf编号名称…

…061-1…………061-2………….038-1…………..…………..索引文件sy1.idx08/12/9705/08/955710/12/894…………….启用日期物理记录号索引文件sy2.idx235275.0022241292.12…….43…11151000.007部

门+str(价格)物理记录号索引文件……79选择索引存取方法的一般规则:1.如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索引);2.如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引;3.如果一个(

或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引;注意:关系上定义的索引数过多会带来较多的额外开销(1)维护索引的开销(2)查找索引的开销选择索引存取方法的主要内容:根据应用要求确定对哪些

属性列建立索引;对哪些属性列建立组合索引;对哪些索引要设计为唯一索引;80二、聚簇存取方法的选择聚簇——为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇。Sb.dbf编号

名称……061-1…………061-2………….038-1…………..…………..建立sb.db名称字段的聚簇Sb.dbf037-1U盘038-1U盘061-1车床061-2车床062-1车床013-1打印机…………..…

……编号名称…81Sb.dbf编号名称……061-1…………061-2………….038-1…………..…………..建立sb.db名称字段的聚簇Sb.dbf037-1U盘038-1U盘061-1车床061-2车床062-1车床013-1打印机…………..………编号名称…

建立sb.db名称字段的索引Sb.dbf索引文件sy1.idxU盘U盘93音响4…………….名称物理记录号编号名称……061-1…………061-2………….038-1…………..…………..82选择聚簇存取方法的步骤:1.设计候选聚簇2.检查候选聚簇中的关系,取消其中不必要的关系8

3聚簇的局限性:1.聚簇只能提高某些特定应用的性能;2.建立与维护聚簇的开销相当大;对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建。当一个元组的聚簇码改变时,该元组的存

储位置也要做相应移动。聚簇的适用范围:1.很少进行增删操作的基本表和很少对列进行修改操作的基本表可以建立聚簇;2.既适用于单个关系独立聚簇,也适用于多个关系组合聚簇3.当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇

码无关的其他访问很少,可以使用聚簇。尤其当SQL语句中包含有与聚簇码有关的ORDERBY,GROUPBY,UNION,DISTINCT等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作。84三、HASH存取方法的选择选择HASH存取方法的规

则:当一个关系满足下列两个条件时,可以选择HASH存取方法(1)该关系的属性主要出现在等值连接条件中或主要出现在相等比较选择条件中(2)该关系的大小可预知,而且不变;或该关系的大小动态改变,但所选用的DBMS提供了动态HASH存取方法。857.5.

3确定数据库的存储结构确定数据库物理结构的内容:(1)确定数据的存放位置和存储结构关系索引聚簇日志备份(2)确定系统配置1.确定数据的存放位置和存储结构基本原则:根据应用情况将易变部分与稳定部分存取频率较高部分与存取频率较低部分分开存放,以提高系统性能.86例:数据

库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上。如果计算机有多个磁盘,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于两个磁盘驱动器分别在工作,因而可以保证物理读写速度比较快。可以将比较大的表分别放在两个磁盘上,以

加快存取速度,这在多用户环境下特别有效。可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能。87DBMS产品一般都提供了一些存储分配参数:同时使用数据库的用户数同时打开的数据库

对象数使用的缓冲区长度、个数时间片大小数据库的大小装填因子锁的数目等等2.确定系统配置887.5.4评价物理结构评价内容:对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构.评价方法:定量估算各种方案存储空间存取

时间维护代价对估算结果进行权衡、比较,选择出一个较优的合理的物理结构如果该结构不符合用户需求,则需要修改设计897.6数据库的实施数据库实施的工作内容:根据逻辑设计和物理设计的结果,用DBMS提供的语言定义数据

库结构。组织数据入库编制与调试应用程序数据库试运行90数据库实施定义数据库结构数据装载数据库试运行数据库物理设计数据库运行和维护物理模型编制与调试应用程序数据库应用系统911.根据逻辑设计和物理设计的结果,

用DBMS提供的语言定义数据库结构。例,对于学生选课的例子,可以用SQL语句如下定义表结构:P87页CREATETABLEstudentCREATETABLEcourse(snoCHAR(8),(…………………………););接下来是在这些基本表上定

义视图:CREATEVIEW....(……………);……………如果需要使用聚簇,在建基本表之前,应先用CREATECLUSTER语句定义聚族。如果需要建立索引,应用CREATEUNIQUE语句定义。………..922.数据库装载数据。组织数据入库是数据库实施阶段最主要的

工作。数据装载方法:人工方法计算机辅助数据入库1.人工方法:适用于小型系统1)筛选数据。需要装入数据库中的数据通常都分散在各个部门的数据文件或原始凭证中,所以首先必须把需要入库的数据筛选出来。2)转换数据格式。筛选出来的需要入库的数据,其格式往往不符合数据库要求,还需要进行转换。这种

转换有时可能很复杂。3)输入数据。将转换好的数据输入计算机中。4)校验数据。检查输入的数据是否有误。932.计算机辅助数据入库:适用于中大型系统1)筛选数据2)输入数据。由录入员将原始数据直接输入计算机中。数据输

入子系统应提供输入界面。3)校验数据。数据输入子系统采用多种检验技术检查输入数据的正确性。4)转换数据。数据输入子系统根据数据库系统的要求,从录入的数据中抽取有用成分,对其进行分类,然后转换数据格式。抽取、分类和转换数据是数据输入子系统的主要工作,也是数据输入子系统的复杂性所在。5)综合数据。

数据输入子系统对转换好的数据根据系统的要求进一步综合成最终数据。3.编制与调试应用程序调试应用程序时由于数据入库尚未完成,可先使用模拟数据。944.数据库试运行数据库试运行也称为联合调试,其主要工作包括:1)功能测试:实际运行应用程序,执行对数据库的各种操作,测试应用程序的各种功

能。2)性能测试:测量系统的性能指标,分析是否符合设计目标。注意的两个问题:1.数据的分期入库重新设计物理结构甚至逻辑结构,会导致数据重新入库。由于数据入库工作量实在太大,所以可以采用分期输入数据的方法先

输入小批量数据供先期联合调试使用待试运行基本合格后再输入大批量数据逐步增加数据量,逐步完成运行评价2.数据库的转储和恢复在数据库试运行阶段,系统还不稳定,硬、软件故障随时都可能发生系统的操作人员对新系统还

不熟悉,误操作也不可避免,因此必须做好数据库的转储和恢复工作,尽量减少对数据库的破坏。957.7数据库运行与维护在数据库运行阶段,对数据库经常性的维护工作主要是由DBA完成的,包括:⒈数据库的转储和恢复;⒉数据库的安

全性、完整性控制;⒊数据库性能的监督、分析和改进;⒋数据库的重组织和重构造;

小橙橙
小橙橙
文档分享,欢迎浏览!
  • 文档 25747
  • 被下载 7
  • 被收藏 0
相关资源
广告代码123
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:395972555 (支持时间:9:00-21:00) 公众号
Powered by 太赞文库
×
确认删除?