科学数据库生态研究元数据标准及其应用课件

PPT
  • 阅读 53 次
  • 下载 0 次
  • 页数 44 页
  • 大小 996.001 KB
  • 2022-12-05 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档20.00 元 加入VIP免费下载
此文档由【小橙橙】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
科学数据库生态研究元数据标准及其应用课件
可在后台配置第一页与第二页中间广告代码
科学数据库生态研究元数据标准及其应用课件
可在后台配置第二页与第三页中间广告代码
科学数据库生态研究元数据标准及其应用课件
可在后台配置第三页与第四页中间广告代码
科学数据库生态研究元数据标准及其应用课件
科学数据库生态研究元数据标准及其应用课件
还剩10页未读,继续阅读
【这是免费文档,您可以免费阅读】
/ 44
  • 收藏
  • 违规举报
  • © 版权认领
下载文档20.00 元 加入VIP免费下载
文本内容

【文档说明】科学数据库生态研究元数据标准及其应用课件.ppt,共(44)页,996.001 KB,由小橙橙上传

转载请保留链接:https://www.ichengzhen.cn/view-92384.html

以下为本文档部分文字说明:

科学数据库生态研究元数据标准及其应用侯艳飞中国科学院计算机网络信息中心2004.8.25北京科学数据库技术培训2思考元数据标准之于实际数据管理的作用中国科学院科学数据库生态研究元数据标准的主要内容如何基于元数据标准进行实际管理系统的分析设计?3目录1.元数据标准与实际的数据管理2

.中国科学院科学数据库生态研究元数据标准(SDB-ERM)简介3.SDB-ERM在实际数据管理中的具体应用实例41.元数据标准与实际的数据管理元数据标准对实际数据管理有何作用?–思考:元数据标准规定了什么?元数据元素元素之间的关系发展应用方案的扩展规则

–只分析一种情形下的作用:Metadataisrecordedoutsideofthefileinwhichthedatabeingdescribedissaved.5……specifiesinformationcontent,butnothowtoorganizethisinforma

tioninacomputersystem……Thereareseveralreasons:Therearemanymeansbywhichmetadatacouldbeorganizedinacomputer.Thereinclud

eincorporatingdataaspartofaninformationsystem,inaseparatedatabase,andasatextfile.Organizationscanchooseth

eapproachwhichsuitstheirdatamanagementstrategy,budget,andotherinstitutionalandtechnicalfactors.--------引自:CSDGM2.06需求说明书元数据标准需求分析Informat

ionsystemanalystsanddevelopers元数据需求功能需求……系统设计说明书管理系统(利用元数据管理数据)Creatorsofrecords元数据记录拟组织和管理的数据资源用户发现、理解、选择和获取数据,实

现元数据的功能总体设计数据结构设计……7代替数据管理系统分析人员完成一部分需求分析工作约束和在一定程度上统一系统设计人员对系统数据结构的设计对元数据著录人员理解和著录元数据元素起帮助作用8元数据标准的使用方式

元数据标准拟组织和管理的数据资源元数据需求对比扩展使用应用方案直接使用扩展规则需求说明书功能及其他需求预算、技术、管理策略等因素系统设计说明书开发实现9元数据标准结合实际需求进行应用流程:Stepbystep1.需求访谈-

-需求访谈的目的是为了解拟要组织和管理的数据资源的内容、系统建设目标、基本元数据需求等。2.需求工作表的说明和填写----需求分析人员向内容专家发放元数据需求工作表单,专家对各自的需求进行初步分析和填写。3.收回需求工作表,进行初步分析----分析人员对反馈

回来的需求工作表进行初步分析,理解用户的真正需求,初步确定参考的元数据标准。104.参考元数据标准的选取、比对和调整/扩展----进行需求和参考元数据标准的初步比对与分析,对元数据标准于本数据管理系统案例的

适用性进行评估,在此基础上,决定直接使用标准还是扩展使用标准,形成本案例需要的元数据方案(格式架构),包括基本元素的设置以及元素与元素之间的基本关系等。5.与内容专家讨论和确认元数据方案----将元数据方案反馈给内容专家,讨论

调整确定该基本架构。6.元数据需求说明书----与系统设计人员一起编写完成元数据需求说明书,作为系统需求说明书的一部分117.采用或研发系统雏形及测试8.在系统中进行元数据著录,并从著录者和数据管理者角度对元数据方案进行评估9.系统对外提供元

数据服务,并从用户角度对元数据方案进行评估10.根据评估结果,可能需要对元数据方案和系统进行改进11.在实际应用中发现元数据标准可能存在的问题,向元数据标准制定者反馈,供修订时参考122.SDB-ERM简介制定背景–“十五”科学数据库元数据标准体系建设–生态学研究具有明显的时

空性特点,需要丰富而易于存取和共享的数据作为研究支撑•长期性•由定性走向定量,由静态走向动态,由小尺度走向大尺度,跨站点、大范围甚至全球尺度的大规模研究成为热点–在对生态学有关建库单位数据资源调研过程中

,发现数据资源特别是观测、试验数据资源的分散保存及缺乏有效的数据组织和管理问题13制定过程CNIC联合南京土壤所、西北水保所、成都山地所、东北农业所等制定–2002.8启动项目–2002.9需求和基础调研工作–2002.11SDB-ERM草案–2002

.12召开SDB-ERM工作研讨会–2003.1SDB-ERM1.0–2003.2-5标准试应用,用户反馈,部分调整标准–2003.8SDB-ERM1.1和通用元数据管理工具–2003.9-12通用元数据管理工具试应用和用户反馈–2004.2-4列表类型生态学数据管理系统(关系数据库系统

)需求调研和分析–2004.4-7系统设计、开发14标准范围和目标范围–主要针对列表类型生态学数据资源,主要包括关系表格、Excel文件以及具有一定结构的文本文件–数据集层次目标–为列表类型生态学数据集资源提供一套

完整而规范的描述元素,用以指导这类资源的组织和管理。15标准特点基于科学数据库核心元数据标准(SDBCM),结合列表类型生态学数据资源的特点进行扩展模块性可扩展性兼容性16标准主要内容内容结构–8个主要模块,3个辅助模块,200多个元数据元素语义结构–语义定义规则和定义方法

语法结构–推荐采用XML语言及其相关语法结构170..∞数据集描述信息数据集分发信息研究项目信息元数据参考信息服务描述信息研究方法信息研究场地信息结构描述信息SDB-ERM范围信息联系信息引用信息0..∞0..∞0..∞主要模块辅助模块18应用实例1-通用元数据管理系统–直接使用(

不针对更特定的数据资源)–“虚拟的”数据管理系统(元数据和数据不在同一系统中保存)–利用XML技术,元数据记录保存为XML文档–通用元数据管理工具(Adesktopapplicationusedtocreatemetadataandtostorethatmetadata

recordbothlocallyandonasharednetworkserverlocatedinSDBCenter)+元数据管理系统(AmetadatadatabaseonaserverlocatedinSDBCenter

,forstoringmetadata,fordatauserstosearchandretrievemetadata,andforothers)。3.SDB-ERM在实际数据管理中的应用实例19应用实例2-试验观测类生态数据管理系统关键词/

句–扩展使用(针对特定需求)–利用关系数据库技术开发的管理系统,B/S架构–元数据与数据在同一系统中保存–有效防止数据资产流失,保证数据共享和保护的均衡20需求分析背景/问题–数据的不可再生:观测/试验的不可重复–历史性试验

/观测原始数据的亟待抢救–数据的分散保存和异构:来自观测、试验的原始数据分别保存在专家、项目组手中,数据的保存和组织方法五花八门–数据的不完整保存:数据的相关信息完整保存意识的缺乏和不完整保存现状–通用元数据管理系统相对于需求的局限性21需求分析(Cont.)所针对的资源范围–“原始的”

列表类型生态观测/试验数据•价值珍贵的历史性原始数据•刚产生及正在产生的原始数据使用范围–机构的信息/数据中心、科技档案处或其他类似部门系统目的–来自观测、试验的原始数据的挽救和保值–来自观测、试

验的原始数据的集中保存–充分尊重和有效保证数据生产者利益和权利基础上的数据管理和服务22需求分析(Cont.)元数据需求数据集描述信息(M,1)数据集名称(M,1)数据集中文名称(M,1)未变数据集其他名称(O,1)未变数据集标识(O,1)未变主题(M,1)学科主

题词(O,n)主题词(M,1)删除理由:成本因素;无合适词表。相应地,自由关键词变为必填。主题词表(M,1)删除自由关键词(M,n)修改OM描述(M,1)未变目的(O,1)未变类型(O,1)删除理由:可通过实体类型反映数据量(O,1)记录数(O,1)删除理由:记录实体的数据量更合理

存储量(O,1)删除23理由:资源粒度;可通过场地反映删除空间范围(O,1)结束时间n1;理由:同上修改开始时间时间段(O,1)理由:数据资源的时间范围特点删除时间点(O,n)时间范围(O,1)学科分类表(M,1)n1;一个系统宜使用一个分类表

整个系统使用同一个分类表修改学科类别(M,n)学科范围(M,1)数据集范围(O,1)理由:涉及的引用只可能在研究方法删除数据集引用(O,1)理由:相对完整且独立删除关联数据集(O,n)理由:数据与元数据存于同一系统删

除URL(O,1)理由:皆为汉语删除语种(O,1)未变数据集最近修改时间(O,1)未变数据集创建时间(M,1)数据集时间删除更新频率(O,1)未变数据集贡献者(O,n)理由:创建数据集,需突出。添加数据集编写者(M,n)未变数据提供者(M,n)理由:针对原

始观测和试验数据删除数据来源(O,1)数据集描述信息(M,1)续删除24数据集分发信息(OM,1)数据格式(O,1)删除理由:可通过实体反映技术要求(O,1)删除理由:无需特殊技术收费策略(O,1)未变权限声明(O,1)未变订购

指南(O,1)删除理由:因系统的数据管理策略访问时间(O,1)删除理由:必要性很小分发联系信息(M,1)修改n1;删除职务名称、主页25元数据参考信息(M,1)元数据时间(M,1)元数据创建时间(M,1)未变元数据最近修改时间(O,1)未变元数据联系信息(M,1)未变是否通

过审核(O,1)添加理由:数据质量保证方面的需求记录审核人(C,1)添加理由:同上记录审核时间(C,1)添加理由:同上元数据标准(O,1)删除理由:整个系统相同2627删除服务参考信息模块–理由:服务

信息之用户的独特性研究项目信息模块元素设置未变更,最大出现次数变为1研究方法信息模块更改–从研究方法信息的实际存在形式、著录成本和原先设定的适用性方面考虑,将该重新设定为包括观测/试验方案和观测/试验过程两个子元素–原先的元素设定变更为对目前所设定的两个子元素在描述内容

上的规范和约束–最大出现次数由n变更为12829应用方案数据集描述信息数据集分发信息元数据参考信息结构信息研究项目信息研究方法信息研究场地信息30树状结构关系数据模型Step1–先将每个主要模块作为一个实体数据集描述数据集标题(M,1)数据

集中文标题(M,1)数据集其他标题(O,1)数据集标识(O,1)主题(M,1)自由关键词(M,n)描述(M,1)目的(O,1)……数据集时间(M,1)数据集创建时间(M,1)数据集最近修改时间(O,1数据集范围(M,1)学

科范围(M,1)学科类别(M,n)时间范围(O,1)时间段(M,1)开始时间(M,1)结束时间(M,1)数据集分发权限声明(O,1)收费策略(O,1)分发联系信息(M,1)联系人(M,1)姓名(M,1)单位(

O,1)联系地址(O,1)国家(O,1)省(市/自治区)城市(M,1)地址(M,1)邮政编码(M,1)联系方式(O,1)传真(O,1)电话(O,1)电子邮箱(O,1)元数据参考元数据时间(M,1)元数据创建时间(M,元数据最近修改时间元数

据联系信息(M,1联系人(M,1)姓名(M,1)单位(O,1)联系地址(O,1)国家(O,1)省(市/自治区)(城市(M,1)地址(M,1)邮政编码(M,1)联系方式(O,1)传真(O,1)电话(O,1)电子邮箱(O,1)是否通过审核

(M,1)记录审核人(C,1)记录审核时间(C1)结构描述实体(M,1)实体名称(M,1)实体标识(M,1)实体类型(M,1)实体定义(O,1)实体文件(M,1)文件后缀(M,1)属性(M,n)属性名称(M,1)属性标识(M,1)属性定义(O,1)数据类型(O,1)计量单位(O

,1)精度(O,1)值域(O,1)漏测值说明(O,n)漏测值代码(M,1漏测值含义(M,131研究项目项目名称(M,1)项目代码(O,1)项目来源(M,1)项目负责人(M,n)项目主要参与人员(O,n)项目描述(O,1)项目时间(M,1)开始时

间(M,1)结束时间(M,1)父项目名称(O,1)父项目代码(O,1)研究方法观测/试验方案(C,1)观测/试验过程(C,1)研究场地场地名称(O,1)场地类型(O,1)地理位置(M,1)气候信息(O,1)生境信息(O,1)地质信息(O,1)水

文信息(O,1)高程信息(O,1)场地历史(O,1)32Step2:每个实体内–可重复复合元素•包含2个或以上子元素,视情况:–独立出来成为一个实体–包含子元素少且每个子元素皆为简单元素时,可考虑将整个元素作为一个字段(字段内,子元素值间以及每个组合元素值间用分隔符

分隔)结构描述实体基本信息(M,1)实体名称(M,1)实体标识(M,1)实体类型(M,1)实体定义(O,1)实体文件(M,1)文件后缀(M,1)属性(M,n)属性名称(M,1)属性标识(M,1)属性定义(O,1)数据类型(O,1)计量单位(O,1)

精度(O,1)值域(O,1)漏测值说明(O,n)漏测值代码(M,1漏测值含义(M,1结构描述实体基本信息(M,1)实体名称(M,1)实体标识(M,1)实体类型(M,1)实体定义(O,1)实体文件(M,1)文件后缀(M,1)属性信息属性名称(M,1)属

性标识(M,1)属性定义(O,1)数据类型(O,1)计量单位(O,1)精度(O,1)值域(O,1)漏测值说明(O,n)E.g.:-9999(仪器设备故障);-1(技术人员错误)33–可重复复合元素(续)•只包含一个子元素–该复合元素

的可重复性转移为其子元素的可重复性,子元素上升为当前实体中的直接复合元素或简单元素,然后按step2中的规则分析该子元素。34–不可重复复合元素•视是否引用辅助模块、该辅助模块是否也被其他实体引用、可选性等–子元素上升为当前实体中的直接复合元素或简单元素,然后按step2中的规则分

析该子元素。–所引用的辅助模块独立为一个实体,该复合元素变为一个外键值,与此实体建立1:1或n:1关联关系。数据集描述数据集标题(M,1)数据集中文标题(M,1)数据集其他标题(O,1)数据集标识(O,1)主题(M,1)自由关键词(M,n)描述(M,1)……数据集范围(M,1)学科范围(M,

1)学科类别(M,n)时间范围(O,1)时间段(M,1)开始时间(M,1)结束时间(M,1)数据集描述数据集中文标题(M,1)数据集其他标题(O,1)数据集标识(O,1)自由关键词(M,n)描述(M,1)目的(O,1)……学科范围(M,1)学科类别(M,n)时间范围(O,1)时

间段(M,1)开始时间(M,1)结束时间(M,1)数据集描述数据集中文标题(M,1)数据集其他标题(O,1)数据集标识(O,1)自由关键词(M,n)描述(M,1)目的(O,1)……学科类别(M,n)时间段(O,1)开始时间(M,1)结束时间(M,1)3

5数据集分发权限声明(O,1)收费策略(O,1)分发联系信息(M,1)联系人(M,1)姓名(M,1)单位(O,1)联系地址(O,1)国家(O,1)省(市/自治区)城市(M,1)地址(M,1)邮政编码(M,1)联系方式(O,1)传真(O,1)电话(O,n)电子邮箱(O,n)元数据参

考元数据时间(M,1)元数据创建时间(M,元数据最近修改时间元数据联系信息(M,1联系人(M,1)姓名(M,1)单位(O,1)联系地址(O,1)国家(O,1)省(市/自治区)(城市(M,1)地址(M,1)邮政编码(M,1)联系方式(O,1)传真(O,1)电话(O,n)电子邮箱(O,n)是

否通过审核(M,1)记录审核人(C,1)记录审核时间(C,1)数据集分发权限声明(O,1)收费策略(O,1)分发联系信息(M,1)元数据参考元数据创建时间(M,1元数据最近修改时间(元数据联系信息(M,1是否通过

审核(M,1)记录审核人(C,1)记录审核时间(C,1)人员信息姓名(M,1)单位(O,1)国家(O,1)省(市/自治区)(C城市(C,1)地址(C,1)邮政编码(C,1)传真(C,1)电话(C,n)电子邮箱

(C,n)36–简单子元素•不可重复子元素:直接成为实体中的一个字段•可重复子元素:作为一个字段,元素值之间用固定分隔符分隔–是否作为检索入口:是否为其建立索引数据集描述数据集中文标题(M,1)数据集其他标题(O,1)数据集标识(O,1)自由关键词(M,n)描述(M,1)目的(O,1)数

据提供者(M,1)数据集编写者(M,1)数据集创建日期(M,1)数据集最近修改日期(O,1)学科类别(M,n)开始时间(C,1)结束时间(C,1)分别建立索引人员信息姓名(M,1)单位(O,1)国家(O,1)省(市/自治区)(C城市(C,1)地址

(C,1)邮政编码(C,1)传真(C,1)电话(C,n)电子邮箱(C,n)不建立索引37Step3–确定实体之间的关系:1:1;1:n;m:n。Step4–代码表字典表381..*0..*0..10..10..*n:11:n1:1n:11:11:nm:n1:1n:139需

求分析(Cont.)用户角色40需求分析(Cont.)功能需求–用户管理–数据录入–数据集授权–系统管理–数据查询–数据浏览41•系统数据结构4243总结元数据标准具体如何使用因具体需求而异基于元数据标准设计开发实际的数据管理

系统有一定的流程可循SDB-ERM是一个面向列表类型生态学数据的元数据标准,是一个可扩展的标准如其他元数据标准一样,SDB-ERM可直接使用,也可扩展使用,如何扩展受扩展规则约束,因所针对具体资源及其组织和管理需求而定使用SDB-ERM的两个实例–直接使用SDB-

ERM,利用XML技术开发的通用元数据管理系统;–扩展使用SDB-ERM,利用关系数据库技术开发的管理系统,通过强大的权限管理功能,实现数据共享和产权保护的均衡44Thanks!

小橙橙
小橙橙
文档分享,欢迎浏览!
  • 文档 25747
  • 被下载 7
  • 被收藏 0
相关资源
广告代码123
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:395972555 (支持时间:9:00-21:00) 公众号
Powered by 太赞文库
×
确认删除?