【文档说明】空间数据库中涉及到的基本知识分解课件.ppt,共(51)页,299.502 KB,由小橙橙上传
转载请保留链接:https://www.ichengzhen.cn/view-92388.html
以下为本文档部分文字说明:
2022/12/51●空间数据模型●空间索引●空间数据库管理系统1空间数据库中涉及到的知识2022/12/522空间数据模型12.1空间数据模型特点:模型的提出、引入与相应的实际应用密切相关。空间数据库的一个重要应用领域是GIS。通常就以GIS为应用背景,介
绍其中的基本空间数据类型。2022/12/53在GIS中,基本空间数据类型由下述三种空间对象组成:(1)点(Point)例如城市。点只表示其空间位置,不表示其范围(extent)(2)线(Line)例如河流、道路、管道、航线、等高线、等降雨线、通信或
电力线路等。线不仅表示线上各点在空间的位置,而且还有长度,即表示其在空间的延伸范围。(3)区域(Region)例如森林、湖泊、行政区域等。区域不但有位置,而且有面积、周长等参数,以表示其覆盖范围。2022/12/54以上三种是最基本空间数据类型,以
此为基础,还可以导出下面两种空间数据类型:(4)划分(Partition)一个区域可以是按其自然、行政或其他特征,分成若干个区域。如果这些子区域互不相交,但其“并”覆盖该区域,则此子区域的集合就称为该区域的一个划分。国家行政区域划分图,土地利用图等都是划分的
例子。划分可嵌套,例如国家分成省市,省市分成县区、县区分成乡镇等。2022/12/55(5)网络(Network)网络是由若干点和一些点与点之间的联线组成。例如公路网、河网、电力网、电话网、交通线路图等都是网络的例子。20
22/12/562.2空间对象所处的环境1.欧氏空间设R表示实数域,V是R上向量的非空集合,如果在V上定义了满足如下条件并称之为内积的一个二元函数<x,y>,则称V为R的欧氏空间:非负性<x,x>≥0,<x,x>=0
x=0,x∈V对称性<x,y>=<y,x>线性性<αx+βy,z>=α<x,z>+β<y,z>,α,β∈R;x,y,z∈V直线R,平面R2和空间R3通过适当的定义内积都是欧氏空间。2022/12/572.空间对象间的关系•集合•拓扑•方位•度量2022/12/
582.3空间对象之间关系1.基于集合的关系基于集合的空间对象关系主要有元素与集合的属于及不属于的关系,集合与集合的包含、相交、并等关系。在空间对象间的层次关系就适合用集合的关系理论来讨论,例如城市包含公园,
公园包含树林等。2022/12/592.基于拓扑的关系基于拓扑的空间对象关系主要有邻接(meet)、包含(within)和交叠(overlap),这三类拓扑关系也是空间数据查询中最有可能出现的情况。空间数据库中,基于
拓扑的查询需要解决这样两个问题:●查询所有与给定对象具有某种拓扑关系R的空间对象。●对象A和B具有怎样的拓扑关系。2022/12/510在平面上,两个对象A和B之间的二元拓扑关系时基于以下对象成分的相交(insection)关系:A的内部——Aﹾ,A的边界∂A,A的外部——A-
。B的内部——Bﹾ,B的边界∂B,B的外部——B-。2022/12/511对象的这六个部分分别构成九种相交情况:Aﹾ∩B,Aﹾ∩∂B,Aﹾ∩B-;∂A∩Bﹾ,∂A∩∂B,∂A∩B-;A-∩Bﹾ,A-∩∂B,A-∩B-。202
2/12/512考虑到{0,1}取值情况{0,1},可以确定有29=512种二元拓扑关系,这里,人们研究其中的八种彼此互斥关系:相离(disjoint),邻接(meet),交叠(overlap),相等(equal),包含(contain),在内部(
inside),覆盖(cover)和被覆盖(coveredby)。2022/12/5133.基于方位的关系●绝对方位即在全球定位系统背景下定义的方位,例如东、西、南、北,东南、西南、东北等。●相对方位即
根据与给定目标的方向来定义的方位,例如左右、前后、上下等。●基于观察者的方位即按照专门指定的称为观察者参照对象来定义的方位。2022/12/5144.基于度量的关系设有一个集合E,如果在E上定义了一个二元函数d(x,y),x,y∈E,满足如下条件:(1)非负性
d(x,y)≥0(2)对称性d(x,y)=d(y,x)(3)三角不等性d(x,y)≤d(x,z)+d(z,y)则称V是一个度量空间,d(x,y)称为V上的度量函数。2022/12/515考察一个空间的“测度”,例如
线段的长度,平面图形的面积,空间立体的体积,以及一个空间对象相对于另一个空间对象的距离等都是基于度量的关系。2022/12/5162.4空间数据操作的谓词描述从理论上讲,空间数据操作特别是空间数据查询的基础是空间对象之间的相互关系,从实际上看,由于
空间数据类型取决于实际应用,空间数据操作主要也由现实中的应用所决定。空间数据操作的描述可以有谓词形式、集合形式和代数形式三种。2022/12/5171.基本符号先定义空间数据操作中的一些记号。●SDT空间数据类型●ZS大小为零(zerosize)空间数据类型
,例如点●NZS大小非零(non-zerosize)的空间数据类型,例如线、区域等●ADT原子(atomic)空间数据类型例如点、线、区域●CDT集合型(collection)空间数据类型,例如网络、划分等2022/12/518●PT
点●LN线●RG区域●PTN划分●NTW网络2022/12/5192.基于拓扑的描述●两个同类型空间数据是否相等(=或≠)PT×PT→BoolLN×LN→BoolRG×RG→Bool●空间数据SDT是否在区域RG中(I
NSERT)SDT×RG→Bool2022/12/520●两个大小非零的空间数据是否相交(INTERSECTS)NZS×NSZ→Bool●两个区域是否邻接(IS-NEIGHBOR—OF)RG×RG→Bool2022/12/5213.基于集合运算的描述(1)相交(Intersection)●
两条线相交为点的集合LN×LN→2PT●线与区域相交为线的集合LN×RG→2LN●区域与区域相交为区域的集合RG×RG→2RG2022/12/522(2)重叠(OVERLAP)PTN×PTN→2FG(3)中心点(CENTER)NZS→PT2022/12/5234.基于度量的描
述●两点间距离(DIST)PT×PT→NUMDIST●两空间图形间的最大、最小距离(MAXDIST,MINDIST)SDT×SDT→NUMMAXDIST或MINDIST2022/12/524●多点的直径(DIAMETER)PT→NUMDIAMET
ER●线的长度(LENGTH)LN→NUMLENGTH●区域的周长(PERIMETER)或面积(AREA)RG→NUMPERIMETER或AREA2022/12/5252.5空间关系的集合描述与判断在空间数据库中,空间关系主要用于查询。为了获得可以接受的查询效率,常常把空间对象用点
、矩形和方盒等简单,规则的图形表示。规则的几何图形可以看做空间中标准的“点集合”,因此,空间数据操作的集合描述就是这些标准集合间关系的描述。2022/12/5261.一维空间中两个线段的关系一维空间中两个线段的7种可能的关系,分别用记号“=、[、%、]、/、|、<”表示。图10-4表示了这些关
系,其中,(1)~(5)是相交关系,(6)(7)是非相交关系。设A、B线段的起点和终点分别为x1A,x2A,x1B,x2B,则(1)~(5)的关系可以归纳为max{x1A,x1B}<min{x2B,x2B}2022/12/527ABABABAB(1
)A=B(1)A[B(1)A%B(1)A]BABABAB(5)A/B(6)A|B(7)A<B2022/12/5282.二维空间中边平行于坐标轴矩形间的关系设A、B为这种矩形,其左下角坐标和右上角坐标分别为{(x1A,y1A),(x2A,y2A)}和{(x1
B,y1B),(x2B,y2B)}。可以得到,如果A和B在x轴和y轴上的投影分别相交,则A、B相交。因此,A,B相交的条件可以表示为[max{x1A,x1B}<min{x2A,x2B}]和[max{y1A,y1B}<min{y2A,y2B}]2022/12/5292.6空间关
系的代数描述与运算空间代数运算的特点在于选择条件或连接条件中出现空间谓词。投影、集合运算不涉及空间谓词,与关系代数没有本质区别。2022/12/5301.空间选择例1写出下列空间选择表达式。●选择广东省所有城市:σF(城市)其中,F=
CENTER(城市地图)INSIDE广东;城市是关系名,其中有属性“城市名”、“人口”、“城市地图”。城市地图表示市区及其周边地区,“广东”是一个区域名称。显然,如果城市中心点在广东省区域内,则该城市一定属于广东省2022/12/531●选择广东省的所有河流:σF(河流)其中F=ROUTE(河流
)INSIDE广东;“河流”是关系名,其中有属性“河流流域图”。ROUTE是空间数据库中的一个函数,计算河流、道路等的中心线。●选择距离广州小于等于100000米,人口大于等于50万的所有城市:σF(城市,广东区域图
)其中F=DIST(城市名,广州)<=100000AND人口=>500000;城市是个关系,“广州”是城市名,F中的第一个谓词是空间谓词,要用到广东省地图。2022/12/5322.空间连接例2对每条河流找出沿河10000米的所有城市设“河流”、“城市”是两
个关系。在关系“河流”中,有属性“河流流域图”。如果城市中心距离河流小于等于10000米,则该城市和河流匹配。可以用空间连接表示如下:∏河流名,城市名(河流⋈F城市)其中,F=Mindist(城市名,ROUTE(河流流域图))<100002022/12/5332.7空间数据
查询语言一般在SQL语言基础上扩充空间数据类型及其操作和相应的保留字。2022/12/534例3●选择广东省所有城市及其人口:select城市名,人口from城市wherecenter(城市地图)insid
e广东省;2022/12/535●选择流经广东省所有河流的河流名及其在广东省境内的长度:select河流名,length(intersection(route(河流流域图),广东))from河流whereroute(河流流域图)int
ersects广东;2022/12/536●选择距离广州小于等于100000米,人口大于等于50万的所有城市:select城市名,人口from城市,广东区域图wheredist(城市名,广州)<=100000and人口=>5
00000;2022/12/537例4将例2表示的查询用SQL风格表示出来select河流名,城市名from河流,城市wheremindist(城市名,ROUTE(河流流域图))<=100002022/12/5383空间索引空间数据库查询的开销一般比关系数据库大,特别是空间谓词求值的开销远比数
值或字符串的比较要大。若采用顺序扫描方法进行查询,则效率就会很低,因此采取空间索引十分必要的。2022/12/5393.1空间索引概述1.空间索引的思路为了减少开销,通常是采用近似规则图形例如边平行于坐标轴的最小矩形来
代替不规则土星进行查询。这种矩形就称为不规则区域的最小限定矩形(minimumboundingrectangle,MBR)。设MBR左下角坐标为(x1,y1),右上角为(x2,y2),则x1,y1就分别为空间对象的最小横坐标和纵坐标,x2,y2分别为空间对象的最大横坐标和纵坐标
。不但区域可以用MBR近似表示,线也可以用MBR近似表示;进一步,不但单个空间对象可以用MBR近似表示,有时MBR还可以包含多个空间对象。最小限定矩形如下图所示。2022/12/540MBRAMBRB(1)区域MBR(1)线MBRAB2022/12/541如果一个MBR
还含有另外的MBR,则称其为目录MBR,否则就称为对象MBR。如果两个空间对象相交,则相应的MBR也相交;如果两个MBR不相交,则对应的两个空间对象也不相交。这样,用MBR代替空间对象检查相交情况,就可以排除一批不相交的对象。2022/12/542当然,两个MBR相交,并
不能得出对应的空间对象一定相交,此时还需要用精确方法对MBR相交的空间对象逐个进行检验,找出真正相交的情形。先用高效率的近似方法进行粗选,再用精确方法进行精选,这是空间数据库中常用的搜索方式。2022/12/5432.空间索引的特点
(1)索引对象的无序性(2)索引对象的不规则性(3)索引对象的交叉性2022/12/5443.2空间对象的近似表示1.点点不但是基本的空间数据类型之一,而且多属性的检索也相当于多维空间点的搜索。有些规则图形也可以用高
维空间的点表示。例如一维空间的线段[a,b]可以用二维空间的点(a,b)表示。二维空间的边平行于坐标轴的矩形{(x1,y1),(x2,y2)}可以用四维空间的点(x1,y1,x2,y2)表示,式中(x1,y1),(
x2,y2)分别为矩形的左下角和右上角坐标。2022/12/5452.矩形或方盒矩形和方盒不但是近似表示不规则空间对象的简单、有效手段,也是划分子空间的首选图形。2022/12/5463.栅格(grid)用栅格表示空间对象,类似于用点阵、像素阵列
表示二维图像,原则上可以推广到高维空间,但主要用于二维空间2022/12/547000111102022/12/5480000111111102022/12/549每个区域都可以近似表示为二进制串的集合。这种二进制串的集合称为该区域的Z元素(Z-element)。
要检查两个区域是否相交或包含,可以按序比较两个区域的Z元素。比较时,如果一个二进制串是另一个二进制串的前缀,则后者所代表的区域必然包含于前者所代表的区域中,例如100101一定包含在1001中。2022/12/550用Z次序的栅格表示区域,可以把本是二维的空间对象,用一维的有序二进制串序列表示
。因此,空间对象所占的区域,可以用二进制串作为索引键,组成一个B树。下面是A,B区域的Z元素,经扫描比较,可以找出它们的重叠部分。2022/12/551重叠部分:(A1,B1),(A1,B2)(A1,B3),(B1,A2),(B1,A3),……。
在上面的重叠栏中,二元组的第一项覆盖第二项。A1A2A3A:0110,10,10010,100110,10110,„„B:0111,100,1010,1011,1101,„„B1B2B3