【文档说明】精选人工智能_不确定性推理课件.ppt,共(73)页,665.500 KB,由小橙橙上传
转载请保留链接:https://www.ichengzhen.cn/view-13129.html
以下为本文档部分文字说明:
1人工智能不确定性推理4.1不确定性推理基本理论4.2可信度方法4.3主观Bayes方法4.4D-S证据理论4.5模糊集理论2不确定性的产生与来源来自人类的主观认识与客观实际之间存在的差异产生原因事物发生的随机性人类知识的不完全、不
可靠、不精确和不一致自然语言中存在的模糊性和歧义性3不确定性(狭义)不确定性(uncertainty)就是一个命题(亦即所表示的事件)的真实性不能完全肯定,而只能对其为真的可能性给出某种估计。例如果乌云密布\电闪雷鸣,则可能要下暴雨
。如果头痛发烧,则大概是患了感冒。4不确切性(模糊性)不确切性(imprecision)就是一个命题中所出现的某些言词其涵义不够确切,从概念角度讲,也就是其代表的概念的内涵没有硬性的标准或条件,其外延没有硬性的边界,即边界是软的或者说是不明
确的。例小王是个高个子。张三和李四是好朋友。如果向左转,则身体就向左稍倾。5自然界中的不确定现象随机模糊混沌分形复杂网络6随机性(偶然性)和随机数学以贝叶斯公式为基础的贝叶斯理论,在人工智能中一直是处理不确定性的重要工具带可信度的不确定推理证
据理论引入信任函数和似然函数来描述命题的不确定性当先验概率已知时,证据理论就变成了概率论模糊性(非明晰性)和模糊数学模糊集合论,隶属度粗糙集理论Vague集理论通过对模糊对象赋予真、假隶属函数,从正、反两个方面
来处理模糊性随机性和模糊性是不确定性的基本内涵7混沌混沌是一种确定性系统中出现的类似随机的过程。因为很难对初值确定得非常精确,近似相同的初值产生很不相同的貌似随机的结果。初值敏感性导致过程的不确定性和不可预测性。蝴蝶效应:亚马逊河热带雨林中的一只蝴蝶扇动了两下翅膀,
可能两周之后会引发美国德克萨斯州的一场龙卷风。“失之毫厘,差之千里”。初始条件的微小的差别能引起结果的巨大的差异。8复杂网络:Internet具有小世界效应和无尺度特性9不确定性人类认知过程的不确定性感知的不确定性记忆的不确定性思
维的不确定性自然语言的不确定性10视觉的不确定性11视觉的错觉12认知的不确定性:13思维的不确定性思维有精确的一面,更有不确定的一面。人类习惯于用自然语言进行思维,思维的结果往往是可能如何、大概如何等定性的结论。人类还擅长通过联想的、直觉的、创造的形象思维来思考,很少象计算机一样做精确的数
学运算或者逻辑推理,但是这并不妨碍人类具有发达的、灵活的智能,并不妨碍人类具有发达的、灵活的模式识别能力。14从感知到记忆到印象感知视觉记忆记忆随时间而淡忘形成的印象σ=0.1σ=0.8σ=1.2σ=1.5σ
=0.515随着时间的推移,印象中的爱因斯坦只剩下一双深邃的眼睛,而印象中萨达姆也只剩下那浓密的胡子。记忆的不确定性:记忆随时间而淡忘形成的印象164.1不确定性推理基本理论●为什么要研究不确定性推理?现实世界的问题求解大部分是不良结构;对不良结构的知识描述具有不确定性:1)问题证据(初始事实
,中间结论)的不确定性;2)专门知识(规则)的不确定性.17不确定性推理是指从不确定性的初始证据出发,通过运用不确定性的知识,最终推理出具有一定程度的不确定性,但又是合理或者似乎合理的结论的思维过程。什么是不确定性推理18不确定性推理中的基本问题在不确
定性推理中,知识和证据都具有某种程度的不确定性,这就为推理机的设计与实现增加了复杂性和难度。除了要解决推理方向、推理方法、控制策略等基本问题外,还需要解决以下问题:●不确定性的表示和量度●不确定性匹配●不确定性的传递算法●不确定性的合
成19不确定性的表示与量度知识不确定性的表示在确立其表示方法时,有两个直接相关的因素需要考虑:1)要能根据领域问题的特征把其不确定性比较准确地描述出来,满足问题求解的需要;2)要便于推理过程中对不确定性的推算.证据不确定性的
表示在推理中,有两种来源不同的证据:1)一种是用户在求解问题时提供的初始证据;2)另一种是在推理中用前面推出的结论作为当前推理的证据.20确定度量方法和范围的原则度量要充分表达相应知识及证据不确定性程度。度量范围的指定应便于领域专家及用户
对不确定性的估计。度量要便于对不确定性的传递和计算,对结论算出的不确定性度量不能超出度量规定范围。度量的确定是直观的,同时应有相应理论基础。21不确定性匹配对于不确定性推理,由于知识和证据都具有不确定性,而且知识所要求的不确定性与证据实际具有的不确定性程度不一定相同,因而
就出现“怎样才算匹配成功”的问题对于这个问题,目前常用的解决方法是:设计一个算法用来计算匹配双方相似的程度,另外再指定一个相似的"限度",用来衡量匹配双方相似的程度是否落在指定的限度内.如果落在指定的限度内,就称它们是可匹配的,相应知识可
被应用.用来计算匹配双方相似程度的算法称为不确定性匹配算法.用来指出相似的"限度"称为阈值.22不确定性推理的一般算法●根据规则前提E的不确定性C(E)和规则强度f(H,E)求出假设H的不确定性C(H),即定义一函数g1,使C(H)=g1[C(E),f(H,E)]●根据
分别由独立的证据E1和E2,求得的假设H的不确定性C1(H)和C2(H),求得证据E1和E2的组合所导致的假设的不确定性C(H),即定义一函数g2,使C(H)=g2[C1(H),C2(H)]●根据两个证据E1和E2的不确定性C(E1)和C(E
2),求出证据E1和E2的合取E1E2的不确定性,即定义一函数g3,使C(E1E2)=g3[C(E1),C(E2)]●根据两个证据E1和E2的不确定性C(E1)和C(E2),求出证据E1和E2的析
取的不确定性,即定义函数g4,使C(E1E2)=g4[C(E1),C(E2)]23◆不确定性推理与通常的确定性推理的差别:(1)不确定性推理中规则的前件能否与证据事实匹配成功,不但要求两者的符号模式能
够匹配(合一),而且要求证据事实所含的信度必须达“标”,即必须达到一定的限度。这个限度一般称为“阈值”。(2)不确定性推理中一个规则的触发,不仅要求其前提能匹配成功,而且前提条件的总信度还必须至少达到阈值。(3)不确定性推理中所推得的结论是否有效
,也取决于其信度是否达到阈值。(4)不确定性推理还要求有一套关于信度的计算方法,包括“与”关系的信度计算、“或”关系的信度计算、“非”关系的信度计算和推理结果信度的计算等等。24不确定性推理模型不确定性推理模型没有一个统一的模型,种类不计其数,其中比较著名的有:Shortlif
fe在1975年结合医疗专家系统MYCIN建立的确定性理论Duda在1976年结合探矿专家系统PROSPECTOR建立的主观Bayes推理DempsterShafer在1976年提出的证据理论Zadeh在1978年提出的可能性
理论,1983年提出的模糊逻辑和逻辑推理Nilsson在1986年提出的概率逻辑Pearl在1986年提出的信任网络25●确定因子法(可信度方法)●主观Bayes方法●证据理论●可能性理论●粗集理论●批注理论不确定性推理的方法264.2确定因子法可信度方法是由E.H.Shortl
iffe等人在确定性理论的基础上,结合概率提出的一种不确定性推理方法,首先在Mycin系统中得到了成功的应用。其核心思想是:利用确定性因子CF(值)Ⅰ.联系于具体的断言Ⅱ.联系于每条规则Ⅲ.通过CF的计算传播不确定性27可信度根据经验对一个事物或现象为真的相信
程度。C-F模型C-F模型是基于可信度表示的不确定性推理的基本方法.28知识不确定性的表示在C-F模型中,知识是用产生式规则表示的,其一般形式是:ifEthenH(CF(H,E))其中,E:是知识的前提条件,它既可以是一个单个条件,也可以是用and及or连接起来的复合条件;H:是结论,它可以是
一个单一结论,也可以是多个结论.CF(H,E):是该条知识的可信度,称为可信度因子或规则强度。(CertaintyFactor)CH(H,E)在[-1,1]上取值,它指出当前提条件E所对应的证据为真时,它对结论为真的支持程度。29确定因子法⑴知识的不确定
性表示MYCIN系统称规则强度为规则确定性因子(CertaintyFactor)CF(H,E),它表示在已知证据的情况下,对假设的确信程度。CF(H,E)定义如下:),(),(),(EHMDEHMBEHCF)(1
)()}(),|(max{1),(HpHPHPEHPEHMB)()()}(),|(min{1),(HPHPHPEHPEHMD30MB:称为信任增长度,它表示因与前提条件E匹配的证据的出现,使结论H为真的信任增长度.MD:称为不信任增长度,
它表示因与前提条件E匹配的证据的出现,使结论H为真的不信任增长度.规则的不确定性31●在环境E'下,若两个证据的合取或析取支持结论H,则可表示为证据的不确定性组合定义为CF(E1∧E2,E')=min[CF(E1,E'),CF(E2,E')]CF(E1∨E2,E')=max[CF(E1,E
'),CF(E2,E')]当两条规则支持同一结论H时,可表示为不确定性的组合32不确定性的组合当组合证据是多个单一证据的合取时,即:E=E1andE2and…andEn若已知CF(E1),CF(E2),…,CF(En),则CF(E)=min{CF(E1),CF(E2)
,…,CF(En)}当组合证据是多个单一证据的析取时,即:E=E1orE2or…orEn若已知CF(E1),CF(E2),…,CF(En),则CF(E)=max{CF(E1),CF(E2),…,CF(En)}33结论不
确定性的合成算法若由多条不同知识推出了相同的结论,但可信度不同,则可用合成算法求出综合可信度.设有如下知识:ifE1thenH(CF(H,E1))ifE2thenH(CF(H,E2))则结论H的综合可信度可分如下两步算出:34结论不确定性的合成首先分
别对每一条知识求出CF(H):CF1(H)=CF(H,E1)max{0,CF(E1)}CF2(H)=CF(H,E2)max{0,CF(E2)}然后用下述公式求出E1与E2对H的综合影响所形成的可信度:CF1(H)+CF2(H)–CF
1(H)CF2(H)若CF1(H)≥0,CF2(H)≥0CF1(H)+CF2(H)+CF1(H)CF2(H)若CF1(H)<0,CF2(H)<0CF1(H)+CF2(H)1–min{|CF1(H)|,|CF2(H)|
}若CF1(H)CF2(H)<035实例有下列一组知识:r1:ifE1thenH(0.8)r2:ifE2thenH(0.6)r3:ifE3thenH(-0.5)r4:ifE4and(E5orE6)thenE1(0.7)r5:ifE7andE8thenE3(
0.8)已知:CH(E2)=0.8,CH(E4)=0.5,CH(E5)=0.6,CH(E6)=0.7,CH(E7)=0.6,CH(E8)=0.9,求:CF(H)=36确定因子法的缺点(1)如何将人表示可信度的术语转
变为数字化的CFs。例如,人的经验规则常涉及"很可能"、"不大可能"等术语,应对应到多大的CF值。(2)如何规范化人们对可信度的估计,不同人所作的估计往往相差较大。(3)为防止积累误差,需指定门槛值,但多大合适呢?太小固然不行,但太大也不好,因为可信度的传递需要累计较小的
变化。(4)为改进可信度的精确性,需提供从系统的实际执行反馈的信息,并基于反馈信息调整可信度。这实际上是一种机器学习问题,尚未较好地加以解决。374.3主观Bayes方法在PROSPECTOR探矿专家系统中,采用了主观Bayes方法来度量不确定性。引入两个数
值(LS,LN)来作度量,LS表现规则A->B成立的充分性,LN表现规则A->B成立的必要性。也就是说LS表现规则A->B,A为真时对B为真的支持程度,LN表现了A不为真(~A)对B为真的支持程度。38对规则的
不确定性度量对规则A->B的不确定性CF(B,A)以(LS,LN)来描述。39建立几率函数表示事实X为真的概率与X为假的概率之比,显然P(X)的越大O(X)也加大,而且:P(X)=0,O(X)=0P(X)=1,O(X)=∞40O(B|A)=LS·
O(B)O(B|~A)=LN·O(B)由这两个公式,对于规则A->B,LS表现A为真时对B为真的支持程度,LN表现了A为假(~A)时对B为真的支持程度。4142根据LS、LN的定义可知,LS≥0,LN≥0,而
且LS和LN不是独立取值,只能出现:LS>1,LN<1或LS<1,LN>1或LS=LN=1但不能两者同时>1或同时<1在实际系统中,LS、LN的值是由专家凭经验给出的,而不依照LS、LN的定义来计算。例如有规则A->B,并且给出LS=20,LN=1则表
示A真支持B真。LS=1,LN=300则表示~A支持B真。434.4证据理论证据理论是由Dempster和他的学生Shafer共同提出来的一种不确定性推理模型,所以也称为D-S证据理论。证据理论可以满足比概率更加弱的公里
体系,当概率值已知的时候,证据理论就变成为概率论了。⑴证据的不确定性设U的幂集2U上定义了一个基本概率赋值函数m:2U[0,1],使满足,基本概率赋值函数m(A)表示了证据对U的子集A成立的一种信任程度。UAAmm1)(,0
)(44信任函数:信任函数定义为似然函数:似然函数定义为信任函数与似然函数的关系ABUBmABelBel)()(],1,0[2:)(~1)(],1,0[2:ABelAPlPlU)()(ABelAPl0)()(BelPl1)
()(UBelUPl)(~1)(ABelAPl1)(~)(ABelABel1)(~)(APlAPl)()()(APlAPABel45●命题的逻辑组合的情况◆合取:◆析取:◆如果几种
规则支持同一命题,总的概率赋值函数定义为各规则假设得到的基本概率赋值函数的正交和,即)}(,),(),(min{)()(2121nnACERACERACERandAandandAACERACER)}(,),(),
(max{)()(2121nnACERACERACERorAororAACERACERmmmm21464.5可能性理论Zadeh在1965年提出了模糊集合论,1978年又提出了可能性理论。⑴模糊命题:含有模糊概念、模糊数据或带有确信程度的语句称为模糊命
题。形式化为:xisA或者xisA(CF)其中,X是论域上的变量,用来代表所论对象的属性;A是模糊概念或模糊数;CF是该模糊命题的确信度,它可以是一个确定的数,也可以是模糊数,还可以是模糊语言值。⑵模糊知识的表示:模
糊产生式规则的一般形式为其中E是用模糊命题表示的模糊条件;H是用模糊命题表示的模糊结论;CF是该产生式规则所表示的知识可信度因子。),(CFHTHENEIF474.6粗集理论粗集理论是波兰华沙理工大
学的Z.Pawlak教授1982年首先提出的处理不确定性信息的理论。该方法特别实用于观察和测量获得的不精确数据的分类问题。48加权的不确定性推理IF该论文有创见AND立论正确AND文字通顺AND格式规范THEN该论文可以发表491、知识的不确定性表示IFE1(ω1)ANDE2(ω2)AND
…En(ωn)THENH(CF(H,E),λ)其中,ωi是加权因子,且λ是阈值,0<λ≤1,只有当CF(E)≥λ时才可使用该条知识。502、组合证据不确定性算法E=E1(ω1)ANDE2(ω2)AND…En(ωn)513、不确
定性的传递算法CF(H)=CF(H,E)×CF(E)52例、设有下列知识:IF该动物有蹄(0.3)AND该动物有长腿(0.2)AND该动物有长颈(0.2)AND该动物是黄褐色(0.13)AND该动物身上有暗黑色斑点(0.13)AND该动物的体重≥20
0kg(0.04)THEN该动物是长颈鹿(0.95,0.8)53证据为:E1:该动物有蹄(1)E2:该动物有长腿(1)E3:该动物有长颈(1)E4:该动物是黄褐色(0.8)E5:该动物身上有暗黑色斑点(0.6)试问该动物是什么动物?54解:CF(E)=0.3×
1+0.2×1+0.2×1+0.13×0.8+0.13×0.6=0.882因λ=0.8,而CF(E)>λ,所以知识可以使用,推出该动物是长颈鹿,其可信度为:CF(H)=CF(H,E)×CF(E)=0.95×0.882=
0.84554、冲突消解设有下述知识r1:IF{E1(ω1)}THENH1(CF(H1,E1),λ1)r2:IF{E2(ω2)}THENH2(CF(H2,E2),λ2)且CF({E1(ω1)})≥λ1C
F({E2(ω2)})≥λ2若CF({E1(ω1)})≥CF({E2(ω2)}),则优先使用r1进行推理。56例、设有下列知识:r1:IFE1(0.6)ANDE2(0.4)THENE6(0.8,0.75)r2:IFE3(0.5)ANDE4(0.3)ANDE5(0.2)THENE7(0.7,0.6
)r3:IFE6(0.7)ANDE7(0.3)THENH(0.75,0.6)已知:CF(E1)=0.9,CF(E2)=0.8,CF(E3)=0.7CF(E4)=0.6,CF(E5)=0.5求:CF(H)57解:由r1有:CF(E1(0.6)ANDE2(0.4)
)=0.6×0.9+0.4×0.8=0.86因为λ1=0.75所以CF(E1ANDE2)>λ1故r1可以使用。58由r2有:CF(E3(0.5)ANDE4(0.3)ANDE5(0.2))==0.5×0.7+0.3×0.6+0.2×0.5=0.63因为λ2=0.6所以CF(
E3ANDE4ANDE5)>λ2故r2可以使用59因为CF(E1ANDE2)>CF(E3ANDE4ANDE5)所以r1先被启用,然后才能启用r260由r1有:CF(E6)=0.8×0.86=0.694由r2有
:CF(E7)=0.7×0.63=0.44161由r3有:CF(E6(0.7)ANDE7(0.3))=0.7×0.694+0.3×0.441=0.6181因为CF(E6ANDE7)>λ3所以r3被启用,得到:CF(H)=CF(H,E)
×CF(E)=0.75×0.6181=0.46357562证据理论基本思想(1)用一个概率范围而不是简单的概率值来模拟不确定性。(2)引入信任函数Bel和似然函数Pl.(3)用区间(Bel(A),Pl(A))表示证据A的
不确定度量63证据理论1、样本空间设D是变量x的所有可能取值的集合,且D中的元素是互斥的,则称D为x的样本空间。D中的任意一个子集都对应于一个关于x的命题。若D有n个元素,则2D表示D的2n个子集。642、概率分配函数设D为样本空间,有映射函数M(x):2D→[0,1],且满足M(Φ)=0∑M(A
)=1AD则称M(x)是2D上的概率分配函数。M(A)称为命题A的基本概率数。它是命题A的信任度。653、信任函数(1)定义设D为样本空间,有映射函数Bel(x):2D→[0,1],且满足Bel(A)=∑M(B),对所有的A∈2DBA则称Bel
(x)为信任函数或下限函数。Bel(A)表示对命题A为真的信任程度(支持度)。66(2)性质①Bel(Φ)=M(Φ)=0②Bel(D)=∑M(B)=1BD67例3、设D={红、黄、蓝},且M({红})=0.3,M({黄})=0,M({蓝})=0.1,M({红,黄})=0.2,M({红,蓝}
)=0.2,M({黄,蓝})=0.1,M({红,黄,蓝})=0.1求Bel(A)68解:Bel({红})=M({红})=0.3Bel({红,黄})=M({红})+M({黄}+M({红,黄})=0.3+0+0.2=0.569Bel({红,黄,
蓝})=M({红})+M({黄})+M({蓝}+M({红,黄})+M({红,蓝})+M({黄,蓝})+M({红,黄,蓝})=0.3+0+0.1+0.2+0.2+0.1+0.1=1704、似然函数Pl:2D→
[0,1],且Pl(A)=1-Bel(A)对所有的A∈2DBel(A)表示对A为非假的程度。Pl(A):A的最大信任度(合情度)f(A)=Bel(A)+|A|/|U|(Pl(A)-Bel(A))f(A):A的不确定性
71例4、对于例3,求Pl(A)Pl({红})=1-Bel({红})=1-Bel({黄,蓝})=1-[M({黄})+M({蓝})+M({黄,蓝})]=1-(0+0.1+0.1)=0.872Pl({黄,蓝})=1-Be
l({黄,蓝})=1-Bel({红})=1-0.3=0.773Thanks.