D S证据理论

D-S 证据理论
D-S 证据理论由 Dempster 于 1967 年提出，其学生 Shafer 将其发展并整理成一套完整的

数学推理理论。该理论提出的初期并没有引起人们的重视，直到 80 年代 Barnett、Friedman
等人将这个方法应用于专家系统，才认识到它具有利用证据的积累可以缩小假设置信区间
的重要优点。
D-S 证据理论能够处理由不知道而引起的不确定性。D-S 证据理论可以看作是有限域上
对经典概率推理理论的一般化扩展，其主要特性是支持描述不同等级的精确度和直接引入
了对未知不确定性的描述。D-S 证据理论可以支持概率推理、诊断、风险分析以及决策支持等,
并在多传感器网络、医疗诊断等应用领域内得到了具体应用。
1. 证据的不确定性
设 U 表示所有可能假设的集合，且 U 的元素的个数为 N ，则 U 的幂集合 2 中的元

U
素个数为 2 ，每个幂集合的元素对应于一个关于假设取值的命题。同时，我们称 U 为辨别

N
框(frame of discernment）。
定义 1：基本概率赋值函数(bPA, basic Probability Assignment)

m:2 U  [0,1] ，且 m( )  0 ，  m( A)  1 。
AU
基本概率赋值函数 m( A) 表示证据对 U 的子集 A 的一种信任度量。 m( A) 的意义是：
（1）若 A  U ,且 A  U ，则 m( A) 表示对 A 的确定信任度;
（2）若 A  U ，则 m( A) 表示这个数不知如何分配;
（3）若 A  U ，且 m( A)  0 ，则称 A 是 m 的一个焦元（Focal element）。
例如： U  {a, b, c} ，则 2 上的一个基本概率赋值函数 m 可以表示为：

U
m(,{a},{b},{c},{a, b},{a, c},{b, c},{a, b, c})

 (0, 0.3, 0.1, 0, 0.2, 0.2, 0, 0.2)
其中， m({a})  0.3 表示对命题 a 的信任度为 0.3； m({a, b, c})  0.2 表示 0.2 不知如
何分配。
特别值得注意的是： m({a})  m({b})  m({c})  0.3  0.1  0  0.4  1 。因此不应该
将基本概率赋值函数理解成概率函数。因为对于概率函数 P，
P ({a})  P ({b})  P ({c})  1 。
在 D-S 证据理论中，信任函数 bel 和似然函数 Pl 的概念起着重要作用。下面给出定义

这两个函数。
定义 2：信任函数
bel : 2U  [0,1] ，且 bel ( A)   m( B ) 。
B A
命题 A 的信任函数的值是 A 的所有子集的基本概率赋值函数 m( B )( B  A) 的数值和，即
信任函数 bel ( A) 表示对 A 的总信任程度。
显然， bel ( )  0 ， bel (U )  0 。在仅有单元素的集上， m( A) 与 bel ( A) 是相等的。
定义 3：似然函数
Pl : 2U  [0,1] ，且 Pl ( A)  1  bel (A)  
B  A 
m( B )
其中 A  U  A 。Pl ( A) 表示不否定 A 的信任度，它是所有与 A 相交子集的基本概率赋值
函数 m( B )( B  A   ) 数值和。
显然， bel ( A) 和 Pl ( A) 满足下面的关系：
Pl ( A)  bel ( A)
Pl ( )  bel ()  0
Pl (U )  bel (U )  1
Pl ( A)  1  bel (A)
bel ( A)  bel (A)  1
Pl ( A)  Pl (A)  1
而 Pl ( A)  bel (A) 表示了既不信任 A ，也不信任 A 的一种度量，即表示对 A 不知道的
度量。
在 D-S 证据理论中，由于缺少关于总概率的分配信息，所以不能确切的知道概率是如
何分配给每个元素 x  U 的，因而也就不可能计算与 U 的子集 A 的概率 P ( A) 。这样，我们
就采取用区间 (bel ( A), Pl ( A)) 来描述 A 的不确定性。 bel ( A) 表示度量的下限， Pl ( A) 表
示度量的上限，即
bel ( A)  P ( A)  Pl ( A)
当 (bel ( A), Pl ( A))  (1,1) 时，因为此时 bel ( A)  1 ，说明对 A 信任；另一方面，由于
Pl ( A)  1 ，即 bel (A)  1  Pl ( A)  1  1  0 ，说明对 A 不信任。所以
(bel ( A), Pl ( A))  (1,1) 表示 A 为真。
当 (bel ( A), Pl ( A))  (0, 0) 时，因为此时 bel ( A)  0 ，说明对 A 不信任；另一方面，
由于 Pl ( A)  0 ，即 bel (A)  1  Pl ( A)  1  0  1 ，说明对 A 信任。所以
(bel ( A), Pl ( A))  (0, 0) 表示 A 为假。
当 (bel ( A), Pl ( A))  (0,1) 时，因为此时 bel ( A)  0 ，说明对 A 不信任；另一方面，
由于 Pl ( A)  1 ，即 bel (A)  1  Pl ( A)  1  1  0 ，说明对 A 不信任。所以
(bel ( A), Pl ( A))  (0,1) 表示对 A 一无所知。
当 (bel ( A), Pl ( A))  (0.25,1) 时，因为此时 bel ( A)  0.25 ，说明对 A 信任是 0.25；另
一方面，由于 Pl ( A)  1 ，即 bel (A)  1  Pl ( A)  1  1  0 ，说明对 A 不信任。所以
(bel ( A), Pl ( A))  (0.25,1) 表示 A 为真的置信度是 0.25。
当 (bel ( A), Pl ( A))  (0, 0.75) 时，因为此时 bel ( A)  0 ，说明对 A 不信任；另一方面，
由于 Pl ( A)  0.75 ，即 bel (A)  1  Pl ( A)  1  0.75  0.25 ，说明对 A 的信任是 0.25。
所以 (bel ( A), Pl ( A))  (0, 0.75) 表示 A 为假的置信度是 0.25。
当 (bel ( A), Pl ( A))  (0.25, 0.65) 时，因为此时 bel ( A)  0.25 ，说明对 A 为真有一定程度
的信任；另一方面，由于 Pl ( A)  0.65 ，即 bel (A)  1  Pl ( A)  1  0.65  0.35 ，说明
对 A 的信任是 0.35，即是对 A 为假有一定的信任程度。
由上述讨论可知， bel ( A) 表示对 A 为真的信任程度， bel (A) 表示对 A 的信任程度，
而 Pl ( A) 表示对 A 为非假的信任程度，而 Pl ( A)  bel ( A) 则表示对 A 不知道的程度，即既
非信任 A 又非不信任的那部分。
2. 证据的组合
对于相同的证据，由于来源不同，可能得不同的基本概率赋值函数， D-S 证据理论采

用正交和来组合这些函数。
设 m1 , m2 ,..., mn 为 2 上的 n 个基本概率赋值函数，它们的正交和表示为
U
m  m1  m2  ...  mn ，且定义为
m ( )  0 ，
m( A)  K 1   m (A )
i Ai  A i i  n
i i
其中
K   m ( A ) 。若 K  0 ，认为 m ( A ) 之间是矛盾的。
i Ai  1i  n
i i
i i
例：设 U  {a, b} ，且从不同的证据源得知概率赋值函数分别为
m1 (,{a},{b},{a, b})  (0, 0.4, 0.5, 0.1) ，
m2 (,{a},{b},{a, b})  (0, 0.6, 0.2, 0.2) 。求正交和 m  m1  m2 。
解：
先求 K
K
 m1 ({a}) * m2 ({a})  m1 ({a}) * m2 ({a, b})  m1 ({b}) * m2 ({b})
 m1 ({b}) * m2 ({a, b})  m1 ({a, b}) * m2 ({b})  m1 ({a, b}) * m2 ({a, b}) K-1=
 0.4*0.6  0.4*0.2  0.5*0.2  0.5*0.2  0.1*0.6  0.1*0.2  0.1*0.2
 0.62
再求 m( A)
m({a})  [1/ 0.62]*[m1 ({a}) * m2 ({a})  m1 ({a, b}) * m2 ({a})  m1 ({a}) * m2 ({a, b})]
 [1/ 0.62]*[0.4*0.6  0.1*0.6  0.4*0.2]
 0.61
m({b})  [1/ 0.62]*[m1 ({b}) * m2 ({b})  m1 ({a, b}) * m2 ({b})  m1 ({b}) * m2 ({a, b})]
 [1/ 0.62]*[0.5*0.2  0.1*0.2  0.5*0.2]
 0.36
m({a, b})  [1/ 0.62]*[m1 ({a, b}) * m2 ({a, b})]
 [1/ 0.62]*[0.1*0.2]
 0.03
所以有 m(,{a},{b},{a, b})  (0, 0.61, 0.36, 0.03)
3. D-S 证据理论的推理
3.1 知识表示
设某领域的假设集合为 U  {s1 , s2 ,..., sn } ，命题 A, B, C ,... ...是 U 的子集，系统的推
理规则表示为:
IF E THEN H, cF
其中E为证据，H为假设，它们是命题的逻辑组合，cF为置信度因子。
命题和置信度因子可表示为
A  {a1 , a2 ,..., ak }
cF  {c1 , c2 ,..., ck }
其中 ci 用来描述 ai 的置信度， i  1, 2,3,..., k
对任何命题A，A的置信度cF应满足:
1. ci  0,1  i  k
2. c
i 1
i 1
3.2 证据描述
设 m 为 2 上定义的基本概率赋值函数，它应该满足下面的条件：
U
1. m({si })  0, 对于si  U ;
2.  m({s })  1 ;
i 1
i
3. m(U )  1   m({si })
i 1
4. m( A)  0, 对于 A  U ，且|A|>1或|A|=0，其中|A|表示命题A中的元素的个数。
若 m1 和 m2 为 2 上的两个基本概率赋值函数，则它们的正交和为
U
m({si })=(1/K)*[m1 ({si})*m 2 ({si})+m1 ({si})*m 2 (U)+m1 (U)*m 2 ({si})]
其中
K 
X Y 
m1 ( X )m2 (Y )
。
如果 K  0 ，则表示 m1 和 m2 矛盾。在 K  0 的条件下，根据定义 2 和定义 3，可以得
到信任函数 bel ( A) 和似然函数 Pl ( A) 。
显然，对于任何 A  U ，都有 Pl ( A)  bel ( A) 。并且对于任意命题 A  U ， B  U ,
都有 Pl ( A)  bel ( A)  Pl ( B )  bel ( B )  m(U ) 。
在 D-S 证据理论中，还利用 Pl ( A) 和 bel ( A) 定义命题 A 的类概率函数 f ( A) ，作为命
题确定性的度量。设 U 为有限域，对任何命题 A  U ，命题 A 的类概率函数为
A
f ( A)  bel ( A)  [ Pl ( A) - bel ( A)]
U
其中 | A | 和 | U | 分别是 A 和 U 中元素的个数。
易于证明，类概率函数 f ( A) 具有如下的性质：
1.  f ({a})  1 ；
aU
2.对于任何 AÍU，有 bel ( A)  f ( A)  Pl ( A) ；
3.对任何 A  U ，有 f (A)  1  f ( A) 。
由上结论，可以得到：
1. f ( )  0 ;
2. f (U )  0 ;
3. 0  f ( A)  1 , 对于任何 A  U 。
3.3不确定推理
在下面的讨论中，我们将所有输入的已知数据、条件部分和假设部分的命题都称为证据，
并且据此来分别讨论规则的条件部分和结论部分命题的确定性。
若 A 是规则条件部分的命题，在证据 E'的条件下，命题 A 与证据 E'的匹配程度定义为
 1 A的所有元素都出现在E'
MD( A, E ' )   。
 0 其他
那么，规则的条件部分命题 A 得确定性为
cER( A)  MD( A, E ') * f ( A)
由于 f ( A)  [0,1] ，所以有 cER ( A)  [0,1] 。
在规则的条件部分为若干个命题的逻辑组合的情况下，整个条件部分的确定性是：
1.若 A  A1 AND A2 AND... AND An ，则
cER( A)  cER ( A1 AND A2 AND... AND An )

 min{cER( A1 ), cER( A2 ),..., cER ( An )}
2.若 A  A1 OR A2 OR...OR An ，则
cER( A)  cER ( A1 OR A2 OR...OR An )

 max{cER( A1 ), cER ( A2 ),..., cER( An )}
对于规则的假设部分的命题确定性，如果有规则
IF E THEN H  {h1 , h2 ,..., hk }, cF  {c1 , c2 ,...ck } ，且 U  {h1 , h2 ,..., hk } ，则 U 上的基本
概率赋值函数为
m({h1},{h2 },...,{hk })  {cER( E ) * c1 , cER ( E ) * c2 ,..., cER( E ) * ck }
根据上述的基本概率赋值函数 m 就可以求出假设部分的信任函数、似然函数、类概率函
数和确定性。
如果有几种类规则支持同一命题时，总的基本概率赋值函数 m 为各规则假设得到的基
本概率赋值函数的正交和，即 m  m1  m2  ...  mn 。
4. D-S 方法的特点
1、D-S 证据理论满足必概率论更弱的公理系统。当 A  1 ，且 m( A)  0 时，证据理论
就退化为概率论；当 m( Ai )  0 (i=1,2,…,n)，且有 A1  A2  ...  An 时，证据理论退化为
可能性理论。
2、证据理论可以区分不知道和不确定的情况。
3、证据理论可以依靠证据的积累，不断的缩小假设集合。例如，证据可能与子集相
关，而不是与单元素集合相关，这样就能较好的逐步缩小诊断的目标。如：心血管疾病→
心脏病→左心室疾病→专门诊断。
4、由 D-S 证据理论所计算的结果在数值上有时缺乏稳定性，基本概率赋值函数 bPA 的
一个很小变化可能导致结果有较大的改变，而且当支持的证据不一致时，比如当两个信任
函
数的焦元不相交时，D-S 证据理论的规则就无法使用。
5、D-S 证据理论要求辨别框中的元素满足相互排斥的条件，这个条件在实际系统中不
易得到满足，而且基本概率赋值函数要求给的值太多，计算比较复杂。

D S证据理论

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

D S证据理论

Uploaded by

Copyright:

Available Formats

D-S 证据理论

D-S 证据理论由 Dempster 于 1967 年提出，其学生 Shafer 将其发展并整理成一套完整的

设 U 表示所有可能假设的集合，且 U 的元素的个数为 N ，则 U 的幂集合 2 中的元

素个数为 2 ，每个幂集合的元素对应于一个关于假设取值的命题。同时，我们称 U 为辨别

定义 1：基本概率赋值函数(bPA, basic Probability Assignment)

基本概率赋值函数 m( A) 表示证据对 U 的子集 A 的一种信任度量。 m( A) 的意义是：

（1）若 A  U ,且 A  U ，则 m( A) 表示对 A 的确定信任度;

（3）若 A  U ，且 m( A)  0 ，则称 A 是 m 的一个焦元（Focal element）。

例如： U  {a, b, c} ，则 2 上的一个基本概率赋值函数 m 可以表示为：

m(,{a},{b},{c},{a, b},{a, c},{b, c},{a, b, c})

特别值得注意的是： m({a})  m({b})  m({c})  0.3  0.1  0  0.4  1 。因此不应该

在 D-S 证据理论中，信任函数 bel 和似然函数 Pl 的概念起着重要作用。下面给出定义

命题 A 的信任函数的值是 A 的所有子集的基本概率赋值函数 m( B )( B  A) 的数值和，即

信任函数 bel ( A) 表示对 A 的总信任程度。

显然， bel ( )  0 ， bel (U )  0 。在仅有单元素的集上， m( A) 与 bel ( A) 是相等的。

其中 A  U  A 。Pl ( A) 表示不否定 A 的信任度，它是所有与 A 相交子集的基本概率赋值

显然， bel ( A) 和 Pl ( A) 满足下面的关系：

bel ( A)  bel (A)  1

而 Pl ( A)  bel (A) 表示了既不信任 A ，也不信任 A 的一种度量，即表示对 A 不知道的

何分配给每个元素 x  U 的，因而也就不可能计算与 U 的子集 A 的概率 P ( A) 。这样，我们

就采取用区间 (bel ( A), Pl ( A)) 来描述 A 的不确定性。 bel ( A) 表示度量的下限， Pl ( A) 表

当 (bel ( A), Pl ( A))  (1,1) 时，因为此时 bel ( A)  1 ，说明对 A 信任；另一方面，由于

(bel ( A), Pl ( A))  (1,1) 表示 A 为真。

当 (bel ( A), Pl ( A))  (0, 0) 时，因为此时 bel ( A)  0 ，说明对 A 不信任；另一方面，

(bel ( A), Pl ( A))  (0, 0) 表示 A 为假。

当 (bel ( A), Pl ( A))  (0,1) 时，因为此时 bel ( A)  0 ，说明对 A 不信任；另一方面，

(bel ( A), Pl ( A))  (0,1) 表示对 A 一无所知。

一方面，由于 Pl ( A)  1 ，即 bel (A)  1  Pl ( A)  1  1  0 ，说明对 A 不信任。所以

(bel ( A), Pl ( A))  (0.25,1) 表示 A 为真的置信度是 0.25。

当 (bel ( A), Pl ( A))  (0, 0.75) 时，因为此时 bel ( A)  0 ，说明对 A 不信任；另一方面，

由于 Pl ( A)  0.75 ，即 bel (A)  1  Pl ( A)  1  0.75  0.25 ，说明对 A 的信任是 0.25。

所以 (bel ( A), Pl ( A))  (0, 0.75) 表示 A 为假的置信度是 0.25。

的信任；另一方面，由于 Pl ( A)  0.65 ，即 bel (A)  1  Pl ( A)  1  0.65  0.35 ，说明

对 A 的信任是 0.35，即是对 A 为假有一定的信任程度。

由上述讨论可知， bel ( A) 表示对 A 为真的信任程度， bel (A) 表示对 A 的信任程度，

而 Pl ( A) 表示对 A 为非假的信任程度，而 Pl ( A)  bel ( A) 则表示对 A 不知道的程度，即既

对于相同的证据，由于来源不同，可能得不同的基本概率赋值函数， D-S 证据理论采

例：设 U  {a, b} ，且从不同的证据源得知概率赋值函数分别为

m1 (,{a},{b},{a, b})  (0, 0.4, 0.5, 0.1) ，

m2 (,{a},{b},{a, b})  (0, 0.6, 0.2, 0.2) 。求正交和 m  m1  m2 。

所以有 m(,{a},{b},{a, b})  (0, 0.61, 0.36, 0.03)

设某领域的假设集合为 U  {s1 , s2 ,..., sn } ，命题 A, B, C ,... ...是 U 的子集，系统的推

其中 ci 用来描述 ai 的置信度， i  1, 2,3,..., k

m({si })=(1/K)*[m1 ({si})*m 2 ({si})+m1 ({si})*m 2 (U)+m1 (U)*m 2 ({si})]

如果 K  0 ，则表示 m1 和 m2 矛盾。在 K  0 的条件下，根据定义 2 和定义 3，可以得

到信任函数 bel ( A) 和似然函数 Pl ( A) 。

显然，对于任何 A  U ，都有 Pl ( A)  bel ( A) 。并且对于任意命题 A  U ， B  U ,

都有 Pl ( A)  bel ( A)  Pl ( B )  bel ( B )  m(U ) 。

在 D-S 证据理论中，还利用 Pl ( A) 和 bel ( A) 定义命题 A 的类概率函数 f ( A) ，作为命

题确定性的度量。设 U 为有限域，对任何命题 A  U ，命题 A 的类概率函数为

2.对于任何 AÍU，有 bel ( A)  f ( A)  Pl ( A) ；

由于 f ( A)  [0,1] ，所以有 cER ( A)  [0,1] 。

1.若 A  A1 AND A2 AND... AND An ，则

cER( A)  cER ( A1 AND A2 AND... AND An )

cER( A)  cER ( A1 OR A2 OR...OR An )

1、D-S 证据理论满足必概率论更弱的公理系统。当 A  1 ，且 m( A)  0 时，证据理论

就退化为概率论；当 m( Ai )  0 (i=1,2,…,n)，且有 A1  A2  ...  An 时，证据理论退化为

You might also like

m({si })=(1/K)[m1 ({si})m 2 ({si})+m1 ({si})m 2 (U)+m1 (U)m 2 ({si})]