You are on page 1of 8

D-S 证据理论

D-S 证据理论由 Dempster 于 1967 年提出,其学生 Shafer 将其发展并整理成一套完整的


数学推理理论。该理论提出的初期并没有引起人们的重视,直到 80 年代 Barnett、Friedman
等人将这个方法应用于专家系统,才认识到它具有利用证据的积累可以缩小假设置信区间
的重要优点。
D-S 证据理论能够处理由不知道而引起的不确定性。D-S 证据理论可以看作是有限域上
对经典概率推理理论的一般化扩展,其主要特性是支持描述不同等级的精确度和直接引入
了对未知不确定性的描述。D-S 证据理论可以支持概率推理、诊断、风险分析以及决策支持等,
并在多传感器网络、医疗诊断等应用领域内得到了具体应用。

1. 证据的不确定性

设 U 表示所有可能假设的集合,且 U 的元素的个数为 N ,则 U 的幂集合 2 中的元


U

素个数为 2 ,每个幂集合的元素对应于一个关于假设取值的命题。同时,我们称 U 为辨别


N

框(frame of discernment)。

定义 1:基本概率赋值函数(bPA, basic Probability Assignment)


m:2 U  [0,1] ,且 m( )  0 ,  m( A)  1 。
AU

基本概率赋值函数 m( A) 表示证据对 U 的子集 A 的一种信任度量。 m( A) 的意义是:

(1)若 A  U ,且 A  U ,则 m( A) 表示对 A 的确定信任度;

(2)若 A  U ,则 m( A) 表示这个数不知如何分配;

(3)若 A  U ,且 m( A)  0 ,则称 A 是 m 的一个焦元(Focal element)。

例如: U  {a, b, c} ,则 2 上的一个基本概率赋值函数 m 可以表示为:


U

m(,{a},{b},{c},{a, b},{a, c},{b, c},{a, b, c})


 (0, 0.3, 0.1, 0, 0.2, 0.2, 0, 0.2)

其中, m({a})  0.3 表示对命题 a 的信任度为 0.3; m({a, b, c})  0.2 表示 0.2 不知如

何分配。

特别值得注意的是: m({a})  m({b})  m({c})  0.3  0.1  0  0.4  1 。因此不应该

将 基 本 概 率 赋 值 函 数 理 解 成 概 率 函 数 。 因 为 对 于 概 率 函 数 P,
P ({a})  P ({b})  P ({c})  1 。

在 D-S 证据理论中,信任函数 bel 和似然函数 Pl 的概念起着重要作用。下面给出定义


这两个函数。
定义 2:信任函数
bel : 2U  [0,1] ,且 bel ( A)   m( B ) 。
B A

命题 A 的信任函数的值是 A 的所有子集的基本概率赋值函数 m( B )( B  A) 的数值和,即

信任函数 bel ( A) 表示对 A 的总信任程度。

显然, bel ( )  0 , bel (U )  0 。在仅有单元素的集上, m( A) 与 bel ( A) 是相等的。

定义 3:似然函数
Pl : 2U  [0,1] ,且 Pl ( A)  1  bel (A)  
B  A 
m( B )

其中 A  U  A 。Pl ( A) 表示不否定 A 的信任度,它是所有与 A 相交子集的基本概率赋值

函数 m( B )( B  A   ) 数值和。

显然, bel ( A) 和 Pl ( A) 满足下面的关系:

Pl ( A)  bel ( A)

Pl ( )  bel ()  0

Pl (U )  bel (U )  1

Pl ( A)  1  bel (A)

bel ( A)  bel (A)  1

Pl ( A)  Pl (A)  1

而 Pl ( A)  bel (A) 表示了既不信任 A ,也不信任 A 的一种度量,即表示对 A 不知道的

度量。
在 D-S 证据理论中,由于缺少关于总概率的分配信息,所以不能确切的知道概率是如

何分配给每个元素 x  U 的,因而也就不可能计算与 U 的子集 A 的概率 P ( A) 。这样,我们

就采取用区间 (bel ( A), Pl ( A)) 来描述 A 的不确定性。 bel ( A) 表示度量的下限, Pl ( A) 表

示度量的上限,即
bel ( A)  P ( A)  Pl ( A)

当 (bel ( A), Pl ( A))  (1,1) 时,因为此时 bel ( A)  1 ,说明对 A 信任;另一方面,由于

Pl ( A)  1 , 即 bel (A)  1  Pl ( A)  1  1  0 , 说 明 对 A 不 信 任 。 所 以

(bel ( A), Pl ( A))  (1,1) 表示 A 为真。

当 (bel ( A), Pl ( A))  (0, 0) 时,因为此时 bel ( A)  0 ,说明对 A 不信任;另一方面,

由 于 Pl ( A)  0 , 即 bel (A)  1  Pl ( A)  1  0  1 , 说 明 对 A 信 任 。 所 以

(bel ( A), Pl ( A))  (0, 0) 表示 A 为假。

当 (bel ( A), Pl ( A))  (0,1) 时,因为此时 bel ( A)  0 ,说明对 A 不信任;另一方面,

由 于 Pl ( A)  1 , 即 bel (A)  1  Pl ( A)  1  1  0 , 说 明 对 A 不 信 任 。 所 以

(bel ( A), Pl ( A))  (0,1) 表示对 A 一无所知。

当 (bel ( A), Pl ( A))  (0.25,1) 时,因为此时 bel ( A)  0.25 ,说明对 A 信任是 0.25;另

一方面,由于 Pl ( A)  1 ,即 bel (A)  1  Pl ( A)  1  1  0 ,说明对 A 不信任。所以

(bel ( A), Pl ( A))  (0.25,1) 表示 A 为真的置信度是 0.25。

当 (bel ( A), Pl ( A))  (0, 0.75) 时,因为此时 bel ( A)  0 ,说明对 A 不信任;另一方面,

由于 Pl ( A)  0.75 ,即 bel (A)  1  Pl ( A)  1  0.75  0.25 ,说明对 A 的信任是 0.25。

所以 (bel ( A), Pl ( A))  (0, 0.75) 表示 A 为假的置信度是 0.25。

当 (bel ( A), Pl ( A))  (0.25, 0.65) 时,因为此时 bel ( A)  0.25 ,说明对 A 为真有一定程度

的信任;另一方面,由于 Pl ( A)  0.65 ,即 bel (A)  1  Pl ( A)  1  0.65  0.35 ,说明

对 A 的信任是 0.35,即是对 A 为假有一定的信任程度。

由上述讨论可知, bel ( A) 表示对 A 为真的信任程度, bel (A) 表示对 A 的信任程度,

而 Pl ( A) 表示对 A 为非假的信任程度,而 Pl ( A)  bel ( A) 则表示对 A 不知道的程度,即既

非信任 A 又非不信任的那部分。
2. 证据的组合

对于相同的证据,由于来源不同,可能得不同的基本概率赋值函数, D-S 证据理论采


用正交和来组合这些函数。

设 m1 , m2 ,..., mn 为 2 上 的 n 个 基 本 概 率 赋 值 函 数 , 它 们 的 正 交 和 表 示 为
U

m  m1  m2  ...  mn ,且定义为

m ( )  0 ,

m( A)  K 1   m (A )
i Ai  A i i  n
i i

其中
K   m ( A ) 。若 K  0 ,认为 m ( A ) 之间是矛盾的。
i Ai  1i  n
i i
i i

例:设 U  {a, b} ,且从不同的证据源得知概率赋值函数分别为

m1 (,{a},{b},{a, b})  (0, 0.4, 0.5, 0.1) ,

m2 (,{a},{b},{a, b})  (0, 0.6, 0.2, 0.2) 。求正交和 m  m1  m2 。

解:
先求 K
K
 m1 ({a}) * m2 ({a})  m1 ({a}) * m2 ({a, b})  m1 ({b}) * m2 ({b})
 m1 ({b}) * m2 ({a, b})  m1 ({a, b}) * m2 ({b})  m1 ({a, b}) * m2 ({a, b}) K-1=
 0.4*0.6  0.4*0.2  0.5*0.2  0.5*0.2  0.1*0.6  0.1*0.2  0.1*0.2
 0.62

再求 m( A)

m({a})  [1/ 0.62]*[m1 ({a}) * m2 ({a})  m1 ({a, b}) * m2 ({a})  m1 ({a}) * m2 ({a, b})]
 [1/ 0.62]*[0.4*0.6  0.1*0.6  0.4*0.2]
 0.61

m({b})  [1/ 0.62]*[m1 ({b}) * m2 ({b})  m1 ({a, b}) * m2 ({b})  m1 ({b}) * m2 ({a, b})]
 [1/ 0.62]*[0.5*0.2  0.1*0.2  0.5*0.2]
 0.36
m({a, b})  [1/ 0.62]*[m1 ({a, b}) * m2 ({a, b})]
 [1/ 0.62]*[0.1*0.2]
 0.03

所以有 m(,{a},{b},{a, b})  (0, 0.61, 0.36, 0.03)

3. D-S 证据理论的推理

3.1 知识表示

设某领域的假设集合为 U  {s1 , s2 ,..., sn } ,命题 A, B, C ,... ...是 U 的子集,系统的推

理规则表示为:
IF E THEN H, cF
其中E为证据,H为假设,它们是命题的逻辑组合,cF为置信度因子。
命题和置信度因子可表示为
A  {a1 , a2 ,..., ak }

cF  {c1 , c2 ,..., ck }

其中 ci 用来描述 ai 的置信度, i  1, 2,3,..., k

对任何命题A,A的置信度cF应满足:

1. ci  0,1  i  k

2. c
i 1
i 1

3.2 证据描述

设 m 为 2 上定义的基本概率赋值函数,它应该满足下面的条件:
U

1. m({si })  0, 对于si  U ;

2.  m({s })  1 ;
i 1
i

3. m(U )  1   m({si })
i 1

4. m( A)  0, 对于 A  U ,且|A|>1或|A|=0,其中|A|表示命题A中的元素的个数。
若 m1 和 m2 为 2 上的两个基本概率赋值函数,则它们的正交和为
U

m({si })=(1/K)*[m1 ({si})*m 2 ({si})+m1 ({si})*m 2 (U)+m1 (U)*m 2 ({si})]

其中
K 
X Y 
m1 ( X )m2 (Y )

如果 K  0 ,则表示 m1 和 m2 矛盾。在 K  0 的条件下,根据定义 2 和定义 3,可以得

到信任函数 bel ( A) 和似然函数 Pl ( A) 。

显然,对于任何 A  U ,都有 Pl ( A)  bel ( A) 。并且对于任意命题 A  U , B  U ,

都有 Pl ( A)  bel ( A)  Pl ( B )  bel ( B )  m(U ) 。

在 D-S 证据理论中,还利用 Pl ( A) 和 bel ( A) 定义命题 A 的类概率函数 f ( A) ,作为命

题确定性的度量。设 U 为有限域,对任何命题 A  U ,命题 A 的类概率函数为

A
f ( A)  bel ( A)  [ Pl ( A) - bel ( A)]
U

其中 | A | 和 | U | 分别是 A 和 U 中元素的个数。

易于证明,类概率函数 f ( A) 具有如下的性质:

1.  f ({a})  1 ;
aU

2.对于任何 AÍU,有 bel ( A)  f ( A)  Pl ( A) ;

3.对任何 A  U ,有 f (A)  1  f ( A) 。

由上结论,可以得到:

1. f ( )  0 ;

2. f (U )  0 ;

3. 0  f ( A)  1 , 对于任何 A  U 。

3.3不确定推理
在下面的讨论中,我们将所有输入的已知数据、条件部分和假设部分的命题都称为证据,
并且据此来分别讨论规则的条件部分和结论部分命题的确定性。
若 A 是规则条件部分的命题,在证据 E'的条件下,命题 A 与证据 E'的匹配程度定义为
 1 A的所有元素都出现在E'
MD( A, E ' )   。
 0 其他

那么,规则的条件部分命题 A 得确定性为
cER( A)  MD( A, E ') * f ( A)

由于 f ( A)  [0,1] ,所以有 cER ( A)  [0,1] 。

在规则的条件部分为若干个命题的逻辑组合的情况下,整个条件部分的确定性是:

1.若 A  A1 AND A2 AND... AND An ,则

cER( A)  cER ( A1 AND A2 AND... AND An )


 min{cER( A1 ), cER( A2 ),..., cER ( An )}

2.若 A  A1 OR A2 OR...OR An ,则

cER( A)  cER ( A1 OR A2 OR...OR An )


 max{cER( A1 ), cER ( A2 ),..., cER( An )}

对 于 规 则 的 假 设 部 分 的 命 题 确 定 性 , 如 果 有 规 则
IF E THEN H  {h1 , h2 ,..., hk }, cF  {c1 , c2 ,...ck } ,且 U  {h1 , h2 ,..., hk } ,则 U 上的基本

概率赋值函数为
m({h1},{h2 },...,{hk })  {cER( E ) * c1 , cER ( E ) * c2 ,..., cER( E ) * ck }

根据上述的基本概率赋值函数 m 就可以求出假设部分的信任函数、似然函数、类概率函
数和确定性。
如果有几种类规则支持同一命题时,总的基本概率赋值函数 m 为各规则假设得到的基

本概率赋值函数的正交和,即 m  m1  m2  ...  mn 。

4. D-S 方法的特点

1、D-S 证据理论满足必概率论更弱的公理系统。当 A  1 ,且 m( A)  0 时,证据理论

就退化为概率论;当 m( Ai )  0 (i=1,2,…,n),且有 A1  A2  ...  An 时,证据理论退化为

可能性理论。
2、证据理论可以区分不知道和不确定的情况。
3、证据理论可以依靠证据的积累,不断的缩小假设集合。例如,证据可能与子集相
关,而不是与单元素集合相关,这样就能较好的逐步缩小诊断的目标。如:心血管疾病→
心脏病→左心室疾病→专门诊断。
4、由 D-S 证据理论所计算的结果在数值上有时缺乏稳定性,基本概率赋值函数 bPA 的
一个很小变化可能导致结果有较大的改变,而且当支持的证据不一致时,比如当两个信任

数的焦元不相交时,D-S 证据理论的规则就无法使用。
5、D-S 证据理论要求辨别框中的元素满足相互排斥的条件,这个条件在实际系统中不
易得到满足,而且基本概率赋值函数要求给的值太多,计算比较复杂。