在线社会网络中面向节点影响力的信息传播阻断模型

I
SSN１０００Ｇ００５４清华大学学报 (自然科学版) ２０１７年第５７卷第１２期３/１６

　
CN１１Ｇ２２２３/N 　JTs
inghuaUn
iv(
Sc l),２０１７,Vo
i& Techno l．５７, No．
１２１２４５
Ｇ１２５３
在线社会网络中面向节点影响力的信息传播阻断模型
赵　宇１,２ ,　黄开枝１,２ ,　郭云飞１ ,　赵　星１,２

(
１．国家数字交换系统工程技术研究中心,郑州４５０００２;２．移动互联网安全技术国家工程实验室,北京１００８７６)
摘　要:目前信息传播阻断模型是在网络中选择并删除 l SAA．Theprob
lemisthenenc
odedasamixedi
ntegerp
rogramming
(MIP)p
rob
lem．F i
nal
ly,aquan t
um gene
tica
lgori
thm i
sus edto
个最佳节点(边)使信息传播到的节点数量最小,该模型未
s
ele
ctt
hebe
stlnode
sandr
emovet
hem．S
imu
lat
ionsshowt
hatt
he
考虑信息传播节点的影响力,导致选择的l 个最佳节点(边)
be
stl node
sse
lec
ted by t
his mode
lin
fluenc
ethe i
nfo
rma
tion
并不准确,阻断有效性较差.针对此问题,该文提出一种面 d
iff
usi
onove
rasma
lle
rrangeandt
hep
roc
ess
ingt
imei
ssho
rte
rthan
向节点影响力的信息传播阻断模型,并设计了一种基于采 t
het
rad
iti
ona
lmode
l．
样平均近似的求解方法.模型以网络中节点的影响力为有 Ke
ywo
rds:soc
ial network; informat
ion d i
ffus
ion b lo
ckng;
i
效性依据,通过选择并删除l 个最佳节点来改变网络结构, minimum inf
l e; s
uenc t
ochast
ic opt
imiza
tion; mi
xed
i
ntegerp
rogramming (MIP)
使信息传播到的目标节点影响力之和最小;该模型为随机
优化问题,首先利用采样平均近似将目标函数转化为确定
性问题,其次进一步编码为混合整数规划问题,最后采用一以微信和微博为代表的在线社会网络已经成为
种量子遗传算法解决该问题得到l 个最佳节点并将其删除. 人们日常交流的重要工具,是民意集中表达与反映
仿真结果表明:相比于传统模型,通过本模型选择的l 个最
的平台.在给人们获取信息带来便利性的同时,该
佳节点能够将信息传播的影响力控制在更小的范围,且处
平台上也传播着大量有害信息,给人们正常生活造
理时间更短.
成了不良影响,甚至影响社会和谐,危害国家安
关键词:在线社会网络;信息传播阻断;影响力最小;随机
全.在线社会网络具有规模大和结构复杂等特点,
优化;混合整数编码
很难根除有害信息的产生,通过改变网络结构等方
中图分类号:TN９１５．
８１文献标志码:A 式来阻断信息传播是目前可行的解决途径,因此,
文章编号:１０００
Ｇ００５４(
２０１７)
１２Ｇ
１２４５
Ｇ０９
对信息传播阻断方法的研究已经成为热点 [１２].
DOI:１０．
１６５１１/
j．cnk
i．qhdxxb．
２０１７．
２５．
０６１
信息传播阻断模型主要在信息传播源点数量和
位置确定的条件下,研究选择并删除 l 个节点或
I
nformat
iondiff
usionb
locki
ngmod e
lo fnod
e 边,使信息传播到的节点数量最少.目前信息传播
in
flu
enceＧ
ori
entedinonl
ineso
cia
ln etwo
rk 阻断问题的研究主要分为２类:一类是减小邻接矩
２,
１, ２,
１, １, １,
２阵最大特征值使得信息传播的最少节点数量低于爆
ZHAOYu HUANGKa
izh
i GUOYu
nfe
i ZHAOX
ing
(１．Nat
ionalDi
git
alSwi
tchi
ngSys
tem Engine
eri
ngand 发门限,２０１２年 Pr
aka
sh 等３提出了消息大规模传
[]
Te
chno
loi
gcalR & DCenter,Zh
engzhou４５０００２,Chna;
i 播门限理论,证明了消息大规模传播条件主要由网
２．Na
tiona
lEngine
eri
ngLaboratoryfo
rMobil
eNe
two
rk
, , )
络结构邻接矩阵的最大特征值和感染率决定,抑制
Se
cur
ity Beii
jgn １００８７６ Chi
na
信息传播只需使邻接矩阵的最大特征值(谱半径)减
Abst
ract:In
forma
tion d
iff
usi
on b
l ock
ing max
imiz
ationis us
edto
se
lectandde
let
ethebestlnodes(edges)t
omi n
imizethenumbero
f 少到爆发门限以下,该结论为后续信息传播阻断研
node
sre
cei
vingi
nfo
rma
tioni
nthene
two r,t
rk．Howeve he mode
l 究提供了理论依据.如何通过删除节点或边最快地
doe
sno
ttakei
ntoa
ccoun
tthenode
􀆳si
nfl
uenc
e wh
ich b
lockst
he
i
nfo
rma
tionf
lowandl
owe
rst
hee
ffi
cienc
y．Th
ispape
rpr
esen
tsan
i
nfo
rma
tion d
iff
usi
on b
lock
ing mode
ltha
tcons
ide
rst
he node
􀆳s 收稿日期:２０１７
Ｇ０４
Ｇ２４
in
fluence with a method based on the s
ampli
ng ave
rage
２０１６YFB０８０１６０５);
基金项目:国家“九七三”重点基础研究项目(
approxima
tion (
SAA)．The mode
lissel
ect
sanddel
etest
hebestl
６１５２１００３)
国家自然科学基金资助项目(
node
sto change t
he ne
two
rk s
truc
tur
e wh
ich mi
nimi
zing t
he
i
nfl
uenc
eoft
het
ar １９８４—),男,博士研究生.
作者简介:赵宇(
ge
tnode
s．Themode
lisas
tocha
sti
cop
timi
zat
ion
r
pob
lem wh
ichi
str
ans
fer
redi
nto a de
termi
nis
ticp
rob
lem us
ing 通信作者:黄开枝,教授,EＧma
il:huangka
izh
i＠t
singhua．
edu．
cn
１
　２４６清华大学学报 (自然科学版) ２０１７,
５７(
１２)
减小谱半径是 NP
Ｇcomp
let
e和 NP
Ｇha
rd 问题４ ,文如图１为独立级联的传播过程,在t０时刻,信息传
[]
[
５]以删除点或者边的代价最小为目标,设计了一播的源点节点１和２通过连接边将消息传播给邻居
种减小谱半径的贪心游走算法,得到近似度较高的节点３、４、５,其中节点３和５接收并转发该消息,
解.文[ ６]基于谱半径提出描述节点阻断信息传播用方块来表示,节点４没有继续转发该消息,用圆
能力的概念 Sh
iel
dVa lue,基于此概念设计了满足来表示;在t１时刻,与节点３和５连接的节点为６
子模型特征的阻断函数,并提出了平衡优化质量和和９,其中节点６接收并转发该消息,用三角来表
时间复杂度的 Ne
tSh
iel
d＋算法.另外一类是以信示,这一时刻节点１和２不会再接收并转发此消
息传播到的节点数量最小为直接目标,Kha li
l等７
[]
息;在t２时刻,节点６转发该消息,但是在该信息
以边活跃图模型为基础,得出通过删除边使信息传传播过程中没有节点继续接收,这一传播过程最终
播范围最小化问题满足超模型特征的结论,基于该接收消息的节点为３、４、５、６.
特征设计了有效的数据结构和最优近似算法,其阻
断效果优于启发式算法.此外,Zhang 等 [８]将删除
对象调整为以群组为单元,通过删除或者免疫最佳
的群组达到最佳阻断效果.
当前信息传播阻断问题研究的不足之处是其模
型只研究传播到节点的数量,并未考虑节点间影响
力的差异,导致阻断目标不精确,信息传播阻断的
有效性较差.例如,对不健康信息进行阻断时,更
应该考虑该信息对不同人群的危害,而不是只考虑
传播的范围,如该信息在青少年人群中传播的影响
图１　独立级联模型示意图
可能远大于在老年人中传播的影响;对国际政治谣
言进行阻断时,该谣言对于高级官员来说更加敏信息传播过程是在源点数量和位置固定的条件
感,若传播到了偏远山区,即使接收人数较多,其下,信息以独立级联的方式在网络中传播,最终传
产生的影响可能也相当有限.因此,阻断模型的目播到的节点数量用σ(
G)来表示:
标并不应只局限于信息传播到的范围,更应考虑对 σ(
G)＝ 􀰐x (G)．
v∈T
v (
１)
网络节点产生的总体影响.
其中:xv(
G)表示图 G 中目标节点集 T 中的节点v
为此,本文提出了一种面向节点影响力的信息
感染概率,是０~１间的随机变量,其分布受独立传
传播模型,并设计了一种基于采样平均近似的求解
播概率和网络结构影响;目标节点集 T ⊆V ,V 为
方法.在该模型中,阻断的有效性是以信息传播到
所有节点集.
的目标节点影响之和最小为目标,为此,模型引入
信息传播阻断目标函数是研究删除哪些节点或
了单个节点的影响力权值,通过选择并删除l 个最
者边使信息传播的范围最小:
佳节点,达到信息传播的有效阻断.
n(
mi σ(
Gl))． (
２)
１　问题描述
l
l 表示删除的节点集或者边集,Gl 表示删除
其中:
在线社会网络用 G＝ (
V ,E)来表示,其中,V 节点集或者边集k 后的网络结构.
和E 分别代表网络中所有节点和所有边的集合.信目前信息传播阻断模型只以信息传播到的节点
息传播采用独立级联模型 [９],即接收到信息的节点数量为目标,阻断的目标与实际需求存在较大偏
通过连接边将信息传播给其邻居节点,节点接收该
差,阻断有效性较差.具体如图２所示:节点用圆
信息并传播的概率为 pe,每条边的传播过程相互独
点表示,圆点的大小代表节点影响力的大小,设 N５
立.在线社会网络中节点对同一条信息通常只转发
影响力为α＞１,其他节点影响力为１.假设信息源
一次,采用递进式的模型来描述此现象,即若节点
点传播的信息会被每一个节点接收并转发,若选择
已进入转发消息状态后将不会再回到等待接收消息
并删除１个最佳节点使得阻断效果最为有效,则发
状态,此条件保证节点的状态不会回退,而且即使
现不同的有效性目标会选择不同的删除节点.如果
网络结构中存在环路,传播路径也不会出现环路.
以阻断信息传播节点的数为目标,则选择删除 N１
赵　宇,等:　在线社会网络中面向节点影响力的信息传播阻断模型１
　２４７
节点为最佳;如果以阻断信息传播节点影响力总和播的节点影响力之和最小.在本模型中删除节点方
为目标,则选择删除 N４节点为最佳;进一步如果法更为灵活,令删除节点动作为操作管理动作集
将节点的影响力大小都设置为１,则信息传播阻断 A＝ {
１,２,􀆺,L},其中单个操作动作的对象根据
中以节点数量最小化为目标,就是以节点影响力总需求可以设定为单个节点或一组节点Vl,并要求各
和最小化为目标的特例. 操作管理动作面向对象无交集且相互独立,则网络
L
中所有节点集 V 可以表示为 V ＝V０ ∪ ( ∪Vl ) ,其

l＝１
中 V０是所有删除操作中没有包括的节点.
为了便于表示操作管理动作的执行情况,令向
图２　信息阻断有效性示意图量YL 为具体的操作策略,该向量表示管理动作集
中删除动作 yl 的执行情况,yl 为０~１向量,yl 取
针对上述问题,本文引入单个节点的影响力权
１时代表执行了对应的删除动作l,yl 取０时代表
值,建立了面向影响力的信息传播阻断模型,并明
该删除动作l 没有执行.另外,删除网络中的节点
确了信息传播的有效性以影响力总和为目标;然
对网络结构造成了破坏,为每一个操作设定一定代
后,设计了一种基于采样平均近似的方法对该模型
价,令cl 表示删除节点动作l 的代价,操作动作的
进行求解,选择并删除l 个最佳节点,使信息传播
总代价限制在一定阈值 C 以内.因此,基于节点影
阻断更为有效.
响力的信息阻断目标函数如下所示:
２　面向影响力的信息传播阻断模型 n　σ(
mi G(YL )),
YL
２．
１　信息传播影响力定义 L (
４)
本文引入了单个节点的影响力权值 βv ( t．　 􀰐clyl ≤ C．
s．
G),该 l＝１
值与节点特征、网络结构和信息属性等内容相关, 其中:G(
YL )为执行了YL 策略的删除动作后的网络
影响力的权值可根据实际情况灵活定义.如考虑不结构图;σ(G(YL ))表示在 G(
YL )结构下,最终感染
健康信息对青少年的影响,则该权值应该依据不健目标节点影响力之和,
􀰐X
康信息对青少年人群节点产生的危害定义;如考虑
σ(
G(YL ))＝ v (
G(YL ))
βv(
G(YL ))． (
５)
谣言在异构网络中的传播范围,则该影响力权值应 v∈T
该以节点在网络中的连接性和中心性等条件为依　　在该模型中,求解目标函数得到的策略YL ,通
据;影响力权值βv ( 过执行策略YL 删除l 个最佳节点,便达到信息传
G)可采用文[
１０１３]等的研究
成果,由于其取值对建立信息传播阻断模型并无本播阻断效果最佳的目的.
质影响,故不针对影响力权值展开研究.基于单个２．
３　模型性质分析
节点的影响力权值和上述信息传播过程,定义网络如何确定l 个最佳节点并删除使信息传播影响
rd 问题４ ,通过对式(
力最小是 NPha ４)的分析发现
[]
中一组初始信息传播源点的最终影响力为
其不满足子模和超模特征,具体见性质１和性质２.
σ(
G)＝ 􀰐x (G)
β(
vG)．v (
３)
v∈T
性质１　传播影响力最小目标函数不满足子模
其中:目标节点集合 T 通常情况下可设置为所有节
特征.
点 V ,针对特殊应用场景也可能存在关注特定节点
证明:如图３所示,为便于量化,将删除节点
集合的情况,此时设置 T 是所有节点V 的子集.此
的代价设置为１,则删除节点的总代价直接对应着
外,本模型中初始信息传播集合 I 为固定值,并未
删除节点的数量.
３)中体现.该信息传播影响力的定义具有一
在式(
一个函数具备子模型特征的定义如下:对于集
定的普适性,若将影响力权值都设置为１,该定义
合 S⊆R⊂E,e∈E\R,若满足式(
６),则目标函数
就简化为信息传播的节点范围的定义.
具备子模特征.
２．
２　模型建立 f(
S∪ {
e})－f(
S)≥ f(
R∪ {
e})－f(
R)．
建立面向节点影响力的信息传播阻断模型:在 (６)
网络中存在固定初始传播源点集 I,通过选择并删　　子模特征的直观解释是集合 R 增加一个元素e
除l 个最佳节点的方式改变网络结构,使得信息传的边界收益要不大于其任何一个子集 S 增加一个
１
　２４８清华大学学报 (自然科学版) ２０１７,
５７(
１２)
元素e 的边界收益. 而
f(
R∪ {
e})－f(
R)＝－１－α,
即
f(
S∪ {
e})－f(
S)＞ f(
R∪ {
e})－f(
R),
７),证毕.
不满足式(
图３　目标函数不满足子模特征示意图
４)不满足子模型特征.
采用反证法举例说明式(
首先构造删除节点的集合并计算删除节点后信息传
播源点在整个网络中的影响力,假设删除节点的较
小节点集 S 为单点 N７ ,即 S＝ {
N７ },为了与子模
图４　目标函数不满足子模和超模特征示意图
函数一致,用 f(
x)表示 σ(
G),那么 f(
S)＝I－α,
其中I 是源点在整个网络中传播的最终影响力;接性质３　贪心算法不能保证传播影响力最小目
下来确定删除节点的较大集合 R＝ {N６ ,N７},则删标函数的解近似最优.
除节点集合 R 后的影响力为f{
R}＝I－α－１;选择证明:采用贪心算法的依据是目标函数满足子
删除的增量节点为 N５ ,即e＝N５ .此时, 模或者是超模特征,若满足,则贪心算法就能够达
f(
S∪ {
e})－f(
S)＝－２, 到近似比为( １－１/e－ε)近似最优解.性质１和性
而质２证明了式 (
４)不满足子模和超模特征,因此采
f(
R∪ {
e})－f(
R)＝－１, 用贪心算法可能会出现非常差的结果.例如在图２
即中,假设通过删除２个节点使影响力最小,若采用
f(
S∪ {
e})－f(
S)＜ f(
R∪ {
e})－f(
R), 贪心算法则采用每一轮删除一个影响力最佳的节
６),证毕.
不满足式( 点,最终结果为 N２、N４２个节点,删除节点后的影
性质２　传播影响力最小目标函数不满足超模响力为 I－４;而全局最优解是删除节点 N５、N６ ,
特征. 删除节点后的影响力为 I－２－α,此时,α 的值越
证明:若该目标函数具有超模特征,则对于集大,采用贪心算法的结果就越差,无法使用贪心算
合 S⊆R⊂E,e∈E\R,满足下式即可: 法得到近似最优解,为此本文设计了一种基于采样
f(
S∪ {
e})－f(
S)≤ f(
R∪ {
e})－f(
R)．平均近似的方法对该模型进行求解.
(７) ３　基于采样平均近似的求解方法
　　超模特征的直观解释是集合 R 增加元素e 的边
信息传播阻断模型中的影响力总和为随机变
界收益要大于等于其任何一个子集 S 增加元素e 的
量,模型为随机优化问题.因此,本文基于采样平
边界收益.
均近似 [１４]的方法解决该问题.
以图４为例,用反证法举例说明式 (
４)不满足
边界收益减少特征.首先构造删除节点的集合并计３．
１　采样平均近似
算删除节点后源点传播信息后的影响力,假设删除在复杂的网络结构中,即使消息发布源点已

的较小节点集 S 为单点 N２ ,即 S＝ {
N２ },用 f(
x) 知,推测信息在整个网络的传播过程也是困难的,
表示σ(
G),那么 f(
S)＝I－２;然后选择删除节点但表示节点感染概率的随机变量 Xv (
G)在网络空
的较大集合为 R＝ {
N２ ,N５},则删除节点后的影响
间中的分布概率是确定的,该概率分布不依赖具体
力为 f{ 选择的删除节点策略.随机变量 Xv(
G)的具体采样
R}＝I－３;选择删除的增量节点为 N６ ,即
e＝N６ .此时,
值可以通过一次信息传播过程来确定,信息传播路
′,为了能够快速地
径所组成的网络即为传播视图 G
f(
S∪ {
e})－f(
S)＝－１,
　２４９
得到网络视图,可采用文 [
９]提出的翻硬币方法, L
σ(
G(^)
y )
s．t．􀰐clyl ≤B 是 OPT 的上界,上界的估
l＝１
该方法假设每条边相互独立并依照一定概率 pe 传 L
播信息,传播信息的边连接而成传播路径,最终由计值在约束 􀰐clyl ≤B 条件下为σ(

G(^)
y ),则最优
l＝１
传播路径连接而成传播网络.该信息传播网络结构解的上界与下界如下:
′,文[
即是快速生成的网络视图 G ９]证明了翻硬币 E[
Z]≤ OPT ≤ E[
Z(^)
y ]． (
１０)
　　E [Z(
^)
方法与级联传播模型得到的传播效果一致.
y －Z ] 是最优解之差 OPT－Z 的上界,
生成网络视图的过程中有两类比较特殊的节
Z(
^)
y －Z 是最优解上界的无偏统计量.
点:一类是在翻硬币过程中信息几乎没有传播到的
节点,另一类是在信息传播中几乎每次都会传播到３．
２　混合整数规划编码
的节点.这两类节点不仅与每条边的独立传播有为求解确定性最优化问题,将式 (
８)编码为混
关,而且主要取决于网络的结构:几乎每次都会传合整数规划问题.当对网络视图进行删除节点操作
播到的节点与源点间存在多条路径,信息传播到该时,υkv(
y)会受到网络结构变化而产生变化,利用变
v(
量 xv 替换υk y),从而将传播接收情况扩展到原有
k
节点的可能性非常高;而几乎没有被传播到的节点
与源点的路径较远有关.那么可以对网络进行优化概率空间.编码后的混合整数规划目标函数如式
处理,剔除每次都传播不到的节点和压缩每次都会 (
１１a)所示,其中对于单个节点v,从该节点到源点
传播到的节点集.优化后的网络结构减少了处理对路径上的所有节点共计 MA 个,其删除动作集合用
象,可降低处理时延.对网络 G 执行翻硬币方法 N A(
v)表示.
１, ２ ,􀆺,
N
′
次,得到 G G′ G′ １
􀰐 􀰐βvxv ;
N 的网络视图集,该网络视
mi
nmax　 k
(
１１a)
图集作为训练视图集.在训练视图集中考虑采用 y Y X Nk＝１ v∈T
′k(
y)中节点 v 的影响力用确定值
L
策略后,视图 G
t．　 􀰐clyl ≤ C;
s． (
１１b)
v(
υk y)表示.那么式 (
４)通过 SAA (
samp
leave
rage l＝１
approx
imat
ion) １
􀰐 yl ,∀v ∉V０,∀k;(
１１c)
方法可得到:
v ≤r １－
xk ( )
N MAl∈A(
v)
１
mi
n　 􀰐 􀰐βvυv(y), 􀰐
k
y Nk v ≤
xk u ,　∀v ∉S,∀k;
xk (
１１d)
(
８)
＝１ v∈T
(
u,v)∈Ek
L
t．　 􀰐clyl ≤ C．
s．０≤ xkv ≤１,yl ∈ {０,１}． (１１e)
１, if xv ∈yl☉Vl;
l＝１ k
　　接下来分析采样结果与真实结果的差别.当训
练视图数量 N → ∞ 时,SAA 的结果会收敛于
其中,r＝
{
０, if xk
v ∉yl☉Vl．
目标函数明确后 ,建立删除操作策略与节点
３),当 N 的采样规模较小时,SAA 的结果并不
式( 信息接收率的约束关系 ,最终编码为混合整数规
是最优解,文[ １５]对随机路由问题进行了分析,该划问题 .在网络视图 G
′k 中没有直接删除节点v
结论适用于本算法,对基于 SAA 的阻断算法的结的情况下 ,其删除动作减少了从源点到目标节点
v 的传播路径数 ,降低了目标节点的影响概率 ,
果偏差进行分析如下.
对式(３)进行 M 次独立采样,每次采样的训练视其影响关系如式( １１c)所示 ,如果直接删除节点
图为 N 个.采样后会产生 y ^１ ,^２ ,􀆺,
y ^m 个执行策
y v,则该节点的信息接收率值为０,该动作由 r 控
３)的目标结果为 Z１,Z２,􀆺,
略备选方案,对应着式( 制 ;另外 ,针对所有节点 ,根据翻硬币的规则 ,
Zm ,令传播视图中感染的目标节点必须与源点存在通
路 ,即信息接收节点有已经接收并转发了信息的
M
１
Z＝
Mm􀰐＝１
Zm ． (
９)
邻居节点 ,如式 (
１１d)所示 ,由此建立起变量 xk
v
其中,Z为 M 个样本 SAA 问题目标函数的最优平和策略 yl 的线性关系 .
均值.E[
Z]≤OPT,OPT 为式(
３)影响力最小化问３．
３　量子遗传算法
题的最优解,那么Z 成为式 (
３)最优解下界的统计为快速和准确地解决节３．
２中编码后的混合整
估计量. 数规划问题,可采用具有并行计算能力和全局最优
令y ３)的一个可行解,通常是一组规模
^ 是式( 解特征的智能算法,其中遗传算法是一种应用比较
为 N′的采样视图的最优执行策略,则目标函数广泛的智能优化算法.Na
rayana１６为了提高遗传
[ ]
１
　２５０清华大学学报 (自然科学版) ２０１７,
５７(
１２)
算法的寻优能力,首次将量子计算理论与遗传算法适应度函数:
[
１７] M L
１－１
􀰐 􀰐xv ε( 􀰐yl －B ) ．
进行结合,提出了量子遗传算法.江逸茗等将量
F
it(
Y)＝ max
k
子遗传算法用于解决网络虚拟化环境下的监控问
[ Mk＝１ v∈T
] l＝１
题,该量子遗传算法同样适用于求解节３．
２中描述 (１４)
的混合整数规划问题,从而得出最佳的l 个节点, k
v １１b)等
其中:x 的取值由策略Y 的具体取值和式(
L
具体步骤如下.
约束条件决定;ε( 􀰐yl－B ) 为阶跃函数,适应度函
步骤１:初始化. l＝１
数为０.
量子比特状态为处于|０›态、|１›态以及|０›和
步骤３:量子旋转门.
|１›之间的任意叠加态,对应目标节点的状态为被
为了对种群进行更新,采用量子旋转门机制.
删除,保留两者的叠加态可描述为
量子旋转门是一种具有酉性的矩阵,用于改变量子
|Ψ›＝α|０›＋β|１›． (
１２)
叠加态的概率幅,其定义为
其中:α、β 是复数; α 和 β 分别表示量子比
２２
特被观测为|０›和|１›态的概率,且两者各为１. éco
s i
θ －snθù
U(
θ)＝ êê úú ． (
１５)
量子遗传算法的运算对象的可行解可以看作是 ësi
nθ c
osθû
个体的染色体,每个染色体由多个量子比特组成, 　　在定义了量子旋转门以后,对某个染色体的第
一个量子比特的概率幅可以定义为 [α β ] T ,而一 αl,βl]
l 个量子位[ T
的更新过程为
个由 L 位量子比特组成的染色体的编码形式为 éêα′ éêc o

sθl －si
nθl ù éαl ù
(
１６)
l ù
êë úúû ＝ úú êê úú ．
si
n co
s
êë
éα１ α２ 􀆺 αL ù β′
l θl θl û ëβl û
q＝ ê
ê ú． (
１３)
ëβ１ β２ 􀆺 βL û ′ ′
ú 其中:αl 和βl 分别表示经过变换后的第l 个量子比
　　一个染色体可以同时描述２L 个状态,即覆盖特的概率幅;Δθl 表示该量子比特所对应的旋转门
了删除操作策略的所有空间,在观测时染色体将坍的旋转角,其定义如下:
缩为一个确定的状态,即确定了删除的l 个节点. θl ＝s(
αl,βl)
Δθl． (
１７)
步骤２:适应度计算. 其中:s(
αl,βl)决定量子旋转的方向,Δθl 决定量子
在确定了染色体的编码以后,对染色体进行测旋转的角度.这２个变量的取值如表１所示.由于
量,方法是为每一个量子比特都生成一个随机数, 量子旋转的角度对算法的收敛速度影响较大,因此
若该随机数小于 α ２ ,则该量子比特位的测量值为在算法运行的初期可以将 Δθl 的取值适当加大;在
０,否则为１;然后计算其适应度,个体执行策略算法运行后期,为了精确求得最优解,可以适当减
Y＝ [
y１ ,y２ ,􀆺,yL ],可将式 (
１１a)进行变换得出小 Δθl 的取值.
表１　量子旋转门的调整策略
s(
αl,βl)
xl bl F
it(
x)≥F
it(
b) Δθl
αlβl＞０ αlβl＜０ αl＝０ βl＝０
００否０００００
００是０００００
０１否０００００
０１是 δ －１ ±１ ±１０
１０否 δ －１ ±１ ±１０
１０是 δ １－１０ ±１
１１否 δ １－１０ ±１
１１是 δ １－１０ ±１
　　注:b 为当前最优解,bl为最优解的第l 位.
置传播参数来模拟传播过程,进而验证本文设计的
４　仿真分析
阻断方法.本文采用的网络数据集包括:１)Twi t
ter,
４．
１　数据集和参数选取该社交网络是一种有向连接的网络;２)S
lashdot,
实验数据集采用真实的网络数据集,利用这些来自免费的开放网络社区,该数据集描述的是朋友
网络数据集构建网络结构,并基于这些网络结构设之间的关系,而且个人的朋友关系可以对外公开;
　２５１
３)Epin
ions,该数据集描述一种在线社会网络中考虑了全局视图,能够把潜在的影响力最大的节点
人与人的信任关系 .网络数据集如表２所示 . 考虑到后续的删除节点的范围内.３种算法对比结
表２　采用的数据集果为,以节点的度为指标的启发式算法最差,基于
数据集节点数边数目标增加量最多和目标增长率最高的贪心算法要优
Twi
tte
r ８１３０６１７６８１４９于基于度的启发式算法.
S
lashdo
t ７７３６０９０５４６８
Ep
ini
ons ７５８７９５０８８３７
　　每类数据集具有不同的特点,Twi
tte
r的节点
关系更为紧密,网络的直径只有７跳,９０％的有效
直径为４．
５跳;S
lashdo
t的节点的网络直径达到了
１０跳,９０％的有效直径为４．
７跳;Ep
ini
ons的节点
关系在３个数据集中直径最大,达到了１４跳,９０％
的有效直径为５跳.基于真实的网络数据结构,设
定传播模型的相关参数,在所有网络中随机选择５
个源点为信息发布的初始节点,并假设信息在网络
２.
中传播的感染率为 pe＝０．
节点的影响力在本仿真中以节点所处的网络结
图５　Twi
tte
r网络中阻断影响力对比示意图
构特征为依据,标识节点影响力通常有节点的度或
在S
lashdo
t网络中的阻断效果如图６所示.在
１３]发现中尺度的网络结构指
者介数等指标,而文[
Ep
ini
ons网络中的阻断效果如图７所示.
标kＧ
cor
e更能准确地反映节点对信息传播的作用,
因此,使用的节点影响力权值为节点的 kＧ
cor
e 值.
另外,对于网络结构来说,删除节点的直接代价是
改变该点与其邻居的连接关系,因此约束代价选择
以节点度为依据.
４．
２　传播有效性分析
选择３种算法进行对比,其中第１种算法是启
发式算法,依次删除度 deg
ree最大的节点;第２种
re Ｇuc９ ,该算法是每一步都选择
edy
[]
是贪心算法 g
当前影响最大的节点;第３种是效率与代价最高比
reedy
Ｇcb１８ ,该算法考虑了操作节点
[ ]
的贪心算法 g
图６　S
las
hdo
t网络中阻断影响力对比示意图
的代价,每一步选择节点时都选择影响力效果与代
价的最大比值.
在３种网络结构中利用翻硬币的方法模拟信息
传播,生成 M ＝５０规模 N ＝１５的采样对象,分别
生成验证网络视图和测试网络视图,规模都为７５０,
即 N _va
lid＝７５０,N _t
est＝７５０.基于 SAA 的阻断
算法在利用训练集中产生最佳执行策略,然后在各
验证样本中进行验证.由于网络中节点的数量不
同,设置删除代价的最大值为总节点度的１０％ .
如图５所示,整体阻断信息传播影响力的结果
中基于 SAA 的阻断算法是最优的,尤其是在删除
图７　Ep
ini
ons网络中阻断影响力对比示意图
节点的中前期,主要原因是基于 SAA 的阻断算法
１
　２５２清华大学学报 (自然科学版) ２０１７,
５７(
１２)
通过对比以上各图可以发现 ,贪心算法与基网络中 ,结构紧密度相对较差 ,网络中存在结构
于 SAA 的阻断算法在 Twitter数据中的最优解洞和较短的信息扩散路径 ,贪心算法容易造成局
比较相近 ,而在其他网络中基于 SAA 的阻断算部最优解 ,因此 ,基于 SAA 的阻断算法要优于
法要明显优于其他贪心算法 .说明基于 SAA 的其他两类贪心算法.
阻断算法与网络的紧密程度和结构相关,在对 SAA 的上界和下界分析如图８所示,设置
Twi
tter网络中由于结构相对紧密 ,信息传播到删除代价的最大值为总节点度的１０％ ,分别分析采
相对远处的路径也较多 ,因此局部的最优解很可样规模对３种网络结构的感染节点影响力的上界和
能就是全局的最优解 .而在 S
lashdo
t和 Ep
ini
ons 下界的影响.
图８　３种网络中不同采样数量的影响
　　通过对３种结构的上界和下界的分析,可以发
现３种网络的采样次数对结果的影响基本一致,当
采样规模达到１５的时候,上下界差与上界的比值
９％ ,因此,每次采样的网络视图规模为
最大为３．
１５时便可以满足需求.
４．
３　预处理对算法时间的影响
预处理包括２种处理方式:一种是剔除不相关
的节点;另一种是将感染关系最为紧密的节点进行
压缩处理. 以 S
lashdo
t 数据为例, 该数据集有
７７３６０个节点和９０５４６８条边,经过预处理后,该数
据集减少至１８４５６个节点和４５２３３２条边.比较进
图９　预处理与正常计算时运算时间对比图
行预处理和没有进行预处理的基于 SAA 算法的运
行时间,以采样５０次规模１５为例.如图９所示, 征,导致贪心算法并不能够保证近似最优解.然
没有预处理的计算时间是进行预处理的计算时间的后,使用采样平均近似方法以全局的角度考虑阻断
３~１０倍.运算时间与解空间的大小相关,但是并模型,将该问题转化为确定性问题,并分析了该最
不是线性关系.在解空间相对较小时,运算时间随优解的界限.最后,进一步将采样结果编码为混合
着删除节点的代价增加而增加,而删除节点代价大整数规划问题,采用一种量子遗传算法进行求解.
于一定值时,其运算时间随着删除节点代价的增加仿真结果表明,该方法阻断信息传播影响力的效果
几乎保持不变,并且能够在较大的解空间内保持较优于贪心算法,并且网络结构上的优化方法可以有
小的运行时间. 效降低算法运行时间.
５　结　论
本文针对社会网络中阻断信息传播的问题,提参考文献　 (
Ref
ere
ncs)
e
出了一种面向节点影响力的信息传播阻断模型,该 [
１] 陈卫．社交网络影响力传播研究 [
J]．大数据,２０１７,
模型的目标是使信息传播的影响力之和最小.本文１(
３):２０１５０３．
CHEN Wei．Res
earchonin
fluenc
edif
fusi
oni
ns oc
ialne
twok
证明了该模型的目标函数不满足子模量和超模特 [J]．B
igData,２０１７,１(３):２０１５０３．(i
nChine
se)
　２５３
[
２] Nowz
ariC,Pr
ecadoV M,Pappa
i sGJ．Ana
lys
isandc
ont
rol [
１０]L
iuY,TangM,ZhouT,e
tal．I
den
tif
yin
fluen
tia
lsp
reade
rs
o
fep
idemi
cs:A sur
vey o
fsp
read
ing p
roc
ess
esonc
omp
lex i
ncomp
lexne rks,t
two her
oleo
fne
i rhood [
ghbo J]．Phys
ia
ne rks [
two J]．IEEECon
tro
lSys
tems,２０１６,３６(
１):２６４６． A :S
tat
ist
ica
l Me
chan
icsandI
tsAppl
ica
ti s,２０１６,４５２:
on
[
３] Pr shB A,Chakr
aka aba
rtiD,Va
llrN C,e
e tal．Thr
esho
ld ２８９２９８．
[
１１]Xi
aY,Ren X,Peng Z,e
tal．Ef
fec
tive
l den
yi tif
yingt
he
c
ond
iti
onsf
ora
rbi
tra
r a
ycsc
ademode
lsona
rbi
tra
ryne
two
rks
[ i
nfl
uen
tia
l sp
reade
rsi
nla
rge
Ｇsc
ales
oci
al ne rks [
two J]．
J]．Knowl
edgeand Info
rma
tion Sys
tems,２０１２,３３(
３):
Mu
ltimed
iaTo
olsandApp
lic
ati
ons,２０１６,７５(
１５):８
８２９８
８４１．
５４９５７５．
[
１２]ZhangJX,Chen D B,Dong Q,e
tal．I
den
tif
yingas
eto
f
[
４] TongH,Pr sh B A,El
aka ias
siＧRad T,e
tal．Ge
ll
ing,and
i
nfl
uen
tia
lsp
reade
rsi
ncomp
lex ne rks [
two J]．S
cien
tifi
c
me
lt
ing,l
areg
g r
aph
sbye
dgema
nipu
lat
ion [
C]// Pr
oce
edi
ngs
Repo
rts,２０１６,６:２７８２３．
o
fthe２１s
tACMI
nte
rna
tiona
lCon
fer
enc
eonI
nfo
rma
tionand
[
１３]Ki
tsak M,Ga
lls L H, Hav
o lin S,e
tal．I
den
tif
ica
tion o
f
Knowl
edgeManagemen
t．Hawa
ii,USA:ACM,２０１２:２４５
i
nfl
uen
tia
l sp
reade
rsi
ncomp
lex ne rks [
two J]． Na
tur
e
２５４．
Phys
ics,２０１０,６(
１１):８８８８９３．
[
５] Saha S, Ad
iga A, Pr sh B A,e
aka tal． App
rox
ima
tion [
１４]Rub
ins
ten R Y, Kr
i oes
e D P．S
imu
lat
ion andt
he Mon
te
a
lgo
rit
hmsf
orr
educ
ingt
hespe
ctr
alr
adi
ust
ocon
tro
lep
idemi
c Ca
rlo Me
thod [M]．New Yo
rk:J
ohn Wi
ley & Sons,２０１６．
sp
read [
C]// Pr
oce
edi
ngso
fthe２０１５ S
IAM I
nte
rna
tiona
l [
１５]Ve
rwe
ijB, Ahmed S,Kl t A J,e
eyweg tal．Thes
amp
le
Con
fer
enc
eonDa
ta Mi
ni ouve,Canada:So
ng．Vanc cie
t o
yfr ave
rageapp
rox
ima
tion me
thodapp
liedt
ost
ocha
sti
crou
ting
I
ndus
tri
alandApp
lied Ma
thema
tis．２０１５:５６８５７６．
c r
pob
lems: A c
ompu
tat
iona
lsudy [
t J]． C
ompu
tat
iona
l
[
６] ChenC,TongH,Pr shBA,e
aka tal．Nodeimmun
iza
tionon Opt
imi
zat
ionandAppl
ica
ti s,２００３,２４(
on ２３):２８９３３３．
l
aregr
a s:Th hms[
J]．I [
１６]Na
rayanan A． An i
ntr
oduc
tor
y t
uto
ria
l t
o quan
tum
g ph eor
yanda
lgo
rit EEETr
ans
act
ion
son
Kn
owl
edgeandDa
taEng
ine
erng,２０１６,２８(
i １):１１３１２６． c
ompu
ting [
C]// Pr
oce
edi
ngs o
ftheIEEE Co
lloqu
ium on
[
７] Kha
llE B, Di
i lkna B,Song L．Sc
i alab
led
iff
usi
onＧ
awa
re
Quan
tum Compu
tingTheo
ry,App
lic
ati
onsandImp
lic
ati
ons．
London,Eng
land:IEEE,１９９７:１３．
op
timi
zat
iono
fne
two
rkt
opo
logy [
C]// Pr
oce
edi
ngso
fthe
[
１７] 江逸茗,兰巨龙,周慧琴．网络虚拟化环境下的资源监控策
２０
thACM S
IGKDDI
nte
rna
tiona
lCon
fer
enc
eon Knowl
edge
略 [
J]．电子与信息学报,２０１４,３６(
３):７０８７１４．
Di
scove
ryandDa
ta Mi
ni rk,NY,USA:ACM,
ng．New Yo
J ng,LAN JuLong,ZHOU Hu
IANG YiMi iqi
n．Re
sour
ce
２０１４:１２２６１２３５．
mon
ito
ringpo
lic
yfo
rne
two
rkv
irt
ual
iza
tionenv
ir t[
onmen J]．
[
８] ZhangY,Ad
iga A,SahaS,e
tal．Ne
arＧ
opt
ima
lal
gor
ithms
J
ourna
lof El
ect
ron
ics & Info
rma
ion Te
chno
logy,２０１４,
f
orc
ont
rol
lingp
ropaga
tiona
tgr
oups
cal
eonne rks [
two J]．
３６(
３):７０８７１４．(
inCh
ine
se)
IEEE Tran
sac
tion
son Knowl
edgeand Da
ta Engi
nee
ring, [
１８]Le cJ, Kr
skove e A, Gue
aus str
in C,e
tal．Co
stＧ
eff
ect
ive
２０１６,２８(
１２):３３３９３３５２． ou
tbr
eakde
tec
tioni
nne rks[
two C]//Pr
oce
edi
ngso
fthe１３
th
[
９] KempeD,Kl
einbe
rgJM,Ta
rdo
sÉ．Max
imi
zingt
hesp
read ACM S
IGKDD I
nte
rna
tiona
l Con
fer
enc
e on Knowl
edge
o
fin
flu
enc
eth
rough a s
oci
al n
etwo
rk [
J]． Th
eory of Di
scove
ryand Da
ta Mi
ning．SanJ
ose,CA,USA:ACM,
Compu
ting,２０１５,１１(
４):１０５１４７．２００７:４２０４２９．

在线社会网络中面向节点影响力的信息传播阻断模型

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

在线社会网络中面向节点影响力的信息传播阻断模型

Uploaded by

Copyright:

Available Formats

I

SSN１０００Ｇ００５４清华大学学报 (自然科学版) ２０１７年第５７卷第１２期３/１６

赵　宇１,２ ,　黄开枝１,２ ,　郭云飞１ ,　赵　星１,２

中所有节点集 V 可以表示为 V ＝V０ ∪ ( ∪Vl ) ,其

算删除节点后源点传播信息后的影响力,假设删除在复杂的网络结构中,即使消息发布源点已

播信息,传播信息的边连接而成传播路径,最终由计值在约束 􀰐clyl ≤B 条件下为σ(

个由 L 位量子比特组成的染色体的编码形式为 éêα′ éêc o

You might also like

在线社会网络中面向节点影响力的信息传播阻断模型

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

在线社会网络中面向节点影响力的信息传播阻断模型

Uploaded by

Copyright:

Available Formats

I

SSN１０００Ｇ００５４ 清华大学学报 (自然科学版) ２０１７ 年 第 ５７ 卷 第 １２ 期 ３/１６

赵 宇１,２ , 黄开枝１,２ , 郭云飞１ , 赵 星１,２

中所有节点集 V 可以表示为 V ＝V０ ∪ ( ∪Vl ) ,其

算删除节点后源点传播信息后的影响力,假设删除 在复杂 的 网 络 结 构 中,即 使 消 息 发 布 源 点 已

播信息,传播信息的 边 连 接 而 成 传 播 路 径,最 终 由 计值在约束 􀰐clyl ≤B 条 件 下 为σ(

个由 L 位量子比特组成的染色体的编码形式为 éêα′ éêc o

You might also like

SSN１０００Ｇ００５４清华大学学报 (自然科学版) ２０１７年第５７卷第１２期３/１６

赵　宇１,２ ,　黄开枝１,２ ,　郭云飞１ ,　赵　星１,２

算删除节点后源点传播信息后的影响力,假设删除在复杂的网络结构中,即使消息发布源点已

播信息,传播信息的边连接而成传播路径,最终由计值在约束 􀰐clyl ≤B 条件下为σ(