首页 理论教育 节点影响力分析及应用

节点影响力分析及应用

时间:2023-06-26 理论教育 版权反馈
【摘要】:测量节点中心度有助于判断哪些个体比其他个体更重要,并识别网络中有影响力的核心节点。度中心性能够高效地度量节点的影响力及重要性,也是最常用的衡量网络核心的指标。如果某节点和其他网络节点的平均距离越短,则该节点的接近度中心性越大。该比例越高,节点对下游的影响力越大。若Inf Factori=1,则表示只要有i的下游节点发生了污染,则受污染节点一定是受到了节点i的影响。

节点影响力分析及应用

节点影响力可以用节点中心性来度量。中心性用以表达社会网络中一个节点在整个网络中的重要性程度,这个程度用数字来表示就被称作中心性或中心度。测量节点中心度(Centrality)有助于判断哪些个体比其他个体更重要,并识别网络中有影响力的核心节点。根据测定中心度方法的不同,可以分为度中心度(Degree centrality)、接近度中心度(或紧密度中心度,Closeness centrality)、中介中心度(或间距中心度,Betweenness centrality)、特征向量中心性(Eigenvector Centrality)等。

本文给出了4种主要中心性定义[128,129]

(1)度中心性(Degree Centrality)

度中心性可表示为节点度数,即连接到该节点的边的数量[81]。这是最直接也是最容易计算的中心性指标。很显然,度数越大,表明该节点与其他节点交互越密切,对其他节点或受其他节点的影响越大。度中心性能够高效地度量节点的影响力及重要性,也是最常用的衡量网络核心的指标。度中心性可以分为出度和入度中心性。节点出度是指从当前节点到它的邻居节点的连边的数量,可以表明它对周围节点的影响范围;入度就是以邻居节点为起点,以当前节点为终点的连边的数量,可以表明当前节点受周围节点的影响程度。度中心性可以用下式计算:

Aij表示节点i与其他节点j(共g-1个,i≠j,不包括到自身的连接)之间的连接数(可以包含权重),g为网络规模(节点总数)。

(2)接近度中心性(又称紧密中心度Closeness Centrality)

接近度顾名思义就是节点之间距离的大小指标。节点距离可以用节点之间的最短路径来表示。如果某节点和其他网络节点的平均距离越短,则该节点的接近度中心性越大。

节点i的接近度中心性计算公式为:

其中d(n i,n j)为节点i和j之间所有路径的最短距离。接近度中心性指标一般用于连通网络。

(3)介数中心性(Betweenness Centrality)

介数中心性又称为节点中介度中心性,它可以用来度量网络节点的中介作用,即对于某节点i,所有其他任意两节点之间的最短路径中,包含节点i的最短路径数和所有最短路径数之比。它反映了网络中的节点通过该节点到达其他节点的中介度。以星形网络为例,显然中心节点的介数中心性为1,因为所有节点必须经由中心节点才能到达其他节点。介数中心性不同则节点在社交网络中的作用和地位也不相同。再比如,在食品供应链形成的网络中,某节点的介数中心性越大,则如果该节点受到污染,传播范围越广;相反,如果该节点的安全控制措施越好,则消除污染的效果越好,食品供应链越安全。

中介度中心性的表达式定义为:

式中p jk(ni)表示节点j和k之间通过节点的最短路径的条数。

(4)基于节点行为的中心性度量

前面几种中心性度量方法,主要是基于网络拓扑结构展开的。网络的拓扑结构比较容易获取,它反映了节点在网络结构中的位置差异,但是拓扑数据却不能全面反映节点间的交互行为和影响。为进一步确定核心节点的影响力,我们提出了基于节点行为的度量方法,即污染传播影响度和影响因子的网络节点中心性度量指标。

对于图g=(V,ε)、节点集V={1,2,I,i,…}和有向边集合ε={(i,j)|i,j∈V},作如下定义:①点污染函数:c:V→{0,1},ci:=c( i),i∈V,若节点i发现了污染,则ci=1,否则ci=0;②边污染函数:e:ε→0,{}1,eij:=e i,()j,∀i,()j∈ε,eij=ci·cj,只要ci和c j中有一个为0,则eij等于0;③受污染的边集合:εc:={(i,j)∈ε|eij=1}⊂ε;④对任意ci=1的节点i,定义污染时间函数:ti:=t(i),t( i)表示节点i受到污染的最早时间;⑤污染传播函数:f:εc→{0,1},f ij:=f(εc(i,j)),如果有ti<tj,并且f ij=1,则表明节点i向节点j进行了污染传播,否则f ij=0。令节点i出度为OutDegreei,定义:(www.xing528.com)

(1)传播度

传播度Inf Degreei表示源节点i早于目标节点受到污染的连接数除以从节点i流出的连接数,即由于自身的污染而传播到周围致其下游受到污染的数量占其全部下游节点的比例,反映的是污染传播能力。比例越高,影响力越大。Inf Degreei=1则表明节点i及其所有下游节点都受到污染。

(2)传播影响因子

传播影响因子Inf Factori是源节点i早于目标节点受到污染的连接数与源和目标均受到污染的连接数之比,即在所有受到污染的节点对中,有多大比例是由上游节点引起的。该比例越高,节点对下游的影响力越大。若Inf Factori=1,则表示只要有i的下游节点发生了污染,则受污染节点一定是受到了节点i的影响。

可见,传播度和传播影响因子可以比较直接地度量食品供应链网络中节点的污染传播能力。

下图是根据德国联邦风险评估研究所提供的食品供应链数据而构建的社会网络,食品工作站对应于社会网络结构图中的节点,节点大小表示节点度中心性的大小,连边的粗细表示两端食品工作站节点的交易频次。该图可以从全局角度比较直观地反映食品供应网络中的核心节点与上下游节点的供应关系。

图6.8 食品供应链的社会网络结构

如第2章复杂网络理论所述,幂律分布是非标度网络的基本特性。我们可以将该食品供应网络节点的度数分布作一个对数刻度的散点图,如图6.9所示,该图也揭示了该食品供应网络有一定的长尾效应,即大多数网络节点的度数很小,但也有少数节点,度数很高(分布图的下方)。应该对这些度数高的食品工作站加强监管,因为假设该节点受到污染,则传播范围很广;反之,如果该节点的安全控制措施越好,则消除污染的效果越佳。

图6.9 食品供应网络节点的度数分布

根据前文关于网络节点中心性度量的定义,我们计算了每个节点的出度、紧密中心度、介数中心度和特征向量中心度4类中心性,其值见附录1。

在Neo4j中,以下Cypher代码通过调用算法包的betweeness方法可以直接计算食品工作站节点的介数中心性并按其大小排序列示出来。可见,此处“Station 250”的介数中心性最大,值为670。图的底下部分是将“Station 250”及周边节点展开以后的情况。

图6.10 用Cypher语句计算和统计节点介数中心性

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈