首页 理论教育 化工供应链网络链路预测技巧

化工供应链网络链路预测技巧

时间:2026-01-22 理论教育 Jonker 版权反馈
【摘要】:本节在这样的背景下选择化工供应链的部分网络进行链路预测就具有巨大的意义。本节中化工供应链关系网络实证数据采集自《中国化工产品目录》,由企业和其对应产品来形成最终网络。图7-10 化工供应链网络产品中间中心度图在度值分布方面,2-模网络中企业度分布呈现一定的幂律分布现象,具体的度值统计如表7-9所示。图7-12 化工2-模网络企业度值分布图2.1-模分析通过对数据处理,本文得到化工供应链网络的2个1-模网络。

一、背景及意义

石油、化工、塑料、基础原料、橡胶行业与人们的衣食住行密切相关,也是国民经济中不可或缺的重要组成部分,同时化工行业还是材料工业的支柱之一,提供了绝大多数的有机化工原料,如为农业提供了氮肥、薄膜、农药等,形成了工业支持农业的局面。毫不夸张地说,现代的物流行业、建筑行业、农业、电子工业、高新技术产业等各行各业均离不开化工行业的支持。

目前我国正处于经济转型期,传统化工行业面临比较大的挑战,如节能减排、限产限电等政策的实施进一步加大了化工行业的成本压力。从经济全球化的角度来看,中国化工产业链的发展极度不平衡,国内的主要产品大多具有在通用型、高能耗高污染、低附加值的特点。而我国正处于工业化初中期阶段,城镇化进程高速发展,对终端消费领域的新型产品的需求远远高于基础产品,加上化工行业产业链长,不确定性极大,这些都可能导致部分化工行业出现产能过剩危机,从而影响我国经济的正常运行。当前,化工行业正按照“十二五”规划积极调整产业结构,从发展基础化工原料向发展高新化工产品转变,从初级化工产品向高附加值产品转变,从粗放型生产向资源节约、环境友好型转变。

本节在这样的背景下选择化工供应链的部分网络进行链路预测就具有巨大的意义。复杂网络理论对研究产业结构,研究产业趋势演变能提供良好的视角。本节将链路预测运用于化工供应链网络,从链路预测角度来说,可以进一步检验相关预测算法的适用性,通过新型的服务供应链和传统的化工供应链之间的比较,可以对链路预测的理论和实践发展起到更多的参考作用;从化工行业的角度来说,通过复杂网络与链路预测的相关研究,可以了解行业网络的态势和化工网络发展中存在的问题,为产业结构调整提供参考价值。

二、网络分析

1.2-模分析

化工行业原材料主要来源于上游化工产品,石油等资源型产品构成了中下游化工产品的基础性原料。中游产品主要是基础油及原料,以及有机中间体,包括乙烯、苯、苯的衍生物、苯乙烯、助剂、甲醇、烷类等,而下游产品主要是精细化学品、高分子材料,如有机硅化学品、水处理技术及水处理剂、通用塑料、聚氨酯、工程塑料等。

本节中化工供应链关系网络实证数据采集自《中国化工产品目录》,由企业和其对应产品来形成最终网络。主要产品为中游产品,化工原材料包括乙炔、电石、丙炔、乙烯、二甲苯、笨、甲醇、乙醇、烷类等32种化工产品。

数据类型之一为2-模数据,首先构建网络的2-模二部矩阵,将其可视化后用图形表示为如图7-8所示(图内圆点表示企业,方形表示产品)。

图示

图7-8 化工网络2-模二部矩阵图

可以明显看到,网络表现出一定的层次特征,符合供应链的特点。这不同于一般的社交网络或合作网络,该网络表现出了差异性。上图还采用了MDS画图方法,即Multidimensional Scaling多位量表的方法,该方法主要特点是将距离近、具有关联性较高的节点显示在一起,即企业与企业相似性更接近,产品与产品也同样具有更大的相似性。结合实际数据,可以发现靠得更近的企业节点往往属于同一类型的企业。当然,不足之处是由于点数过多,很多节点被覆盖,而无法从视觉上看清。我们将企业节点去除,专门观看产品节点,即得到如图7-9所示。

图7-9中方形节点所处的位置即表示了其自身与谁具有更好的关联性。如丙炔比较独立,与其他产品关联度较低,而苯(被焦化苯覆盖)、甲苯、焦化苯则处于临近位置,下面一层则是烷类与大多数烯类。类似地,也可以找到相关企业的关联情况。

图示

图7-9 产品节点关联性分析图

我们测量网络的中间中心度,并依据其数值大小来改变节点的大小,最终结果如图7-10所示。在图7-10中,上半部分表示产品的中间中心度,下半部分为了显示效果,去除了连线,在同样的位置显示节点标签。可以看到,甲苯、甲醇、苯为网络的核心,即这三种产品在本网络中具有的核心地位,紧随其后的是二甲苯与环氧乙烷。但是我们没有发现比较突出的企业节点,即本网络没有特别明显的核心企业。我们推测其上游或下游会出现比较明显的核心节点,如基础原材料、矿产资源类。

图示

图7-10 化工供应链网络产品中间中心度图

在度值分布方面,2-模网络中企业度分布呈现一定的幂律分布现象,具体的度值统计如表7-9所示。

表7-9 化工二模网络度值分布

图示

度值分布如图7-11、7-12所示。

图示

图7-11 化工2-模网络企业度值分布图(普通坐标系)

同样地,2-模网络中化工产品的度分布却没有呈现幂律分布,度值最大的产品与155个企业产生联系,度值最小的产品与4个企业产生联系,但度值出现概率基本一致,这与产品数目过少有关,数据过少导致无法体现完整。

图示

图7-12 化工2-模网络企业度值分布图(对数坐标系)

2.1-模分析

通过对数据处理,本文得到化工供应链网络的2个1-模网络。1-模矩阵中对角线的数值即代表着与该模发生联系的节点数量。如在1-模产品矩阵中,对角线数值最大的分别为甲醇、甲苯、笨,其值分别为155、153、126,第一个数值代表着与甲醇有生产或使用关联的企业共有155家。而在1-模企业矩阵中,矩阵数值多为1或2,很少有大于10的数值,这表明绝大多数企业之间的业务联系仅仅依赖于1—2种化工产品,仅有几家企业与其他企业通过10种以上产品建立联系。这从一定角度反映出,化工供应链网络中企业业务单一,生产比较专业化,保持了比较稳定的需求和供给方向,这与其他行业比较多元化、扩张化的经营方向有所不同,化工供应链具有较高的稳定性。

图7-13反映了32种化学产品的关联性与产品重要程度,重要程度越大,节点尺寸越大;产品关联度越高,节点在图7-13上的位置越密集。

图示

图7-13 32种化工产品关联性与重要程度图

图7-14为538个企业的MDS分布图,图7-14中以节点度做了尺寸大小分析。

图示

图7-14 538家化工企业的MDS分布图

在此,我们忽略了边的数值,即只要产品与产品之间因某企业产生关联,那么该节点对就产生连边。同理,我们不计两个企业之间有几种化学品关联,但凡有生产、使用关系就建立连边。也正是这种原因,企业与产品之间的方向问题在数据中无法得到体现,在1-模企业网络中,包含着共同使用某种化工品、共同生产与生产使用这三种关系。而由于无法得到实际的供应数据,我们无法得知生产某化学产品的企业和使用该化学品的企业之间的一一对应关系,只能笼统地对涉及这个产品的企业建立联系,本供应链并不是对现实供应链的真实映射,而只是单纯地根据企业-产品对应关系给出的虚拟关系网络。当进行模数转换时,企业与企业之间就不再是单纯的交易传递链条,而是关系网络了,这就导致了大量的边(企业关系)的产生,也是本文网络边数较多的主要原因。

网络中企业集群特性不是十分明显,但度值较小的企业与度值较大的企业分居两个区域,这表明不同的企业在规模或网络地位上存在明显差异。

1-模网络的相关统计特征如表7-10所示。

表7-10 化工供应链1-模网络与服务供应链对比表

图示

续 表

图示

从定性的角度分析,网络平均路径长度远小于随机网络的平均路径长度,同时具有较高的集聚系数,因此,产品的1模网络和企业1-模网络均具有一定的或局部“小世界特性”,且产品之间的联系更加密切。

三、链路预测预处理

由上文的数据及网络结构分析,我们可以看到,本实例中化工供应链关系网络集聚系数比较高,网络密度比服务外包网络大很多,网络效率较高,是一个发展趋于成熟成熟期间的网络。2-模网络中,企业度值分布符合幂律分布,而1-模网络中度值分布则出现较大差异。1-模网络的企业度值分布如图7-15和图7-16所示。

图示

图7-15 化工1-模网企业度值分布图(普通坐标系)(https://www.xing528.com)

图示

图7-16 化工1-模网企业度值分布图(对数坐标系)

1-模网络中,产品度值分布如图7-17和7-18所示。

图示

图7-17 化工1-模网产品度值分布图(普通坐标系)

1-模网络中企业的度值分布走向与产品度值分布走向趋势大体相同,但没有表现出明显的幂律分布形态,不是完全的无标度机制。鉴于其0.805的集聚系数,我们首先考虑RA指数更为适用。加之,供应链内网络关系本身就代表了资源的分配与利用,这与RA自身定义相符合,因此我们选用RA指数及其扩展指标作为化工供应链关系网络的链路预测算法。

图示

图7-18 化工1-模网络产品度值分布图(对数坐标系)

四、化工供应链网络链路预测

1.链路预测总流程

只有存在相应的网络模型,才能依据网络的特点进行算法的选择以便更好地进行链路预测。因此,首先要通过企业和化工产品之间的关系,构造多维化工供应链网络,这里需要指出的是网络是有向的;然后针对企业,将与其连接的化工产品做降维和加权处理,得到单一维度网络,最后根据链路预测的某些算法或指标,如RA指标,进行预测新的网络中所建立的连边,即最有可能产生合作的企业节点对。链路预测的总体流程如图7-19所示。

图示

图7-19 链路预测流程框架图

2.化工供应链的网络处理

在化工供应链关系网络中,企业和企业之间的相互关系并不是直接产生的,而是依托于他们所生产或所使用的化工产品来间接体现的。比如企业A生产了苯,企业B、C都采用苯作为原材料生产了硝基苯、焦化苯,然后硝基苯被D企业生产成了苯胺,那么这一系列的供应与使用关系如图7-20所示。

图示

图7-20 产品的供应与使用示例图

倘若用网络图的视角去转化,则如图7-21所示(在此,用圆圈代表企业、用三角形代表化工产品)。

图示

图7-21 供应链的网络示意图

显然,网络中存在两种类型的节点,一种是活动发生的主体,称作企业节点;一种是活动产生的对象,称作产品节点。因此,可以定义如下的集合:设定E为企业集合,节点数为n。企业集合为E={e1,e2,e3,…,en};设定P为产品集合,节点数为m,产品集合为P={p1,p2,p3,…,pm}。

3.多维网络与降维处理

在本节中,依据化工产品的属性、功用、重要程度等特点,可以有多种不同的多维网络构建模式。我们也可以将m种化工产品分为几个维度,对几个维度分别赋予其相应的权重,即某几种化工产品所占的权重更大。可以考虑使用ABC分类法对化工产品进行分类,这种权重分配方式相比而言会更加符合现实情况。但是鉴于每种化工产品的贡献程度难以统计,因此本节选择较简便的方式,划分成m个维度。即每一种产品作为一个维度,那么企业节点A与企业节点B之间最多可以通过m种化工产品产生联系,通过越多的产品维度产生连边的权重则大于只通过单一产品维度建立的连边。但是,这里有个前提假设,即每一种化工产品的单位权重也是相等的,不存在某种化工产品的权重大,某种产品权重小的现象。因为在真实的供应链中,由于各种化工产品其地位或者作用不可视作平等,其产量、使用量等都决定了m种化工产品的作用不同,其权重也不可能完全一致。

定义1(多维网络):

∀ei∊E,∀pj∊P节点对(ei,pj)为节点ei与pj之间存在一条连边,则D={(ei,pj)|ei ∊E,pj∊P,1≤i≤n,1≤j≤m},(其中n为企业个数,m为产品类别个数)为E中节点与P中节点所有可能连边的集合,因此定义多维网络M是以E和P为节点集合,以D中某个子集为连边集合的网络。其中,∀ei∊E,∀pj∊P,由ei和pj形成的子集合Dj={(ei,pj)|ei∊E,pj ∊P,1≤i≤n,1≤j≤m}为M的单产品维度网络,m为产品的总维度,即产品类别的总数。

由于在供应链网络中,存在多种不同类型的关系。整个网络中的指向关系包括:共同生产、共同使用和生产—使用关系,对这三种关系分别赋予不同的权重,分别为b1,b2,b3

定义2(降维网络):

当1≤j≤m时,∀ei∊E,令P中与ei有连边的节点集合为pi(pi⊂p,1≤i≤n),则对于∀ex ∊E,∀ey∊E(x≠y,1≤x≤n,1≤y≤n),定义ex与ey之间存在连边的条件是当且仅当px∩py≠∅;若|(px∩py)|≥2,则ex和ey之间存在多条边。所谓降维处理就是将多条边化为一条,定义边的权重为w(x,y),以E为节点集合,按ex与ey之间连边所组成的网络称M的降维网络G,也就是按照产品维度综合成一条边一个值的网络。那么在该网络中,就存在三种类型的边,对应着三种关系值,同时两企业间有关联的产品越多,其值累加后就越大,代表关系更加紧密。

4.算法应用

通过对化工供应链网络进行降维处理,我们得到企业间单一维度关系网络。同时选择CN共同邻居指标、RA指标进行链路预测。传统的共同邻居指标仅仅考虑共同邻居的个数,即两个节点x和y之间拥有共同邻居节点的个数的多少决定了节点x和节点y存在连边的可能性大小。在此基础上,我们给节点x和节点y之间增添了共同生产关系、共同使用关系、生产—使用关系的权重,即b1,b2,b3,并提出针对该供应链网络的节点相似性定义指标:

图示

在公式(7-19)中,Γ(x)指的是网络中节点x的邻居节点集合,z表示为节点x和节点y共同邻居节点,w(x,z)为节点x和节点z之间存在的边的总权重值。

类似地,我们可以对RA指标进行扩展得到其加权模式。

图示

本化工网络包含化工企业538家,化工产品种类32种,共有可能的连边144 453条,降维处理后共产生实际连边41 368条(已剔除了部分无效的边或错误边),按照9∶1的比例划分训练集37 231条,测试集4137条。为了更加符合企业个体的考虑,本文采用Precision指标衡量链路预测的精度,即在前L条被预测的边中预测准确的比例。本节比对了所有测试集中的边数,即在前4137条边中,有m条预测准确,那么预测精度为:图示

本节将共同生产、共同使用、生产—使用三种关系设置一系列不同的权重,并分别采用加权CN算法和加权RA算法进行链路预测,经过计算,CN与RA指标链路预测精度如表7-11所示。

表7-11 化工供应链网络链路预测结果表

图示

CN与RA指标预测精度变化趋势如图7-22所示。

图示

图7-22 化工供应链网络预测精度走势图

五、结果分析

从表7-11可以看出,总体上,加权CN指标的预测精度处于59%—66%之间,这表明,无论如何改变权重,CN算法对精度的提升空间有限,并不是本网络适用的算法。而加权RA的预测精度处于71%—85%之间,加权后的RA算法比加权的CN算法预测精度高很多,这表明加权的RA算法对化工供应链关系网络的预测效果是不错的。同时,我们得到非加权RA算法精度达到86.488%,相比于加权的RA算法,在不计算权重的情况下,预测效果反而提高。在生产—使用关系权重降低的情况下,预测效果得到提升,这也符合以往研究中对“弱连接效应”的猜想,表明本化工供应链关系网络也遵循弱连接的效应。实际上,在化工供应链中,企业与企业的某种合作关系的建立更多的是倾向于看重同层之间合作伙伴而不是上下游的供应关系,也就是说企业更倾向于和供应链本层级的企业进行合作,而很少会选择跨层次合作。

从现有结果来看,企业与企业的关系实际上是由相关的产品间接产生的,因此,企业节点度分布形态与产品节点度分布形态就存在一致的变化。在网络结构方面,1-模形态的企业节点度值分布与产品节点度值分布呈现一致的态势,且没有表现出幂律分布的现象。我们猜测很有可能是以下原因造成的:

第一,本网络由于无法获得实际中供应与生产的一一对应数据,并不是对现实供应链的直接映射,其中必然有某些企业不存在关系,却无法识别出来,这导致网络度值分布、结构等出现一定误差。

第二,本网络数据只涉及化工供应链中处于中游的部分产品,其上游和下游还存在许多重要产品节点,有可能对整个化工行业网络起着十分重要的作用。这种提取部分网络节点的做法会在一定程度上分割网络形态,有可能只是整个产业网络局部的反映,不能代表整体。这种部分分割会造成结构偏差。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈