信,皇,技术 D0I 10.39696.issn.1672—6375.2017.06.001 2017年(第46卷)第6期 一类确定型的小世界等级指数型复杂网络模型 赵倩 兰州730030) (兰州市卫生统计信息中心,甘肃摘要:小世界效应在实际生活中是随处可见的,例如复杂网络中的六度分离理论。本论述为了更好地研究小世界网络的 拓扑结构,采用完全三部图 为基本元素,通过循环迭代的算法程序,设计了一类小世界网络模型。首先,分析了它的重 要拓扑参数:聚类系数、直径和平均距离,得证该模型具有小世界效应,而后通过计算机仿真还获知该模型具有等级结构。 其次,通过计算其顶点的累积度分布得知,该模型拥有指数分布特性。最后,利用特殊的演化过程,得到了其最多叶子生成 树的叶子数目。 关键词:复杂网络模型;小世界效应;等级结构;指数分布;最多叶子生成树 中图分类号:N94;O173 文献标识码:B 1引言及背景 近年来随着互联网技术的不断发展与更新,人们 对复杂网络的研究,迎来了一个热潮,越来越多的科研 工作者们对其投入了大量的研究精力,因此获得了很 多研究成果和大批网络模型,如:物联网、地震网、食物 链网、电力网、细胞新陈代谢网、神经信号传送网、股市 gann 建立了可随机替换的WS小世界模型,2000年, Kleinberg[8 介绍了一类演化的小世界网络模型,其中的 构成元素是二维的方格子。在国内,章忠志 m 等人在 Physica A杂志上分别于2006年提出了一类边循环迭 代演化的确定型小世界网络模型和2012年提出了以 Farey图为基本生成元素的小世界网络模型。除了小 世界效应之外,复杂网络还具有指数分布特性 ],即:顶 网等。事实上,关于复杂网络的研究经过了一段很长 的时间,上世纪60年代,匈牙利数学家Erdos和Renyi 提出了随机网络模型,称为ER模型…。上世纪末,统计 物理学家A.L.Barabasi和他的研究生R.Albert 通过对 万维网随时间演化过程的研究,发现很多现实中的复 点的累积度分布服从指数分布。Dorogovtsev、Goltsev 和Mendes等人n¨也发现了网络中存在等级结构,即: 度为k的顶点的聚类系数c 满足c .1}~。随着网 络研究的不断深入,网络安全[12-20]引起了人们的高度重 视,生成树的数目就是其中一个与安全性能相关的重 杂网络都具有两个基本的形成机制:增长和择优连 接。1998年,Watts和Strogatzb 首次构造了一类具有 高聚类系数和低平均距离的网络模型,叫做WS模型, 要指标,其作为网络的一个不变量,与渗流、疾病传播、 网络同步性能和随机游走等都是密切相关的。 也称为小世界网络模型(small—world mode1),为此把高 聚类系数和低平均距离(或小直径)作为小世界效应的 两个重要的拓扑参数,之后为了更好地揭示小世界网络 背后所蕴藏的拓扑结构与演化机理,Newman和Watts[5刮 丰富了已有的WS模型。除此之外1999年,Kasturiran一 2定义和命题 (1)作为衡量一个网络传输性能与效率的重要参 数直径D和平均距离 ,它们的定义如下: 对于Ⅳ 中的任意两个互异的顶点i和 来说,它 们之间的距离d 表示连接顶点i和 的所有路中内部 收稿日期:2017—03—12 作者简介:赵倩(1978一),女,汉族,甘肃武威人,硕士,工程师,主要研究方向:计算机技术。 4 2017年(第46卷)第6期 信,皇,技术 边最少的那条路所含边数的数目,直径D就是指网络 中任意一对互异顶点i和 距离d 的最大值,记为 式中 =U ,E。=UEU (1), (1)表示由任 』=1 J 1 D=max{a li,j∈Ⅳ ;平均距离 指网络中所有顶点对 和_『距离 的和与—IV(t)lO v(tx-I)的比值—一意一个拷贝图G ,E )中的核心集合中的任意一个顶 点与其余n一1个拷贝图中核心图中的每一个顶点连线 所产生的边集合,连边运算中不允许重边和自环的出 ,记为 ∑d d= Ev(o 现,把由这一组拷贝图中核心点集合通过映射厂(1J作用 后产生的子图称为图G, ,E,)的核心图日(1),从核 0V(t)lOV(t)l一1)1/2。 (2)结合大量的实际网络模型的研究数据和相应 的计算机仿真模拟,一些网络模型具有如下的拓扑性 质: (a)低的平均度< >(稀疏性) :当时间t很大 时,存在一个常数A,使得<k>_÷A成立; (b)指数分布:对于任意选取的度为k顶点,其概 率服从指数分布,即:P oc 卢。~。或者,对于任意给 定的一个度值k,网络中度数大于 的顶点的数目服 ∑ k 、, 从指数分布,即:P一  ̄a2lfz~, 表示t 时刻顶点度数等于k 的顶点数目; (c)高的聚类系数:当时间t很大时,总存在一个正 常数8,使得C≥占成立; (d)等级结构性 :对于任意选取的度为k顶点,其 聚类系数C满足C。ck~; (e)小的直径:随着时间t的延续,网络模型的直径 满足D 。c ,ln(1V(t)1); (f)低的平均距离:随着时间t的延续,网络模型的 平均距离 满足 ocoL l ̄(Iv(t)l1。 命题1网络模型具有小世界效应,如果它拥有高 聚类系数(c)、小的直径(e)和低的平均距离(f)。 命题2网络模型具有指数特性,如果其顶点的度 分布(累积度分布)服从指数分布(b)。 (3)网络运算映射.厂:对于一个给定的简单图 G 目,顶点集合和边集合分别为 和E,简单记作 G。对任意的一组顶点集合(核心集合) @={131) :,…,"oi},都可以得到图G的一个顶点导出子 图G( ( ),E( )),若将图G拷贝上n个,依次标号为 G ( ,E ),G ( ,E ),…,G V-,E“),映射f作用在这一组 图集合上,便能得到一个诱导图。如下: (G ,G ,・一,G )=G,( ,E。) (I) 心图日(1)中任意选出i个顶点作为核心顶点集合,再拷 贝上n个图G ,E ),按照生成图G。 ,E。)的过程,这n 个图G。 ,E )在映射, ’下便可得到一个新图 G: ,E:),这个过程可以重复多次,直至得到理想的模 型,这样便得到一组模型,构成了一个网络模型空间 (G ,H(t)dfv',t)。 (4)网络运算0:一般而言,对于一个随时间不断 变化的复杂网络来说,获取它的直径D和平均距离 的数值是一件很困难的事.为此文中定义了一种新的 网络运算,简称为0运算,其运算法则被展示在等式 (2)中。 文中的网络模型JJv∞的建立是依阶数为6的完全 三部图 为基本元素,结合了增长和优先连接两大 基本演化机制,并采用了循环迭代的算法程序(网络运 算映射厂)得到的.其顶点集合和边集合分别用 (f)和 E 表示,相应地,顶点数目和边数目用I (f)l和IE(f)I表 示,记号[m,n】表示m,m+1,rn+2,…,n一2,n—l,n的自 然数集合。 。。 z1 (6l+ )c』]d 口l6l cldl 。 a:b2 c:d2 =l (62+ )cJJ ] ●●● 。 = a。b ●●● 吼 +LJ 1 )cJ] i 1= 【 = 1鲫 JJ (6m十 ) - .. (2) 3建立网络模型 (1)在£=1时刻,初始网络模型Ⅳ(1)是一个具有6 个顶点的完全三部图 依次将其三部分标号为 B(1),B(2), (3),图1中的左图。 5 信息技术 (2)在t=2时刻,网络模型/、,f2)是由3个初始网络 模型N(1)组成的。从每一模型Ⅳ (1),i∈【l,3】中选出在同 一2017年(第46卷)第6期 4网络模型N(t)的拓扑性质 下面将以定理的形式详细讨论文中模型N(t)所具 部分中的两个顶点构成顶点集合B。∽√∈【1,3],然后 用选定的这三部分中的6个顶点在网络运算映射厂【2】 有的拓扑性质。下,相互连接构成一个新的完全j部图 ,称它为模 型N(2)的中 tL,图,也称核心图,简单记为dP(2),图l中 的中间图。 (3)在t≥3时刻,网络模型N(t)是由3个网络模型 N(t—1)组成的,依次记为 —l ∈[1,3]。从每一个模 型Ni(t一1 ∈[1,3]的核心图qbj(t一1)中选出在同一部分 中的两个顶点构成顶点集合B (j),jEl1,3J,然后让这6 个顶点在网络运算映射 卜下连接组成模型N(t)的中 心图 ∽,见图2。 这样的循环迭代运算(网络运算映射厂)过程可以 进行无限次,直至达到所需的网络规模.在t时刻后,模 型N(t)的顶点数(模型的阶)和边数(模型的尺寸)分别 如下 tv(t)l=31V(t一1)1=3 w(1)l:2×3 (3) IE( )I:31E(£一1)I+鱼! :2×3 .-一6 (4) 婚静 图1 N(1),N(2)和Ⅳ(3) ①N(t一1) 图2模型N(t1 6 4.1平均度<k> 作为一个网络模型的重要结构参数(拓扑参 数)——平均度<k>,体现了所建构模型的稀疏性 (sparse),其拓扑定义为:网络模型所具有的边数目的2 倍与网络顶点数目的比值,即 = (5) t时刻之后,网络模型N(t)的平均度 < >: 6,是一个很小的数值,满足性 x j 质(a),所以说模型Ⅳ( 具有稀疏性。 4.2聚类系数 作为另一个定量描述网络拓扑性质的参数——聚 类系数,它刻画了网络的集聚程度(整体和局部)。例 如:在研究者合作网络中,每一个小团队中的成员之间 的合作是相当紧密的,既而在他们之间会形成很强的 互动联系,然而每一个团队之问的联络就没有如此的 紧密了,并不是两个团队中的每一个人都参与互动,只 是每个团队中的个别人(领头人)与另一个团队中的个 别人(领头人)发生联系,通过这种互动关系依次逐渐 形成了更大的合作网络。在拓扑学中,顶点i的聚类系 数C.被定义为与顶点i相连的三角形的个数和顶点i 相连的三元组的个数的比值,即 E(£) (6) F 式中E (£)表示模型N(t)中顶点i的邻居顶点之间 实际存在的边数, .( 。一1)/2表示模型Ⅳ(£)中顶点i的 邻居顶点之间最多可能存在的边数。对于整个网络而 言,聚类系数c 丽Ci。据此可以得到模型,v(z)中 每个顶点的聚类系数,见表1如示。 表1 则整个网络的聚类系数 c= 南= JP c( )=善;× + ×_4 2>。_524(7) 2017年(第46卷)第6期 信,皇,技术 图3整个网络模型J7、r∞的聚类系数 可以看出模型Ⅳ 具有很高的聚类性,满足性质 (c).当1<t≤100时,模型Ⅳ∞的聚类系数变化曲线可 以参看图3。 从上述表格中易见:对于顶点度为k=4i(i足够的 大)的顶点而言,其聚类系数符合如下的方程 c 2×k (8) 满足性质(d),所以说文中的模型Ⅳ∞具有等级结 构性。 4.3度分布 网络模型的度分布是衡量模型是否具有某种特性 (例如:无标度特性——度分布服从幂率分布,指数分 布特性——度分布服从指数分布)的拓扑参数,文献 [1 1]中Dorogovtsev提出了对于确定型演化模型度分布 的计算公式,即: ∑ P一 (9) 上式中nat)表示t时刻顶点度数等于k 的顶点数 目。为此,给出模型J7、r∞的顶点的度谱表格,如表2所示。 表2模型Ⅳ(f)的顶点的度谱表格 可以看出:顶点的度谱是一列离散的实数数值。 对于度值为k=4(t—t +1)的顶点而言,根据公式(9)有 lj一1 P-. =— 2+4∑3 =3 ~=3×3 一^ (1o) U 模型ⅣO)的累积度分布服从指数分布,满足性质 (b),说明该演化模型是指数分布型网络模型。 4.4直径和平均距离 大量的实验数据表明生活中许多演化网络拥有小 世界效应,即:随时间的推移,演变模型具有小的直径 D和低的平均距离 。在获知模型Ⅳ 具有指数分布 特性后,这一部分将证明它的小世界效应。鉴于文中 模型N(t)的特殊构造过程,直径D和平均距离 的表 达式将被呈现在下面的定理中。 定理1在t时刻,模型J7、『 的直径D 为 1fD =2t一1,t≥2 ,1 1、 D(1)=2,f=1 证明:当t=1时,模型N(1)就是一个完全三部图 ,易知其直径D(1)=2,符合定理1中陈述;当t=2 时,模型Ⅳ(2)是由3个完全三部图 组成的,易知其 直径D(2)=3=2×2—1,也符合定理1中陈述;当t≥3 时,模型Ⅳ ) 由3个N(t一1)构成的。从图2中可以得 出:直径DO)的长度是一条始点i和终点.,属于不同组 成部分ⅣlO一1)qe[1,3])的路的长度,否则,假设始点i 和终点 在同一个 一1)(1e[1,3])中,显然一定有 d O一1)≤D 一1)成立,那么就会有如下的不等式链 lD ≤D 一)二1 ≤…≤D(2)=3 一 . (12) 但这是矛盾的,既而假设错误.由于模型Ⅳ 具有 很好的旋转对称性,不防设顶点i属于N。 一1),顶点j: 属于N2(t一1),那么直径D 就是 D =d讲㈣ +1+ ㈤ (13) 式中d哪, 等于顶点i到Ⅳl 一1)中核心顶点 H(t,1)(数目是两个)的距离, ㈤ 等于顶点 到 N2(t一1)中核心顶点H(t,2)(数目是两个)的距离。由上 述方程(13)可知 fd///0,1) = -Tj…ti ̄s,z) vi, (f)= . 4 联立(13)和(14),在初始条件D(2)=3下便可以得 到 』D( = +l+ -2(t—1)+1=2t-1,t>1 (1)=2, 1 (15) 证毕。 可以看出,随着时间t的推移,直径D =2t一1与 7 信息技术 2017年(第46卷)第6期 顶点个数IV(t)l=2X 3 的自然对数值是同阶的,即: 2t一1 ocIn3Xt+In2, 一。。),满足性质(e)。 接下来讨论模型ⅣO)的平均距离 。 定理2在 时刻,模型Ⅳ0)的平均距离 为 + : 赤 号争 2 证明:当t=1时,模型N(1)就是一个完全i部图 ,则 = _1.2。当f=4时, 的计算过程将在文章末尾的附录I中以例子呈现, 仅供参阅。当t>2时,模型Ⅳ(£)中所有顶点对i和 的 距离dij(t)的和d0)=∑d 满足如下递推公式 d(t)=3d(t一1)+△ —1). (17) 式中△O一1)表示属于ⅣO)中不同小块 一1) ∈【l,6])(见图4)的任意一对顶点U和 距离之 和,即:a(t—1)=∑d (£)。通过Ⅳ(£)的构造过程,可 以重写A(t一1)为 ・2 o(t-1)+[ … 依据对称性可知 ∞-1(£ 1))== ∑{√i :0 l(f~1, )lJ∑J 0 = (d(£一1, )+d() t-lj))A(t-l√)]l J)} (19) 式中d0—1, 表示在同一个小块oq(t一1) ∈【l,61) (见图4)中到核心顶点H(t,D距离i=d(t—l,0,A(t一1,0 表示了在同一个小块 (f一1)(/ell,6J)中到核心顶点 H(t,D距离为i=d(t一1, 的顶点数目(可以参看附 录Ⅱ).结合模型的构造过程和附录Ⅱ,有如下的一组 方程 A(f,0)=1,A(t,1)=2£,A(i, )=0£>户 .A(i, )=2 A(£,i)=A(£一1,i)+2A(£一1, 一1) A(t—l,i)=A(£一2,i)+2A(£一2.i-1) 8 . 。 ‘ A( + , ) ( , )+2A(i,i-1) (20) 易得A(t,i)的递推公式 I =A“,0+2ZAO,i一1) A(t, l一 1 (21\ ,) :2‘+2 ̄AO',i-11 』=i 进一步可得 = i)+2yA(i ,i。一1) f—J, 2—1 、 =A(t,i.) 2 +2∑}A(i。一1, 。一1)+∑A(i,, 。一2)} 2 l\ l-1 f r一1 一1 i2—1 f—I i2—1 I1一 \ =2 I\ 1+∑+i2 i1‘∑∑+…+∑∑…∑A! ili3 il一1 i2=ili iJ _。 i =2 (i 1)IJ (22) 联立方程(17)一(22)以及应用0运算可得 3 + 计算并化简可得方程(16),证毕。 图4模型Ⅳr3)和Ⅳ 的剖分 2017年(第46卷)第6期 信,电技术 当£ o。时,网络模型Ⅳ 的平均距离 一百4t。 网络模型Ⅳ 的顶点数目的对数为tIn3+ln2,则 子生成树的叶子数目为Lu∞等等。下面我们不加证明 地给出如下推论: } 鲁=D(1),满足性质∽。当1< ≤100时,模型 子生成树 Ⅳ 的平均距离变化曲线见图5。 ( 推论1 t时刻之后,模型J7、r∞的任意的两个最多叶 和 的顶点集合满足 ) v(t一2) (24) )n ( 可以看出模型Ⅳ 符合命题1,说明Ⅳ 是小世界 网络模型。 定理3 t时刻之后,模型Ⅳ∞的最多叶子生成树的 叶子数目 ∞为 ∞=4X3 ‘ (25) 证明:通过分析及图2可知,在J7v(c)中,只有当每一 个N(t—1)都是最多叶子生成树时,Ⅳ∞的生成树才具 有最多的叶子,因此有 』l :L 3f1)=4 × 一1) 计算知 (f)=4×3 ,证毕。 (、2。6 ) 5结束语 图5整个网络模型Ⅳ∞的平均距离 4.5最多叶子生成树 本论述以完全三部图 为基本的构成元素,通 对于一个给定的模型,它的生成树的数目不仅是 一过循环迭代的运算映射.厂,构造了一类复杂网络模 个不变量,而且还刻画了它的安全可靠性、随机游 型。通过计算该模型的平均度和顶点的累积度分布, 获知该模型不仅是稀疏的,而且具有指数分布特性;理 论分析和数值仿真均表明,该模型具有小世界效应, 即:高的聚类系数、小的直径和低的平均距离;最后,利 用特殊的演化过程,获得了它的最多叶子生成树的叶 子数目.希望文中的研究方法能有助于今后复杂网络 的研究 _32】,后续将开展进一步的探索,不仅通过丰富 基本元素之间的连接方式,而且结合概率,增加网络演 化的随机性,以期获得更加符合现实网络的演化模型。 走、优化同步性以及渗流效果.对于一个给定的有限图 而言,它的生成树的数目都能通过Kirchhoff's矩阵树理 论得到,即该图的Laplacian矩阵的所有非零特征根的 乘积,这仅仅只是一个理论分析,面对成千上万个顶点 的庞杂网络模型,一般的计算机在短时间内不可能获 取相应的数值,如何找到有效可行的好算法,已经成为 一个迫切、有待深入研究的问题。在近几年已发表的 文章中 圳,作者们针对每一类特殊的模型,提出了一 类计算生成树数目的循环算法.作为一类特殊的生成 树——最多叶子生成树,其指的就是网络模型中用最 少的顶点来控制最多的一度顶点(叶子)的一类树。在 附录I 的计算过程 按照对模型Ⅳ(4)的剖分过程,依次给每一个小块 标号为n (3),a2(3),a3(3),cL4(3),o5(3),cl6(3)。当顶点 实际网络中它有着广泛的用途,例如:在一个时序In. ternet中,大量的用户都是一度顶点,并且随着时间的 延续,这类用户的活动是最频繁的,即很频繁地进人网 多叶子生成树是很有必要的。 U和v都在同一个分支ct,(3)(i∈[1,6])时,它们之间的距 离记作d ,则有∑d = 。当顶点u和v不在同一 。络、退出网络、重新与其他顶点连接等等,所以研究最 个分支 ̄ti(3)(iE[1,6])时,由于旋转对称性,不妨设UEG (3)、VEO2(3),它们之间的距离记作d ,则有 在文献乜 圳中,作者们已经对最多叶子生成树进行 了初步的研究,提出了控制顶点集合(Dominate—Ver- ∑d = (3).应运网络运算0,则有以下方程 ve er,(3) tex-Set),简记为D—V—S,平稳集(Balance—set),最多叶 0(3)的表达式: 9 × (U )cJ] oo J = 492 (34) r1 X0、 (3)= 6x lr1 X0、 8X3 2“) 2 8×3 (2.4) l。l 2 I= U(2+ ) =0 J =o =o J 6× (L, + ) 附录1I: (27) . 1 l × × × J 表1模型Ⅳ∽中的A(j,0和d0',0 8× (U3+dJ)cJ] =54+486+1296+1080=2916 既而,有A(3): ] 叫卅叫一-1] J] J f=: △(3)=12(2196+729)=35100 (28) 为了获得△(1)和A(2),同理有以下的方程 0(2)的表达式: r1XO、 f,1×O、 (2)=l 4×14×2 l/l 2.3) 0I 4X 4X21 3l ) = (29) (3O) 0)(2 x0) 嚣 图5模型Ⅳ(4)的平均距离 的图示 △(1)的表达式: △(1)=12(12+9)=252 (32) 联立方程(27)一(32),再根据公式(23),便有d(4) 的表达式 d(4)=33d(1)+3 △(1)+3△(2)+△(3)=48546 (33) 根据公式(16),可得到模型Ⅳ(4)的平均距离 10 : 2 + 0 = @ 参考文献: [1]Erdos P,Renyi A.On random graphs[J].Pub1.Math.1959 (6):290—297. 12 J A.一L.Barabrsi,R.Albea,H.Jeong Mean—field theory for SCale'free random networks Physiea A.1999(272):173—187. 【3 J D.J.Watts,Small W0r1ds: I'Ile Dynamics of Networks be. tween Order and Randomness(Princeton University Press, Princeton,NJ,1999). 14 J D.J.Watts and S.H.Strogatz,Collective dynamics of small— world networks[J].Nature.1998(393):440—442. [5]M.E.J.Newman,D.J.Watts.Phys.Lett.A 263(1999)341. [6]M.E.J.Newman,D.J.Watts.Phys.Rev.E 60(1999)7332. [7]R.Kasturirangan.cond-maff991M055(1999). [8]J.Kleinberg.Nature.406(2000)845. 19 J Z.Z.Zhang,B.Wu,Y.Lin.Counting spannin。g trees in a smM1一wodd Farey graph,J.Physica A,391(2012)3342— 3349. [10]Z.Z.Zhang,L.L.Rong,C.H.Guo.A deterministic small— wodd network created by edge iterations[J].Physica A.363 (2oo6)567—572. [11] S.N.Dorogovtsev,A.V.Gohsev,J.F.F.Mendes.Phys. Rev.E 65(20o2)0066122. 【12 J B.Yao,M.Yao,X,E,Chen,X.Liu,W.J.Zhang,Re— search on Edge—Growing models related with scale-free small—world networks[J],Applied Mechanics and Materi- als,Volumes 513-517,2014. 【13 J C.M.Song,T.Koren,P.Wang,A.一L.Barabasi,Model— ling the scaling properties of human mobility[J].Nature Physics.2010(1760):1-6. 2017年(第46卷)第6期 信息技术 (上接第85页) 好的服务于广大基层患者。 参考文献: 于传统刷片,主要是因为传统刷片涂片面积较大,涂片 过厚,细胞受外力破坏,涂片时有些细胞重叠,结构不 [1]武春燕,王彦丽,陈岗,等.液基细胞学在肺癌支气管刷片 检查中的应用价值[J].同济大学学报(医学版),2009,30 (3):65—69. 清,标本固定不及时导致细胞风干变形。与传统涂片 方法相比,离心法利用细胞黏附原理,使用特殊的细胞 基液将脱落细胞混匀,去除粘液及红细胞,然后进行离 心甩片,细胞丰富,背景清晰。 国产离心法液基细胞制片系统是一种改良的细胞 [2]陶玉,何松,吉志固.4种液基细胞制片的比较EJ].临床与 实验病理学杂志,2009,25(5):559—561. [3] 国宏莉,唐幕湘,田林,等.宫颈液基细胞学检查国内外方 法的对比研究[J].西部医学,2009,21(9):1524-1526. [4]王娅.1I.T与TCL两种液基细胞学技术应用对比分析[J]. 河北医学,2013,19(4):558—561. 学制片技术,由于其本身的优点,是支气管镜刷检诊断 肺癌是一种可靠方法。且由于其操作简便,省时省力, 成本低廉,质量稳定,更适合基层单位广泛开展,能更