搞懂图论中的中心性

大家好，欢迎来到IT知识分享网。

文章目录

0. 前言
1. Degree Centrality
2. Eigenvector Centrality
3. Katz Centrality
4. PageRank
参考资料

0. 前言

中心性（Centrality）表示的是图（Graph）中，每个节点的重要度。图在越来越多的领域中被应用，甚至在图像小样本分类中，也有了应用，比如2022年的一篇CVPR论文《Learning to Affiliate: Mutual Centralized Learning for Few-shot Classification》就用了中心性来解决小样本分类的问题。

本文就是对目前比较主流的几种求图中心性的方法进行的梳理。

在进行算法的说明之前，首先要搞清楚，什么是“节点的重要度”。不同的方法对其定义也不相同，比如重要度可以是有多少条边从这个节点出发的，可以是有多少边经过了这个节点，也可以是有多少条边到达了这个节点。对于无向图来说，这三者都是一样的。不同的定义，对应着不同的方法，下面会详细展开讲。

1. Degree Centrality

度中心性，这是容易理解的一种中心性。它对重要度的定义是节点的入度。这是非常直观的一种定义，比如一篇论文被引用的数量可以表示其重要度。

图1-1 示例图

这种方法的缺点在于无视了与其相邻的邻居的重要度，这样很容易被造假。比如就网站的重要度而言，如果想要提高自己网站的重要度，只需要设计许多无意义的网站指向需要提高重要度的网站即可。

2. Eigenvector Centrality

特征向量中心性，如果使用转移矩阵，它对重要度的定义就是节点被访问的概率，如果使用邻接矩阵，它对重要度的定义就是邻居的重要度。这里涉及到一个随机游走(Random Walk)的概念，就是随机在图上的每个节点安排几个粒子，将粒子所在的位置作为起始点，然后每次随机走过一条边，记录每个节点被访问的概率，将这个概率作为重要度。

举个例子（以转移矩阵为例），图1-1所示的图的转移矩阵可以表示为

图2-1 转移矩阵

同理，可得此时落在各个节点的概率变为了

$\approx [0.38, 0.21, 0.21, 0.21]$

可以发现，在这个例子之下，粒子落在每个节点的概率在逐渐收敛。

先说结论，这个最终收敛的概率向量就是邻接矩阵的特征向量，且这个特征向量对应的特征值是所有特征值中最大的。

并不是所有的 $\times n$ 转移矩阵 $T$ 都是可以收敛的，这里要求转移矩阵是不可约矩阵(irreducible matrix)，也就是说该转移矩阵对应的图必须是强连通图，也就是说，图中的任意一个节点都可以到达图中另外一个节点。

根据Perron-Frobenius定理，如果 $T$ 是不可约的，那么

T有一个最大特征值 $r$ ，且 $r > 0$ ；
$r$ 对应的特征向量中的所有元素均为正

这里来证明一下为什么不断游走的过程最终会收敛到转移矩阵 $T$ 特征值最大的特征向量。

首先，上述游走的过程就是初始概率 $x_0$ 不断左乘邻接矩阵 $T$ 的过程，第 $t$ 步的概率可以表示为
$x_t = T^tx_t= Tx_{t-1} \tag{2-1}$

假设 $\times n$ 的转移矩阵 $T$ 的单位特征向量为 $v_1, v_2, …, v_n$ ，对应的特征值为 $\lambda_1, \lambda_2,…,\lambda_n$ 。这里为了最终表示方便令特征值是降序排列的，即 $\lambda_1 > \lambda_2 > \dots > \lambda_n$ 。由于单位特征向量直接线性不相关，所以任意一个 $x_t$ 都可以表示为其线性组合

$x_t = \beta_1 v_1 + \beta_2 v_2 + \dots + \beta_n v_n \tag{2-2}$

那么就有

$x_1 = Tx_0 = \beta_1 Tv_1 + \beta_2 Tv_2 + \dots + \beta_n Tv_n \tag{2-3}$

根据特征值的性质有 $Tv_1 = \lambda_1 v_1$ ，带入 $(2 - 3)$ 可得

$x_1 = Tx_0 = \beta_1 \lambda_1 v_1 + \beta_2 \lambda_2 v_2 + \dots + \beta_n \lambda_n v_n \tag{2-4}$

我们之前已经假设了 $\lambda_1 > \lambda_2 > \dots > \lambda_n$ ，故有
$lim_{t \rightarrow +\infty} (\frac{\lambda_n}{\lambda_1})^t = 0 \tag{2-7}$

则经过无穷多次迭代之后，就有

$x_t = Tx_{t-1} = \lambda_1^{t} \beta_1v_1 \tag{2-8}$

$\lambda_1^{t} \beta_1$ 是个常数，也就是说，最后收敛得到的就是转移矩阵 $T$ 特征值最大的对应的特征向量。

当然最终要能收敛还有一些约束条件，因为最大的特征值可能是负的之类的情况：

图中没有dead ends，也就是没有只进不出的向量，这会导致最终收敛到0；
图中没有spider traps，也就是没有cyclic structure

其实，这就是说矩阵要是不可约矩阵。

3. Katz Centrality

Katz中心性对重要度的定义和特征向量中心性的定义是一致的，一般使用邻接矩阵，那也就表示了邻居的重要度。

这个矩阵表示了图的结构，如果两个节点相连，那么对应的矩阵位置 $ij$ 就是1。特征向量中心性也是可以用邻接矩阵来算的。

我们令两个邻接矩阵相乘可以得到

$M^2 = \left[ \begin{matrix} 2 & 0 & 0 & 2 \\ 1 & 2 & 1 & 0 \\ 1 & 2 & 1 & 0 \\ 1 & 1 & 1 & 1 \end{matrix} \right] \tag{3-2}$

令三个邻接矩阵相乘可以得到

$M^3 = \left[ \begin{matrix} 2 & 4 & 2 & 0 \\ 3 & 1 & 1 & 3 \\ 3 & 1 & 1 & 3 \\ 3 & 2 & 1 & 2 \end{matrix} \right] \tag{3-3}$

仔细观察可以发现， $M^t$ 中的位置 $ij$ 表示从 $i$ 走到 $j$ ，长度为t的不同路径的数量。比如 $M^2[1, 0] = 1$ 表示从A到B，长度为2的路径只有1条，观察图1-1可以发现，确实只有1条，为【A->D->B】。这就是邻接矩阵累乘的实际意义。

为了解决这个问题Leo Katz提出了用一个系数 $\alpha \in (0, 1)$ 来惩罚长的路径，其具体定义如下式 $(3 - 5)$ 所示。
$x_t =\alpha Mx_{t-1} + \beta \tag{3-5}$

$\alpha$ 和 $\beta$ 都是常数。 $\beta$ 是初始化的中心性，这个其实无所谓，取度中心性就可以，取1取0也是有的。惩罚因子 $\alpha$ 就比较重要了， $\alpha$ 不能太大，大了，比如取1，就相当于是特征向量中心性了，一般 $\alpha < 1 / |r|$ ， $r$ 是 $M$ 的最大特征值； $\alpha$ 也不能太小，小了，比如取0，就变成度中心性了。

假设最终可以收敛，令 $x_t = x_{t-1}$ ，那么根据式(3-5)就有
$x_t = \beta (I – \alpha M)^{-1} \tag{3-6}$

这就是计算katz中心性的式子。

4. PageRank

PageRank对重要度的定义和特征向量中心性的定义是一致的，也就是邻居的重要度。Katz中心性的问题是，一个高中心性的节点，会把其影响传播给其他的节点，比如google链接了无数的网站，google的中心性很高，这就会使得google指向的网站中心性都很高，这是我们不希望的。PageRank通过出度(out-degree)将中心性进行了稀释。

PageRank的定义为

$x_t = \alpha MD^{-1}x_{t-1} + \beta\tag{4-1}$

其中 $D$ 是一个对角矩阵， $d_{ii} = max(r_{i}^{out}, 1)$ ，对于没有出度的，令 $d_{ii} = 1$ ，相当于中心性除以了出度。

同样的，上式可以表示为

$x_t = \beta (I – \alpha MD^{-1})^{-1} = \beta D(D – \alpha A)^{-1} \tag{4-2}$

同样地， $\alpha$ 的取值是有范围的，不能大于 $AD^{-1}$ 的最大特征值的倒数。特别地，对于无向图来说，这个值就是1。

参考资料

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://haidsoft.com/119130.html