pr-core的工作

1.定义

给定M是概率转移矩阵，就是网络邻接矩阵对应的归一化矩阵
计算p=pM，p是M最大本征值对应的本征向量，也就是不带随机游走项的pagerank值
pagerank_core定义为：

$$pr_c=\frac{kc}{\sum{i,j}W_{ij}}$$

其中，$\sum{i,j}W{ij}$是邻接矩阵的和，也就是所有边的数目的两倍，或者是网络的每个结点的度和
删除小于某个$pr_c$的结点，对剩下的结点在计算pagerank值，如此反复，直到不可删去，这些删去的结点对应此时的$pr_c$值
最终，得到整个网络的pagerank_core

在对一个全连通的undirected network，pagerank值对应的就是它的归一化后的度值

$$(d_1,d_2,…,d_n)=(d_1,d_2,…,d_n)M$$

也就是，当没有随机游走的时候，pr-core得到的结果应该与k_core一样，所以可以看看在有向网络和加权网络上，pr-core的效果
对一个非全连通的网络，它的pagerank值的初始化默认是给每个节点赋同样的值，这就导致出现如下情况：（以随机生成的小世界1000个结点的网络为例，删去了一些结点后，图不连通了）

可以找到联通的子图，对子图分别算pagerank值，然后按照子图的边值占总边数的比来乘以对应点的pr值，可以得到下图：

问题是，需要这样吗？在一个大集团中小k_core的结点的传播能力可能比小集团大k-core的结点传播能力要强
数值计算问题

绘制了随着alpha变化的pr_c，k_c与实际传播能力的坎德尔系数

但由于计算中不可避免的遇到数值舍入的问题，会导致最终计算的当alpha=1时，与k_core有差异，而且还挺大

我稍微放宽了pr_core在实际计算中的条件（每次判断要不要舍弃的时候，原本是要求<pr-core，放宽到<pr_core+0.001）