Fast Newman-FN算法以及模块度定义介绍

一、社区的定义

Newman第一次提出模块度定义就是在2004年发表的这篇文章“fast algorithm for community structure in networks”，第一次用量化的公式来确定社区划分。

首先，我们来看Newman如何定义社区的：the vertices in networks are often found to cluster into tightly knit groups with a high density of within-group edges and a lower density of between -group edges。

用大白话说就是：社区内部的边尽可能地多，但是社区之间的边尽可能地少

（一些定义）：i、j指社区i和社区j；

n是网络中节点的数量；

m是网络中边的数量。一条边上连接两个节点，和明显，2m即网络中所有节点度之和

二、如何量化到模快度？

我们先用e_ij表示社区i和社区j之间连接的边的数量比整个网络边的数量，e_ii表示社区i内部边的数量比整个网络边的数量，既然这样的话我们只要使∑_ie_ii尽可能大就好了，但是问题又来了，最大肯定就是1咯，所有节点归为一个社区，那这样很明显就没有意义了。

于是他有提出，网络中连接两个同种类型的边（即社区内部的边的比例e_ii）减去在相同结构下任意连接这两个节点边的比例的期望，于是模块度登场

Q=∑_i(e_ii-a_i²)

其中，a_i=∑_je_ij表示与社区i中节点相连的边占所有边的比例。如果社团内部边的比例不大于社团内部边随机连接的期望，那么Q=0,最大时为1。一般来说，Q值最大对应的社团结构就是网络中的社团结构

三、如何变成算法可操作性？

意思来了，我们只要优化Q就好了，但是如何把n个节点划分多少个社区？每个社区多少个节点？作者指出有2^n-1种可能，这样的话根本无法将Q推广在高于20节点以上的网络？为了减少时间复杂度，作者提出一种贪婪策略

FN：（1）首先将网络中每个节点自定义成一个社区

（2）计算出两两社区结合是Q的值，找到Q增加最大的或者减少最少的合并方式进行社区合并

（3）直到所有社区合并成一个大社区时停止，找出合并过程中最大的Q是的社区划分结果

这个时候，Newman有注意到，当两个社区合并时，模块度的增量detaQ=(e_ji+e_ij-2a_i*a_j)=2(e_ij-2a_i*a_j)

四、代码来了

clear all

close all

clc

% load preprocess.mat

% E=e;

load('dolphin.mat');

E=A;

% E(find(E>0))=1;%建立邻接矩阵

tic;

e=E;

e(e==1)=1/sum(E(:));

a=sum(e);

n=size(A,2);

b=[1:n];

b=num2cell(b);%用来存储社团元素的变量

c={};

k=1;

while length(e)>1

      lg=length(e);

      detaQ=-(10^9)*ones(n-k+1);%△Q

      for i=1:lg-1

          for j=i+1:lg

             if e(i,j)~=0

                detaQ(i,j)=2*(e(i,j)-a(i)*a(j));%计算△Q

             end

          end

      end

   if sum(detaQ+(10^9))==0

      break

   end

% Q(k)=max(detaQ(:));%寻找△Q的最大值，并把它存储进Q(k)矩阵

%-----------------------------寻找最大△Q对应的两个社团，并将其合并，并改变e矩阵

[I,J]=find(detaQ==max(detaQ(:)));

     for ii=1:length(I)

         e(J(ii),:)=e(I(ii),:)+e(J(ii),:);

         e(I(ii),:)=0;

         e(:,J(ii))=e(:,I(ii))+e(:,J(ii));

         e(:,I(ii))=0;

% e(I,I)=e(I,I)/2;

%—————————记录△Q最大所对应的社团以及各社团中的元素

        b{J(ii)}=[b{I(ii)} b{J(ii)}];

        b{I(ii)}=0;

     end

  e(I,:)=[];

  e(:,I)=[];

  b(I)=[];

  c(k,:)=num2cell(zeros(1,n));

  c(k,1:length(b))=b;

  for kk=1:length(b)

      c2=cell2mat(c(k,kk));

      c2(c2==0)=[];

      c{k,kk}=c2;

      c2=[];

  end

a=sum(e);

k=k+1;

tmp=0;

  for jj=1:length(e)

      tmp=tmp+(e(jj,jj)-a(jj)*a(jj));

  end

Q(k)=tmp;

end

max_k=find(Q==max(Q(:)))-1;

ll=0;

for i=1:length(c(max_k,:))

    if sum(c{max_k,i})~=0

        ll=ll+1;

        c{max_k,i}=c{max_k,i}(c{max_k,i}~=0);

    end

end

c_newman=c(max_k,1:ll);

label=zeros(n,1);

for i=1:ll

    label(c{max_k,i}')=i;

end

Fast Newman-FN算法以及模块度定义介绍的更多相关文章

数据结构与算法 java描述第一章算法及其复杂度
目录数据结构与算法 java描述笔记第一章算法及其复杂度算法的定义算法性能的分析与评价问题规模.运行时间及时间复杂度渐进复杂度大 O 记号大Ω记号 Θ记号空间复杂度算法复杂度及 ...
C#开发微信门户及应用(43)--微信各个项目模块的定义和相互关系
我们在开发微信相关的应用的时候,一般需要完善的基础模块支持,包括微信公众号,微信企业号,以及一些业务模块的支持,一般随着功能的增多,我们需要非常清晰的界定他们的关系.模块的分拆以及合并往往需要考虑的代 ...
RequireJS 模块的定义与加载
模块不同于传统的脚本文件,它良好地定义了一个作用域来避免全局名称空间污染.它可以显式地列出其依赖关系,并以函数(定义此模块的那个函数)参数的形式将这些依赖进行注入,而无需引用全局变量.RequireJ ...
使用AndroidStudio编写APICloud模块需要注意的地方，解决模块未定义。
在新的版本下,使用AndroidStudio编写APICloud模块,已经非常简单了,解决模块未定义,最重要的就是要先看官方的视频! 注意在模块的module.json中name很重要,建议做到三统一 ...
barnes-hut算法 && Fast Multipole Methods算法
barnes-hut算法 http://arborjs.org/docs/barnes-hut Fast Multipole Methods算法 http://www.umiacs.umd.edu/~ ...
重拾算法之复杂度分析（大O表示法）
.katex { display: block; text-align: center; white-space: nowrap; } .katex-display > .katex > ...
Python_模块的定义与使用
1.模块的定义: 1.1 标准格式: import 模块名模块名.函数名(实参列表) 1.2 特殊格式: from 模块名 import 函数名1,函数名2... 函数名(实参列表) 2.模块的使用 ...
Python排序算法之选择排序定义与用法示例
Python排序算法之选择排序定义与用法示例这篇文章主要介绍了Python排序算法之选择排序定义与用法,简单描述了选择排序的功能.原理,并结合实例形式分析了Python定义与使用选择排序的相关操作技 ...
WEB开发性能优化--核心定义介绍篇（1）
推荐理由随着互联网的蓬勃发展,并且伴随着产品功能的越来越复杂,对于技术人员来说最大的挑战就是如何在保证业务快速发展的同时,也可保证不断复杂的业务对用户体验的影响,其中对用户来说最重要的体验指标是如 ...

随机推荐

DevExpress VCL 已死-----关于13.1.4的发布。
随着DevExpress VCL 13.1.4 的发布,已基本上宣布了devexpress vcl 已经死亡了. 除了一些bug 修正,没有什么新的东西,每年的订阅费又那么贵,而且delphi 现在已 ...
2018.09.23 codeforces 1053A. In Search of an Easy Problem（gcd）
传送门今天的签到题. 有一个很显然的结论,gcd(n∗m,k)≤2gcd(n*m,k)\le 2gcd(n∗m,k)≤2. 本蒟蒻是用的行列式求三角形面积证明的. 如果满足这个条件,就可以直接构造出 ...
2018.07.04 BZOJ 2618 Cqoi2006凸多边形（半平面交）
2618: [Cqoi2006]凸多边形 Time Limit: 5 Sec Memory Limit: 128 MB Description 逆时针给出n个凸多边形的顶点坐标,求它们交的面积.例如n ...
2018.07.06 BZOJ 1588: HNOI2002营业额统计（非旋treap）
1588: [HNOI2002]营业额统计 Time Limit: 5 Sec Memory Limit: 162 MB Description 营业额统计 Tiger最近被公司升任为营业部经理,他上 ...
SQL之mysql常用操作语句(入门级)
1.进入数据库: mysql -u root -p mysql -h localhost -u root -p database_name 2.列出数据库 show databases; 3.选择数据 ...
HDU 2037 今年暑假不AC （区间贪心）
题意:又是中文题... 析:先说一下区间贪心的一个定理,选择不相交的区间:数轴上有n个开区间(ai, bi).选择尽量多的区间,使得这些区间两两不相交,贪心策略是,一定是选bi小的.(想一下为什么). ...
nginx 配置图片服务器（window版本）
配置nginx二级域名 ①找到配置文件例如:%nginx_home%/conf/nginx.conf ②配置 #user nobody; worker_processes 1; #error_log ...
理解load averages
今天在客户的生产环境中遇到了网络丢包的问题,但是查看我方部署smokeping监控发现对同一条线路监控,我方监控显示正常,判断丢包是由客户服务器负载过高导致,原因及排查思路如下: 使用uptime ...
WPF 最简单的TextBox水印
最简单的TextBox加水印的方法,但是不具有很强的通用性. 如果你只是使用一次,或者用的不多,偷偷懒可以使用. 因为此方法只需要修改TextBox的Template,而不用重写何任代码. 注意: 1 ...
abp + angular $http + webapi 服务
什么是angular $http服务 http是angularjs的一个核心服务,用于读取远程服务器的数据,也就是封装了浏览器原生的xhtmlrequest对象,可以直接同外部进行通信. 怎样使用an ...

Fast Newman-FN算法以及模块度定义介绍

Fast Newman-FN算法以及模块度定义介绍的更多相关文章

随机推荐

热门专题