NEU(Fst Network Embedding Enhancement via High Order Proximity Approximation)

NEU:通过对高阶相似性的近似,加持快速网络嵌入

NRL的框架总结

  • First, Clarify the notations and formalize the problem of NRL.
  • Then, Introduce the concept of k-order proximity.
  • Finally, Summarize an NRL framework based on proximity matrix factorization and show that the aforementioned NRL methods fall into the category.

定义本文处理的图是无权无向图。这也是他的局限性。这是一个NEU算法的缺点!

对角阵 \(D_{ii}=d_i\)是\(v_i\)节点的度。\(A=D^{-1} \widetilde A\) ,是对邻接矩阵\(\widetilde A\)的归一化结果。
Laplacian Matrix: \(\widetilde L = D - \widetilde A\), 这是把\(\widetilde A\)全取反再在对角线上加上\(v_i\)的度数。
Normalized Laplacian Matrix: $ L = D^{-\frac{1}{2}}\widetilde L D^{-\frac{1}{2}} $

这俩Laplacian matrix 拿来何用?

K-order proximity

$ A\(和\)\widetilde L$ characterize 一阶相似性,建模局部节点对的proximity。
还是沿用GraRep的K-step转移概率矩阵:transition probability matrix 作为k-order proximity matrix.
\(A^k = \underbrace{A \cdot A ... A}_{k}\)

NRL Framework

Step1: Proximity Matrix Construction 相似性矩阵建立
相似性矩阵\(M \in \mathbb R^{|V|\times |V|}\)编码了 \(k\) 阶相似性,\(k = 1,2,...,K\) .有\(A\)是normalized邻接矩阵, \(M=\frac{A+A^2+...+A^K}{K}\)表示了K阶相似性矩阵的联合再平均。\(M\)通常是由\(A\)的\(K\)级的多项式表示,文章记为\(f(A) \in \mathbb R^{|V|\times |V|}\), \(K\)级是多少,depends on 相似度矩阵proximity matrix要表达的最大的proximity阶数。

Step2: Dimension Reduction 维数约减
寻找2个矩阵,\(R\) 和 \(C\).

  • \(R \in \mathbb R^{|V|\times d}\) 是节点的低维向量表达,
  • \(C \in \mathbb R^{|V|\times d}\)是context角色时,节点的低维向量表达。

矩阵的乘积\(R \cdot C^T\)就是对原网络的相似性矩阵\(M\)的近似。这里,不同的算法对\(R \cdot C^T\)和\(M\)的距离有不同的描述,employ different distance function. 比如,用\(M- R \cdot C^T\)

前人的方法与本框架的关系
Spectral Clustering:
DeepWalk:
GraRep:
TADW:
LINE:

观察和Problem Formalization

既然是2步框架,第一步是建立proximity matrix,怎么建立一个好的proximity matrix for NRL.在这篇文章里讨论。
至于第二步,维数约减,future Work.

Observation 1: 更高阶的,和更精确的proximity matrix可以提升模型的学习效果。也就是说,如果探索一个更高阶的polynomial proximity matrix \(f(A)\),NRL可以因此受益。

Observation 2:对大规模网络来说,对高阶的proximity matrix的精确计算是不可行的。实际上对proximity matrix的计算takes \(O(|V|^2)\) time. SVD的时间复杂度也随k 的增大,get dense,从而增加。

其实Observation1&2是矛盾的,前者要更精确,更高阶。后者又表明越高阶越难算。
因此如何高效地获得高阶的proximity matrix变为一个问题。
文章的解决方案是,先对低阶的proximity matrix的信息进行编码,以此作为一个基础,来避免重复的计算。

问题的构建
有个假设,\(R\)和\(C\)是某个NRL算法学到的表达,\(R \cdot C^T\) 对\(K\)阶的多项式proximity matrix \(f(A)\) 构成近似。目的就是学到一个更好的\(R'\)和\(C'\),它俩可以构成对\(g(A)\)的近似,这个\(g(A)\)比\(f(A)\)更高阶。并且,算法还要高效,should be efficient in the linear time of \(|V|\). 注意,时间复杂度下界是\(O(|V|d)\) ,which is the size of embedding matrix \(R\).

NEU(Fst Network Embedding Enhancement via High Order Proximity Approximation)的更多相关文章

  1. [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximati

    [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximation 本文结构 解决问题 主要贡献 主要 ...

  2. Network Embedding 论文小览

    Network Embedding 论文小览 转自:http://blog.csdn.net/Dark_Scope/article/details/74279582,感谢分享! 自从word2vec横 ...

  3. network embedding 需读论文

    Must-read papers on NRL/NE. github: https://github.com/nate-russell/Network-Embedding-Resources NRL: ...

  4. 论文:network embedding

    KDD2016: network embedding model: deep walk(kdd 2014): http://videolectures.net/kdd2014_perozzi_deep ...

  5. On the Optimal Approach of Survivable Virtual Network Embedding in Virtualized SDN

    Introduction and related work 云数据中心对于虚拟技术是理想的创新地方. 可生存性虚拟网络映射(surviavable virtual network embedding ...

  6. Content to Node: Self-Translation Network Embedding

    paper:https://dl.acm.org/citation.cfm?id=3219988 data & code:http://dm.nankai.edu.cn/code/STNE.r ...

  7. Context-Aware Network Embedding for Relation Modeling

    Context-Aware Network Embedding for Relation Modeling 论文:http://www.aclweb.org/anthology/P17-1158 创新 ...

  8. Network Embedding

    网络表示 网络表示学习(DeepWalk,LINE,node2vec,SDNE) https://blog.csdn.net/u013527419/article/details/76017528 网 ...

  9. 论文阅读:Relation Structure-Aware Heterogeneous Information Network Embedding

    Relation Structure-Aware Heterogeneous Information Network Embedding(RHINE) (AAAI 2019) 本文结构 (1) 解决问 ...

随机推荐

  1. ML: 聚类算法R包-K中心点聚类

    K-medodis与K-means比较相似,但是K-medoids和K-means是有区别的,不一样的地方在于中心点的选取,在K-means中,我们将中心点取为当前cluster中所有数据点的平均值, ...

  2. Visio View:打开VSd时,IE弹出已停止工作。

    解决办法:关闭第三方扩展功能

  3. ALGO-143_蓝桥杯_算法训练_字符串变换

    问题描述 相信经过这个学期的编程训练,大家对于字符串的操作已经掌握的相当熟练了.今天,徐老师想测试一下大家对于字符串操作的掌握情况.徐老师自己定义了1,,,,5这5个参数分别指代不同的5种字符串操作, ...

  4. ALGO-145_蓝桥杯_算法训练_4-1打印下述图形

    记: 这里用到了printf("%*s%s%*s\n",n-i,"",arr,n-i,"");的写法, 其中%*s中的*代表该字符串s的个数 ...

  5. Redis持久化实践及灾难恢复模拟 [转]

    参考资料:Redis Persistence http://redis.io/topics/persistenceGoogle Groups https://groups.google.com/for ...

  6. JavaEE Web 开发 链接 mysql 出现 Class.not found的错误

    明明在项目的library里头导入过mysql-connector.jar的包,但是在加载driver的时候eclipse一直报这个错误.解决方案其实很简单,就是同样的jar包在tomcat的安装目录 ...

  7. 限制input输入字符数(中文2个字符,英文1个字符)

    input的maxlength可以限制input的输入的字符数,但是是字符串的长度,相当于判断str.length;然而经常会有中文字符算2个字符英文算1个字符的需求,目前只能通过编写代码来实现. & ...

  8. PAT 乙级 1077 互评成绩计算 (20)

    在浙大的计算机专业课中,经常有互评分组报告这个环节.一个组上台介绍自己的工作,其他组在台下为其表现评分.最后这个组的互评成绩是这样计算的:所有其他组的评分中,去掉一个最高分和一个最低分,剩下的分数取平 ...

  9. react路由传值

    在上一篇总结了react中路由的基本用法,实现了基本的页面跳转,但这肯定是不够用的,比如说在新闻列表页面,点击某一条新闻,希望页面能跳转到新闻详情页,又该如何实现呢? 首先继续上一篇的项目,添加一个新 ...

  10. 符合seo的html标签优化

     原文地址:http://www.rainleaves.com/html/1032.html   seo(Search Engine Optimiztion)搜索引擎优化的英文缩写.通过总结搜索引擎的 ...