论文信息

论文标题：Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning
论文作者：Yizhu Jiao, Yun Xiong, Jiawei Zhang, Yao Zhang, Tianqi Zhang, Yangyong Zhu
论文来源：2020 ICDM
论文地址：download
论文代码：download

1 Introduction

　　创新点：提出一种新的子图对比度自监督表示学习方法，利用中心节点与其采样子图之间的强相关性来捕获区域结构信息。

　　与之前典型方法对比：

2 Method

2.1 Subgraph-Based Self-Supervised Representation Learning

　　对于中心节点 $i$，设计了一个子图采样器 $\mathcal{S}$，从原始图中提取其上下文子图 $\mathbf{X}_{i} \in \mathbb{R}^{N^{\prime} \times F}$。上下文子图为学习节点 $i $ 的表示提供了区域结构信息。其中，$\mathbf{X}_{i} \in \mathbb{R}^{N^{\prime} \times F}$ 表示第 $i$ 个上下文子图的节点特征矩阵。$\mathbf{A}_{i}$ 表示节点 $i$ 邻居的邻接矩阵。$N^{\prime}$ 表示上下文子图的大小。

　　目标是学习一个上下文子图的编码器 $\mathcal{E}: \mathbb{R}^{N^{\prime} \times F} \times \mathbb{R}^{N^{\prime} \times N^{\prime}} \rightarrow \mathbb{R}^{N^{\prime} \times F^{\prime}}$ ，用于获取上下文图中的节点表示。

　　注意：

- 子图采样器 $S$ ：作为一种数据增强的手段，需要计算邻居重要性得分，并对重要节点进行采样，从而组成一个上下文子图，为中心节点提供领域结构信息。　　
- 子图编码器 $\mathcal{E} $：需要计算中心节点 $i$ 的表示，还要根据子图信息生成子图表示 $s_i$

2.2 Subgraph Sampling Based Data Augmentation

　　重要性得分矩阵 $\mathcal{S}$ 可以记为：【邻居节点连的节点越多越不重要】

　　　　$\mathbf{S}=\alpha \cdot(\mathbf{I}-(1-\alpha) \cdot \overline{\mathbf{A}})\quad\quad\quad\quad(1)$

　　其中

- $\overline{\mathbf{A}}=AD^{-1}$；
- $S(i，：)$ 为节点 $i$ 的重要度得分向量，表示它与其他节点的相关性；
- $\alpha \in[0,1] $ 是一个参数，它总是被设置为 $0.15 $；

　　对于一个特定的节点 $i$ ，子图采样器 $S$ 选择 $top-k$ 重要的邻居，用得分矩阵 $S$ 组成一个子图。所选节点的指数可以记为

　　　　$i d x=\text { top_rank }(\mathbf{S}(i,:), k)$

　　其中，$\text { top_rank }$ 是返回顶部 $k$ 值的索引的函数，$k$ 表示上下文图的大小。

　　然后，可以使用上述产生的 $ids$ 生成子图邻接矩阵 $A_i$、特征矩阵$X$：

　　　　$\mathbf{X}_{i}=\mathbf{X}_{i d x,:}, \quad \mathbf{A}_{i}=\mathbf{A}_{i d x, i d x}$

　　到目前为止可以生成上下文子图 $ \mathcal{G}_{i}= \left(\mathbf{X}_{i}, \mathbf{A}_{i}\right) \sim \mathcal{S}(\mathbf{X}, \mathbf{A})$ 。

2.3 Encoding Subgraph For Representations

　　给定中心节点 $i$ 的上下文子图 $\mathcal{G}_{i}=\left(\mathbf{X}_{i}, \mathbf{A}_{i}\right) $，编码器 $\mathcal{E}: \mathbb{R}^{N^{\prime} \times F} \times \mathbb{R}^{N^{\prime} \times N^{\prime}} \rightarrow \mathbb{R}^{N^{\prime} \times F^{\prime}}$ 对其进行编码，得到潜在表示矩阵 $\mathbf{H}_{i} $ 表示为

　　　　$\mathbf{H}_{i}=\mathcal{E}\left(\mathbf{X}_{i}, \mathbf{A}_{i}\right)$

　　　　$\mathbf{h}_{i}=\mathcal{C}\left(\mathbf{H}_{i}\right)$

　　其中，$\mathcal{C}$ 表示选择中心节点表示的操作。

　　我们利用一个读出函数 $\mathcal{R} : \mathbb{R}^{N^{\prime} \times F^{\prime}} \rightarrow \mathbb{R}^{F^{\prime}}$，并使用它将获得的节点表示总结为子图级表示 $\mathbf{s}_{i}$，记为

　　　　$\mathbf{s}_{i}=\mathcal{R}\left(\mathbf{H}_{i}\right)$

　　其实就是 $\mathcal{R}(\mathbf{H})=\sigma\left(\frac{1}{N^{\prime}} \sum\limits _{i=1}^{N^{\prime}} \mathbf{h}_{i}\right)$

2.4 Contrastive Learning via Central Node and Context Subgraph

　　整体框架如下所示：

　　对于捕获上下文子图中的区域信息的节点表示 $h_i$，我们将上下文子图表示 $s_i$ 视为正样本。另一方面，对于一组子图表示，我们使用一个 Corruption functions $\mathcal{P}$ （其实就是 shuffle 操作）来破坏它们以生成负样本，记为

　　　　$\left\{\widetilde{\mathbf{s}}_{1}, \widetilde{\mathbf{s}}_{2} \ldots, \widetilde{\mathbf{s}}_{M}\right\} \sim \mathcal{P}\left(\left\{\mathbf{s}_{1}, \mathbf{s}_{2}, \ldots, \mathbf{s}_{m}\right\}\right)$

　　其中，$m$ 是表示集的大小。

　　采用三联体损失函数（triplet loss）：

　　　　$\mathcal{L}=\frac{1}{M} \sum\limits _{i=1}^{M} \mathbb{E}_{(\mathbf{X}, \mathbf{A})}\left(-\max \left(\sigma\left(\mathbf{h}_{i} \mathbf{s}_{i}\right)-\sigma\left(\mathbf{h}_{i} \widetilde{\mathbf{s}}_{i}\right)+\epsilon, 0\right)\right)\quad\quad\quad(2)$

　　算法流程如下：

3 Experiment

数据集

实验细节

不同编码器对比

　　对于 Cora、Citeseer、Pubmed、PPI 采用带跳跃连接的一层的 GCN 编码器：

　　　　$\mathcal{E}(\mathbf{X}, \mathbf{A})=\sigma\left(\hat{\mathbf{D}}^{-\frac{1}{2}} \hat{\mathbf{A}} \hat{\mathbf{D}}^{-\frac{1}{2}} \mathbf{X} \mathbf{W}+\hat{\mathbf{A}} \mathbf{W}_{s k i p}\right)$

　　其中：$\mathbf{W}_{s k i p}\$ 是跳跃连接的可学习投影矩

　　对于 Reddit、Flickr 采用两层的 GCN 编码器：

　　　　$\begin{array}{c}G C N(\mathbf{X}, \mathbf{A})=\sigma\left(\hat{\mathbf{D}}^{-\frac{1}{2}} \hat{\mathbf{A}} \hat{\mathbf{D}}^{-\frac{1}{2}} \mathbf{X} \mathbf{W}\right) \\\mathcal{E}(\mathbf{X}, \mathbf{A})=G C N(G C N(\mathbf{X}, \mathbf{A}), \mathbf{A})\end{array}$

　　对比结果：

不同的目标函数：

　　对比结果：

子图距离对比

训练时间和内存成本

子图大小分析

4 Conclusion

　　在本文中，我们提出了一种新的可扩展的自监督图表示，通过子图对比，子V.。它利用中心节点与其区域子图之间的强相关性进行模型优化。基于采样子图实例，子g-con在监督要求较弱、模型学习可扩展性和并行化方面具有显著的性能优势。通过对多个基准数据集的实证评估，我们证明了与有监督和无监督的强基线相比，SUBG-CON的有效性和效率。特别地，它表明，编码器可以训练良好的当前流行的图形数据集与少量的区域信息。这表明现有的方法可能仍然缺乏捕获高阶信息的能力，或者我们现有的图数据集只需要驱虫信息才能获得良好的性能。我们希望我们的工作能够激发更多对图结构的研究，以探索上述问题。

论文解读（SUBG-CON）《Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning》的更多相关文章

论文解读（SimGRACE）《SimGRACE: A Simple Framework for Graph Contrastive Learning without Data Augmentation》
论文信息论文标题:SimGRACE: A Simple Framework for Graph Contrastive Learning without Data Augmentation论文作者: ...
论文解读(GraphSMOTE)《GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks》
论文信息论文标题:GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks论文作者:Tianxi ...
论文解读（ChebyGIN）《Understanding Attention and Generalization in Graph Neural Networks》
论文信息论文标题:Understanding Attention and Generalization in Graph Neural Networks论文作者:Boris Knyazev, Gra ...
论文解读（MLGCL）《Multi-Level Graph Contrastive Learning》
论文信息论文标题:Structural and Semantic Contrastive Learning for Self-supervised Node Representation Learn ...
论文解读（DFCN）《Deep Fusion Clustering Network》
Paper information Titile:Deep Fusion Clustering Network Authors:Wenxuan Tu, Sihang Zhou, Xinwang Liu ...
论文解读(GraphDA)《Data Augmentation for Deep Graph Learning: A Survey》
论文信息论文标题:Data Augmentation for Deep Graph Learning: A Survey论文作者:Kaize Ding, Zhe Xu, Hanghang Tong, ...
论文解读（GraphMAE）《GraphMAE: Self-Supervised Masked Graph Autoencoders》
论文信息论文标题:GraphMAE: Self-Supervised Masked Graph Autoencoders论文作者:Zhenyu Hou, Xiao Liu, Yukuo Cen, Y ...
论文解读（KP-GNN）《How Powerful are K-hop Message Passing Graph Neural Networks》
论文信息论文标题:How Powerful are K-hop Message Passing Graph Neural Networks论文作者:Jiarui Feng, Yixin Chen, ...
论文解读（SR-GNN）《Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data》
论文信息论文标题:Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data论文作者:Qi Zhu, ...

随机推荐

outlook配置osc地址（删除原账户重新配置）
方法二:使用手动配置邮箱(适用于标准化未入域机器) Step1:在"开始"菜单找到 "控制面板"并打开(或按键盘上的"Win"+" ...
什么是Spring的依赖注入？
依赖注入,是IOC的一个方面,是个通常的概念,它有多种解释.这概念是说你不用创建对象,而只需要描述它如何被创建.你不在代码里直接组装你的组件和服务,但是要在配置文件里描述哪些组件需要哪些服务,之后一个 ...
spring aware 的个人理解
今天学习到了spring aware ,特地百度了下这方面的知识,现在谈下我的理解. Spring的依赖注入的最大亮点就是你所有的Bean对Spring容器的存在是没有意识的.即你可以将你的容器替换成 ...
复杂JSON字符串解析，可以少走弯路
发现一个好文章:装载至http://www.verejava.com/?id=17174254038220 package com.json5; import org.json.JSONArra ...
c++ 虚函数多态、纯虚函数、虚函数表指针、虚基类表指针详解
静态多态.动态多态静态多态:程序在编译阶段就可以确定调用哪个函数.这种情况叫做静态多态.比如重载,编译器根据传递给函数的参数和函数名决定具体要使用哪一个函数.动态多态:在运行期间才可以确定最终调用的 ...
git和github学习笔记
1. 了解Git和Github 2. 使用Github 3. Git安装和使用 4. Git基本工作流程 5. Git初始化及仓库创建和操作 6. Git管理远程仓库 7. Github Pages ...
一个模型预测控制（MPC）的简单实现
1 生活中的启示情景如下:你们团队每天早晨开一次例会,主要会议内容是你汇报工作进度,领导根据工作目标和工作进度,制定当天的工作计划,你领到工作计划后开始工作.每天都这样周而复始,从领导的角度看,这件 ...
从零开始：微信小程序新手入门宝典《一》
为了方便大家了解并入门微信小程序,我将一些可能会需要的知识,列在这里,让大家方便的从零开始学习: 一:微信小程序的特点张小龙:张小龙全面阐述小程序,推荐通读此文: 小程序是一种不需要下载.安装即可使 ...
react开发教程（三）组件的构建
什么是组件组件化就好像我们的电脑装机一样,一个电脑由显示器.主板.内存.显卡.硬盘,键盘,鼠标.... 组件化开发有如下的好处:降低整个系统的耦合度,在保持接口不变的情况下,我们可以替换不同的组件快 ...
【小程序开发】文本text-overflow属性的使用
text-overflow原本是CSS3的一个属性,在微信小程序中也支持. text-overflow文本溢出显示省略号~ 注:使用text-overflow时,需要设置固定的宽度才起作用,所以该元素 ...

论文解读（SUBG-CON）《Sub-graph Contrast for Scalable Self-Supervised Graph Representation Learning》