图神经网络（GNN）目前的主流实现方式就是节点之间的信息汇聚，也就是类似于卷积网络的邻域加权和，比如图卷积网络（GCN）、图注意力网络（GAT）等。下面根据GCN的实现原理使用Pytorch张量，和调用torch_geometric包，分别对Cora数据集进行节点分类实验。

　　Cora是关于科学文献之间引用关系的图结构数据集。数据集包含一个图，图中包括2708篇文献（节点）和10556个引用关系（边）。其中每个节点都有一个1433维的特征向量，即文献内容的嵌入向量。文献被分为七个类别：计算机科学、物理学等。

GCN计算流程

　　对于某个GCN层，假设输入图的节点特征为$X\in R^{|V|\times F_{in}}$，边索引表示为序号数组$Ei\in R^{2\times |E|}$，GCN层输出$Y\in R^{|V|\times F_{out}}$。计算流程如下：

　　0、根据$Ei$获得邻接矩阵$A_0\in R^{|V|\times |V|}$。

　　1、为了将节点自身信息汇聚进去，每个节点添加指向自己的边，即 $A=A_0+I$，其中$I$为单位矩阵。

　　2、计算度（出或入）矩阵 $D$，其中 $D_{ii}=\sum_j A_{ij}$ 表示第 $i$ 个节点的度数。$D$为对角阵。

　　3、计算对称归一化矩阵 $\hat{D}$，其中 $\hat{D}_{ii}=1/\sqrt{D_{ii}}$。

　　4、构建对称归一化邻接矩阵 $\tilde{A}$，其中 $\tilde{A}= \hat{D} A \hat{D}$。

　　5、计算节点特征向量的线性变换，即 $Y = \tilde{A} X W$，其中 $X$ 表示输入的节点特征向量，$W\in R^{F_{in}\times F_{out}}$ 为GCN层中待训练的权重矩阵。

　　即：

$Y=D^{-0.5}(A_0+I)D^{-0.5}XW$

　　在torch_geometric包中，normalize参数控制是否使用度矩阵$D$归一化；cached控制是否缓存$D$，如果每次输入都是相同结构的图，则可以设置为True，即所谓转导学习（transductive learning）。另外，可以看到GCN的实现只考虑了节点的特征，没有考虑边的特征，仅仅通过聚合引入边的连接信息。

GCN实验

调包实现

　　Cora的图数据存放在torch_geometric的Data类中。Data主要包含节点特征$X\in R^{|V|\times F_v}$、边索引$Ei\in R^{2\times |E|}$、边特征$Ea\in R^{|E|\times F_e}$等变量。首先导出Cora数据：

from torch_geometric.datasets import Planetoid

cora = Planetoid(root='./data', name='Cora')[0]

print(cora)

　　构建GCN，训练并测试。

import torch

from torch import nn

from torch_geometric.nn import GCNConv

import torch.nn.functional as F

from torch.optim import Adam

class GCN(nn.Module):

  def __init__(self, in_channels, hidden_channels, class_n):

    super(GCN, self).__init__()

    self.conv1 = GCNConv(in_channels, hidden_channels)

    self.conv2 = GCNConv(hidden_channels, class_n)

  def forward(self, x, edge_index):

    x = torch.relu(self.conv1(x, edge_index))

    x = torch.dropout(x, p=0.5, train=self.training)

    x = self.conv2(x, edge_index)

    return torch.log_softmax(x, dim=1)

model = GCN(cora.num_features, 16, cora.y.unique().shape[0]).to('cuda')

opt = Adam(model.parameters(), 0.01, weight_decay=5e-4)

def train(its):

  model.train()

  for i in range(its):

    y = model(cora.x, cora.edge_index)

    loss = F.nll_loss(y[cora.train_mask], cora.y[cora.train_mask])

    loss.backward()

    opt.step()

    opt.zero_grad()

def test():

  model.eval()

  y = model(cora.x, cora.edge_index)

  right_n = torch.argmax(y[cora.test_mask], 1) == cora.y[cora.test_mask]

  acc = right_n.sum()/cora.test_mask.sum()

  print("Acc: ", acc)

for i in range(15):

  train(1)

  test()

　　仅15次迭代就收敛，测试精度如下：

张量实现

　　主要区别就是自定义一个My_GCNConv来代替GCNConv，My_GCNConv定义如下：

from torch import nn

from torch_geometric.utils import to_dense_adj

class My_GCNConv(nn.Module):

  def __init__(self, in_channels, out_channels):

    super(My_GCNConv, self).__init__()

    self.weight = torch.nn.Parameter(nn.init.xavier_normal(torch.zeros(in_channels, out_channels)))

    self.bias = torch.nn.Parameter(torch.zeros([out_channels]))

  def forward(self, x, edge_index):

    adj = to_dense_adj(edge_index)[0]

    adj += torch.eye(x.shape[0]).to(adj)

    dgr = torch.diag(adj.sum(1)**-0.5)

    y = torch.matmul(dgr, adj)

    y = torch.matmul(y, dgr)

    y = torch.matmul(y, x)

    y = torch.matmul(y, self.weight) + self.bias

    return y

　　其它代码仅将GCNConv修改为My_GCNConv。

对比实验

MLP实现

　　下面不使用节点之间的引用关系，仅使用节点特征向量在MLP中进行实验，来验证GCN的有效性。

import torch

from torch import nn

import torch.nn.functional as F

from torch.optim import Adam

class MLP(nn.Module):

  def __init__(self, in_channels, hidden_channels, class_n):

    super(MLP, self).__init__()

    self.l1 = nn.Linear(in_channels, hidden_channels)

    self.l2 = nn.Linear(hidden_channels, hidden_channels)

    self.l3 = nn.Linear(hidden_channels, class_n)

  def forward(self, x):

    x = torch.relu(self.l1(x))

    x = torch.relu(self.l2(x))

    x = torch.dropout(x, p=0.5, train=self.training)

    x = self.l3(x)

    return torch.log_softmax(x, dim=1)

model = MLP(cora.num_features, 512, cora.y.unique().shape[0]).to('cuda')

opt = Adam(model.parameters(), 0.01, weight_decay=5e-4)

def train(its):

  model.train()

  for i in range(its):

    y = model(cora.x[cora.train_mask])

    loss = F.nll_loss(y, cora.y[cora.train_mask])

    loss.backward()

    opt.step()

    opt.zero_grad()

def test():

  model.eval()

  y = model(cora.x[cora.test_mask])

  right_n = torch.argmax(y, 1) == cora.y[cora.test_mask]

  acc = right_n.sum()/cora.test_mask.sum()

  print("Acc: ", acc)

for i in range(15):

  train(30)

  test()

　　可以看出MLP包含了3层，并且隐层参数比GCN多得多。结果如下：

　　精度收敛在57%左右，效果比GCN的79%差。说明节点之间的链接关系对节点类别的划分有促进作用，以及GCN的有效性。

图卷积神经网络分类的pytorch实现的更多相关文章

图卷积神经网络(GCN)入门
图卷积网络Graph Convolutional Nueral Network,简称GCN,最近两年大热,取得不少进展.不得不专门为GCN开一个新篇章,表示其重要程度.本文结合大量参考文献,从理论到实 ...
论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)
摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...
Graph 卷积神经网络：概述、样例及最新进展
http://www.52ml.net/20031.html [新智元导读]Graph Convolutional Network(GCN)是直接作用于图的卷积神经网络,GCN 允许对结构化数据进行端 ...
最全面的图卷积网络GCN的理解和详细推导，都在这里了!
目录目录 1. 为什么会出现图卷积神经网络? 2. 图卷积网络的两种理解方式 2.1 vertex domain(spatial domain):顶点域(空间域) 2.2 spectral doma ...
Graph Neural Networks：谱域图卷积
以下学习内容参考了:1,2, 0.首先回忆CNN,卷积神经网络的结构和特点处理的数据特征:具有规则的空间结构(Euclidean domains),都可以采用一维或者二维的矩阵描述.(Convolu ...
卷积神经网络概念及使用 PyTorch 简单实现
卷积神经网络卷积神经网络(CNN)是深度学习的代表算法之一 .具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”.随着深度学习理论的提出和数值计算设备 ...
基于卷积神经网络的面部表情识别(Pytorch实现)----台大李宏毅机器学习作业3(HW3)
一.项目说明给定数据集train.csv,要求使用卷积神经网络CNN,根据每个样本的面部图片判断出其表情.在本项目中,表情共分7类,分别为:(0)生气,(1)厌恶,(2)恐惧,(3)高兴,(4)难过 ...
PyTorch基础——使用卷积神经网络识别手写数字
一.介绍实验内容内容包括用 PyTorch 来实现一个卷积神经网络,从而实现手写数字识别任务. 除此之外,还对卷积神经网络的卷积核.特征图等进行了分析,引出了过滤器的概念,并简单示了卷积神经网络的 ...
Pytorch实现基于卷积神经网络的面部表情识别(详细步骤)
文章目录一.项目背景二.数据处理 1.标签与特征分离 2.数据可视化 3.训练集和测试集三.模型搭建四.模型训练五.完整代码一.项目背景数据集cnn_train.csv包含人类面部表情的图 ...
[DL学习笔记]从人工神经网络到卷积神经网络_3_使用tensorflow搭建CNN来分类not_MNIST数据(有一些问题)
3:用tensorflow搭个神经网络出来为什么用tensorflow呢,应为谷歌是亲爹啊,虽然有些人说caffe更适合图像啊mxnet效率更高等等,但爸爸就是爸爸,Android都能那么火,一个道 ...

随机推荐

第三方模块的下载与使用、requests模块、爬取链家二手房数据、openpyxl模块、hashlib加密模块
目录第三方模块的下载与使用下载第三方模块可能会出现的问题网络爬虫模块之requests模块网络爬虫实战之爬取链家二手房数据自动化办公领域之openpyxl模块第三方模块的下载与使用第三方 ...
Day29：StringBuilder详解
StringBuilder 1.1 StringBuilder概述我们先对普通的String字符串对象建立进行内存分析: public class Demo{ public static void ...
node版本管理工具fnm踩坑
我建议是直接不要用fnm,还是老老实实用nvm吧 fnm下下来电脑防火墙会报毒(用github上推荐的cargo install fnm方式下载,并非第三方安装) Trojan.Generic.HgE ...
SourceGenerator 使用姿势（1）：生成代理类，实现简单的AOP
SourceGenerator 已经出来很久了,也一直在关注.之前观摩大佬 xljiulang 的 WebApiClient 使用 SourceGenerator 生成接口代理类,深受启发,准备拿过来 ...
记开源项目：DotNetCore.CAP.MySql问题分析：only mysqlparameter objects may be stored
1. 简介最近在学习分布式事务及解决方案,最终找到了开源项目DotNetCore.CAP ,因为自己用的MySql数据库比较多.于是也使用MySQL+EFCore+RabbitMQ+CAP实现事务 ...
<五>基于CAS操作的atomic原子类型
C++11多线程类库中提供了 include包含了很多原子类型原子操作若干汇编指令具有读-修改-写类型,也就是说它们访问存储器单元两次,第一次读原值,第二次写新值假定运行在两个cpu上的两个内核 ...
(admin.E104) 'XXXX' must inherit from 'InlineModelAdmin'.
代码: class CaseStepAdmin(admin.ModelAdmin): list_display = ('id', 'casetep', 'casedata', 'webcase', ' ...
react项目中如何出现config文件夹
答案:运行 npm run eject 即可出现config文件夹原因: 在package.json中:只有三个依赖,分别是react,react-dom,react-scripts,依赖为什么 ...
JavaScript：操作符：正负号和自增自减及其隐式转换数据类型
正负号正号即加号,负号即减号,运算结果同数学意义一样: 对非数字类型进行正负号运算,会隐式转换为数字,再进行运算: 一些特殊的非数字,转换情况同算术运算符: 自增自减自增即为++,自减即为--. ...
JavaScript：七大基础数据类型：数值number及其表示范围
数值number类型,用来表示任何类型的数字:整数或者浮点数都可以: 实际上,JS中的数值,是一个64位的浮点数,这与Java中的double类型的浮点数是一致的: 但是它有表示的范围,在范围内,JS ...

图卷积神经网络分类的pytorch实现