3. 图神经网络 GNN
3.1 GNN 基础结构 ***
常见架构:Y=σ(D^−1A^XW)
图谱(Graph Spectrum)和图傅里叶变换(GFT)
拉普拉斯矩阵 L=D−A,其中 A 为邻接矩阵,D 为对角度矩阵
特征值分解 L=UΛUT,其中 Λ 是从小到大的特征值,是 G 的 图谱
特征值 - 频域频率,特征向量 - 基波
特征值越小,特征向量(波)越平缓
图傅里叶变换(GFT) x^=UTx,图逆傅里叶变换(IGFT) x=Ux^
基于 频域 的 GNN:GCN
卷积定理:两个函数卷积后的 FT,是他们各自 FT 后的乘积
卷积:x∗h=U⋅diag(h^)⋅UTx,各自 FT 乘积的 IFT
y=σ(U⋅(∑k=0KαkΛk)⋅UTx)=σ(∑k=0KαkLkx)
本质:将每个节点的 K 步范围内的邻居特征融合起来
基于 空域 的 GNN:GAT,GraphSAGE
GAT:基于多头注意力机制的邻域卷积,yi=σ(M1∑m=1M∑j∈Niαij(m)(xj⋅W(m)))
GraphSAGE:K 度邻居特征融合(max-pooling, average-pooling, LSTM)
融合目标节点邻域的特征 hNi=aggregate({xj∣j∈Ni})
使用 邻域+自身 拼接特征更新 yi=σ(concat(xi,hNi)⋅W)
3.2 GNN 在推荐系统中的应用 PinSage
网络构建
二部图:图片 - 图板
图片特征:视觉、文本标注、流行度
模型结构(GraphSAGE)
节点邻域定义:随机游走,K 度邻居中,抽出 T 个重要节点
aggregate 操作:按照重要性,加权平均
负样本抽取:课程学习,每轮选取难以分辨的负样本
任务总结
点分类 p(vi)=Softmax(hi)
边预测 p(Aij)=σ(hihjT)
图分类 p(G)=Softmax(∑i∈Vhi)
3.3 GNN 的推理能力 ****
推理能力
关系推理(Relational Reasoning):根据实体间关系,做出逻辑判断
组合泛化(Combinational Generalization):组合零碎知识,解决新问题
GNN 基本计算框架
更新 e 向量表示
聚合,更新 v 向量表示
聚合所有 e 的向量表示,聚合所有 v 的向量表示,更新 G 向量表示
有何优势
具备推断关系的能力:关系的强度、方向可以学习
充分利用训练数据:建模图中任意一对邻接节点之间的关系,泛化能力强
模型输出与节点标号顺序无关
推理机制 在其他领域的应用
自注意力机制:zi=∑j=1nαij(xjWV),αij=softmax(eij)
其中 eij=dz(xiWQ)(xjWK)T,代表元素 i, j 之间的相关性
完全图,Z 视为节点向量,eij 视为边,自注意力机制 = 完全图神经网络
层次结构 Transformer 多个自注意力累计 = 图神经网络多层卷积
基于度量的元学习:y=∑ikθ(x,xi)⋅yi,其中 kθ(⋅,⋅) 是衡量相似性的核函数
分解机:y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n⟨vi,vj⟩⋅xixj,其中 v 是辅助表示向量
GNN 推理能力重点:对关系建模
Last updated