Jointly Adversarial Network Embedding

简介

在这篇文章中，作者分析并质疑了Network Embedding领域中使用对抗机制来正则嵌入表示的方法。作者认为这些方法由于直接比较真实嵌入和直接从先验分布中采样生成的虚假嵌入，相当于强迫嵌入表示符合高斯分布，但些方法不能捕捉隐空间中的语义变化。而GAN能在隐空间中捕捉语义变化的原因是，它比较的是真实数据和虚假样本，并不是比较真实嵌入和虚假嵌入。为了克服该问题，作者提出一种联合对抗网络嵌入框架JANE，该框架区分嵌入、拓扑信息和节点特征联合的真假。

方法

该框架包含三个部分，嵌入模块、生成器和判别器。总体架构如图Figure 2s所示。

判别器模块

为了使用真实数据修正高斯先验，JANE的判别器模块区分拓扑、节点特征和嵌入表示联合的真假，如下所示：

$\mathbf{R}=(\mathbf{Z}\|\mathbf{A}\| \mathbf{X}), \quad \mathbf{R}^{\prime}=\left(\mathbf{Z}^{\prime}\left\|\mathbf{A}^{\prime}\right\| \mathbf{X}^{\prime}\right),$

其中$\mathbf{A}$和$\mathbf{X}$分别是给定真实的邻接矩阵和节点特征，$\mathbf{Z}$和$\mathbf{Z}^{\prime}$分别是真实和虚假的表示。$|$表示拼接操作。判别器可以使用多层感知机实现。

嵌入模块

嵌入模块使用带自注意力机制的GCN，也可以被具有相同功能的其他模型替代。

生成器模块

由于判别器的输入是拓扑、节点特征和嵌入表示的联合，所以生成器的目标是基于从高斯分布采样的样本去生成虚假联合。最简单直接的方法是将从高斯分布中生成的向量作为虚假嵌入，然后生成虚假拓扑和虚假节点特征。但是，这种方式在高维输出的情况下太低效。因为采样自高斯分布中的样本倾向于捕捉隐空间中的语义变化，虚假嵌入可以在真实嵌入的基础上构建得到，如下所示：

$\mathbf{Z}^{\prime}=\mathbf{Z}+\mathbf{Y}$

接下来，虚假节点特征和邻接矩阵可以分别从$\mathbf{Z}^{\prime}$生成。为了阐释，简化如下：虚假特征可以使用多层感知机生成，临界矩阵可以使用虚假嵌入的乘积再经过sigmoid变换得到。

优化

JANE的目标函数可以定义为min-max的形式，如下：

$\min _{G, E} \max _{D} V(D, E, G)$

其中$V(D, E, G)$定义如下：

$\begin{aligned} V(D, E, G):=\mathbb{E}_{(\mathbf{a}, \mathbf{x}) \sim p_{\mathbf{A}} \mathbf{x}}[\underbrace{\mathbb{E}_{\mathbf{z} \sim p_{E}(\cdot \mid \mathbf{a}, \mathbf{x})}[\log D(\mathbf{z}, \mathbf{a}, \mathbf{x})]}_{\log D(E(\mathbf{a}, \mathbf{x}), \mathbf{a}, \mathbf{x})}] \\ +\mathbb{E}_{\mathbf{z} \sim p_{\mathbf{Z}}}[\underbrace{\mathbb{E}_{(\mathbf{a}, \mathbf{x}) \sim p_{G}(\cdot \mid \mathbf{z})}[\log (1-D(\mathbf{z}, \mathbf{a}, \mathbf{x}))]}_{\log (1-D(\mathbf{z}, G(\mathbf{z})))}] \end{aligned}$

结论

在这篇文章中，现存使用对抗机制的网络嵌入方法被分析和质疑，因为它们不能够捕捉隐空间中的语义变化，这是由于在没有从真实数据修正高斯分布，而直接比较嵌入结果和从高斯分布中采样的样本导致的。为了克服该问题，JANE框架被提出来使用对抗机制来做网络嵌入。该框架在链路预测和节点聚类任务上的性能改善证明了该框架可以捕捉隐空间中的语义变化。