心远地自偏


  • 首页

  • 标签

  • 分类

  • 归档

Multi-Class Imbalanced Graph Convolutional Network Learning

发表于 2020-07-27
简介论文传送门 该工作要解决的问题是图表示学习中的多类不平衡问题,也就是大多数节点属于大类,然后少数节点属于其他小类。当面对不平衡类分布时,现有的网络表示学习倾向于偏向于来自于大类的节点,而使得来自于小类的节点未经过充分训练。存在于一个类或更多类中的类别不平衡学习问题会导致其他类被过度代表,进而导致表示学习方法的性能下降。这是由于下面两个原因造成的: 拓扑交互:除了每个节点关联的特征信息外,不同的节点具有与其他节点的拓扑连接,意味着节点的类别赋予不仅被其自身的特征信息决定,还被与其连接的节点决定。 不清楚的边界:图数据往往具有多种高度有偏的节点类别,使得很难去平衡表示学习和准确的类别边界识别 ...
阅读全文 »

Jointly Adversarial Network Embedding

发表于 2020-07-23
简介论文传送门 在这篇文章中,作者分析并质疑了Network Embedding领域中使用对抗机制来正则嵌入表示的方法。作者认为这些方法由于直接比较真实嵌入和直接从先验分布中采样生成的虚假嵌入,相当于强迫嵌入表示符合高斯分布,但些方法不能捕捉隐空间中的语义变化。而GAN能在隐空间中捕捉语义变化的原因是,它比较的是真实数据和虚假样本,并不是比较真实嵌入和虚假嵌入。为了克服该问题,作者提出一种联合对抗网络嵌入框架JANE,该框架区分嵌入、拓扑信息和节点特征联合的真假。 方法该框架包含三个部分,嵌入模块、生成器和判别器。总体架构如图Figure 2s所示。 判别器模块为了使用真实数据修正高斯先验, ...
阅读全文 »

Learning Deep Network Representations with Adversarially Regularized Autoencoders

发表于 2020-07-17
简介论文传送门 许多现存网络嵌入方法,从采样的节点序列中学得节点表示,但由于从网络中采样的序列具有稀疏性质,导致学得的模型不易泛化。解决该稀疏问题的一个理想方法是通过学习一个采样序列上的概率密度函数来产生表示。但在低维流形上分布往往并不存在分析解。在该论文中,作者提出使用对抗正则编码器(NETRA)来学习网络表示。NETRA学习一个正则节点表示,其通过联合考虑局部性留存和全局重建约束,可以很好的捕捉网络结构。该联合推理可以概述为使用生成对抗训练过程来避免对一个显示先验分布的要求,因此获得更好的泛化性能。 网络采样的稀疏问题如下图所示: 随机游走采样技术被广泛地用在网络嵌入研究中,但其受稀疏性 ...
阅读全文 »

Adversarial Network Embedding

发表于 2020-07-01
简介论文传送门 这是一篇发表于2017年的论文,也是第一次尝试将生成对抗网络应用到图表示学习上的工作。之前的方法主要是将不同的结构性质编码进表示中,比如邻居连接模式,全局结构角色相似性和其他高阶相似性。但作者认为除了捕捉网络结构性质的方法,大多数方法都因为缺少额外的约束而导致不能加强表示的鲁棒性。针对此问题,作者提出对抗网络嵌入(ANE)框架,其充分利用对抗学习原则来正则化表示学习。该框架包含两个部分,一个结构保存成分和一个对抗学习成分。前一个成分旨在捕捉网络结构性质,而后一个成分旨在通过令隐表示的后验分布匹配一个先验分布来学得更鲁棒的表示。 方法对于结构保存,作者提出一种归纳式(induct ...
阅读全文 »

A Generative Adversarial Network for Multi-View Network Embedding

发表于 2020-06-30
简介论文传送门 该论文针对多视图网络表示学习问题(multi-view network representation),即如何为多视图网络中的节点构建低维和信息留存的嵌入的问题,提出来基于生成对抗网络的多视图网络表示框架。来自于真实世界的应用的数据,往往可以用多视图网络表征,其中节点通过多种关系连接。举例来说,在Facebook, 两名用户可以具有朋友关系,入学同一所大学,喜欢或者不喜欢一条动态。一个简单的多视图网络如Figure 1所示。 相比较单视图网络,使用GAN在多视图网络上做表示学习需要克服一个关键的挑战:在单视图网络中,生成器只需要建模节点对之间的连接性,但在多视图网络中,需要建 ...
阅读全文 »

Adversarial Learning on Heterogeneous Information

发表于 2020-06-19
简介论文传送门 之前的异质网络嵌入方法具有如下三个限制: 它们通常使用负采样技术,随机选取现有节点作为负样本。这样的话,它们的负样本就不仅是任意的,也局限于原本网络的空间。 它们主要集中于捕捉异质网络上丰富的语义,但并没有捕捉节点的潜在分布,因为真实世界的异质网络往往稀疏并且有噪声,因此这些方法缺乏鲁棒性。 许多方法依赖于合适的元路径来匹配想要的语义,而这通常需要领域知识,而领域知识有时是很主观的并且获取不易。 作者提出了基于对抗的方法,希望学到语义留存和鲁棒的节点表示。为了实现作者的方法,需要解决两个挑战: 如何捕捉多种类型的节点和关系的语义?在现有方法中,仅使用拓扑结构来区分正负样本 ...
阅读全文 »

傅玄诗两首

发表于 2020-05-31
吴楚歌燕人美夕赵女佳, 其室则迩兮限层崖。 云为车兮风为马,玉在山兮兰在野。 云无期兮风有止,思多端兮谁能理? 昔思君昔君与我兮形影潜结,今君与我兮云飞雨绝。 昔君与我兮音响相合,今君与我兮落叶去柯。 昔君与我兮金石无亏,今君与我兮星灭光离。
阅读全文 »

你的灯还亮着吗

发表于 2020-01-14
问题是什么?尽量不要在还没有定义好问题的时候就仓促地给出解决方案。这样的解决方案不一定对症。也不要在问题的定义上没完没了地绕圈子。因为一方面不可能给出独一无二、完全明确的定义,另一方面如果不能就问题本身达成共识,几乎可以肯定最后找到的解决方案无法切中要害。 对于想成为问题解决者的人来说,入门的关键在于把单一思维模式切换成多重思维模式。为了实现这一转换,问题解决者应该试着趁早问答这个问题: 谁碰到了问题?然后针对答案给出的每一个群体,分别问问: 问题的本质是什么? 问题的定义:问题就是理想状态和现实状态之间的差别。 别去费力帮助缺乏幽默感的人解决问题。这样做的理由是:会被粗暴地否决掉一些可 ...
阅读全文 »

如何做好开题报告PPT

发表于 2019-10-11
准备篇 PPT $\neq$ 提词器 演示的核心是辅助演讲者和听众信息交流的工具。 PPT需要简介,突出重点 内容逻辑比形式设计更重要 确定汇报时长,撰写逐字讲稿,排练三遍以上 设计篇 文字使用原则 使用微软雅黑字体(汉字) 无错别字(标点) 凝炼大段文字,只列要点 强调文字可用加粗或反白显示 字号一般在24以上,不要小于20 图形使用原则 布局页面 突出重点 使用图标形象化抽象概念 使用线条和箭头表示逻辑关系 使用基本图形重新作图 图片使用原则 图片表示原始纵横比 使用高清无水印的图片 多图片排版应当裁剪至同样大小,并对齐 使用阴影或边框来轮廓化 图表使用原则 专业图表使用 ...
阅读全文 »

Novel Node classification framework

发表于 2019-10-10
Informationtitile: Novel Node classification framework Keting authors: Keting Cen, Huawei Shen, Jinhua Gao, Qi Cao, Bingbing Xu, Xueqi Cheng Abstract图卷积网络是可以基于半监督的节点分类任务学习到整合图结构和节点特征的函数的高效算法。尽管图卷积超过了其他最先经第方法,但它需要学习的参数远比使用的样本要多。因为只有标注节点和他们2-hop 的邻居被用来学习GCN的参数。因此随着训练数据集尺寸的减少,节点分类的准确率也随之快速地下降。为了减少参数量和更 ...
阅读全文 »
123…6

plato

51 日志
6 分类
23 标签
© 2020 plato
由 Hexo 强力驱动
|
主题 — NexT.Muse v5.1.4