您现在的位置是:首页 > 人工智能人工智能

西电TKDE 2021 | 可自动发现元路径的异质图神经网络

查看 cc博主 的更多文章cc博主2021-10-19【人工智能】658人已围观

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第1张

作者 | 杨亚明,管子玉,李建新

伟,崔江涛,王泉

单位 | 西安电子科技大学

论文地址:https://ieeexplore.ieee.org/document/9508875

代码地址:https://github.com/kepsail/ie-HGCN


1
引言

目前面向异质图的图卷积神经网络普遍存在两个重要的不足:

(1)大部分已有工作依赖用户人工输入一系列任务相关的元路径(Meta-path),这对于没有专业知识的用户来说是困难的。换句话说,已有方法无法有效地、灵活地从所有可能的元路径中自动挖掘出针对某个任务的最优元路径,这阻碍了模型的有效性和可解释性;

(2)大部分已有方法在执行图卷积之前都需要执行额外的、耗时的预处理操作,这显著增加了模型的时间复杂度,限制了模型的伸缩性。为了解决上述两个问题,该论文提出了高效且可解释的异质图卷积神经网络ie-HGCN,其包含了投影,对象级聚合,类型级聚合三个关键步骤。该模型可以端到端地自动评估所有可能的元路径的重要性,在粗粒度和细粒度两个层面上发现对于当前任务最优的元路径。而且,提出的两层聚合架构也可以避免额外的预处理操作,从而降低了模型的时间复杂度。

论文从理论上证明了ie-HGCN自动发现元路径的能力,分析了其与谱图卷积的联系,分析了其近似线性的时间复杂度。在四个真实网络数据集上的实验结果显示,ie-HGCN不仅能够取得优越的性能,而且可以有效地发现元路径。



2
方法

下图通过在DBLP上的一个模型实例展示了方法的基本流程。如左侧子图(a)所示,模型一共包含5层。在每一层,针对某个对象类型,都将其异质邻居的特征聚合过来(实线),同时也将其自身的上一层的特征聚合过来(虚线)。右侧子图(b)展示了针对P(Paper)类型对象的计算过程:(1)自身/邻居的特征投影;(2)利用归一化邻接矩阵聚合;(3)利用注意力聚合。

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第2张

图1 模型整体架构图

投影

考虑到在异质图里,不同类型的对象的特征通常有着不同的分布,因此在每一层,通过相关的投影矩阵把邻居特征映射到一个共同的语义空间中。同时,也将上一层输出的目标对象的自身特征也投影到这个空间:

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第3张

对象级聚合

对于每种类型的邻居,通过相应的行归一化的邻接矩阵将其投影后的特征聚合起来。这里,自身的投影特征不需要执行对象级聚合。至此,形成若干个临时的特征,即:目标对象自身的投影特征,以及聚合的各种类型的邻居的投影特征。每种特征都从不同的方面反映了目标对象的特性。

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第4张

类型级聚合

利用注意力机制将这些临时的特征聚合起来,从而全面地刻画目标对象的特性。首先,通过不同的参数将目标对象的自身投影特征映射为注意力的查询值和键值,也通过不同的参数将邻居的聚合特征映射为相应的键值:

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第5张

然后,通过一个小型的非线性神经网络将查询与键值映射为注意力系数:

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第6张

通过softmax函数将注意力系数归一化:

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第7张

利用归一化的注意力系数,将若干个临时特征聚合起来,形成目标对象本层输出的新的特征:

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第8张


3
理论分析

论文从理论上证明、分析了该模型具有以下三个良好的性质:

  • 在粗粒度和细粒度两个层面上,可以自动发现针对当前任务最的元路径。

  • 模型实际上是在谱域执行异质谱图卷积。

  • 具有近似线性的时间复杂度。



4
实验

论文在4个公开的真实数据集上与若干个先进的基线方法进行了实验比较。结果显示该模型能够取得优越的性能以及效率。最重要的是,模型可以有效地自动发现最有用的元路径,从而促进了模型的可解释性。我们考虑在DBLP数据集上对作者(A)类型的对象进行分类任务。下图展示了模型发现的针对此任务最有用的若干元路径。上方的子图(a)展示了每一层中,每个目标对象类型与邻居类型(包括自身)之间的归一化注意力系数。下方的子图(b)展示了最有用的几条元路径的重要性得分及其计算过程。其中,第二列中的符号“—”代表了自连接(如图1中的虚线所示),这表明了有些路径是可以“坍缩”的。如此,经过合并一系列等价的路径,我们可以得到任意长度的元路径(第一列)的重要性得分。

很明显,我们可以看到,元路径CPA的得分最高,而该路径的语义是:作者(A)将其论文(P)发表到了会议(C)。令人鼓舞的是,这与数据集的真实情况高度吻合。实际上,这个数据集中,作者(A)类型对象的真实类别标签(ground-truth label)就是根据作者的论文(P)所发表的会议(C)来被标记的。

其他几个得分高的元路径也可以得到合理的解释。元路径CPTPA表明除了作者自己所发表论文的会议以外,另外一些会议也很重要,这些会议里的论文和作者的论文有很多共同的关键词(T)。元路径CPAPA表明作者的共同合作者所发表论文的会议也很重要。元路径CPCPA也比较有意思,因为一篇论文通常只会被发表到一个会议,从而左侧的子路径CPC等价于子路径C,进而CPCPA也可以被解释为CPA。

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第9张

图2 模型自动发现的最有用的若干元路径

西电TKDE 2021 | 可自动发现元路径的异质图神经网络 第10张

cc博客网(公众号:cc博客网)


cc博客网版权文章,未经授权禁止转载。详情见转载须知。

Tags:免费机场shadow x加速器ios下载

文章评论

猜你喜欢

  • 弥补二合一品类主流市场空白,华为MateBook E Go推动二合一品类发展进入普及拐点

    业界弥补二合一品类主流市场空白,华为MateBook E Go推动二合一品类发展进入普及拐点

    移动办公时代,适应多元办公场景的二合一笔记本受到消费者欢迎。虽然头部PC品牌都推出了二合一笔记本产品,但由于价格较高、形态切换体验差、无法提供高效生产力等原因,二合一笔记本一直属于小众的“尝鲜品”。数据显示,当前二合一笔记本的市场份额仅为4%左右。基于对办公...

    查看 cc博客 的更多文章2022-09-07314人已围观

    阅读更多
  • Demis Hassabis:AI 的强大,超乎我们的想象

    人工智能Demis Hassabis:AI 的强大,超乎我们的想象

    有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。整理|黄楠、王玥编辑|陈彩娴近日,DeepMind 的创始人 Demis Hassabis 作客 Lex Fridman 的播客节目,谈了许多有趣的观点。在访谈的一开头,Hassabis 就直言图...

    查看 cc博客 的更多文章2022-08-11280人已围观

    阅读更多
  • 让开发者走出「代码泥潭」,AI如何实现「大一统」?

    芯片让开发者走出「代码泥潭」,AI如何实现「大一统」?

    过去几年间,曾经只在科幻电影中出现的人工智能突破了虚拟与现实之间的高墙,走入了普通人的生活。小到手机APP中的智能推荐,大到可以规划整个城市运转的智慧城市系统。不知不觉中,AI已经进入了我们生活中的每个角落。而随着通信技术的发展,更快的Wi-Fi 7和5G正...

    查看 cc博客 的更多文章2022-08-08527人已围观

    阅读更多
  • 反电信网络诈骗法(草案)提请二审 权威解读来了!

    业界反电信网络诈骗法(草案)提请二审 权威解读来了!

    近日,《中华人民共和国反电信网络诈骗法(草案)》(本文以下,简称“《草案》”)提请十三届全国人大常委会第三十五次会议二次审议。相较于初审稿(2021年10月19日,提请十三届全国人大常委会初次审议)中的39项条例,本次增加至46项。新增内容包括:出入境人员管控...

    查看 cc博客 的更多文章2022-07-01361人已围观

    阅读更多
  • ACM 杰出会员姬水旺:量子化学和物理的深度学习

    人工智能ACM 杰出会员姬水旺:量子化学和物理的深度学习

    整理丨汪浩文校对丨维克多量子技术和人工智能都是当前最先进的科学技术,前者被寄希望于拥有超强的计算能力,后者已经在各行各业“大杀四方”。当两者相遇会碰撞出什么样的火花?人工智能又能在哪些方面助力量子技术?去年12月份,德州农工大学计算机科学与工程系(校长有...

    查看 cc博客 的更多文章2022-04-11416人已围观

    阅读更多

   有免费节点资源,我们会通知你!  加入纸飞机订阅群  

×
天气预报查看日历分享网页电报扫码留言评论电报频道链接