自20世纪末以来,物理学家对来自不相同的领域的网络图展示出了浓厚的兴趣,期望能发现它们之间的“共性”,并提出对应的物理学统一模型来进行解释,比如1998年以及1999年分别提出的小世界网络模型和无标度网络模型,以及之后提出的一系列模型。在这之后的二十余年时间中,物理学家提出了大量的从微观到宏观的各类网络测度,并研究不同的网络结构对其上动力学行为的影响,涌现出了许多杰出的成果。另一方面,计算机科学家则着眼于不同类节点、连边、以及网络的结构“个性”,期望能抓住不同类节点、连边、网络之间的结构特征差异。基于此,他们通过对网络进行向量化表征,并结合机器学习技术来进行各类预测,比如进行虚拟货币交易网络中的诈骗节点识别,在线社交网络中的特定关系推断、电子商务和短视频平台的商品和内容推荐、基于分子结构的化学毒性预测等等。对知识自动化的追求促使研究者提出各类网络图特征自动提取方法,即图嵌入方法,通过将网络中节点、连边、网络映射成不同维度的向量,建立起了互联网空间和欧氏空间之间的桥梁,从而有助于更方便快捷地使用各类前沿的机器学习方法。近年来,随着深度学习的蓬勃发展,在图数据挖掘领域,也提出了多种端到端图神经网络框架,逐步提升了对各类网络图数据的自动化分析和处理能力。
本书主要介绍图机器学习,即结合网络图结构可以进行机器学习算法设计,并将其应用于实际网络数据挖掘中。事实上,从计算机科学的视角,在离散空间,时间序列、图像、视频可以认为是典型的一维、二维、三维网格数据,仅时间或空间相邻数据点之间有联系,每个节点有一个值对应其固有特征。而网络图则能表达任意的拓扑结构,每个节点一样能有其固有特征,是一种更具一般性的数据表征方式。
本书共分为八章,第一章介绍了现实和虚拟世界中的各类网络,在此基础上给出了网络图数据的表示,概述了图上的各类机器学习任务和方法,并详述了本书所使用的各类图数据集和相关资源。第二章至第五章是图机器学习的基础算法部分,我们从微观到宏观分别介绍了节点分类、链路预测、社团检测、图分类的各种机器学习任务及算法,每章先给出对应的任务和评测指标体系,然后由浅入深介绍基于启发式、图嵌入、和深度学习的各类算法,并给出在真实数据上的实验结果,比较各类算法的优劣。社团检测由于属于非监督学习,相对独立,该任务在网络科学领域很成熟,算法众多,我们主要挑选一些比较有意思的传统方法和深度学习办法来进行介绍。第六章和第七章主要介绍图机器学习算法在对抗攻击下的鲁棒性(或安全性)问题,分别介绍对抗攻击策略和对抗防御策略。针对AI算法的鲁棒性问题是近年来AI领域的热点研究方向之一,大量的研究表明AI算法具有其固有的脆弱性,输入数据细微的扰动就能导致算法的失效。基于类似的原理,对网络图数据的细微干扰(比如对图进行少量重连边操作或者对节点固有特征进行微扰等)也能使图机器学习算法失效。在第六章,我们将详细探讨针对多类图机器学习算法的对抗攻击策略;而在第七章,我们将介绍包括对抗训练、图净化、对抗样本检测等对抗防御策略,以提升图机器学习在对抗环境中的鲁棒性。最后在第八章,我们将探讨领域前沿图数据增强技术,通过利用图数据自身的结构和属性信息来拓展特征空间,乃至自动生成更多的标注数据,以全方面提升图机器学习算法的性能。
本书聚焦于网络科学和人工智能前沿交叉领域,以期将机器学习前沿技术用于自动分析网络图数据,获取知识。对于网络科学领域的青年学者,我们期望本书介绍的图嵌入、深度学习、以及对抗攻防和增强等相关章节能够给您带来与传统网络科学书籍不一样的体验,在巩固网络科学相关知识的同时,也能促进您对AI的兴趣和技术积累;对于机器学习领域的青年学者,我们大家都希望本书能够给您提供一个全新的应用领域,并了解网络图数据的普适性,其中介绍的网络科学、启发式算法等有助于您更深入地了解图数据的来源和应用前景。
宣 琦,浙江工业大学网络空间安全研究院院长、教授、博士生导师。入选浙江省院士结对培养青年英才计划、浙江省高校中青年学科带头人、浙江省杰出青年基金获得者,主持国家自然科学基金联合重点项目及多项面上项目。主要是做图机器学习、互联网数据挖掘以及人工智能安全等领域的研究工作,在TKDE、PRE、ICSE、FSE等期刊及会议发表学术论文100余篇。曾赴卡内基梅隆大学、加州大学戴维斯分校、香港城市大学从事博士后和访问学者合作研究。目前任中国人工智能学会社会计算与社会智能、中国指挥与控制学会网络科学与工程等专业委员会委员。
作者要感谢近年来与本人在图机器学习领域并肩开拓的几位同学,包括张剑、王金焕、殳欣成、周嘉俊、陈丽红、谢昀苡、单雅璐、徐慧玲、沈杰、李晓慧、周涛、甘燃,以及我的同事阮中远,你们为本书做出了巨大贡献,协助我整理了本书的大部分材料,复现了相关算法,衷心感谢并为你们感到骄傲!
感谢香港城市大学陈关荣教授,是您将我带入网络科学这个非常有意思并充满挑战的前沿领域,让我在学术上实现自我成长;感谢中国工程院杨小牛院士,是您将我带入互联网空间安全这一关系到未来人类命运共同体的领域,并启发我将安全引入图机器学习,从而开辟了全新的学术方向。同样也感谢国内外网络科学和AI领域的众多学者,跟你们的交流、读你们的文章都能让我获得诸多启迪。
希望未来能有更多的青年学者一起来从事图机器学习这一充满挑战和机会的领域!