知识图谱“世界杯”榜单揭晓度小满TranS算法刷新世界纪录

近日,素有知识图谱“世界杯”之称的OGBL-wikikg2公布比赛结果,度小满AI-Lab团队强势夺冠,碾压Meta(原Facebook)AI实验室FAIR、蒙特利尔Mila实验室等一众国内外顶级AI科研机构,创造了KGE算法新纪录。

OGB是斯坦福大学发布的国际知识图谱基准数据集,也是图神经网络领域最权威、最具挑战性的“竞技场”,每年Meta(原Facebook)、蒙特利尔大学、蚂蚁金服、科大讯飞等众多顶级研究机构和企业都会前来参赛。

在这场“高手云集”的国际竞赛中,度小满数据智能部AI-Lab团队提出创新性知识图嵌入(KGE)模型TranS,刷新了OGBL-Wikikg2基准数据集最高记录。该团队表示wikikg2图数据规模巨大,训练迭代时间长,在分数优化空间已接近极限的情况下,他们仅使用V100-16G显存的GPU就打败了其他使用A100-40G的团队。

图神经网络就是图数据与神经网络的结合。其中,图数据可以简单理解为一种独特信息表现形式——图的每个节点看做是一种实体,比如一个用户、一个商品,或者一个事件;图的边则表示不同实体和事件之间的关系。

图数据在现实世界无处不在,高度结构化的图数据形成了庞大的知识图谱,这种知识表示形式,为AI系统提供了可学习的先验知识,能够获得处理复杂任务的能力。因此,图神经网络算法在金融风控领域有着广泛的应用前景。

比如金融风控领域往往依赖于大量的文本信息,而实际上还存在着大量的结构化的知识图谱信息待风控模型使用。对于基于神经网络的风控模型来说,如何将离散的图信息转换成连续的向量表示十分重要。而通过TranS模型可以有效提升图结构中实体和关系的表示效果,进而挖掘潜藏的复杂关系,提升风控模型的准确度与区分度。

庞大数据量,是金融行业AI化的天然优势,但数据的复杂性,多维性,以及隐私等问题也为金融企业带来了不小的挑战。度小满团队表示,图神经网络技术,能够帮助行业降本增效、解决数据孤岛和安全问题,在智能获客、智能风控、智能经营、智能机器人等应用方面发挥着重要作用。

在图神经网络之外,度小满AI Lab在深度学习、计算机视觉、自然语言处理,包括文本向量化、文本分类、信息抽取等方向上也早有布局。去年3月,该团队凭借DML算法获得MS MARCO 国际比赛中文档排序任务的冠军。去年12月,该团队又研发了轩辕 (XuanYuan) 预训练模型,在国际权威测评基准CLUE1.1榜单中「力压群雄」斩获第一,距离人类表现仅差3.38分。时隔几个月,度小满再次在世界级AI竞赛中夺冠,并不让人意外。

“未来度小满AI Lab团队将继续围绕知识图谱补全、实体对齐等具体问题展开深入研究,同时兼顾更广义的图网络在金融风控方向的应用,希望通过诸如社交关系、交易关系、地理关系等信息构建的大规模图网络,运用图神经网络等算法提升模型在信用风险评估和反欺诈等方面的使用效果,”度小满数据智能部总经理杨青说。

发表回复

您的电子邮箱地址不会被公开。