学术期刊网 > 学术资讯 > KDD 2021之百度:学术研究与技术应用相结合

KDD 2021之百度:学术研究与技术应用相结合

学术期刊网 学术资讯 2021-08-18

  8月14日至18日,国际数据挖掘与知识发现大会 KDD 2021在线上正式举行。此前本届KDD入选论文已经揭晓,百度被收录的多篇论文,其突出的特点是学术研究与技术应用紧密结合,再次展现百度在AI领域的技术实力。

  ACM SIGKDD(简称KDD)国际数据挖掘与知识发现大会至今已连续举办了26届,是世界数据挖掘最高级别的学术会议之一,有数据挖掘领域“世界杯”之称,每年吸引了大量数据挖掘、机器学习、大数据和人工智能等领域的研究学者、从业人员参与。

  百度在AI技术方向多年创新积累,数据挖掘和知识发现也是重点关注和持续投入的相关领域,并拥有多项技术成果和应用落地案例。在多年为KDD输送优质论文的基础上,百度今年的被收录论文再次体现了技术与应用紧密融合的趋势。

  生物计算与医疗:生命健康里的AI新可能

  在与人类息息相关的生命健康领域,百度也取得了长足进步:在AI+医疗多个方向上探索,构建医疗AI中台、面向医疗场景提供各种AI解决方案;更进一步寻觅生物计算的密码,推出生物计算平台螺旋桨PaddleHelix。此次KDD 2021中,百度发表了论文聚焦生命健康领域,提出了相关的新型图神经网络模型和医学实体关系循证框架。

  1. 三维结构感知的交互式图神经网络 —— 用于蛋白质-配体亲和力预测的新型图神经网络模型

  Structure-aware Interactive Graph Neural Networks for the Prediction of Protein-Ligand Binding Affinity

  药物设计的一个关键步骤是准确的预测蛋白质-配体的亲和力(protein-ligand binding affinity)。最近的研究进展已经证明,使用图神经网络 (GNNs) 来学习蛋白质-配体复合物(protein-ligand complexes)的表示,比传统方法可以更准确地预测亲和力。然而,现有的模型通常将蛋白质-配体复合物视为拓扑图,并没有充分利用分子的三维结构信息。同时GNN模型也忽略了原子之间基本的远距离相互作用。为此,我们提出了一种新型的三维结构感知的交互式图神经网络 (SIGN),它由两个部分组成:基于极坐标的图注意力层 (PGAL) 和成对交互式池化层 (PiPool)。具体来说,PGAL层首先迭代执行节点-边聚合过程以更新节点和边的表征,在这个过程可以同时保留原子之间的距离和角度信息。然后,SIGN可以通过PiPool层来对交互边进行池化操作,随后通过重建交互矩阵的学习任务来反映蛋白质-配体的全局交互信息。在两个基准数据集上的实验结果验证了SIGN预测效果的优越性。



  2. 基于大规模机器阅读理解的医学实体关系循证

  Medical Entity Relation Verification with Large-scale Machine Reading Comprehension

  医学实体关系验证是构建企业级医学知识图谱的关键步骤。现有的信息抽取的方法专注于实体关系的挖掘,但并不能对挖掘的关系提供有效的循证支撑,这在真实医学应用场景下是不可接受的。因此,设计一种以循证为基础的医学实体关系验证框架是十分必要的。

  针对上述场景,我们提出了一种基于大规模机器阅读理解技术的医学实体关系循证框架。该框架中我们设计了多种创新性的方法和模块来提高医学实体关系循证的效率和准确率。比如,为了解决医学实体的多样性和变体问题,我们提出了一种近义词感知(synonym-aware)的召回模型;为了更好的利用医学的领域知识,我们创造性的设计了基于关系感知(relation-aware)的证据探测模块和基于医学本体增强(medical ontology-enhanced)的聚合模块,来共同提高整体循证模型的效果。此外,为了解决证据标签缺乏的问题,我们提出了一种新颖的基于交互协调训练的新方法(interactive-collaborative training)来提升标注效率,提升证据准确率。通过实验验证,我们提出的循证框架超越多个现有的基于事实验证的最好基线方法(state-of-the-art baselines)。该框架已经应用在了百度临床辅助系统(CDSS)上,多方位支撑CDSS产品矩阵的可解释循证,帮助了上万名医生。



  POI检索、推荐等为用户提供更好、更便捷的智能化位置服务

  作为国内智能化位置服务的代表产品之一,百度地图日均位置服务请求已突破了1200亿次。

  怎样让用户在使用百度地图时能够获得更好、更快、更方便的服务?KDD 2021中选论文中,百度延续以往在百度地图方面的技术研究、进行了升级和创新,覆盖POI即时检索、多语言POI检索、POI推荐和基于自监督元学习的路线耗时预估办法等。

  3. MST-PAC:基于元学习的时空个性化POI即时检索

  Meta-Learned Spatial-Temporal POI Auto-Completion for the Search Engine at Baidu Maps

KDD 2021之百度:学术研究与技术应用相结合杂志位列学术资讯
广告位
下一篇:没有了