设为首页 | 加入收藏

欢迎访问彩票大赢家优化版软件-3d走势图彩票大赢家-3d走势图彩票大赢家

3d走势图彩票大赢家 >> 霞浦天气-人工智能助力药物研制!发生更大的实践使用价值

点评 | 吴朝晖(浙江大学校长,我国科学院院士)

责编 | 兮

生命科学迅猛展开,改写咱们对生命认知的一起,也给疾病医治带来了更多的或许性。理论上,简直一切生物学功用都能够被药物靶向。小分子因其相对低价的本钱,成为各大制药公司和研讨组织展开疾病医治研讨的首选东西,药物发现也因而越来越“平权化”。但是,找到具有适宜药理学、毒理学和药代动力学等特性的小分子,仍然是一个很大的应战。面临不断增加的药物研制数据,现有的人工智能(AI)办法尽管能够据此构建出强壮的猜测模型,但是深度神经网络所学到的东西一般难以被化学家和生物学家了解,并且这种认知间隔正在不断增大,也使科技人员难以信赖AI模型的猜测效果,这也约束了AI技能在药物研制实践中的运用【1】

近来,中科院上海药物所蒋华良院士和郑明月研讨员(榜首作者为博士研讨生熊招平)在Journal of Medicinal Chemistry宣布封面文章Pushingthe Boundaries of Molecular Representation for Drug Discovery with the GraphAttention Mechanism该论文介绍了一种根据留意力机制的图神经网络模型(Attentive FP)。该模型能够用于分子表征,在多个药物发现相关的数据集上的猜测体现到达当时最优,并且该模型所学到的内容具有可解说性。这种可解说性在机器的认知和人的认知的差异间架起了一座桥梁,由此或许更好地运用机器的认知增强药物学家的认知,发生更大的实践运用价值。Attentive FP的特征可视化标明,它能够主动从特定使命中学习到分子结构内非部分的特性,因而能够协助药物学家或化学家逾越经历和直觉,直接从各种性质数据中获取对该分子结构更深层的了解。


结构决议性质,性质体现于结构。怎么从一个分子的化学结构中提取出它的各种性质是科学家朝思暮想的方针。到现在为止,人们先后发明晰5000种以上的不同描述符(特征)去表征一个化学分子的结构【2】。传统的机器学习模型就环绕这些预界说的描述符,经过特征工程选取不同的组合,对小分子的各种性质进行建模猜测。特征工程选取是一个繁琐且耗时的进程,并且这种较强的预设先验很或许使模型发生误差,导致猜测效果达不到最优。以Neural FP为代表的分子图神经网络模型能以较少的特征描述符作为输入,得到显着更优的猜测效果,是人工智能在分子表征范畴的重要测验【3】。但是,在机器学习中精确性和可解说性很难统筹。假如不能使神经网络的“黑盒子”通明化,人们很难判别一个模型只是拟合或记住了练习数据,仍是真实具有了泛化的才干。面临药物研制后期巨大的本钱投入,药物学家不或许完全信赖某个黑盒算法给出的“果断”猜测【4】。因而,人工智能药物规划研讨的要点之一便是需求探究深度学习算法的可解说性,针对性地开发了更契合化学布景,更易于解读的人工智能模型。

图1. Attentive FP全体结构以及与同类的图神经网络模型比较。

作者比较了他们自己的AttentiveFP模型与其他几种图神经网络模型(图1)。假如将分子看作为一张图(graph),给定一个节点(赤色符号的方针原子),在Neural FP【3】和GCN【5】模型中,其他节点对方针节点的影响会随间隔严峻衰减,这不契合化学直觉,即化学结构中心隔较远的原子间有时也会发生较强的影响,比方分子内氢键的构成;Weave【6】和MPNN(特指Deepchem中完结的MPNN)模型则默许一切其他节点对方针节点有霞浦天气-人工智能助力药物研制!发生更大的实践使用价值相同的影响,这能够更好捕捉分子结构中的一些非部分特征,但显着忽视了化学分子固有的结构。作者提出的Attentive FP能在坚持分子固有结构的情况下,有用捕捉图的非部分特征和远间隔节点相互效果(图2)。这得益于Attentive FP先在原子水平参加留意力机制,学习到分子的部分特征,后在整个分子水平参加留意力机制,学习到分子的大局特征。值得一提的是,比较其他同类图神经网络模型,Attentive FP用了最少的初始特征作为模型输入,仍然在多个测试数据会集到达了当时最优的猜测体现。

图2. Attentive FP 留意力求神经网络架构。


图3 AttentiveFP学习水溶性时主动学习到的特征与化学家界说的描述符比较。

作者将Atte霞浦天气-人工智能助力药物研制!发生更大的实践使用价值ntive FP学习水溶性时主动学习到的特征与化学家界说的描述符进行了比照(图3)。能够看到,练习前后,主动学习到的特征简直能复现出跟猜测使命相关的经历描述符。这些经历描述符是根据化学家的专业常识所界说出来的,比方TPSA(拓扑分子极性表面积)和LogP(油水分配系数)。由于这些经历描述符与水溶性高度相关,对猜测使命有较强的辅导,传统的机器学习模型一般会直接挑选这些描述符作为输入特征的一部分来猜测水溶性。但作者展开的Attentive FP能够不以这些化学先验作为输入,而以更原始简略的输入(如原子和键的类型等),直接在在隐含层中主动学习到的这些人们长时间堆集的化学常识,体现为练习后的模型隐含层特征与这些经历描述符的相关性变高,而与猜测使命不相关的描述符如SA Score (组成难易性)和Drug Likeness(类药性)与学习到的隐层特征相关性比较并没有显着改动。

图4. Attentive FP主动学习化3a街拍学环境。

作者展开的AttentiveFP模型还能主动学习到原子地点的化学环境,比方,以药物溶解度作为监督使命进行练习,将模型学习到的原子向量作相似性评价,负相关的原子对标为黄色,正相关的标为蓝色(图4)。效果标明经过学习,整个分子显现出特定的结构形式,这种形式在躲藏层的高层愈加显着。关于图4所示的Iprodione结构,原子被主动集合的三个部分正好对应分子结构中的三个片段,其间,分子结构中灰色布景的化学基团极性比较小,不利于水溶性,中心赤色布景的基团极性较大,利于水溶性。这一效果提示模型或许主动学习了到各个原子地点的不同化学环境。

图5. Attentive FP主动学习到分子中的芳香性质结构霞浦天气-人工智能助力药物研制!发生更大的实践使用价值。

化学分子中的芳香性是一种典型的非部分特征,这一问题也给根据卷积架构的图神经网络模型带来了应战。经过运用留意力机制,作者展开的Attentive FP模型很好的处理了这一问题。当原始输入中去除编码芳香性的相关特征(防止信息走漏),输出仅以分子中芳香原子的个数作为学习方针进行监督练习时,Attentive FP能根据留意力机制的权重,精确标出芳香原子的方位。一起,练习完结的模型面临对抗性的样本(细小的结构改动,但对芳香性影响巨大的分子)也能进行精确辨别,展现了强壮的泛化才干。

人工智能在人脸辨认、语音辨认、翻译和主动驾驶等方面的运用不需求重视智能算法学习到了什么,为什么会做出这样的判别,只需到达满足的精度即可。但关于像药物发现这种科学问题,其间有更多的不确认性,在通用人工智能把整个新药发现流程包揽曾经,药物学家会更信赖自己的经历直觉,但一起又期望从越来越多的药物研制数据中罗致新的见地。数据的堆集和深度学习算法的运用能够树立更精确的猜测模型,而这些猜测假如是不能被解说,或者说被药物学家了解,那么将很难取得药物学家的信赖,从而被真实运用而成为药物发现必不可少的环节。该团队开发的根据留意力机制的可解说图神经网络分子指纹Attentive FP是对人工智能的可解说性在药物发现中的有利探究,它将机器认知与人的认知衔接起来,以期更好地运用机器的认知增强药物学家的认知,这类前沿且与药物研讨需求紧密结合的探究,信赖能发生更大的实践运用价值。

全体来说,文章干货满满,更多内容可自行查阅原文,有爱好的读者也能够直接运用揭露的代码做自己的探究,https://github.com/OpenDrugAI/AttentiveFP。

值得一提的是,蒋华良/郑明月课题组前不久也在Journal of Medicinal Chemistry杂志上宣布人工智能助力药物研制的论文,根据现有激酶活性大数据,运用深度神经网络算法,树立了药物调控激酶谱的猜测剖析办法(详见此前BioArt的报导:特别评述 | 人工智能助力药物研制:深度学习猜测药物调控激酶谱)。



专家点评


吴朝晖(浙江大学校长,我国科学院院士,人工智能研讨专家)

评论家布雷特金(Brett King)在《智能浪潮:增强年代降临》一书中指出,今日所探究的人工智能等科技,将完全从头界说人类的下一个年代,这一年代可称之为智能增强年代。智能增强年代不可防止地要协调好机器智能和人类智能的联系,在决议方案中交融机器智能,完结人机协同,增强人类智能。

最近十年,得益于算力的增加和数据的累积,咱们留意到深度学习在物流、监控、个人帮手、高频买卖等范畴取得了突破性的成功,推动了这一波的人工智能热潮。但是,咱们相同发现现在以深度神经网络为代表的衔接主义人工智能(AI)还有许多限制:它太依赖于数据,短缺泛化推理才干,也是人类不能了解的“黑箱”。咱们不知道神经网络得到猜测的根据,更不确认人工智能模型究竟是学习到了可泛化的常识,仍是只是记住了样本,拟合了数据。关于比如图像辨认、机器翻译等使命,有些情况下即便发生过错并不会发生严峻后果,只需模型到达好的猜测效果,咱们能够不用关怀模型是怎么做出猜测的。有许多人工智能使命,会由于人类对智能体系了解缺乏,而存在的巨大危险。深度神经网络假如一向坚持“黑箱”状况,模型会很简单受对抗性样本的进犯,用户也很难决议什么时候能够信赖模型的猜测。例如,医师不知道AI模型对病理图片作出猜测的根据,就不能定心选用AI给出的确诊定论;药物学家不知道AI体系为什么优选开发某些分子而不是别的一些分子的原因,面临后期巨大的经费投入和失利危险,就很难信赖AI给出的研制决议方案。

因而,当时人工智能想要真实显现才智特征,发明普惠价值,需求处理的一个重要问题是深度神经网络的可解说性。只要人工智能决议方案进程变得愈加通明,这种智能才干愈加通用。可解说性人工智能(Explainable AI)作为一个十分前沿的研讨方向,聚集于用体系性和可解说的办法出现人工智能所学习到的杂乱逻辑,让人工智能的猜测根据更好地被人类了解。这是完结人机协作,增强人类智能的根底。可解说性人工智能受到了各国政府、工业界和学术界的广泛重视。美国国防部先进研讨项目局DARPA赞助了可解说性人工智能项目XAI(ExplainableAI);我国国务院在2017年印发的《新一代人工智能展开规划》中提出要“完结具有高可解说性、强泛化才干的人工智能”,得到了产业界和学术组织广泛认可和活泼响应。

近来,上海科技大学和中科院上海药物研讨所蒋华良院士和郑明月研讨员团队在人工智能的可解说性在药物发现范畴中的运用进行探究,开发了一种新的分子结构表征办法Attentive FP【8】。该办法是根据留意力机制的图神经网络模型。其间,图神经网络模型对拓扑图中的点和边的联系进行建模,有利于联系推理。留意力机制是近年来人工智能天然言语模型的中心展开之一,在进步言语模型功用的一起也提升了模型的可解说性【9】。在Attentive FP中,该团队运用图神经网络处理含有原子和键的分子图结构,并经过立异性地引进原子水平缓分子水平的留意力机制,使分子图模型兼具推理才干和可解说性。运用Attentive FP进行分子表征和药物性质猜测建模,能够取得泛化功用更好的模型;经过可视化模型主动学习到的特征,能够发现Attentive FP能从化合物的性质数据中直接学习和提取契合化学经历常识的形式和关联性。这些特功用够协助药物学家愈加高效地处理日益扩增的研制数据,从海量大数据中直接获取新的见地,丰厚药物学家的常识库和经历储藏。

未来,跟着脑科学、认知科学、类脑核算的迅猛展开,人工智能在感知、回忆、推理等方面的功用“短板”终将得到补齐,人工智能“黑箱”模型也将变得愈加通明,到时人工智能才干更显才智特征,更具普惠价值。能够预见,药物研制范畴也会交融机器智能与人类智能,完结人机协同,由机器智能协助药物学家快速处理海量数据,增强药物研制的合理决议方案。根据留意力机制的图神经网络分子指纹Attentive FP是在药物发现中对可解说性人工智能的活泼测验,也展现了可解说性人工智能在人机协同以及在助力药物研制方面的巨大潜力。



作者简介

熊招平(榜首作者)

熊招平,上海科技大学与中科院上海药物研讨所联合培育博士生,导师为蒋华良院士和郑明月研讨员。他研讨爱好会集于图神经网络(Graph Neural Network)在分子表征、分子生成和结构优化中的运用,要点探究可解说性人工智能在新药研制中的潜力。他思想活泼,研讨爱好广泛,对多学科穿插交融特别感爱好。2015年第二届中美青年创客大赛中,他地点的无人船团队取得上海赛区榜首名,他在其间担任视觉算法开发和布署。2016年榜首届由中科院细小卫星中心举行的细小卫星规划大赛中,他掌管的细小卫星生化试验模块项目取得第二名。2018 DREAM Challenge的“多靶点药物猜测应战赛”(Multi-Targeting Dream Challenge 2018) 中,他在甲状腺髓样瘤(medullarythyroid carcinoma)和tau蛋白神经退行性模型两项使命都取得榜首名(人工智能助力上海研讨生熊招平摘取多靶点药物分子规划世界应战大赛冠军)。

郑明月(通讯作者)

郑明月,我国科学院上海药物研讨所研讨员、博士生导师、国家新药研讨要点试验室成员、我国化学会核算机化学专业委员会委员。研讨方向是根据人工智能和大数据的精准药物规划技能开发。在药物效果机制和靶点发现、新靶点活性化合物的发现和成药性优化等方面取得了一系列效果,展开了具有特征和立异性的机器学习算法和模型,得到了国内外同行的重视。近年来,共宣布SCI论文70余篇,参加5部专著的编写;在Trends Pharmacol Sci、Autophagy、J Med Chem、J Chem Theory Comput和Bioinformatics等杂志宣布通讯或榜首作者论文40余篇。参加请求发明专利和软件著作权16项,其间已取得发明专利授权5项,软件著作权3项。现在掌管天然科学基金面上项目,作为课题担任人参加科学院个性化药物先导专项和生物安全关键技能国家要点研制方案等项目。近年来,当选中科院青年立异促进会会员(2013),取得我国药学会施维雅青年药物化学奖(2014),赛诺菲-中科院上海生科院优秀青年人才奖(2015),上海市人才展开资金(2018)等奖赏和荣誉。

蒋华良(一起通讯作者)

蒋华良,我国科学院院士,我国科学院上海药物研讨研讨员,上海科技大学免疫化学研讨所教授。1987年结业于南京大学化学系,取得有机化学学士学位;1992年于华东师范大学化学系取得物理化学硕士学位;1995年于我国科学院上海药物研讨所取得药物化学博士学位。

蒋华良长时间努力药物科学根底研讨和新药发现,他经过生物学、化学、数理科学和核算信息科学等多学科的穿插,展开原创药物研讨新策略与新办法、先导化合物发现和优化、药物靶标调控机制等研讨。他展开了一系列靶标发现和药物规划新办法,被世界同行和制药公司广泛运用。他展开了能猜测化合物药效的理论核算办法,部分处理了药物规划范畴的严重难题。他针对多种重要靶标发现了数十个新结构类型的先导化合物,其间5个候选药物已进入临床试验研讨,。迄今他在世界学刊上宣布论文460余篇,其间通讯或一起通讯论文作者200余篇、总述13篇;合编专著24本,译本2本,论著被他引2万余次。请求专利160项,获授权70余项(其间世界专利16项),完结效果转让6项。

他获国家天然科学二等奖、国家科技进步二等奖、何梁何利科技进步奖、国家青年科学家奖、国家青年科技奖、上海市牡丹天然科学奖、上海市科技进步一等奖、上海市科技精英等多种奖项。现在担任J. Med. Chem.副主编和其他5种世界学刊的编委。曾任国家863方案专家组成员、国家严重根底研讨方案“蛋白质科学严重根底研讨方案”专家组成员、国家天然科学基金委“根据化学小分子探针的信号转导进程研讨”严重研讨方案专家组成员,现任国家天然科学基金委“生物大霞浦天气-人工智能助力药物研制!发生更大的实践使用价值学分子动态润饰与化学干涉”严重研讨方案专家组组长。

原文链接:

https://doi.org/10.1021/acs.jmedchem.9b00959

制版人:小娴子

参考文献

1. Shake-up in AI drug discovery, NatBiotechnol. 2019, 37(6):576.

2. Dragon 7.0. https://chm.kode-solutions.net/products_dragon.php

3. Duvenaud, D.; Maclaurin, D.;et al.. Convolutional Networks on Graphs for Learning Molecular Fingerprints. ArXiv E-Prints 2015, arXiv:1509.09292.

4. Schneider, G. Mind and Machinein Drug Design. Nat. Mach. Intell. 2019, 1 (3), 128–130.

5. Zhou, Z.; Li, X. GraphConvolution: A High-Order and Adaptive Approach. ArXiv E-Prints2017,arXiv:1706.09916.

6. Kearnes, S.; McCloskey, K.;Berndl, M.; Pande, V.; Riley, P. Molecular Graph Convolutions: Moving BeyondFingerprints. J Comput-Aided Mol Des 2016, 30, 595.

7. Wu, Z.; Ramsundar, B.; et al..MoleculeNet: A Benchmark for Molecular Machine Learning. Chem Sci2018,9 (2), 513–530.

8. Xiong, Z, Wang, D,; et al..Pushing the boundaries of molecular representation for drug discovery withgraph attention mechanism. J Med Chem. 2019,https://doi.org/10.1021/acs.jmedchem.9b00959

9. Ashish, V.; Shazeer N,; et al.."Attention is all you need." In Advances in neural informationproc霞浦天气-人工智能助力药物研制!发生更大的实践使用价值essing systems, 2017, pp. 5998-6008.



上一条      下一条
返回顶部