在数百万的化合物的定义中,如何快速寻找可行的化合物的定义

假阳性化合物:药物研发者的心头之“痛” | 科学人 | 果壳网 科技有意思
假阳性化合物:药物研发者的心头之“痛”
本文作者:Jonathan Baell, Michael A. Walters
图片来自:Nature,漫画作者:Roz Chast
(/译)近年,新药开发领域炙手可热,大量研究人员蜂拥涌入。但是,他们当中很多人缺乏应有的引导,科研也做成了一团浆糊。每当生物学家们发现一个与疾病相关的靶点蛋白,他们就会想方设法寻找能够与这个蛋白质分子结合并影响其活性的化合物,这些有苗头的化合物常被称为“活性化合物”。一次典型的药物筛选流程能够找到数千种活性化合物,它们可以作为疾病机理研究的工具,也是寻找新药的基础。
但是,在筛选试验中,很多化合物展现出来的“活性”仅仅是一种假阳性结果——它们的“活性”并不是基于化合物分子与蛋白质之间特异性的作用。真正的药物能够精确作用于特定蛋白质的结合位点,从而抑制或激活蛋白质的功能。而“假阳性化合物”则伪装成药物结合的样子,在各种筛选研究中大放烟雾弹。
科学家们把这些坏家伙叫做pan-assay interference compounds(泛筛选干扰化合物),简称PAINS(这个缩写可谓物如其名,它们真是研究人员的心头痛)。PAINS有着明确的化学结构,横跨多个化合物种类。但是,很多生物学家和缺乏经验的化学家都不能一眼认出它们。相反,经常有科学论文把它们错当成有潜力的“药物候补”。为了优化PAINS的活性,大把时间和研究经费都打了水漂。化学家们耗费精力制作出各种类似物,试图提高PAINS和蛋白质之间的“结合性”。与此同时,真正有潜力的活性化合物却不得不坐上了冷板凳。
十年前,药物筛选工作主要由各大制药公司完成,这些公司往往有经验丰富的化学家提供技术支持。而现如今,越来越多的学术机构也开始进行药物筛选,同样水准的技术支持却未必存在。一个例子就是成立于2012年的学术药物开发联盟(Academic Drug Discovery Consortium),该机构目前已在9个国家成立了超过115家研发中心,并颇引以为豪。但是,学术机构中越来越多的药物研究人员缺乏相应的训练,无法区分“活性化合物”中何为良何为莠,何为捣蛋分子。
PAINS在筛选试验中表现出的“活性”极具诱惑力,于是出现了这种现象:即使已经有论文发表指出某种化合物会干扰筛选结果,关于该化合物的“活性”研究仍会继续。例如,2013年的一项研究发现了七种在筛选时能够与超过三分之一蛋白质发生作用的干扰化合物,但是这篇论文并未得到应有的关注。
像这样对多种蛋白质有反应、看上去大有前景的干扰化合物被研究人员们反复报道,相关数据充斥着整个化学界文献库。这些论文再三将假阳性分子错认为有效的新药,带动一轮又一轮的“筛选-发表-穷折腾”的恶性循环。药剂公司将这些假阳性化合物放进产品目录,号称是有发表论文支持的蛋白质抑制剂,导致其他生物学家也开始在自己的研究中使用这些化合物。
造成筛选假阳性的“罪犯”们。图片来自:Nature,漫画作者:Roz Chast。点击图片查看大图
尽管PAINS常被叫作“坏反应物(bad actors)”,但它们其实是相当优秀的“演员”:在假装自己“有潜力“方面简直堪称完美!乔纳森o贝尔(Jonathan Baell,也是本文作者之一)在自己的实验室因为假阳性物质白白浪费了两年后,于2010年首次发表了一篇关于识别PAINS的指南。而另外一位作者迈克尔o沃尔特斯(Michael A. Walters)在为一种试验中的杀真菌剂准备说明书和专利申请时,发现了很多名不副实的“活性“化合物,于是也开始了反PAINS的宣传之路。一个简单的例子就能说明PAINS为科研带来的危害:研究人员发现了一些能够与蛋白质发生非特异性作用的化合物,于是就花费了一年多的时间试图弄清个中机理,他们试遍各种方法,包括蛋白质聚集、化学分解、反应活性检验以及荧光测定,最终却没有收获。根据我们的估计,只要提高对PAINS的认识外加一些预防措施,就能避免无用功,为生物医学研究工作节省数年的时间以及数百万美元的研究经费。
一个典型的学术药物筛选数据库中往往有5~12%的化合物属于PAINS,而且这些冒牌货还能被重复实验验证。大部分实验室青睐的“标配”数据库情况相似,例如大牌试剂公司Sigma-Aldrich提供的药理活性化合物数据库(LOPAC),以及美国国立卫生研究院(NIH)提供的分子库-小分子存储项目(MLSMR)。
大多数PAINS仅仅是有反应活性的化学物质,而非真正具有特异性的药物候选。它们用以瞒天过海的方法五花八门。有的PAINS能发出荧光或是自己有颜色,即使目标蛋白不存在时也能够表现出阳性反应。还有一些PAINS能捕获筛选实验中被用作试剂或反应物的金属元素,使得后者引发阳性反应,尽管这种反应与蛋白质本身没有半点关系。另外一些PAINS能够附着在蛋白质表面,或是与蛋白质功能相关的金属离子螯合,亦或是通过特异性结合以外的方法改变蛋白质的化学性质。在发现具有药物潜力的化合物后,研究者们会想方设法调整它们的分子结构,以提升其效果(这项手艺俗称“药物化学”),而前面提到的这些无疑会阻碍进一步的开发与研究。
因为不具特异性,PAINS的往往能够作用于多种蛋白。例如,在特定筛选条件下,一些分子会产生过氧化氢,而过氧化氢能够使目标蛋白失活,从最终结果看来这些化合物活像蛋白质抑制剂。但事实上,它们并没有与目标蛋白结合。
新的活性化合物被筛选出来后,下一步往往要在细胞中进行检验。在这一阶段,PAINS同样有多种花招扰乱人们的视线。它们能够让细胞表现出预期中的结果(譬如生长抑制),背地里的机制却完全是另外一套。研究人员总是盲目乐观,愿意相信自己手头的化合物有潜力与某种目标蛋白发生反应。他们从药剂供应商那里买来类似的化合物,随后又花费大量经费和资源,制造出更多的类似物并一一检验。有些化合物甚至要等到专利申请或动物实验后才露出马脚。令人遗憾的是,根据我们的经验,从动物试验中也可能得出与预期机理毫无关系的误导性结果。
相反,真的活性化合物——也就是能够与选定的目标蛋白质发生特异性作用的分子——在细胞实验中往往一开始并不能表现出活性,只有在修饰过分子结构,使之与蛋白质结合效率提升或是更容易进入细胞后,它们才显现出真正的实力。
全是付出,没有回报
研究者最需要警惕的化合物包括毒黄素,以及多羟基的植物化学成分,例如姜黄素、表没食子儿茶素没食子酸酯、染料木黄酮和白藜芦醇。尽管前人的研究已经全面揭发了这些化合物及其类似物节操丧失的本质,但仍有源源不断的新研究将之用作实验性新药和“阳性”对照组。
要想知道问题的严重性,绕丹宁(rhodanines)就是一个很好的例子。搜索文献库可以发现,有410篇论文声称绕丹宁具有生物活性,涉及的绕丹宁类化合物多达2132种,这些论文的作者来自290家研究机构,其中只有24家是商业公司。这些论文往往将绕丹宁鼓吹为前景光明的药物开发对象。药剂公司Bristol-Myers Squibb发表的一篇论文警告研究者们,这种类型的化合物会发生光诱导反应,从而不可逆地改变蛋白质结构,这是为数不多冷静的声音。作用机制既然如此,就很难想象这种物质能够成为药物或者有用的研究工具。但是,在那些假定绕丹宁具有活性的论文中,却几乎无人引用这项研究。
偶尔有一些PAINS化合物的确能够与蛋白质发生特异性的反应。这些化合物可以通过药物化学的方法修饰结构、优化性能。然而即便如此,PAINS的前景依旧堪忧——作用结果到底是特异性的“药效“作用,还是有其他什么猫腻,我们很难加以区分。跟绕丹宁有关的专利多达280项,这说明绕丹宁已经被选拔为下一步药物研发的目标。但是,据我们所知,还没有任何筛选出来的绕丹宁化合物进入了临床使用,甚至连临床试验的苗头都没有。因此我们认为,绕丹宁相关专利的申请和维护都属于资金浪费,更别提专利背后的海量研究工作了。
学术期刊《药物化学(Journal of Medicinal Chemistry)》近期开展了一项提议,鼓励投稿人在稿件中附上可被软件识别的分子结构文件,从而可以方便地实现化合物可靠性的自动审查。这带来的好处有很多,其中之一就是能够帮助编辑和审稿人排除PAINS相关的投稿。我们希望其他期刊也能引入这样的机制。我们也建议曾经发表过论文、把PAINS描述为潜力化合物的研究人员提供后续实验数据,证实这些化合物的假阳性性质。给PAINS贴上标签能大大减少无用功,也能防止药剂销售商继续把它们卖给蒙在鼓里的生物学家们。
最重要的是,药物研发人员应当提高警惕。在药物筛选试验中表现出最强活性的化合物未必是最合适的研究对象。即便是训练有素的药物化学家也不能大意,而应努力积累筛选经验。听我们一句话:千万别走进PAINS这条骗人的死胡同。(编辑:窗敲雨)
Nature, Chemistry: Chemical con artists foil drug discovery
你可能感兴趣
生理学博士
引用 的话:此文太专业,已经不是科普了。但是看得真爽啊
这篇比较接近我心中科普形象······把前沿研究者在做的高贵的事情简化几个量级,又讲的让受过基础教育的或者非同专业的大概能看懂产生兴趣
此文太专业,已经不是科普了。
显示所有评论
全部评论(58)
此文太专业,已经不是科普了。
生理学博士
引用 的话:此文太专业,已经不是科普了。但是看得真爽啊
引用 的话:但是看得真爽啊目前新药研发的平均胜率约为~8%(从一期临床算)。如果从项目开始算,应该小于&1%。所以如果有一分胜率,就值得做了。
引用 的话:但是看得真爽啊你看看这篇文章
好文!来自
生理学博士
引用 的话:Nature:分子筛选技术带来的虚假信息这不是同一篇英文吗
再多几篇这样的文章就好
空间信息与数字技术专业
如果添加一两种与之无关的蛋白质结合作为阴性对照,如果在无关蛋白结合实验中发现阳性结果即排除这一物质,是否可能降低 PAINS 蒙混过关的概率?
引用 的话:如果添加一两种与之无关的蛋白质结合作为阴性对照,如果在无关蛋白结合实验中发现阳性结果即排除这一物质,是否可能降低 PAINS 蒙混过关的概率? 首先,“无关”蛋白分子或大分子活性物质与靶蛋白是否存在生理性相互作用需要更大量的基础研究加以证明,这还不包括病理条件下。其次,药物,或候选物,对“无关”大分子是否有直接作用?这种作用能否影响靶蛋白功能?复杂了吧?八竿子打不着的几个蛋白,在一个钙离子的搅和下就能玩儿死一票科研工作者。 设立阴性对照是基础药理学要求,一般情况下大家是不会忽略的,一方面是为了降低假阳性率,另一方面,一旦有意外收获呢,是吧。根据靶蛋白筛选药物(药筛)不是简单看试验结果就能拿到数据的,特别是细胞试验,缺少对生理病理条件的全面模拟,很难决定药物是否满足继续研发的要求。但是,在体实验太TM难做了!看看CNS杂志,除了细胞就是转基因,都是成百上千万的投入,如果最后得到的是阴性结果,谁能认输?这是个坑,要不换药,要不换靶点,总之一定要见到回报。
作为搞新药研发的,深有体会啊。。。来自
虽然是科研相关,不过还算是挺有意思了。主要是看上了萌萌的配图_(:з」∠)_
我只想说: 看到“表没食子儿茶素没食子酸酯”的时候 我整个人都震惊了 这谁取的名字啊!
引用 的话:我只想说: 看到“表没食子儿茶素没食子酸酯”的时候 我整个人都震惊了 这谁取的名字啊!刚看的时候还以为作者没有断句,仔细看了下才发现,这是一个酯:D
有机化学博士,法学学士
姜黄素……前两天我还看到有人拿这个申请春晖计划的。
看了那张“罪犯”,突然发现里面全是白种人,感觉如果里面有黑种人大概又要面临指责了吧?
就是叫药学研究共享个数据库的意思嘛
引用 的话:看了那张“罪犯”,突然发现里面全是白种人,感觉如果里面有黑种人大概又要面临指责了吧?仔细看还有个把绿种人
这篇比较接近我心中科普形象······把前沿研究者在做的高贵的事情简化几个量级,又讲的让受过基础教育的或者非同专业的大概能看懂产生兴趣
免疫学硕士生
现在的药物筛选都是高通量的,这也带来了一些容易忽略的地方,所以效率是把双刃剑,建立一个好的药物筛选模型很重要,不论是细胞、体外还是动物疾病模型,这是筛药的基础。
引用 的话:目前新药研发的平均胜率约为~8%(从一期临床算)。如果从项目开始算,应该小于&1%。所以如果有一分胜率,就值得做了。本文说的内容,离临床一期还差着十万八千里呢。这里筛出来的候选只是化学的,还要经过体外实验,体内实验的筛选才到临床。这中间能有1%到临床就不错了。
引用 的话:姜黄素……前两天我还看到有人拿这个申请春晖计划的。可是...我印象里好像见过姜黄素动物实验做出药效的文章诶...这东西的误导这么厉害吗...
引用文章内容:表没食子儿茶素没食子酸酯这个念起来好拗口。。。
医学生表示看不懂
肿瘤基因组学博士生,法医迷
科研过程里常常会遇到类似的事。每次都以为自己有了重大发现,结果只是false positive而已。
罗丹宁不是实验常用的阳性对照药吗?
白藜芦醇不也是做的很热吗?
引用 的话:罗丹宁不是实验常用的阳性对照药吗? 白藜芦醇不也是做的很热吗?罗丹明(rhodamine)和饶丹宁(rhodanine)...
I am going to major in medicinal chemistry,PAINS,come on!
好棒的科普,之前从来不知道药物研发还有假冒阳性的物质,竟然还造成了这么大规模的困扰
引用 的话:姜黄素……前两天我还看到有人拿这个申请春晖计划的。哦漏,难道是上了pain的当
显示所有评论
(C)果壳网&&&&京ICP证100430号&&&&京网文[-239号&&&&新出发京零字东150005号&&&&
违法和不良信息举报邮箱:&&&&举报电话:&&&&&&&&当前位置:
&【求助】如何快速简便的检测有机化合物中是否存在氨基?
【求助】如何快速简便的检测有机化合物中是否存在氨基?
作者 jftsinghua
本人在合成一个带氨基的有机化合物,但是几次都似乎不是很成功,因此我想快速简便的检测一下该合成的有机化合物是否存在氨基?不知各位前辈有什么好的办法没有?谢谢指教。
TLC爬板,碘缸熏,或者茚三酮乙醇喷下,高温枪显色
不知你的结构里还有没有别的碱性基团,如果没有可以试试能不能成盐酸盐来检测一下.
配点香草醛显色溶液&&就ok了&&如果有氨 显黄色
香草醛或者茚三酮显色
香草醛可检测胺基的存在,机理应该是醛和氨基反应生成亚胺(imine),能显色。你可以上网上搜一下,有关于检测各种化合物的方法。或者搜显色剂,
茚三酮溶解,然后加入待检测物质的溶液,振荡均匀,加热。
用纸层析,茚三酮喷显色,可明显看到
24小时热帖
下载小木虫APP
与700万科研达人随时交流如何根据峰图判断_分析测试百科网
如何根据峰图判断
如何根据峰图判断的热门新闻
红外吸收光谱在有机化学中的应用
拉曼光谱-食品安全快检中的超级特工 (一)
质谱学会年会大会报告(二)
红外吸收光谱在有机化学中的应用 红外光谱法无论是在科学技术方面,还是在结构关系的研究方面都较成熟,因此应用也相当广泛,是现代研究物质的重要工具之一。现将其在有机化学方面的应用情况介绍如下。 一、鉴定化合物 这项工作在日常中遇到最多,尽管有机化合物多达数百万种,红外光谱对......
广州地化所揭示挥发作用对原油中金刚烷类化合物的影响 金刚烷类化合物是一类具有似钻石结构的烃类化合物,在原油和烃源岩中广泛分布,具有较强抗热降解和生物降解的能力,是一类可以媲美生物标志化合物的地化指标物。挥发作用虽被证实是影响原油中金刚烷类化合物含量和分布的因素之一,然而,其中各化合物具体的......
拉曼光谱-食品安全快检中的超级特工 (一)起因食品安全事关国计民生。近年来,三聚氰胺事件、苏丹红事件、瘦肉精事件、地沟油事件等食品安全问题频发,严重影响了我国食品业的发展。有专家认为,我国农产品、食品生产企业数量多、规模小而分散,法治和自律意识比较弱,而人口众多,消费人群和渠道也多......
Copyright (C) ANTPEDIA, All Rights Reserved京ICP备号京公网安备电信与信息服务业务经营许可证:京ICP证110310号天然化合物中CFTR氯离子通道激活剂的筛选及策略
现代医药产业对国家的经济发展和社会进步具有重要的影响。创新药物的研究与开发,集中体现了生命科学和生物技术领域前沿的新成就与新突破,体现了多学科交叉的高新技术创新与集成,是新世纪科技和经济国际竞争的战略制高点之一。在创新药物研究过程(特别是发现阶段的研究过程)中,需要探索和解决一系列重大的科学问题。最根本的问题是分子标靶的确立和药物库的建立。本世纪初,人类基因组研究测序任务顺利完成,标志着基因组研究将从测序转向功能研究的新阶段。越来越多的有效分子药靶将被认定。近年来,生命科学、生物技术的迅速发展,导致以高通量筛选(HTS)为代表的一批重要的新技术在创新药物研究中被实际应用,新药研究的投入随之大幅增加。但是,近年来新药研究的成果和产出,并未如所预期的那样,同步显著上升。其中一个重要原因是药物库的组成。目前药物库的主要来源包括以下三个方面:1.组合化学库,组合化学技术的发展已经实现了在很短时间内合成大量小分子化合物,目前国际上积累的这&
(本文共51页)
权威出处:
CFTR(cystic fibrosis transmembrane conductance regulator)即囊性纤维化跨膜电导调节因子,是一种受cAMP调节的氯离子通道,在呼吸道、胃肠道、胰腺、睾丸及汗腺等处的上皮细胞广泛表达,主要参与电解质及液体的转运。该通道活动的异常与多种疾病的病理发生相关,CFTR氯离子通道功能丧失或活性降低可导致囊性纤维化、慢性胰腺炎、男性不孕、便秘和干眼病等,而功能的过度激活则与分泌性腹泻、多囊肾病等疾病的发生关系密切,因此CFTR氯离子通道高效、特异性调节剂的发现对于研究这些疾病的病理机制和治疗有重要价值。本文的目的之一是从中药单体化合物库中筛选wt-CFTR氯离子通道的激活剂并对其分子药理学特征进行系统研究。利用碘离子高度敏感的wt-CFTR氯离子通道荧光测定细胞模型,对386种中药单体化合物进行了筛选,得到了14种能够明显促进碘离子转运的单体化合物,它们在结构上分别属于香豆素类、蒽醌类、...&
(本文共93页)
权威出处:
囊性纤维化跨膜转运调节因子(cystic fibrosis transmembrane conductance regulator ,CFTR)是一种受cAMP激活的Cl–通道蛋白,属于ABC大家族中的一个成员,CFTR在所有与分泌和吸收有关的组织的上皮细胞顶膜上表达。对于跨上皮细胞的盐类运输、液体流动和离子浓度调节等都具有重要的决定作用。最新研究发现,CFTR还在血管平滑肌上表达,对机体血压调节具有重要意义。CFTR蛋白活性与许多病理生理现象密切有关,CFTR功能障碍可导致遗传性疾病囊性纤维化(CF),还与慢性特发性胰腺炎、干眼病、习惯性便秘密切相关。CFTR活性过高则可导致多囊肾病、分泌型腹泻等疾病。因此CFTR作为重要疾病的药物靶点地位受到了极大关注。近年来,从组合化合物库中筛选到多种能够促进CFTR通道开放的激活剂,这些激活剂在研究CFTR结构与功能之间关系、探讨CF发病机理等方面发挥了重要作用。但是由于对潜在的生物安全...&
(本文共62页)
权威出处:
囊性纤维化跨膜转导调节因子(cystic fibrosis transmembrane conductance regulator, CFTR)蛋白是一种氯离子通道,属于ATP结合蛋白(ATP binding cassette, ABC)大家族的成员。CFTR主要功能是进行Cl-的跨上皮运输,同时也能调节细胞膜上其它离子通道的功能。由CFTR基因突变导致在白种人中广泛存在的致死性常染色体隐性遗传病——囊性纤维化(CF)。到目前为止发现并确定了1,300种以上的CFTR突变。其中66%以上是由于编码CFTR蛋白质第508位氨基酸的密码子缺失引起的(ΔF508-CFTR)。这种突变由于蛋白发生错误折叠或与分子伴侣相互作用的障碍,使得ΔF508-CFTR滞留在内质网而无法转运到细胞质膜上。而且即使ΔF508- CFTR定位到顶膜上,还需要CFTR通道激活剂的作用才能恢复氯离子通道的功能。近年来,从组合化合物库中筛选到几种能够促进ΔF5...&
(本文共38页)
权威出处:
囊性纤维化跨膜电导调节因子(cystic fibrosis transmembrane conductance regulator, CFTR)是一种CAMP/PKA依赖的上皮氯离子通道,同时又是某些膜转运蛋白的调节因子。属于ATP结合盒(ATP binding cassette, ABC)转运蛋白超家族的成员。CFTR在哺乳动物中所有与分泌和吸收有关的上皮组织(例如小肠、气道、胰腺、汗腺、输精管细胞、心肌细胞、血管平滑肌细胞)中广泛表达。CFTR的主要功能是介导跨上皮细胞Cl-转运、控制氨敏感的上皮细胞Na+通道(epithelial Na+ channel, ENaC)、促进HCO3-分泌及调节K+通道等,因此CFTR与多种生理和病理状态密切相关。CFTR功能障碍会引起致死性遗传疾病囊性纤维化病(cystic fibrosis, CF)、特发性慢性胰腺炎(idiopathic chronic pancreatiti, ICP...&
(本文共47页)
权威出处:
囊性纤维化跨膜电导调节因子(cystic fibrosis transmembrane conductance regulator,CFTR)是一种典型的cAMP依赖的氯离子通道,在所有与分泌和吸收相关的上皮细胞内表达,CFTR的突变会引起多种疾病,因此CFTR成为治疗CFTR突变引起的相关疾病的分子靶标。近年来发现,许多天然小分子化合物可以用来能够治疗CFTR突变引起的相关疾病,且比合成化合物具有更好的效果。实验前期利用荧光细胞测定模型从天然小分子化合物库中筛选出大量CFTR激活剂,选取其中的去氢木香内酯和橘皮素作为研究对象,重点研究了二者对CFTR氯离子通道活性的影响,利用荧光细胞测定模型、跨膜短路电流测定、细胞内cAMP水平测定和膜片钳等技术研究了二者的具体作用机制,以期寻找到治疗由于CFTR突变引起的相关疾病的药物,同时实验还测定了二者对小鼠气管粘膜下腺体液体分泌速度的影响。实验结果显示,黄酮类化合物橘皮素对野生型CFT...&
(本文共51页)
权威出处:
囊性纤维化跨膜转导调节因子(cystic fibrosis traus membrane conductance regulator,CFTR)基因于1989年由Riordan克隆[1],其基因定位于人类染色体7q31,全长约250 kb。并发现其基因外显子上3个碱基对的缺失可导致CFTR蛋白第508位置上的苯丙氨酸残基缺失(ΔF508)[2],这是引起人类遗传性疾病囊性纤维化(CF)最常见的一种基因突变,约占病人总数66%。CFTR m RNA编码一个含有1 480个氨基酸的跨膜糖蛋白,是c AMP或PKA依赖的氯离子通道,也属于ATP结合蛋白(ATP binding cassette,ABC)大家族。CFTR最早是在上皮细胞上证实其编码氯通道[3-5],CFTR蛋白缺陷引起呼吸道、肠道、胰腺和生殖腺等器官上皮细胞氯通道功能异常,临床表现是肺脏、气道、胰腺、肠道、胆道、输精管、子宫颈等的腺管被黏稠分泌物堵塞所引起一系列症状,尤...&
(本文共7页)
权威出处:
扩展阅读:
CNKI手机学问
有学问,才够权威!
xuewen.cnki.net
出版:《中国学术期刊(光盘版)》电子杂志社有限公司
地址:北京清华大学 84-48信箱 大众知识服务
京ICP证040431号&
服务咨询:400-810--9993
订购咨询:400-819-9993
传真:010-安妮 编译自 Nature
一分子就是一世界。
对药物研发人员来说,确实这样。在这篇《Nature》的文章中,渥太华记者Asher Mullard将把你拉进一个药香世界。
故事即将开场——
2016年,住友制药的美国子公司Sunovion召集了几名经验丰富的研发者,分配给他们一个不一般的任务:
我们来个游戏吧,看看谁能发现最好的新药。
摆在研究人员面前的是数百个化学结构,其中只有不足十分之一的结构标注了生物效应信息。研究人员需要从众多结构中挑选出最合适的几种,依据他们的化学和生物知识合成药物。
11名参赛者中,10名纠结了数小时,但有一名参赛者仅用几毫秒轻松得出结果。
它是一个算法。
展开剩余92%
作为初创公司Exscientia的化学信息学部负责人,Willem van Hoorn设计了这个计算机程序。当时,Exscientia还是个坐落于英国邓迪的初创公司,它研究用AI设计药物,并期望与Sunovion合作。
但Sunovion并没有把这个小创业公司放在眼里。“一开始我的信誉岌岌可危,”van Hoorn感慨。经过20几个游戏回合后统计比分时,他才终于松了口气。这个算法好像掌握了一些化学“黑魔法”,击败了除一名合成专家外的所有人。
这个“游戏”开启了Sunovion与Exscientia开始合作的里程碑。“是这场比赛说服了那些研究人员,”Sunovion的计算化学部主任Scott Brown回忆。
无论学术界还是工业界,想用计算机技术探索奥妙化学世界的大军不断增长,而Exscientia也仅是其中一员。
化学家们预测,人类可以合成1060种类药性分子,比太阳系中的原子还要小。他们希望芯片中的算法能把数百种硅氧化合物分类比较,帮助研究人员快速、合理地找到最佳候选药物。
不少支持者认为,这些备选方案让药物更安全,减少药物在临床试验中失败的概率,并能发现新的治疗方法,或许它们还能帮助开括未知的领域。
当然,也有不少反对的声音。很多药物化学家仍对这种“炒作”行为持怀疑态度,不相信复杂奇妙的化学反应最终能被几行代码概括出来。一些AI支持者也承认,很多尝试达不到预期效果,计算机生成的化合物有时候很难合成出来,有时候反应条件又过于苛刻,合成起来很危险。
“当研究人员不了解这个领域时,计算机生成的合成方法就不太可行了,”van Hoorn说。同时他表示,人类专家可以训练这些张扬的数字设计师。“我认为一些想法可以在计算机科学家和化学家的介入下实现。”van Hoorn说。
想在化学宇宙中遨游,有张“地图”是必不可少的。2001年,瑞士伯尔尼大学的化学家Jean-Louis Reymond开始尽可能用电脑绘制化学空间。16年后,他他已经整理出世界上最大的小分子数据库GDB-17。这是一个巨大的化合物虚拟数据库,参与研究的原子总数多达17个,形成了1660亿个组合,刚好也是Reymond的计算机能应付的数量。“现在,用一台计算机编译数据库中的化合物列表仅需要10小时。”Reymond说。
为了弄清这些大量药物的合成起始点,Reymond想了一种方法拼凑他的化学小宇宙。他从元素周期表中获取灵感,将化合物聚集在一个多维空间中,结构相似的化合物也会挨在一起。化合物的位置是根据42个特征分配的,比如每个分子中的碳原子数量。
每种进入市场的药物,都有数百万种在结构上与之相似的化合物,可能只是一个氢键或双键的位置变化。其中一些可能比进入市场的药物效果更好,但化学家们不可能完全构想出所有同分异构体。
“你不可能用一支笔和一张纸来对付这些异构体。”Reymond说。
有一种方法帮助解决这个难题,Reymond和他的团队能通过寻找化合物间的相似点识别出有治疗前景的“近邻”。通过一种特殊的药物作为起始合成点,研究人员可在3分钟内对数据库中所有1660亿种化合物进行梳理,筛选出可以合成药物的最佳备选结构。
在一个概念验证实验中,Reymond开始结构用一个已知结构的分子与尼古丁乙酰胆碱受体结合。这是使神经系统和肌肉功能紊乱的一种途径,为此他们还编制了344个相关化合物的备用名单。
之后,研究小组合成了其中三种结构,发现有两种可以有效地激活受体,还能治疗老年肌肉萎缩。Reymond说,这种方法就像通过地质地图寻找金矿。“你需要通过某种方式选择你要挖掘的地方,”他说。
对计算机来说,这意味着用芯片从化学库中的海量结构里筛选出与指定蛋白质结合的小分子。首先,研究人员需要用X射线给蛋白质“拍照”,确定其中的结合位点。之后,用分子对接算法,计算化学家可以通过化合物的集合寻找给定位点的最佳匹配。
随着计算力的爆炸式增长,这些算法的能力得到了提高。加州大学旧金山分校的化学家们在Brian Shoichet的带领下,在2016年展示了这一方法的潜力,找到了一种新的止痛药。
Shoichet团队通过筛选300多万市场上可以买到的化合物找到了最好的一种,选择性地激活μ-阿片受体信号减轻疼痛,而且不会扰乱β-抑制蛋白密切相关的信号通路。研究人员从巨大的化合物库中迅速找到了23个最可能化合物。
除了大学教授,Shoichet还有一个双重身份,他还是加州旧金山的生物技术公司Epiodyne的联合创始人。Epiodyne想用相同的办法找到更安全的止痛药,他们计划在千万中之前从未被合成出的化合物中找到容易合成的备选止痛药。
目前,已经有商业化的药物开发公司在测试这种方法,比如这个马萨诸塞州的生物技术公司Nimbus Therapeutics。它将屏幕上的虚拟化合物与自然界产生的化合物相结合。目前还不清楚这种方法是否会促进新药出现,但该公司首席执行官Don Nicholson表示,这至少在药物设计项目中,“是个很好的着力点”。
虽然这些数据搜索方法已经经过尝试和测试,但计算机只能按照脚本指令执行。机器学习一直走在发现新药的前沿,算法用数据和经验自学哪些化合物与哪些目标结合在一起,找到新模式。大约有12家公司如雨后春笋般涌现,与大型制药公司合作共同创建药物追踪算法。
Andrew Hopkins是英国药物研发公司Exscientia的CEO,就证明了这些新方法是可靠的。一种新药从发现、到优化、到临床研究一般需要4.5年的时间,化学家通常会合成上千种化合物保证最后能够得到最优选择,即便这样,药物最终能商业化生产的可能性依然微乎其微。
Exscientia尝试将一些算法进行组合(前文提到的惊艳了Sunovion的算法就是其中一个),算法的组合或许能够将药物研发时间从4.5年降低至1年,并且能够有效减少前期需要考虑的化合物的数量。
位于加州圣布鲁诺的AI药物设计公司Numerate的CTO Brandon Allgood表示,算法还能帮助药物研发人员尽早决定pass掉哪些化合物。
他认为,如果一个化合物在几个月后的毒性或吸收测试中失败,那么之前的研究和测试都将变得没有意义。在未开始用AI研究化学前,Allgood曾是一名宇宙学家,“用AI控制它只需要一毫秒的时间。”Allgood说。
今年,Numerate已经与制药公司达成了两项协议,其中包含与法国Suresnes公司共同创建的合作项目,它们想通过临床试验治疗心脏衰竭和心律失常。
虽然不断有新资金流入整个AI制药行业,但这些计算方法的正确性仍有待证明。与其他学科库相比,Reymond的收藏价值巨大,但它仅涵盖了化学宇宙的一小部分。
许多计算出来的备选化合物在实验室中的合成难度很大,化学家们须费尽心思找到推荐化合物的原材料,这可能需要几个月甚至更长时间。即便如此,也不能保证这种分子一旦制成就会起效。
Reymond的方法预测了一种化合物的活性谱,但预测准确率仅有5-10%,这就意味着化学家必须在20种以上化合物中选择,才能找到最符合预期的那种。“我想说,探索化学空间的瓶颈是敢不敢制造这种化合物。”Reymond说。为了达到这个目的,他最近把化学物质库转变成一个由1000万分子组成的短链,这些分子很容易制造,但仍然涵盖了广泛的属性。
剑桥大学科学家Mark Murcko认为,计算化学家关注的重点不应该是算法策略,而更多的是改进他们从中改进数据集。“我知道的最好的预测模型的方法就是持续不断地喂它,”他说。
对于Exscientia的首席执行官来说,这些合作至关重要。这需要计算科学家花费数十年的时间写程序来击败国际象棋大师。之后,1997年,IBM的深蓝就打败了象棋大师卡斯帕罗夫。但这些失败并不意味着象棋游戏的终结。相反,卡斯帕罗夫创造出双人版象棋玩法,每队有一个人和一名AI组成。
“人和AI结合可以胜过任何人类,也可以胜过任何算法,”Hopkins说。他想要同样的数据处理、创造性和常识改变新药的发现。“我们就处在卡斯帕罗夫和深蓝的巅峰对决时刻。”Hopkins说。
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。}

我要回帖

更多关于 芳香化合物 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信