最近辉瑞和IBM开始一个合作项目,将使用其智能软件“华生新药发现”帮助辉瑞寻找更好的免疫疗法。华生是一个智能搜索加工软件,不仅可以快速搜索海量文献(2500万摘要,100多万文章),更重要的是可以从这些文献中提取智能信息。华生已经有多个不同专业化版本,用于不同的领域如肿瘤基因测序。今天JAMA就有一篇文章介绍人工智能在诊断方面的应用。但与辉瑞这个合作是人工智能第一次进入新药发现。
新药研发高度复杂,所以不断有新技术号称能显着提高研发效率。也正因为这个过程高度复杂,所以极少有任何单一技术能显着提高总体效率。很多人听到这个合作的第一反应是“not again”,认为这是和CADD、组合化学、各种组学一样雷声大雨点小。当然这个看法有情可原,连设计合成路线这样相对简单的任务现在计算机都难以战胜优秀的化学家,找新药可能确实还有差距。但另一方面IBM深蓝已经是世界象棋第一高手,谷歌阿法狗去年也4:1击败围棋顶级高手李世石。现在的人工智能已经达到相当水准。
寻找新药相关信息类似寻找民间高手。华生可能比人能更高效找到所有自封的民间高手,但却不一定有能力从大量江湖术士中挑出少数真正高手。这是新药研发和百科知识的关键不同。新药相关研究鱼目混杂,大部分无法重复。很多都是垃圾,而鉴别真伪不是计算机长项。另外也很难培训华生,因为新药研发个体化严重。每个公司都有不同套路,同一公司不同科学家对同一问题也看法不同。另外真正知识(所谓tacit knowledge)很少发表,多数公开发表的东西都是经过包装过的,只能误导华生。最后真正有可能有突破潜力研究的一般发表在比较高端杂志,也会被高频率引用。需要华生这样超级软件才能找到的研究极少会是很重要的。
但是华生也可能为新药研发做出一定贡献,因为华生可以高效提供很多有帮助的线索。比如你的化合物出现PK/PD失联,华生可以告诉你有人在1982年报道一系列化合物和你的化合物有70%类似,但调控另一个靶点。这样你可以更快找到可能的脱靶蛋白。或60年代有人在寻找免疫抑制剂时意外发现免疫激活作用,但当时不知如何使用这些另类化合物。这些功能类似写文章的同义词提示,即使最优秀的作家也可以从同义词提示得到一些帮助。
今天最新统计大药厂的内部投入回报已经降到3.7%这个几乎不可持续的水平,所以任何能够帮助提高研发效率的工具都是有益的。华生是根据IBM首任CEO Tom Watson命名,但是恰巧大侦探福尔摩斯的助手也叫华生(John Watson)。我们首先要把华生当作助手而不是对手,华生短时间内还不能取代Vagelos,做决定的还是科学家。(路人丙)