药物重定位
药物研发是一项耗资巨大、周期漫长、风险度高且成功率低的系统工程。据统计,新药研发从确定思路到投入市场需花费12-16年的时间、成本达10-20亿美元。传统的药物发现主要遵循着“一个化合物分子→一个靶标→一种疾病”的模式,旨在为单个疾病寻找作用于单个靶标的最特殊药物。然而事实上,复杂疾病是由诸多因素影响的,容易受到各种因素的影响,疾病之所以发病是由于基因突变的不断积累以及差异基因与通路的干预所造成的。因此通过基于生物信息网络的计算方法,可有效预测药物和类药化合物潜在的靶标,药物开发逐渐转向“多个药物→多个靶标→多种疾病”的模式,以此来发现已上市药物的新用途,即药物重定位(老药新用)。药物重定位有助于减少药物研发的成本,降低研发风险,缩短研发周期。其研发周期可缩短到3-6年,成本减少至0.5-2亿美元,仅为新药开发的十分之一(图1)。同时,药物重定位有助于延长药物的使用寿命,使得已撤市药物能够得到重新利用。由于经过重定位的药物降低了未预料到的毒性风险,因而这些药物经常能很快进入行临床阶段。理论上能够拥有新用途的药物比例在75%左右。
图1创新药开发与老药新用开发对比
从历史上看,传统的药物重定位在很大程度上是随机和偶然的所得,一般是将药物的脱靶效应用于商业开发,往往处于相对被动的研发状态,而且基于生物实验的传统药物靶标验证方法精度低、成本高、周期长的缺陷,需要消耗大量的时间和成本。迄今为止,最成功的药物重定位案例也尚未涉及系统的研究方法。但历史的经验又表明成功的老药新用经济价值和社会价值绝对不亚于创新药,因此通过AI技术运用于药物重定位开发是非常必要的,利用人工智能和转录组大数据的平台技术是解决老药新用瓶颈问题的新方法。
人工智能和转录组大数据平台
随着不同组学技术的进步,产生了海量的生物学数据,对于药物重定位来说,这些数据无疑是有用的。然而,只有借助计算工具,挖掘并整合数据中的相关信息,才能彰显数据的魅力。
江苏百奥信康医药科技有限公司构建了利用人工智能和转录组大数据开发已上市药物新适应症的平台DrugMine(图2),基于人工智能、机器学习技术,充分挖掘生物信息大数据的价值,获得更准确的计算机药物筛选结果,从而能够锁定药物研发的初始目标,减少生物实验的盲目性,增加实验的针对性,提高药物筛选的成功率,节约早期药物研发成本,降低药物研发失败所带来的风险。该平台从系统生物学的角度出发,综合生物信息学、医学、药学、数学、人工智能、大数据等跨学科知识,运用组学数据作为疾病表型、小分子等的分子标签(gene signature),并进行分子标签的匹配,能逆转某疾病分子标签的小分子,则可能治疗该疾病,以此来预测已上市药物新适应症。
图2 DrugMine平台原理
AI预测的准确性基于两个方面,数据与算法。江苏百奥信康医药科技有限公司构建的基于AI和转录组开发已上市药物新适应症的平台DrugMine,从系统生物学的角度出发,综合了生物信息学、医学、药学、数学、人工智能、大数据等跨学科知识。在数据方面,DrugMine整理了约14000套、20万组样本转录组数据,涵盖了约300种人类细胞/组织,包含约3000种化学小分子、天然产物、生物大分子、细菌、病毒、细胞和生活方式,数据丰富的同时也兼顾了数据质量。在算法方面,CMap将每个基因等重要性处理,原理其实就是计数,对上1个基因就是1,2个基因就是2,在“平等的对待每一个基因”。然而,在真实的生命活动中,每一个基因都起着不同的作用,甚至某些必须基因的失调会导致细胞的死亡,因此这些基因相较于其他基因可能对生命活动起着更加重要的作用。DrugMine提出了一种基于超几何测试的加权功能富集方法,引入每个基因的先验权重,开发了加权富集分析工具算法进行加权功能富集分析。
现在很多新适应症的发现是基于结构的,依靠靶点和化合物结构信息的传统的药物筛选有很大局限性,基于生物信息学大数据,信息来源更广、更深入,目前后台上万套转录组数据,集合了更多的生物学信息,理论上比只依靠靶点和化合物结构信息的传统的药物筛选方法更优。生物数据往往比传统的化学数据更能精准反应人体细胞/器官的状态,因而基于此类生物信息方法预测的准确率远远高于传统基于化学信息的方法。同时,要把AI技术应用到新药研发、并进行商业化开发,团队就必须要有真正工业型的、做过新药研发的人才加入进来,目前传统AI制药公司核心团队成员大部分都是从事AI技术相关研究的人才,对算法擅长,但欠缺药品产业化实操经验。相较于传统AI制药公司,江苏百奥信康医药科技有限公司核心团队拥有丰富的药物开发经验,有着从基础研发到产业化实操经验的管理团队,建立了产业化规模的研发团队,确保了人工智能平台的有效性,保障了后期成果的产业性转化,是国内唯一利用人工智能和转录组大数据平台技术专门从事老药新用开发的Biotech公司。