作者: admin

  • 圆壹现场 | 圆壹智慧将隆重亮相2022 APM第三届亚洲制药产业大会

    时间:2022年11月24-25日(周四、周五)

    地点:上海环球港凯悦酒店 7楼

    大会主题:绿色、智能、创新、国际化

    我们的展位:

    5号展位

    11月24-25日,圆壹智慧将隆重亮相2022APM第三届亚洲制药产业大会(5号展位),介绍其新一代不依赖靶点结构的多指标优化药物分子设计平台,届时欢迎业界同仁前来交流。该平台由小分子设计引擎CarbonAI™蛋白设计引擎SentinusAI™ 所组成,它们可以在数小时内自动生成高度优化的类药物分子,以应对一些最复杂的药物发现的挑战。


    CarbonAI™

    用于多目标药理学优化的小分子和PROTAC从头设计引擎。功能包括靶点结合和选择性优化、分子生成、ADME和PK评估以及化合物脱靶预测等。


    SentinusAI™ 

    基于序列进行抗体从头设计和优化的抗体和融合蛋白工程引擎。功能包括蛋白质-蛋白质亲和力改造、蛋白药物人源化、蛋白药物脱靶毒性预测、蛋白质稳定性和翻译后修饰预测等。

    圆壹智慧提供一系列小分子、生物制剂和其他新形式的药物设计服务和管线合作。这些服务由InnocentAI™提供支持——一个在AWS上运行、自主发展的AI云平台,支持多个药物设计AI模块,具有无限可扩展性。凭借其固有的自主学习能力,该计算平台的准确性会通过自动更新的数据集成和算法优化引擎不断提高。

    圆壹智慧展位指示

     

    2022APM第三届亚洲制药产业大会

    2022APM第三届亚洲制药产业大会由上海市生物医药产业发展领导小组办公室作为指导单位,中国化学制药工业协会(CPIA)、上海医药行业协会(SPPA)、上海士研咨询(SC)联合主办。大会汇聚制药产业监管机构、协会学会领导,科研院所专家,国内外制药工业百强药企、全球创新药企、制药装备、原料药、耗材及生产服务型企业的高管与决策者,共同探讨医药产业创新驱动转型、产业链供应链稳定发展、药品开发与产业化技术攻关、制造能力与系统升级、智能制造与绿色工厂、产学研机构协同与国际化合作等问题,共同推动制药生产质量升级,促进绿色安全发展,实现制药产业迈向高端化、智能化、绿色化、国际化的高质量发展水平

    大会详细日程【点击了解】

    通过圆壹智慧报名参会,可享以下权益:

    免会务费

    全体大会听会权益

    一对一商务洽谈权益

    会后可公开PPT交流权益

    含会刊资料,茶歇点心,同传翻译等其他会务服务

    联系人:

    金先生 

    jianfeng.jin@ainnocence.com

    18521324698

    朱先生

    cheng.zhu@ainnocence.com

    13260023943

    需提供以下报名信息:公司/机构,姓名,职位,手机,邮箱

    本周四(11月17日)下午,圆壹智慧人工智能药理学总监李四维博士也将受邀于2022张江AI智药论坛作演讲分享,主题为“小分子和PROTAC药物的AI多目标优化设计实现靶向选择性与成药性的统一突破”。【点击了解】

  • 圆壹现场 | 圆壹智慧将受邀出席2022张江AI智药论坛作主题演讲

    2022张江AI智药论坛

    时间:2022年11月17日 下午

    地点:上海张江科学会堂405会议室

    主题演讲:小分子和PROTAC药物的AI多目标优化设计实现靶向选择性与成药性的统一突破

    演讲嘉宾:圆壹智慧人工智能药理学总监 李四维 博士

    届时,李博士将以圆壹智慧小分子设计引擎CarbonAI™在药物发现中的应用为例,和大家分享圆壹智慧在AI药物研发技术上的创新突破。圆壹智慧作为初创AI制药公司代表,也将在该论坛正式加入张江AI新药研发联盟。

    今年6月,圆壹智慧全球启动不依赖靶点结构、自主进化的多目标AI药物发现平台——小分子设计引擎CarbonAI™和蛋白设计引擎SentinusAI™(点击了解)该平台突破了单靶生物尺度,实现了多靶标、多尺度生物计算

    其中,CarbonAI™是用于多目标药理学优化的小分子和PROTAC从头设计引擎,功能包括分子生成、药理性质优化、靶点结合和选择性优化以及化合物脱靶预测蛋白-配体结合预测模型可做到在无需对接情况下习得蛋白质柔性。分子生成模型中,骨架空间的化学多样性覆盖为40万以上。

    CarbonAI™已在多个疾病领域的早期药物发现与设计中得到验证,与传统药物发现相比,在时间和成本上可节省高达80%

    点击此处了解CarbonAI™实际应用案例


    关于李四维博士

    圆壹智慧人工智能药理学总监

    李博士于南京大学获得生物技术学士学位,于美国辛辛那提大学获得生物分析化学博士学位,其后于美国密西根大学药学院任研究员并完成博士后训练。他拥有斯坦福大学数据科学职业认证,也是爱思唯尔杰出审稿人。

    李博士具有十余年的代谢组学、蛋白质组学、RNA测序、药物科学和数据科学的交叉学术研究经历和产业经验,并拥有新药发现、临床前研究、临床生物标记物研究及转化应用的经验,曾任百济神州资深主任研究员,加州硅谷生物科技公司研发科学家。他的代谢物鉴定软件iMassFrag曾获得密西根两百周年校庆-密西根中国论坛创业大赛亚军,迄今已在国际知名期刊发表十余篇论文。


    目前,越来越多的制药公司开始将AI技术纳入药物研发工具箱。尤其近两年来,AI与制药的合作不断增加,合作范围遍及制药的各个环节,覆盖从小分子、大分子、基因治疗、PROTAC等多种治疗方法。此外,不仅仅AI技术方与制药公司之间,AI技术方与CRO之间也有多项合作产生。

    2021年10月,张江AI新药研发联盟(以下简称“联盟”)在首届上海国际生物医药产业周——张江生命科学国际创新峰会上正式揭牌成立。经过一年的发展,联盟成员都在快速发展,跨入了新阶段、取得了新成果。

    为进一步促进合作与交流,2022年11月17日,AI新药研发联盟邀请多位业内专家和相关企业,将在张江生命科学国际创新峰会期间举办第二届张江AI智药论坛,共同探讨AI与制药合作的现状和下一步发展。

    主办单位

    上海张江(集团)有限公司

    承办单位

    上海美迪西生物医药股份有限公司

    智药邦

    参会人员

    联盟成员及增补成员、AI制药公司、AI公司、制药公司、生物技术公司、CRO公司等AI新药生态圈科研中高层人员

    关于张江AI新药研发联盟

    张江AI新药研发联盟(以下简称“联盟”)由陈凯先院士、蒋华良院士、饶子和院士创始倡议;由中国科学院上海药物研究所、浙江大学上海高等研究院、美迪西、英矽智能、上海翰森等创始发起,首批成员单位15家,美迪西陈春麟博士担任首届联盟轮值主席。联盟旨在以关键项目为牵引、联合开展协同攻关,以本地生态为基底、共同提升本地生态密度。是推进AI与医药跨界交叉融合、数据资源共享、技术迭代升级的重要纽带,是立足张江、面向上海、服务全国,推进人工智能新药创新生态建设的重要力量!

  • 圆壹成果 | 圆壹智慧高效小分子和PROTAC药物设计引擎CarbonAI™案例研究

    传统CADD方法已无法满足当今高效节省的药物研发趋势的需要。一个小分子用QM(量子力学) 计算,用一个GPU 大约花费几个小时至几天(取决于具体任务),而机器学习/深度学习场景下,在一个CPU上计算几千到几百万分子只需一分钟。药物研发行业向来为惊人的高投入、长耗时和高失败率所累,使用AI进行药物发现应运而生。

    今年6月,圆壹智慧全球启动不依赖靶点结构、自主进化的多目标AI药物发现平台——小分子设计引擎CarbonAI™和蛋白设计引擎SentinusAI™。该平台突破了单靶生物尺度,实现了多靶标、多尺度生物计算

    其中,CarbonAI™是用于多目标药理学优化的小分子和PROTAC从头设计引擎,功能包括分子生成、药理性质优化、靶点结合和选择性优化以及化合物脱靶预测。蛋白-配体结合预测模型可做到在无需对接情况下习得蛋白质柔性。分子生成模型中,骨架空间的化学多样性覆盖为40万以上

    CarbonAI™已在多个疾病领域的早期药物发现与设计中得到验证,与传统药物发现相比,在时间和成本上可节省高达80%。本文给大家介绍的是CarbonAI™的几个实际应用案例。

    1

    骨架跃迁/先导化合物发现

    抗癌药物 – SOS1抑制剂

    RAS是肿瘤患者中最常见的致癌基因之一,其中KRAS突变最常发生在肺癌、胰腺癌以及结直肠癌中。RAS曾被医学界称为“不可成药靶点”,科学家们在研究有效的RAS抑制剂方面已经摸索尝试了超过30年。目前,KRAS抑制剂已开辟出多种疗法,通过直接或者间接方式阻止突变的KRAS激活。SOS1抑制剂是通过间接方式,干扰KRAS-SOS1相互作用来阻断KRAS的活化,从而抑制KRAS突变肿瘤的生长,解决KRAS突变肿瘤患者的临床需求。

    CarbonAI™仅用两周时间生成数万个分子结构,通过筛选,最终选择了10个具有全新骨架、易合成的、具有专利空间的分子进行化学合成两个月内发现具备SOS1抑制活性和成药性的小分子,命中率为30%。而使用传统方法达成如此结果通常需要两年时间,并且需要高通量筛选107~109个分子。

    在第一轮10个合成的分子中, AI-011可阻止KRAS-G12C、G12D、G12V激活。后续优化得到的AI-027在3D细胞(SW620,G12V)增殖试验中的抗肿瘤增殖活性得到显著提升(见下表)。

    AI-011的ADME性质也于下表列出,其CYP抑制和TDI性质均优于对照化合物BI-3406,结果符合CarbonAI™的预测,验证了CarbonAI™预测的准确性

    前十个化合物中,其中两个活性较好的,在小鼠体内PK研究中表现出较好的小鼠药代动力学PK性质;分子AI-011具有和BI-3406相似的小鼠PK性质(下表)。

    对SOS1和KRAS-G12V相互作用抑制效果的预测

    为了评估化合物对SOS1和KRAS-G12V相互作用的抑制效果,采用KRAS-G12V/SOS1结合试验测试了24种AI设计的化合物。与阳性对照化合物2的 IC50范围(10-42 nM)相比,66.7%的化合物效力值小于42nM实验测得的结合亲和力值与AI结合亲和力预测得分具有相关性(下图)。

    体外抗增殖效应

    通过3D细胞(SW620,KRAS-G12V)增殖试验测定了14种化合物的抗肿瘤增殖效应,其IC50值也与AI预测的结合亲和力得分具有相关性(下图)。

    CYP亚型抑制预测

    通过体外CYP抑制试验,我们研究了6种有效化合物对CYP的抑制作用。CarbonAI™预测在CYP1A2、CYP2C19(斯皮尔曼秩相关系数Rs=0.60)和CYP3A4抑制实验结果中表现出良好的相关性,化合物和BI-3406相比CYP酶抑制更弱,有效降低了潜在的药物安全性风险(下图)。

    溶解度预测

    通过动力学溶解度测定法测定了16种化合物的溶解度,溶解度预测和测量之间显示出良好的相关性(Rs=0.415)(下图)。

    通过AI药物设计,CarbonAI™发现了一种有效的口服生物利用SOS1抑制剂AI-011。AI设计的化合物(AI-011,AI-027)在SW620(KRAS-G12V)3D细胞增殖试验中显示出抗肿瘤增殖活性CarbonAI™在预测SOS1蛋白结合亲和力、CYP亚型抑制(CYP1A2、2C19和3A4)和溶解度方面均表现出很好的泛化性能

    2

    PROTAC从头设计

    FGFR选择性PROTAC分子

    成纤维细胞生长因子受体(FGFR)是一类典型的受体酪氨酸激酶(receptor tyrosine kinases,RTKs),其信号的异常在多种肿瘤中被发现。FGFR信号的异常参与了肿瘤发生的多项进程,包括细胞存活、增殖、炎性反应、迁移、血管生成、上皮间质转化及耐药等。现在,以FGFR为靶点的小分子抑制剂为治疗FGFR异常引起的癌症提供了一种新的有效策略。一些小分子显示出良好的抗肿瘤活性,进入临床前、临床研究阶段或被批准上市。然而,在FGFR抑制剂的开发领域仍然存在挑战,例如需要更有效和更具有选择性的FGFR抑制剂

    靶向蛋白降解(Targeted Protein Degradation,TPD)有可能以新的方式解决药物靶向问题,用于治疗癌症和其他疾病。蛋白降解靶向嵌合体技术(PROTAC),利用异双功能小分子化合物将靶蛋白和细胞内E3连接酶拉近,利用生物体内泛素-蛋白酶体蛋白降解途径特异性降解靶蛋白。PROTAC分子由三部分组成,一端是特异性E3连接酶配体,另一端是靶蛋白的特异性配体,以及中间的连接子,从而组成“靶蛋白-PROTAC-E3连接酶”三元复合物。其独特的化学和生物学特性使PROTAC在癌症治疗中具有事件驱动的活性、靶向不可成药蛋白、克服传统耐药等优势,劣势则包括透膜性、脱靶毒性等。目前靶向FGFR的PROTAC尚处于早期研究阶段。

    CarbonAI™靶向FGFR家族某一蛋白,通过从头设计和选择性优化,在两个月内得到一种具有高度活性(微摩尔量级以下)和选择性的PROTAC分子,其中通过计算进行的设计、药理性质优化、靶点结合与选择性优化仅用两周时间完成。

    3

    从头虚拟筛选

    抗癌药物-GLI1抑制剂

    GLI1蛋白

    胶质瘤相关癌基因GLI1编码一个锌指蛋白Kruppel家族的成员。GLI1蛋白作为一种转录激活剂,是 Hedgehog(Hh)信号通路的效应器,在胚胎发育期间参与众多组织和不同细胞类型的增殖、分化等过程。GLI1在高度分化的正常细胞中低表达,并通过复杂的调控机制处于失活状态。研究表明,GLI1与其他激酶(如RAS/RAF、PI3K-ATK、TGFβ等)通路的串扰产生的非规范激活可能是多种非Hedgehog依赖的肿瘤(如胃肠道肿瘤)的驱动因素。这些研究指出,对于这部分肿瘤类型,抑制GLI1的常规激活(如针对PTCH/SMO的抑制)在临床表现是失败的。例如第一个被FDA批准用于治疗BCC的SMO抑制剂Vismodegib,未能在转移性结直肠癌的临床试验中证明其疗效。因而将GLI1本身作为药物靶点可能可以兼顾其规范激活和非规范激活,实现广谱的抗肿瘤疗效。遗憾的是,目前尚无针对GLI1的上市药物。

    CarbonAI™针对GLI1在数小时内完成针对数千万化合物库的虚拟筛选,最终选择的19个分子中,7个在细胞实验中具有抗增殖效应,命中率达37%,2个化合物和已进入临床前阶段的具有体内药效的参考化合物具有同等生化和细胞活性(下图)。

    青霉素在二战期间曾成功地将细菌性肺炎的死亡率降低至不到1%——小分子药物一直是传统医学的支柱,塑造了现代医学的开端。相对于大部分生物技术产品来说,大部分小分子药物可以口服,给药方便,储存运输方便,能够很好地作用于细胞内(包括细胞核内靶点)与细胞外的靶点,而且几乎没有免疫原性。

    此外,小分子一直是制药业历史上最具轰动性的产品之一——阿托伐他汀(立普妥)在2003-2011年的专利期内曾每年为辉瑞公司创造至少90亿美元的收入。

    不过随着近几年生物创新疗法(包括抗体、基因疗法、细胞疗法等)的不断兴起,小分子药物也因其劣势而大有式微之势——如特异性不高,半衰期短,开发成功率较低,对于没有适合作用口袋的靶点较难开发,其相对简单成熟的制备工艺也使其生产成本远低于其他生物技术产品,更容易因“专利悬崖”而出现仿制药,对原研市场形成巨大的压力。

    正因为如此,利用人工智能大幅度节省小分子药物发现与设计的时间和成本,才显得尤为重要圆壹智慧的小分子药物设计引擎CarbonAI™通过靶点选择性优化、多重药理学性质优化、化学品性质优化等多样的应用场景,使陷入瓶颈的小分子药物发现重焕生机

    与此同时,它对减轻小分子创新药研发的压力起到了关键且积极的作用,也为鼓励市场走向绿色、良性的路径提供了坚实的基础。无论如何,对小分子和生物创新疗法的多样性、互补性保持开放的态度,才更可能迎来一个更好的未来。CarbonAI™即是顺应小分子创新药研发趋势的产物,同时兼备引领未来创新药研发走向的巨大潜力

  • 利用人工智能和重组技术促进通用疫苗的发展 | NewsMedical对话潘麓蓉博士和Amy Sheng博士

    本次采访中,NewsMedical与新一代生物技术创业公司圆壹智慧的创始人兼CEO潘麓蓉博士和义翘神州(Sino Biological)的技术客户经理Amy Sheng博士探讨了如何将人工智能(AI)与高通量生产和筛选相结合,以改善潜在通用疫苗的开发过程。 

    访问Sino Biological官网可收听本文podcast:

    https://www.sinobiological.com/activities/podcast/universal-vaccine-advancement

    也可点击下方收听:

    讨论的主题包括人工智能如何与蛋白质的高通量生产和筛选相结合,以加快候选通用疫苗的开发进程——这是一种预防和控制未来大流行病的理想方法,也是当今生物技术领域的主要研究挑战之一。 

    NewsMedical(NM):能分别介绍一下你们各自的背景和目前在圆壹智慧和Sino Biological的工作吗? 

    潘麓蓉博士(LP):我是人工智能药物发现平台圆壹智慧的创始人兼CEO。我拥有计算生物学的博士学位和专门研究人工智能的计算机科学背景。我在这个行业从事药物设计和使用不同的计算算法已经有14年了。我最初与Sino Biological合作是将其作为我们内部药物发现项目的细胞供应商之一。 

    Amy Sheng博士(AS):我是Sino Biological的技术客户经理。我的背景是细胞和分子生物学、抗体开发和生产。目前我负责Sino Biological美国的CRO项目。 

    NM:你能给通用疫苗下一个定义吗?为什么说研究它们很重要? 

    AS:通用疫苗是对不同病毒株具有广谱效应的疫苗。从SARS-CoV-2的案例中,我们经历并理解了病毒变异和免疫逃逸的速度有多快。因此,开发疫苗或治疗试剂以抵御可能出现的任何新变异病毒至关重要。 

    与传统疫苗相比,通用疫苗在保护弱势人群免受不同毒株甚至未来变种的侵害方面更有潜力。在SARS/COVID之前,流感一直是开发通用疫苗的目标。几十年来,开发生产范围更广的流感疫苗一直是一个目标。由于疫苗靶点和更高效的交付平台的最新发展,这一目标变得更易实现。 

    NM:与具有特定疾病实例的传统疫苗接种方法相比,通用疫苗还有哪些其他优势? 

    AS:对于流感,传统疫苗不能产生持续有效的免疫和交叉反应性免疫应答,从而中和各种流感病毒毒株。在不同年龄组和不同病毒株中,传统疫苗效力存在显著差异。毒株错配是疫苗失效的主要原因之一。我经常听到朋友们说疫苗没有作用。我曾经注射过流感疫苗,但我也被流感打趴下过一周。事实上,就在去年,H3N2流感的主要毒株发生的变异,使它不能通过已设计的疫苗有效地为弱势人群提供免疫力。 

    然而,通用疫苗有可能解决这个问题,并尽快提供更好的生产。除效力外,如果我们面临病毒迅速变异的情况,通用疫苗将降低疫苗研发、制造和储存的成本,这将极大地造福于特别易受流行病影响的低收入国家人口。 

    NM:你能解释一下通用疫苗如何起作用,以及它们如何对一系列疾病发挥免疫力的科学基础吗? 

    AS:通用疫苗的开发主要集中在病毒的不变部分或保守区域。然而,该区域可能被病毒不断变异的结构域所遮蔽,这种结构域称为免疫优势。换句话说,产生的通用疫苗可能具有较低的免疫应答。现在,研究人员正试图制造嵌合蛋白疫苗,以使保守区域更具免疫优势,免疫反应更广泛、更持久。 

    疫苗的包装方式也会极大地影响毒株和免疫应答的质量。例如,腺病毒可以被修饰并用于传递编码我们想要呈现的病毒抗原的DNA序列。这样做的好处是它们可以连续数周产生抗原,这可能有助于延长反应时间。 

    LP:疫苗有两种用途:预防和治疗。预防性意味着你提前用它,它提供一段时间的保护性。这些疫苗通常能产生B细胞免疫,在我们的免疫系统中具有更长的记忆并发挥作用。从目前科学的进步来看,我们已经观察到某些抗体或抗体鸡尾酒疗法可以针对多种病毒感染。如果我们能利用计算和实验手段找到一种通用抗原,最终的产品将成为一种通用预防性疫苗,生成一种长期保护性B细胞免疫的混合物。 

    我们免疫的另一部分是T细胞免疫,它通常会对我们身体的非选择性入侵者作出更明确和强烈的反应以清除它们。我们可以用一种治疗方法来控制T细胞的行为,当我们感染时刺激其功能,同时为不同类型的患者定制治疗方案。 

    一些患者的T细胞免疫功能受损,一些患者的过度兴奋T细胞免疫会导致炎症反应。如果我们能有一种调节剂来刺激我们的T细胞,使其能够保护我们,清除来自外界的任何入侵者或致病模块,同时又不伤害我们——这将产生长期保护性B细胞和T细胞免疫的组合。 

    NM:在寻找通用疫苗候选者方面有哪些挑战,人工智能技术如何帮助应对这些挑战? 

    LP:传统上,我们使用单个抗原物种产生抗体。例如,对于COVID,最初我们使用动物模型设计疫苗,以产生针对当前正在发生的毒株的抗体。当病毒变异时,我们必须在一个时间段内多次注射样本。我们不能用传统动物模型追赶变异速度的方法来开发通用疫苗。 

    计算技术在合作实验中可以有很大帮助,在这些实验中,我们几乎计算了从大流行开始到当前时间点的所有毒株,共计超过1000种不同的毒株。在几个小时内,可以生成对不同毒株有潜力的抗体。相反,我们也可以使用相同的算法来识别所有这些变异毒株中的共同点,以生成抗体来抵御未来的毒株。在使用该模型进行的抗体设计中,抗体也能够抵御未来的毒株。 

    病毒物种的进化特征中有一些模式,我们可以从中学习并能够预测这些物种未来的变异趋势。如果我们能够完全将病毒数字化,我们就可以构建一种算法来发现其进化模式,并找到一个共同的免疫遗传序列,为疫苗设计过程做出贡献。计算技术可以加速设计,甚至有助于发现未来生物学中的新现象。 

    NM:病毒种类繁多,如流感、SARS等。在疫苗开发过程中,你是否看到不同病毒之间有类似的进化模式? 

    LP:我们看到了病毒进化的共同模式:它们快速进化并与宿主一起进化。这是我们可以通过数字和计算来学习到的,并能用来分析、理解甚至预测其趋势。所有物种共通之处在于,每个组分都以一种数字化形式编码在RNA或DNA序列中。在这种情况下,这些进化模式是可计算的。 

    NM:在开发此类技术时,人工智能的引入,以及与像圆壹智慧这样的公司合作,是如何帮助并改变了Sino的工作流程? 

    AS:圆壹智慧是一个设计蛋白质和抗体的绝佳平台,它为产生理想的候选药物/疫苗提供了一个指南。圆壹智慧帮助我们更好地理解和预测产品将如何与蛋白质伙伴相互作用。 

    在生产方面,如果疫苗是蛋白形式的,所预测序列的生产可能具有挑战性。所需蛋白质应具有高稳定性、高产量和纯度,以供后期制造商和研发的其他方面使用。为了使这种蛋白质的生产标准化,我们必须进行大量的故障排除。 

    NM:能否谈谈你们是如何与圆壹智慧开始合作的,以及是如何将AI平台与你们的开发工作流程相结合以开发这些新的候选疫苗的? 

    AS:圆壹智慧是我们的客户之一,我们曾一起开发过许多重组抗体项目。由于我们为重组生产提供了各种平台,特别是备受认可的蛋白质生产和筛选,我们可以在短短四周的时间内生产多达1000个制成物。 

    与圆壹智慧一起,我们能够对一些基本信息——如产量、稳定性和纯度以及计算设计——提供快速解答。我们对病毒蛋白生产具有丰富的经验,也拥有世界上最大的病毒蛋白库。这些抗原可用于分析疫苗诱导的抗体反应。 

    NM:Dr. Pan, 你能谈谈将圆壹智慧的技术应用于Sino这一项目的技术过程吗?和圆壹智慧的其他项目相比,与Sino合作的情况如何? 

    LP:我们从合作COVID项目开始,发现许多客户不仅想产出蛋白药物,还想改善这些蛋白药物的特性。在过去,你必须尝试不同的变异体才能找到一个质量好的(抗体),这需要花费很多时间和成本。假设我们可以使用人工智能,将所有不必要的实验都列入一个名单。在这种情况下,我们可以使用我们的AI引擎来扩充所有高概率阳性物种,因此只需要进行非常有限的实验来节省时间。这将加快研发过程,对客户来说,则意味着花费在失败实验上的资金将减少该技术是一个很好的行业解决方案,如果我们同时将其和设计、生产能力结合起来,我们就能为更多客户和合作提供快速周转。这对我们双方来说也都是一个很好的商业模式。

     

    NM:通用疫苗能在世界各地普遍用于治疗需要多长时间实现,人工智能对此有多大影响? 

    LP:许多大学、商业实体和非营利组织正在研究通用疫苗。从科技准备就绪的角度来看,我认为我们正在逐步接近(这个结果)。我无法给出准确预测是未来五年还是十年,但我认为我们将在未来三年内看到良好的动物研究结果。大型人体试验则是另一回事,因为这将涉及一系列长期的安全性研究、更大的群体以及全球不同地区的合作。在接下来的五到十年里,我会希望看到一种能够在人体试验中得到验证的、能够覆盖大多数常见病原体的候选疫苗。 

    AS:我们最近看到针对SARS-COVID的疫苗开发是一个独特案例。通用疫苗开发或任何疫苗开发的正常过程都需要很长时间,特别是在政府最终批准之前,需要确保其具有良好的安全记录。我们希望能更快地实现这一目标,但最重要的是安全性和保持正轨。 

    (文中观点仅代表个人)

    关于Amy Sheng博士

    Amy Sheng博士是Sino Biological技术客户经理。Amy于2021年加入Sino Biological,支持其美国东部地区的CRO服务和项目管理。 

    在加入Sino Biological之前,她曾在Caprico Biotechnologies担任生产经理,负责流式细胞仪的抗体开发和生产。她拥有佐治亚理工大学分子和细胞生物学博士学位,是ASCP认证的分子生物学家和ASQ认证的CSSGB。 

    关于潘麓蓉博士

    潘麓蓉博士是圆壹智慧创始人兼CEO。圆壹智慧是由人工智能驱动的新一代生物技术初创公司。 

    潘博士利用结构生物学、计算化学和人工智能技术进行药物设计、精准医学研究的经验超过14年。她曾担任美国阿拉巴马大学伯明翰分校医学院结构生物学和计算生物学研究员,工程院交叉学科中心计算总监,全球健康药物研发中心(GHDDI,由比尔及梅琳达·盖茨基金会、清华大学和北京市政府共同创建的非营利机构)人工智能部门负责人、副主任研究员,领导设计和实现高性能人工智能药物研发计算平台和精准医学计算平台。 

    潘博士在美国阿拉巴马大学伯明翰分校获得化学博士学位,在佐治亚理工大学获得计算机科学硕士学位,在南京大学获得应用化学学士学位。她还是IBM认证的大数据架构师。 

  • 圆壹药闻 | 利用非靶点结构依赖的多目标AI药物发现平台,圆壹智慧积极探索CNS疾病创新疗法

    CNS药物研发的难点除了疾病生物学机制比较复杂、难以验证之外,大部分CNS的功能性靶点属于膜蛋白,病理性相关蛋白为天然无序蛋白。传统的生化实验很难有效纯化这些蛋白靶点和对其进行精确的、和生理环境相关的3D结构测量与建模。因此,传统的基于靶点的实验筛选和基于3D结构docking的计算化学方式对于此类靶点的药物设计无法有效展开

    圆壹智慧新一代AI药物设计计算平台可以不依赖靶点结构,有效设计具有靶向选择性的活性分子,对于CNS领域药物研发提供前所未有的解决方案。此平台实验验证率也显著高于传统计算和传统高通量筛选方法,比后者节省高达80%的时间和湿实验成本

    近日,卫材(Eisai)和渤健(Biogen)宣布其共同开发的阿尔兹海默病(AD)在研疗法lecanemab临床三期验证试验Clarity AD结果积极,达到主要终点,显著改善患者的CDR-SB评分,同时该试验达到所有关键性次要终点。试验结果显示,lecanemab能够对减缓阿尔茨海默早期阶段认知和功能的下滑。

    Lecanemab 是一种针对阿尔茨海默病 (AD) 的人源化单克隆抗体。Lecanemab 选择性地中和并消除可溶性、有毒的淀粉样蛋白-β (Aβ) 聚集体(原纤维)。这些聚集体被认为会引起 AD 中的神经退行。因此,lecanemab 可能对疾病病理学产生影响并减缓疾病的进展。

    AD其中一个被深入研究的病理学表征是大脑内存在淀粉样蛋白(Aβ)聚合体。Lecanemab即与可溶性Aβ聚合体(被认为是造成神经元损伤的主要聚合形态)结合,并促进它们的清除。但是Aβ作为治疗AD的靶点一直备受争议。Aβ在大脑内的沉积一般出现在临床症状之前15 – 20年,是AD的早期症状之一。而痴呆(认知衰退和心理变化)则是由大脑神经细胞受损死亡引起。根据受损的大脑区域不同,会对AD患者产生不同的影响并导致不同的症状。将Aβ脑内聚积和痴呆联系起来的则是Aβ级联假说。此假说认为,Aβ形成的寡聚体、聚集体和斑块会直接导致神经细胞受损死亡,也会激活大脑免疫系统,从而引发细胞因子的释放。过多的细胞因子也会损伤神经细胞。

    在过去的二十年中,很多药物都以减少 Aβ 产生、拮抗聚集或加强脑清除 Aβ 的能力为途径来降低 Aβ 单体、低聚物、聚集体和斑块水平。这些药物并未能在轻度至中度 AD 患者的大型临床试验中显示出临床益处。这一系列的失败使人们对流行的淀粉样蛋白级联假说产生怀疑。很多学者提出了 Aβ 积累是AD的一种附带现象,而不是神经细胞死亡的原因,从而也不会导致痴呆。但是坚持Aβ级联假说的学者认为,这些针对Aβ的药物在以前的临床实验中未见效用的原因是用药太晚。在有症状的患者中,不可逆的神经细胞损伤早有发生。

    阿尔兹海默病是老年人最常见的神经退行性疾病之一,属于中枢神经系统(CNS)疾病。据WHO统计,在全球超过5500万痴呆患者中,就有60-70%为AD患者(约3300-3850万)[i]。在美国,阿尔茨海默病(AD)是第6大导致死亡的疾病,在我国则是第5位,给居民和社会带来的经济负担日渐加重。据WHO 2021年统计,全球痴呆患者每年医疗总费用高达1.3万亿美元,预计2030年将达到2.8万亿美元。

    另据2020年一项全国性横断面研究显示,我国60岁及以上人群中有1507万例痴呆患者,其中AD患者983万例,占痴呆患者的65%[ii]。虽然AD主要影响老年人群,但并不是衰老的必然结果,社会对AD仍有普遍误解,改善对AD病患的认知还有很长的路要走,其治疗方式也始终难有大的突破。圆壹智慧AI平台将针对包括AD在内的神经退行性疾病开发新药

    精准调节小胶质细胞功能,治疗神经炎症和神经退行性变

    越来越多的证据表明,神经退行性疾病经常和免疫细胞和其相关通路异常失调有关。神经胶质细胞之于大脑相当于巨噬细胞之于周边器官。它们是中枢神经系统的先天免疫细胞,对维持大脑的稳态很重要。但是在过去的几十年里,神经胶质细胞以及入侵血脑屏障周边免疫细胞在CNS疾病/损伤中的角色一直备受争议。这些不确定是因为受限于当时的技术,涉及大脑稳态和疾病的免疫细胞类型和状态无法区分。

    最近,得益于single-cell sequencing(单细胞测序)技术的发展,科学家们发现了一种新的保护性神经胶质细胞亚型——疾病相关小胶质细胞(DAM),并破译了它们在阿尔茨海默病进展过程中的动态[iii]。在此项研究中,小鼠和人脑切片的染色显示DAM细胞内有吞噬的Aβ颗粒。这种独特的小胶质细胞类型有可能减缓神经退行性变,这可能对未来治疗 AD 和其他神经退行性疾病具有重要意义。如何使用靶向小胶质细胞特异性抑制检查点来诱导早期 DAM 激活,以及如何作为治疗(或预防)靶点来触发针对 AD 斑块病理学、衰老和其他神经退行性疾病的小胶质细胞反应,仍有待确定。

    总而言之,操纵小胶质细胞的功能可能成为新的治疗方法。全世界针对相关靶点的在研药物已处于临床前至临床II期的各个阶段。

    针对相关靶点,圆壹智慧的CarbonAITM引擎可进行分子设计及虚拟筛选19亿个化合物化学空间,高效完成ADME/Tox成药性和靶标特异性评估,计算分析化合物的效率比传统预测工具高1万倍。蛋白药物设计引擎SentinusAITM则利用数据驱动的Al技术,结合疾病生物学知识,对抗体和其他融合蛋白进行优化

    小分子抑制剂治疗中枢神经系统水肿

    每年,全世界有6千万人遭受创伤性大脑或脊髓损伤,1500万人遭受中风。这些损伤是中枢神经系统水肿的主要原因。中枢神经系统水肿的标准护理,如脑室引流和颅骨切除术,都是非常具有创伤性的。

    针对CNS水肿的所有药物干预在临床试验中都失败了,目前没有任何用于水通道蛋白(AQP)的通道阻断药物被批准用于人体。因此,圆壹智慧采取了一种不同的方法:靶向于AQP4亚细胞,一种星形胶质细胞中的水通道。通过体内抑制相关调节素或蛋白激酶可消除AQP4依赖性CNS水肿。

    目前有3个CaM拮抗剂处于临床前阶段。圆壹智慧将利用其人工智能平台来寻找针对相关受体的更好的小分子药物。

    小分子抑制剂治疗重度抑郁症(MDD)

    全球约有3.8%的人口(2.8亿)受抑郁症所困,成人中占5%,60岁以上人群中占5.7%。2008年,世界卫生组织将重度抑郁症(MDD)列为全球疾病负担的第三大原因,并预测到2030年将升至首位。

    据估计,2020年,美国2100万成年人至少有一次严重抑郁发作[iv],占所有成年人的8.4%(下图)。其中,18-25岁的人群发作率最高(占17.0%)。有1480万18岁以上的美国成年人在前一年(2019)中至少有过一次严重抑郁发作并伴有严重损害,占所有成年人的6.0%。

    同年,有410万12-17岁的青少年至少有一次严重抑郁发作,占该年龄层17.0%(下图)。有290万12-17岁青少年在前一年(2019)中至少有一次严重抑郁发作并伴有严重损害,占该年龄层12.0%。

    重度抑郁症与巨大的负担相关,而目前一代的单胺类抗抑郁药以及二代的SSRIs对大多数患者无效。最近,血清素(五羟色胺)和抑郁症之间的关联也受到了挑战。针对血清素研究领域并没有提供一致的证据证明血清素与抑郁症之间存在关联,也没有支持抑郁症是由血清素活性或浓度降低引起的假设。因此,我们需要重新考虑一些针对血清素的抗抑郁药。整个疾病领域需要新的治疗策略。

    作用于前额皮质(PFC)的一些膜受体是新型的调节因子,可以作为治疗慢性应激性MDD的潜在药物靶点。此类受体在抑郁症患者的PFC中高度上调;在暴露于慢性应激的小鼠PFC中具有高的表达水平;于病毒诱导PFC的抑郁样行为中亦表现出过表达。相比之下,此类蛋白的消融可导致显著的抗抑郁样表型和应激恢复能力。

    该靶点研究仍处于临床前阶段。作为First in class研究管线,圆壹智慧的人工智能平台将寻找这种受体的小分子抑制剂候选。

    圆壹智慧在自研管线方面以CNS为主要布局领域,通过AI平台引擎进行多组学靶点发现计算和非结构依赖药物分子设计,寻求减缓CNS(脑,脊髓和视神经)退化,促进神经再生和缓解神经系统炎症的精准治疗方法(包括AD等神经退行性疾病),对未满足的临床需求做出迅疾、精确和有效的反应

    Contributors: Dr. Xiaojie Wang, Dr. Yang Jiao, Dr. Lurong Pan, Cheng Zhu

    参考文献

    [i]https://www.who.int/news-room/fact-sheets/detail/dementia

    [ii] 任汝静等,《中国阿尔茨海默病报告2021》,诊断学理论与实践2021年第20卷第4期

    [iii]https://www.cell.com/fulltext/S0092-8674(17)30578-0#secsectitle0065

    [iv]https://www.nimh.nih.gov/health/statistics/major-depression

  • 圆壹算法 | 图距离神经网络证实预测多药物相互作用的巨大潜力

    作者: Haifan Zhou, Wenjing Zhou, Junfeng Wu*

    摘要

    随着多药物联用的日益普及,如何准确预测药物之间的相互作用变得愈加重要。我们可以用图表示药物相互作用,图中的节点代表药物,边则代表药物之间存在的相互作用,那么我们将DDI预测的问题转换为链接预测问题,即根据已知的药物节点特征和DDI类型预测未知的DDI类型。本文尝试提出了图距离神经网络(GDNN,Graph Distance Neural Networks)模型对药物相互作用进行预测。GDNN模型首先充分考虑了图中的距离信息,采用靶点法为图中节点生成初始特征。随后,GDNN模型采用改进的消息传递框架,综合考虑图中节点和边的特征,更好地生成各个药物节点嵌入表达。最后,GDNN模型对嵌入表达进行聚合操作并经过MLP处理,生成最终的预测药物相互作用类型。GDNN模型在ogb-ddi数据集上取得了Test Hits@20=0.9037 ± 0.0193的成绩,证明了GDNN模型在预测DDI中的巨大潜力。

    关键词:药物相互作用预测;GDNN;靶点法;改进的消息传递框架

    1  引言

    联合用药是临床常见的治疗方案,对于患有复杂疾病的患者尤为重要。但是这也增加了药物-药物相互作用(DDI)的风险。DDI是指药物之间的药理学的相互作用,其会导致药物疗效的增强或者减弱,进而导致药物的不良反应。每年DDI都导致了大量的患者死亡,同时造成了约1770亿美元的损失[1]。同时随着批准药物数量的增加,药物之间相互作用的可能性也相应增加。因此为了降低风险和成本,准确地预测DDI成为临床上的一项重要且紧急的任务。目前传统的体内和体外实验可以识别DDI,但是由于实验室的限制和高昂的成本而难以进行,因此开发计算的方法以预测DDI尤为重要。

    基于ogb-ddi数据集的假设,DDI的预测可以转化为基于蛋白-蛋白相互作用和药物-蛋白相互作用形成的图网络中药物-药物相互作用的节点之间的预测问题。Marinka等人构建了一个预测DDI的GCN架构(Decagon)[2]。Feng等人将GCN和DNN模型组合从DDI网络中提取药物结构特征以预测DDI[3]。在本文中,我们基于图神经网络的框架,将图中的节点之间的距离信息作为节点的初始特征,并综合考虑图中的边信息,以提高DDI预测的准确性。

    2  问题描述

    给定一个DDI图G={V,E},V表示图中节点的集合,共包含N个节点,节点特征矩阵用X∈RN×D表示。E表示图中边的集合。对于一个给定的药物对xi∈RD,xj∈RD,xi和xj之间的药物相互作用可以采用ei,j来表示,即eij∈{0,1}。上面式子中D代表节点特征的维度,同时eij被用来作为边的特征Y∈{0,1}E

    我们将DDI预测转化为一个链接预测问题。我们假设图中有一些缺失的边YU,即Y={YU,YL}。我们在已知节点特征X和部分已知的DDI链接YL的情况下,目标是预测未知的DDI类型YU

    3  图距离神经网络框架

    针对DDI预测问题,我们提出了GDNN框架。GDNN框架主要由三个部分组成(如图1所示),即首先通过靶点法生成节点的初始特征,再经过GDNN的消息传递框架(Encoder部分)生成节点的嵌入表达,最后通过GDNN的链接预测器(Decoder部分)生成两节点之间的关系。

    图1. GDNN框架

    由于ogb-ddi图中并没有节点特征,我们需要为图中节点生成初始化的特征。目前常见的方法是直接通过词嵌入的方法为图中节点随机生成特征,但是上述方法忽略了图中的结构信息。Boling Li等人提出了将图中节点之间的距离作为节点的初始特征可以显著提高DDI预测的准确性[4]。但是计算图中各个节点之间的距离是一个很繁琐的任务,为了简化计算过程,本文采用基于靶点的距离计算方式。我们在图中选择k个节点作为我们的靶点,然后再去计算图中所有节点到这k个节点的距离,生成的距离特征矩阵用X∈RN×k来表示,我们使用距离特征矩阵X作为图中的节点的初始特征。

    靶点的选择不同将会导致节点的初始特征不同,我们采用了以下三种靶点选择方式,1)随机从图中不重复地选择k个节点作为靶点,2)从图中选择节点度最小的k个节点,3)从图中选择节点度最大的k个节点。

    GDNN框架的详细介绍请参阅论文。

    4  计算部分

    4.1 数据集

    本文使用ogb官方提供的ddi数据集[6]。Ogb-ddi数据集是一个同质,无权且无向的图。每一个节点均代表已获FDA批准或处于实验阶段的药物。每一条边均代表药物对之间的相互作用,可以解释为一种现象,即两种药物一起服用的联合效果与药物相互独立作用的预期效果有很大不同。

    4.2 计算设置与评价指标

    我们将GDNN模型与GNN,Graphsage,JKNet等baseline模型的效果进行了对比。同时我们设置了消融实验,建立GDNN模型(即不加入边的特征),以验证边特征的有效性。评价指标我们使用ogb官方所提供的Hits@20指标。

    具体网络设计与实现请参阅论文。

    4.3 计算结果

    具体的计算结果如表1所示,从表1中我们可以发现我们的GDNN模型取得了最好的效果。

    表1. Ogb_ddi数据集计算结果

    5  结论

    综上所述,GDNN模型使用靶点法为图中的节点生成初始特征,综合考虑了图中节点和边的特征,更好地生成了各个药物节点的embedding,并降低了算法的复杂度,有效提高了预测准确度,证明了GDNN模型在DDI预测中的巨大潜力

    Reference

    [1] K. Giacomini, R. Krauss, D. Roden, M. Eichelbaum, and M. Hayden. When good drugs go bad. Nature, 446:975–977, 2007.

    [2] Marinka, Z., Agrawal, M., and Jure, L. (2018). Modeling Polypharmacy Side Effects with Graph Convolutional Networks. Bioinformatics 34, i457–i466. Oxford, England. doi:10.1093/bioinformatics/bty294

    [3] Feng, Y. H., Zhang, S. W., and Shi, J. Y. (2020). DPDDI: a Deep Predictor for Drug-Drug Interactions.BMC Bioinformatics 21, 419–515. doi:10.1186/s12859-020-0X

    [4] Boling Li ,Yingce Xia, Shufang Xie. Distance-Enhanced Graph Neural Network for Link Prediction.2021.05

    [5] Shitao Lu and Jing Yang. Link prediction with structural information.2021.08

    [6] David S Wishart, Yannick D Feunang, et al. DrugBank 5.0: a major update to theDrugBank database for 2018. Nucleic Acids Research, 46(D1): D1074–D1082, 2018.

    论文全文请见:

    https://github.com/zhf3564859793/GDNN/blob/main/Graph_Distance_Neural_Networks_for_Predicting_Multiple_Drug_Interactions.pdf

    关于图机器学习

    图结构数据在自然科学和社会科学中无处不在,从电信网络到量子化学。如果我们希望系统能够从这类数据中学习、推理和概括,那么在深度学习架构中构建关系归纳偏置是至关重要的。此外,图可以被视为更简单类型的结构化数据(如图像)的自然概括,因此,它们代表了机器学习下一个突破的自然途径。

    近年来,对图表示学习的研究激增,包括深度图嵌入技术、卷积神经网络对图结构数据的归纳,以及受信念传播启发的神经消息传递方法。图神经网络和相关技术进步导致了许多领域的最新成果,包括化学合成、3D视觉、推荐系统、问答和社交网络分析,如今也被广泛应用于医药、医疗领域,包括药物发现与开发。

    关于OGB

    Open Graph Benchmark (OGB, https://ogb.stanford.edu/)于2019年由斯坦福大学发起并开源,由社区驱动不断迭代更新。这是一组具有挑战性的、真实的基准数据集,用于促进可扩展、鲁棒和可再现的图机器学习(ML)研究。OGB数据集是大规模的,包含多个重要的图机器学习任务,并涵盖了从社会和信息网络到生物网络、分子图、源代码AST和知识图谱等多种领域。OGB有标准化的评估程序和排行榜,以跟进最新结果。

    OGB涵盖了三个基本的图机器学习任务类别:预测节点、链接和图的属性。圆壹智慧团队开发的图距离神经网络(GDNN)模型在ogbl-ddi 数据集中排名第四,成绩卓著(该排名榜持续更新),证明了该模型在预测DDI中的巨大潜力

  • 圆壹药闻 | 圆壹智慧当选WAIC 2022全球创新项目路演TOP20企业

    世界人工智能大会(WAIC)日前在上海举办,其中,全球创新项目路演赛事是深刻体现WAIC国际化水平的重要活动之一,圆壹智慧当选TOP20企业,且是榜单中唯一一家AI生物制药团队

    2022 WAIC全球创新项目路演活动关注AI前沿基础研究和前沿技术、以及技术赋能的多产业应用、跟踪国际最新研发创新及应用趋势,发掘更多科创项目,推动产业生态发展。该活动自启动以来即受到行业内外广泛关注。国内外约200家人工智能成长型企业参与报名。在初评入围的50家项目中,涵盖智能服务机器人、工业机器人、自动驾驶、智慧金融、AI芯片、医疗机器人等多个热门赛道,可谓是强强对话,竞争激烈。经过4天的线上复评和评审,甄选出20个优秀企业项目入围终评,圆壹智慧即位列其中

    复评评审环节,来自国内外加速器和孵化器、海内外投资机构、科技产业园区的专家组成的专业评审团,从技术创新、团队能力和商业模式三个维度对参赛案例进行综合打分,并以云端会议直播间的方式与每一家企业互动交流,提出详细精彩的点评和建设性意见。

    同时,专家评审团对本次入围终评的20家企业给予了高度评价,他们表示:今年入围的企业各有特色,技术创新性高于往年,团队背景强,在创新应用上具有实用性和普遍性,未来都有较大的发展潜力。

    在综合专家评审团的评审情况后,“WAIC 2022全球创新项目路演 TOP 20 榜单”于9月2日精彩揭幕:

  • 不依赖蛋白结构,初创跨界AI制药团队突破单靶生物尺度,实现多尺度生物计算

    动脉网 原文链接

    2016年,AI制药开始在国内逐步发展,据动脉网统计,目前国内AI制药企业已发展至约80家。6年里,AI制药企业投资热度持续高涨,多家公司两轮融资时间间隔不超过一个月,甚至有公司在一年内完成3轮融资。据动脉橙数据库统计,2021年全年,国内AI制药领域融资总额达到127.4亿美元,占到全球融资总额的1/4。

    那么,在各式AI制药算法平台不断推陈出新的今天,AI制药企业与投资方更加关注的,是如何将制药管线快速变现的问题。

    近期,动脉新医药了解到,一家AI制药初创企业,圆壹智慧,首年就完成了约300万美金的签单,建立的10条管线其中半数已经进入体外实验阶段,另有两条正在进行体内试验,且已经完成一条管线的License-Out

    圆壹智慧是一家拥有快速、自主进化AI药物设计平台的新一代生物技术公司。自去年4月成立以来,圆壹智慧在国际AI制药领域中大展拳脚。目前,圆壹智慧的整体算法平台已经在亚马逊云上线,在美国、欧洲、中国的签约订单近300万美金,折合人民币2000万元

    01

    仅用序列一周完成计算筛选优化,实现多指标体内仿真优化

    圆壹智慧的交叉学科背景团队打造了CarbonAI小分子药物SentinusAI蛋白药物设计系统,能够在掌握生物靶点的序列信息后的几小时内,从数十亿生物分子和化合物中筛选出几十或几百个候选分子,绕过传统高通量筛选实验,减少体内体外实验迭代轮次,大大降低药物研发成本和风险,突破结构未知的靶点早期发现和后期优化瓶颈。

    ▲ 圆壹智慧AI算法系统整体流程简介

    圆壹智慧独创的AI算法体系无需获得靶点结构信息,仅通过其蛋白质序列即可开始第一轮的先导化合物/先导分子发现。其计算系统在过去已经完成了对百亿化学结构、几千万蛋白序列数据和几百万生化、细胞、体内数据的学习,具备了通过靶点序列来预测药物分子性质的能力,所以在该套算法体系中不再依赖通过蛋白质结构进行先导物发现和优化,突破单靶点计算生物尺度,实现多靶点、脱靶检测,细胞和体内生理层面的全局计算。同时,基于序列的直接计算能够将计算效率提高1×106~7倍,极大缩短了AI计算的时间,实现生物体系的高性能低碳计算。

    圆壹智慧的底层技术不仅在小分子尺度上实现更全面的体外和体内药效预测,还将计算尺度跨越到蛋白药物,基因和细胞治疗的生物大尺度,从根本上解决了蛋白相互作用和多体计算问题在传统结构生物学计算层面的瓶颈和算力不可及性。

    圆壹智慧创始人兼CEO潘麓蓉表示,圆壹智慧的技术与广为人知的AlphaFold具有底层相似性,圆壹智慧的差异在于不计算结构、也不基于结构,“工业界对结构在制药里面的应用实际上是比较存疑的,它并不是限速步骤,本身也是具有局限性的定性研究,而不能够真的利用它来进行精确定量计算“。

    圆壹智慧的视野并不局限在狭窄的靶向问题,而是宏观的整体成药问题,“绝大部分传统AI工具没有办法在有限算力内计算生物大分子之间在多种生物尺度上的作用力,而基于圆壹智慧的AI底层技术,平台可以拓展应用到蛋白药物、偶联药物、细胞和基因治疗以及合成生物学等更广泛的层面。”潘麓蓉解释。

    CarbonAI小分子设计引擎和SentinusAI蛋白设计引擎能够从上亿分子中找到通过多维度优化的小于50个的先导化合物,在10-100个分子内可以找到一个临床前候选化合物(PCC),计算时间仅为几小时

    CarbonAI是用于多目标药理学优化的小分子和PROTAC从头设计引擎。功能包括靶点结合和选择性优化、分子生成、ADME和PK评估以及化合物脱靶预测。

    SentinusAI是仅基于序列进行蛋白药物从头设计与优化的抗体和融合蛋白工程引擎。功能包括蛋白-蛋白亲和力改造、蛋白药物人源化、蛋白药物脱靶毒性预测、蛋白质稳定性和翻译后修饰预测。

    由此可见,圆壹智慧既具备序列设计的生成引擎,同时也拥有提升蛋白质亲和力、预估脱靶性和蛋白质人源化的能力,并且通过高度自动化与智能化的AI替代传统的大通量筛选实验和预测体内药性,给中小型药企或大型药企中预算较低的项目带来更多项目推进的可能性。

    目前,圆壹智慧通过“建立在蛋白质生化性质上的全自动化的AI计算”,能够在前20分子的筛选结果中保证约10%的命中率,前50-100分子的筛选结果中保证约40%的命中率

    02

    跨界人才创新:Prepared for This Moment

    除了“AI计算”与“药物研发”本身存在极高的技术壁垒外,对于企业来说,如何找到计算机型人才与生物化学型人才的平衡点,也是目前提升核心技术、实现科研效率的重要问题。在人工智能与生物医药领域同时拥有丰富经验的复合型人才,已然成为各大AI药企争相挖掘的热门。

    圆壹智慧作为一家初创公司,能在短时间内取得目前的成绩,和其交叉学科背景的核心团队息息相关。

    圆壹智慧创始人兼CEO潘麓蓉博士具有计算化学、结构生物学、人工智能等多重教育和工业背景,从纯物理学的过程模拟到机器学习的方法论,她在过去逾14年里对计算技术用于生物学研究和药物设计进行了开发与应用,覆盖神经退行性疾病、心血管疾病、癌症、罕见病以及传染病。与此同时,在新冠疫情的推动下,全球数据开源量以及计算生物学的发展有了巨大进步。回顾在AI制药从学术到产业的积累与沉淀后,潘麓蓉认为自己“Prepared for This Moment”,2021年4月,圆壹智慧就此诞生。

    “人工智能与生物医药两个领域拥有不同的方法论与知识体系,”潘麓蓉告诉动脉新医药,“如果想要将AI用在生物医药如此庞大的生物体系中,只有在双边领域都拥有理论基础与实践经验的人才,才更有可能实现创新发明。这样的人才培养体系是在过去10年,在全球为数不多的高校和研究机构内才开始建立起来的。

    这一理念被完全贯彻至圆壹智慧的团队搭建中。目前,圆壹智慧在中美两地同时搭建具有国际化标准与视野的创新团队,核心成员毕业于佐治亚理工大学、密西根大学、南加州大学、哥伦比亚大学等世界名校,拥有化学、药理学、生物学及AI药物发现等复合学科背景,其中研发团队硕士以上学历超过70%,博士占比一半。其团队拥有丰富的产业经验,且具有AI+药物研发干湿闭环验证成功经验。

    03

    管线实现License-Out,订单300万美金

    圆壹智慧成立15个月以来,其AI算法平台已在亚马逊云上线,全球签约订单近300万美金,发表人工智能专利10余项,药物分子专利三项,累计开发管线10条,主要覆盖癌症、代谢与神经类疾病。

    这样可观的管线进度与业绩成果,也侧面突出了圆壹智慧全自动化AI计算的高效率性,以及其跨界人才在企业发展中体现出的高协作性,这一点在行业中是较难复制的。

    未来,圆壹智慧将以三年为一时间节点,制定相应的发展规划。在第一个三年,圆壹将继续开发临床前阶段的AI计算平台,迭代自己计算技术与生命科学在理论和实践上的闭环,推进更多的全球合作研发,开发更多样的PCC递交IND申报。在第二个三年圆壹将加速国际化合作进程,让AI技术在新药研发中实现更多的应用场景、以及多种分子形态的精准设计,推动系统性的效率和成功率的提高。在积累足够的临床前准确率后,逐步向临床阶段迈进。

    圆壹智慧致力于成为国际领先的智能药企。作为为数不多通过生物学计算实现临床前闭环的数据驱动公司,潘麓蓉希望能够通过提升圆壹智慧的AI平台,形成与行业内的良性互动,培养更多的交叉学科人才,激活计算科学与生命科学融合的更多可能性,让AI技术在新药研发中实现更多的应用场景、打造更强的技术成果, 提升AI技术在生物医药行业的接受程度和标准化进程,推动更多临床问题的解决和生命科学的新发现

  • 圆壹智慧创始人兼CEO潘麓蓉:AI制药工业落地的痛点与前进方向

    摘要:2022年8月5日,2022阿里云生命科学与智能计算峰会在北京望京昆泰酒店举行,圆壹智慧创始人兼首席执行官潘麓蓉博士,带来了题为《The Challenges and Future Directions of AI in pharmaceutical industry》的分享,以下是她的演讲内容整理,供大家阅览:

    圆壹智慧创始人兼CEO 潘麓蓉

    美国NIH的4D map是全球制药行业的行业金标准。以小分子为例,从靶点的识别到先导化合物的发现、优化,从 early discovery 到 development 再到最终的 clinical trial,中间的每一步都已经有非常成熟的方法论、实验平台、理论指导以及监管标准。

    然而,该系统的数字化程度非常低,制药行业也是所有行业中数字化程度相对较低的行业。

    转化医学、生物标志化合物相关的数据、临床数据、监管数据、医保数据以及临床采样和体外采样的信号数据,都需要由不同的机构和科研人员负责。基于此,制药工业想要在系统上提效,只有两个方法:第一,将整个系统进行重新定义;第二,从过去的历史数据中去掉杂音、找到信号,并用最先进的方法论取代过时的方法论

    上图为药筛流程。从第一步到最后一步需要进行的实验数量决定了最终的系统效率。传统流程基本需要从 2 万个分子筛至一个分子,盲筛则基本需要 200 万个分子作为起点。而如果能实现以100个分子作为起点,则整个行业的投入和耗时将得到80%以上的节省。

    以上筛选流程已经沿用多年,但过去 10 年的投入产出比在逐年下降。因此我们需要考虑:如何突破现有的筛选流程?能否通过AI帮助提升效率?

    严格意义上来说,AI并不是一种工具,因为工具需要人来使用,而 AI 可以进行自优化,不需要人类帮助也能实现目的。在AI的学科定义里,它需要具备像人一样的思考和行为能力,最后还需经过图灵测试等方式的确认。

    但将AI应用于制药行业,最大的难点在于如何为AI定义目标。比如制药问题上,目标可以是优化选择性,也可以是优化整体的体内药效,还可以是优化最终的适用病人群体。如果给予AI足够的数据,实际上它可以通过自己的办法实现目标。

    因此,人需要做两件事:首先明确目标,其次明确需要喂给AI什么样的数据和规则,最终由AI负责实现目标

    人工智能本身是一个交叉学科,而制药也是涉及到生物化学、细胞生物学、生理学等多维度信息的学科。如何将众多庞大的学科体系进行高效地融合,是我们面临的最大挑战。

    上图涵盖的数据基本涵盖了制药行业所有计算的输入。QM(量子力学)、DFT(Density Functional Theory,密度泛函理论)、Molecular Mechanics(分子力学)和Molecular Dynamics(分子动力学)是纯物理的方法,DFT 和 Molecular Mechanics里也存在一些实验参数用于进行校准,而QM 完全只取决于输入的分子的原子组成。他们在不同的精度进行计算,但精度和准度是完全两个不同的统计学参数,我们不一定需要最高的精度,但是需要最高的准确度,这样对于下一步的判断才能更完整

    而此前的方法论或多或少存在局限。比如 QM 计算的是电子精度,只能在材料和一些小型溶液化学体系里进行计算。想要扩到生物体,则需要做更多的近似和牺牲一定的精度,因此有了 DFT 方法。分子动力学方法相当于借用一些经典力学和经验参数,模拟量子力学的输出,可以将计算尺度拉到单蛋白的程度,精度从电子省略到了原子。

    但是,后续需要对蛋白之间的相互作用进行计算,以及更高的体系比如细胞里有 4200 万个蛋白,如果使用 MD 进行计算,则全世界的计算机加起来都无法实现。人体需要计算生理学的结果,如果从原子开始,需要进行 4200万*30 万亿的计算才能真正从分子层面映射到人体。受限于计算能力,从分子动力学之后,基于原子为单位对生物学的模拟随即陷入困境,且不论基于原子为基础的3D结构本身解析的精准程度。而随着信息学的介入,我们又看到了希望的曙光

    信息学是基于信号的读取,信号可以分为两层:一层是分子本质的信号,比如蛋白质、DNA 、小分子等都是序列,序列是确定的、没有任何噪音的;另一层是宏观层面,将分子放到体系里,可以观测到电信号、荧光信号得到各种对生物事件间接的理解。

    得益于信息学的手段,过去 40 年前,化学信息学和生物信息学得到了长足发展。在此之前,我们只能用一些简单的统计学方法来实现从微观到宏观的映射。而此后的多组学能够将所有物种的 DNA 进行解析,得到多层面的数据。QM的计算复杂度大约为O(N)4-O(N)7,N为电子最大的体系约几百个原子;Molecular Mechanics的计算复杂度降至23,最大的体系约 100万个原子,即接近一个单病毒。但是计算复杂度在统计学或机器学习的预测场景下接近于线性,因此相当于又将计算效率节省了10 6 -10 7 倍。当前深度学习大行其道,根本原因是我们无法通过物理学模型计算更大的生物体系,需要通过历史数据的学习来换取产生这一部分数据层投入的算力和实验资源。

    DNA 是静态的,因为DNA的序列一般不会有太多变化。而生物是动态的,RNA、蛋白质和代谢的测量会伴随人的年纪、饮食、身体状况而动态变化。此外,当前对生命的过程模拟,从单原子角度而言大概只能达到微秒级,酶反应也大约为微秒到毫秒级,因此无法实现真正的过程模拟。而借助信息学,我们可以实现端到端的黑盒子模拟,即端到端模拟

    物理学家不断地简化物理公式和计算复杂度,使得最小的药物分子到体系观、不同的理论基础都可以从物理层面进行模拟。但这也意味着需要重新计算实验条件,重新发展单独的工具和物理范式,而这是一种比较笨拙的方法。我们期望能够找到精度可调、通用的模型,可以用同一个模型来解决所有问题。

    深度学习就是我们的第一次尝试。只需要每个维度的数据足够多,即可用黑盒子来预测每个维度的问题,不需要考虑底层的物理原理。深度学习也在过去的实践中被证明非常有效,但它依然不是最完美的,因为它对数据过于依赖。

    我们更期望的完美方式是找到一个通用型的、动态的、跨多尺度的数学公式,能够从根本上观察生物学,并且不依赖任何数据

    上图为具体的数据公式。传统的一个小分子在 QM 计算一个GPU 大概花费几个小时至几天(取决于具体任务),FEP大概为一天,Docking 为几分钟。而机器学习场景下,在一个CPU上计算几千到几百万分子只需一分钟。

    上图为阿里云上测试的若干算力。QM 计算几个氨基酸的互相作用,一个CPU 大概需花费半小时。MD 预测大型的膜蛋白每纳秒的行为需几个小时,而微秒或毫秒级所需时间则需乘以 103或10。深度学习模型经过训练,预测所需时间更短,一个小时即可实现百万级的筛选。

    机器学习已经广泛应用于制药领域,比如蛋白质的结构预测、功能预测、基因编辑、系统生物学以及更大生理性多组学等。而最终的瓶颈在于对生物大数据的理解和清洗。

    药物领域的AI发展主要分为上图四个阶段,到目前已经拥有完善的数据驱动方法。一直以来,我们都希望能够将整个流程里的所有数据全部打通,得到最高效的方法。

    那么,从学科层面还值得继续突破的方面有哪些?

    我们利用AI,并不是只希望它做得更快,而是希望它做得更好,能实现一些人类无法突破的挑战。AI能超越人的两个方面在于:

    第一,它不需要休息,而且可以有几千个 AI agent 同时做一项工作,这是能力上的突破。

    第二,AI对于世界的认知是多维的,人只能从 3D 维度以及时间维度来认知世界,而AI 可以在几千个维度或一维、零维这样人类无法认知的维度下认识世界,然后获得更好的答案。

    制药领域存在一个很有意思的现象:二维的认知与一维的认知完全相反。如上图,PK 是影响生理指标的重要因素,不同情况下它会存在巨大反差,从人的角度看它们可能非常相似,但 AI 可以从二维以外的一些维度识别到更大的区别。

    此外,专家进行优化,往往一次只能在一个维度上优化一个问题,因此一个项目会产生无限多的迭代。而如果采取人工智能最典型的 Multiobjective optimization 多目标优化方式,可以一次从多个维度实现多种优化。在过去的实践中我们已经验证,使用 AI 比如在 30个维度里同时打分再做实验相较于人工思考再做实验的命中率要高很多。因此我们也坚信,在此领域,AI 能够比专家做得更好

    新项目一般从表型筛选开始,从表型直接预测潜在的假设,将涉及到黑盒子问题,而这正是 AI 擅长之处。过去大部分原创新药都属于Phenotypic Screening,而大部分Follower drug属于 Target-based Screening。

    AI Phenotype Screening已经进行非常多尝试,比如我们过去在GHDDI曾对 3000 个cell based assay逐一进行了 AI 模型的建立,然后进行 retrospective 和 prospective 两种大规模验证,最终发现过去 30 年的数据里,只有 5% 的数据能够基本接近真实的 cell-based 结果。但这已经是一个不错的结果,至少证明了该数字保持着增长的趋势。

    合成问题一直是小分子药物的瓶颈。而Science杂志的相关文章表明:AI passed the Turing test,意味着天然产物的全合成路径都已可预测。只是合成问题的瓶颈并不在于路线预测,而在于反应条件预测。

    AlphaFold 饱受关注,它被认为是划时代的壮举。但我们需要先确认三个问题:

    第一,制药领域是否需要知道结构?正常的Biology discovery 可以直接在细胞上筛选或直接纯化蛋白筛。已知的只是序列和 binding affinity, 不需要过程模拟,但过程模拟的好处在于可以对一些关键位点进行改造。

    第二,AlphaFold 预测的结果和传统的同源建模相比,传统的同源建模在有已知模板的情况下表现更好。其中涉及 AlphaFold 里深层次算法的 flow 使用了 Multisequence alignment,是借用其他所有物种的所有蛋白质 family 的信息去预测高等生物的信息,而这在很多核心区域会出现问题。如果是传统的同源建模一般是更接近的物种或者同一物种的同一个蛋白组族,在已知的模型上即可直接预测,因此在真实的制药过程中,传统的同源建模置信度更高。而针对没有模板的蛋白,则需要采取其他办法。

    最后,我们采取的办法是直接从一级结构去预测生物活性,完全跳过了structure biology的过程,也就避免了这一过程中的误差。

    2013 年,我曾花费两个月调用了1024个CPU,得到约一微秒的膜蛋白,磷脂双分子层,小分子三种组分的simulation,当时已经是全球最大的可计算膜蛋白体系,涉及上百万原子。而在当今的超级计算机同等硬件配置下,以上时间花费可减少至2-3天,但这也仅仅是 30 倍的增长,意味着真正系统性地计算动态过程依然非常困难。

    因此,我们必须全方位利用 Data Driven AI 模型。通过下面这一链接,可查看这一篇滚动更新的review相关内容,里面提供了解决 data limitation 问题以及如何建模等方案。

    相关链接:http://greenelab.github.io/deep-review/

    生物大数据里的噪音非常多,如何从噪音里提取信号、集成干净的数据集也尤为重要。业内提供了非常多方法论层面、工程层面以及算法层面的解决方案,比如Multimodal 方法,如果一个尺度上的数据量很少,则可以从其他尺度上迁移,比如multi-task方法,如果一个靶点的数据很少,则将其 family 或相似的所有 pocket 数据都找出来用于做迁移学习,以弥补其数据的限制。

    最有用的AI模型一定是泛化能力很强的模型,一定能够从已知的事物预测未知的事物,这才是最有意义的 AI。因此,从根本上来说,迁移学习(transfer learning)的方法最为有效

    如果要做 target specific 预测,专家只需反馈少量结果或几个到几十个数据,即可进行 fine-tuning ,而后一般只需进行五轮以内的主动学习即可达到想要的结果,效率远远优于此前的盲筛。

    另外,生成数据一般有三种方法:

    第一,从现有数据里挖掘,我们曾经汇总了全球所有的商业数据库以及100 +开源数据库,最后淘汰掉了95%的数据,这也属于对历史的重新审视。

    第二,自己做实验,有针对性地补足一些数据,需要明确数据的化学、生物空间分布,以最少的数据点推动最优的模型表现。

    第三,模拟数据,比如 QM 的计算最准,则先用物理的底层采样,最后用这些数据去换已经耗费的算力,无需再重新进行计算。

    当前我们圆壹智慧的一体化解决方案如图有一个抽象的展示,具体内容参见官网,从 target 序列开始,在几个小时内通过几十个 AI 模型同时打分,可以 propose 10-20 个新分子,基本只需2-3轮、在 100 个分子以内即可得到目标化合物。

    另外,在算力方面,我们从 training 、调用、 GPU 和 CPU 的分配等方面都做了非常灵活的方案,已经是一个成熟的自动化平台。

    今年6月,圆壹智慧在美国生物国际大会(BIO International Convention)上首次发布了多目标 AI 模型,对于生物药、化学药以及核酸药都提供了自动化设计的能力,并且与全世界的多家CRO、CDMO、药企都有紧密合作,公司成立一年至今已获得 300 万美金订单。

    在未来,我们也希望化学药、生物药(核酸药,蛋白药,细胞治疗)等以及各医疗产业链能够在多目标AI模型的加持下,更加高效地解决临床的问题。我的分享就到这里,谢谢大家。

    点击这里,观看嘉宾在本次峰会的精彩演讲视频。

  • 如何培养AI的纯真意志? | PharmaFeatures对话潘麓蓉博士

    采访/撰文 Nick Zoukas(PharmaFeatures主编)

    (本文为中英双语对照)

    Lurong Pan is the founder and Chief Executive Officer of Ainnocence, a firm seeking to accelerate drug discovery efforts through comprehensive AI models. We caught up with Lurong Pan during our Medicinal Chemistry Strategy Meeting in Boston, 2022 where we explored her motivations in the industry, and the impact of Artificial Intelligence (AI) in the drug discovery space 

    潘麓蓉博士是圆壹智慧创始人兼CEO,该公司致力于通过全面的AI模型加速药物发现。2022年5月,我们在波士顿举行的药物化学战略会议上与潘麓蓉会面,探讨了她在该行业的动因,以及人工智能(AI)在药物发现领域的深远影响。

    PF(PharmaFeatures): It’s a pleasure to have you here with us, Lurong. You have had an interesting journey in the life sciences world so far, leading up to your founding of Ainnocence. Would you like to tell us a bit more about yourself, your personal background and what motivates and drives you? 

    LP(Lurong Pan): Of course. I would say my journey began with my undergraduate degree in Applied Chemistry. Afterwards, I developed my interest in the field further while doing my PhD in Chemistry specializing in Computational Chemistry, which led to my further academic endeavors through my post-doc in Structural Biology, while studying for a master’s degree in Artificial Intelligence. What I would say has been the common driver through my ten year long academic career is the desire to try and find the best way to leverage computational methods to predict biological events – such as molecular properties, how interactions between different molecules play out, and others, particularly with regards to disease pathophysiologies.

    PF(PharmaFeatures):潘博士,很高兴你能来到这里。到目前为止,你在生命科学领域经历了一段有趣的旅程,并最终创立了圆壹智慧。可以多谈一点关于你的个人背景,以及是什么激励和驱动着你吗?

    LP(Lurong Pan):当然。我认为我的旅程始于我的应用化学本科学位。后来,我在攻读计算化学的化学博士学位时,进一步发展了对该领域的兴趣,继而通过结构生物学的博士后阶段,同时攻读人工智能硕士学位,进一步进行了学术努力。我想说的是,在我十多年的学术生涯中,一个持续的驱动因素是,我希望找到利用计算方法来预测生物事件的最佳方法,例如分子性质、不同分子之间如何相互作用等等,特别是在疾病的病理生理学方面。

    PF:How would you say these experiences shaped you and your approach to modern bioinformatics?

    LP: Among all the available computational methods I came across during my time in academia, I kept noticing countless limitations – which kept pushing me forward to look for the next best solution. I moved from approaches such as molecular mechanics docking, molecular dynamics and quantum mechanics to more informatics-based, machine-learning based matters to finetune predictions down to a microscale level of biological properties. But it is also crucial to integrate all these methods, and the properties they predict, to produce a comprehensive predictive platform. This would enable estimations for valuable applications, such as the behavior of drugs in different layers of biology. My academic experience engendered me with the background to ask these questions – my experience of integrating data, which is often a big bottleneck, in industry provided me with the tools to start answering those questions. 

    PF:你认为这些经历如何塑造了你和你的现代生物信息学方法?

    LP:在我在学术界期间遇到的所有可用计算方法中,我一直注意到无数的局限性,这促使我不断寻找下一个最佳解决方案。我从分子力学对接、分子动力学和量子力学等方法转向更基于信息学和机器学习的问题,将预测微调到生物特性的多尺度水平。但是,整合所有这些方法及其预测的特性,以生成一个全面的预测平台,也是至关重要的。这将有助于估测有价值的应用,例如药物在不同生物层面中的反应。我的学术经验为我提供了提出这些问题的背景,而我在行业中整合数据(这通常是一个很大的瓶颈)的经验,则为我提供了开始回答这些问题的工具。

    PF: And how would you say you went about answering these questions – any formative questions you could recall with using this expertise? 

    LP: I would say one of my most formative experiences was when I joined a group of scientists to build the Global Health Drug Discovery Institute, a non-profit institute founded by the Bill & Melinda Gates Foundation, Tsinghua University and the Beijing Municipal government, aiming to leverage Chinese expertise to solve global health problems. We built our very own team of computational AI scientists, creating a platform to provide a holistic, open-source, free AI platform for drug discovery to support projects working on problems such as malaria, and other diseases causing unnecessary burdens in the poorest parts of the world. We also provided our expertise and data for COVID study, being one of the first groups to release COVID-related AI models and technologies – regardless of whether it would lead to publication or not; a lot of our work was actually published on GitHub!

    PF:那么你是如何用这些专业知识来回答这些问题的呢?你能回想到哪些具有重大意义的问题吗?

    LP:我想说,对我最有影响的经历之一是加入一个科学家小组并共同打造了全球健康药物研发中心(GHDDI),这是一个由比尔和梅琳达·盖茨基金会、清华大学和北京市政府联合发起成立的非营利性新药研发机构,旨在利用国内的专业知识解决全球健康问题。我们建立了自己的AI科学家团队,创建了一个全面、开源、免费的药物发现AI平台,以支持解决在世界最贫困地区造成不必要负担的疾病问题,如疟疾等等。我们还为新型冠状病毒研究提供了专业知识和数据,是首批发布新型冠状病毒相关AI模型和技术的团队之一,不管其成果最终是否会发表。事实上,我们的很多工作成果最终都发表在GitHub上!

    PF: Is that one of the main reasons you then went on to found Ainnocence? 

    LP: Yes, subsequent to these experiences, I felt truly equipped to build a truly comprehensive data-driven AI model. We think that leveraging AI and big data is a new way of doing research, on a global, much more collaborative scale. We named it Ainnocence to hint at the ethical dilemmas presented by Artificial Intelligence. Our view and belief is that AI need not raise ethical concerns when constructed and managed appropriately, hence the innocence. We focused on creating a self-evolving, high throughput system, but with low energy consumption and high portability through the cloud. Our aim is to translate our lived and accumulated experiences into successes for many people seeking to produce life-extending and life-saving therapies, accelerating pipeline development while reducing costs. 

    PF:这是你后来创立圆壹智慧的主要缘由之一吗?

    LP:是的,在这些经历之后,我觉得自己真正具备了构建一个全面的数据驱动AI模型的能力。我们认为,在全球性、更具协作性的尺度上,利用AI和大数据是一种新的研究方式。我们将公司英文名命名为Ainnocence,这个我们自创的词中暗含AI可能带来的伦理困境问题。我们的观点和信念是,AI在恰当的构建和管理之下,无需引发伦理上的忧惧,因此它也是纯真(innocence)的。我们专注于创建一个自主进化的、高通量的系统,在云平台上具有低能耗性和无限可扩展性。我们的目标是将我们过往积累的经验,成功地运用在延长和挽救生命的疗法中,加快管线开发效率,同时降低成本

    PF: What would you say is the unique brand of Ainnocence – with regards to values, and perhaps the impact you seek to have on the world? 

    LP: I have always held a deep appreciation for the medical practice in general – perhaps because I come from a family of doctors to begin with. I think that decreasing the global burden of disease is a noble goal, and one of the most direct routes towards having an indubitably positive impact on society. And I am not merely referring to easily preventable disease – although it is a tragedy that we live in a world where such conditions claim so many lives and years. I am also referring to mental disease, which has long suffered from a lack of formal investigation. We have seen how collaboration can bring about rapid change, particularly with collaboration. And that is the goal we seek to achieve with Ainnocence: leveraging our own expertise in bioinformatics to translate it to improved health outcomes. 

    PF:就价值观或者你想对世界产生的影响而言,你认为圆壹智慧的独特品质是什么?

    LP:总的来说,我一直对医疗工作怀有深切的欣赏,这可能和我来自医生家庭有关。我认为,减轻全球疾病困扰是一个崇高的目标,毫无疑问,它也是对社会产生积极影响的最直接途径之一。我指的不仅仅是容易预防的疾病——尽管在我们生活的世界里,这些疾病也夺走了相当多的生命,这无疑是悲剧。我也指长期以来缺乏正式研究的精神疾病。我们已经看到协作可以带来快速变化,而且尤其是协作本身。这也是我们希望通过圆壹智慧实现的目标——将我们在生物信息学方面的专业知识,转化为促进健康的结果

    PF: You spoke at length about collaboration – but how do we balance collaboration with competition, so that the two can coexist? 

    LP: That is a good, and open question, I would say. I do not think the industry has yet reached a point where we can say we are at an ideal equilibrium of collaboration with competition – but they can definitely coexist, when balanced appropriately. AI, for example, is mostly algorithms and mathematic formulae: it is easy for it to be open. But anything data-related raises many more questions regarding collaboration: data ownership, data security, data usage. Data is an asset, and it must not only be balanced by market concerns, but also through regulatory, privacy and ethical concerns. But high quality data can also lead to significantly improved AI models, and I think that is where collaboration should truly come in. Bringing different data owners together, to construct more powerful AI models that everyone can benefit from – without compromising a single party’s data. To reach a point where that happens regularly however, we need to overcome many challenges, such as data fragmentation, industrial and academic siloes. Doing so will require work from an industry-wide scale, but I think it is the best option for the future of healthcare and pharma. 

    PF:你经常谈到“合作”。但是我们如何平衡合作与竞争,使两者能够共存?

    LP:我想说,这是一个很好的开放性问题。我认为这个行业还没有达到一个合作与竞争的理想平衡点——但如果恰当平衡,它们肯定可以共存。AI主要是算法和数学方案:它很容易开放。但任何与数据相关的东西都会引发更多关于协作的问题:数据所有权、数据安全性和数据使用。数据是一种资产,它不仅需要通过市场来平衡,还必须通过监管、隐私和伦理相关来平衡。但高质量的数据可以显著改进AI模型,我认为这才是真正需要协作的地方——将不同的数据所有者聚集在一起,构建更强大的AI模型,使得每个人都可以从中受益,而不损害任何一方的利益。然而,要达到让这种情况经常发生的程度,我们需要克服许多挑战,例如数据碎片化、工业和学术孤岛。这样做需要在整个行业层面上开展工作,但我认为这是医疗保健和制药行业未来的最佳选择。

    PF: You also spoke about the capacity for AI to be innocent, as you put it or perhaps a bit more malevolent. But, do you think we’re quite there yet? Where AI is actually an artificial intelligence that can make its own decisions and bring good or harm to the world?

    LP: I do think we could be there if we wanted; whether AI can have decision-making impact is a function of whether we have delegated such capabilities to it. Obviously, I do not think society has reached a consensus on whether we want to do that yet – and there should be a strong regulatory framework and consensus before we do so. Currently, it is most often employed as a sort of “optimizer”. In this application, AI acts more like an intelligent agent optimizing and reiterating its own self to achieve the goals it was tasked with. In this sense, I do not think that AI can be malevolent; but there can be malevolent goals. AI can definitely be more efficient than humans in a multitude of applications, but maintaining a human involved in processes which can impact decision-making should remain a necessity for the time being. 

    PF:你谈到了——用你的话来说,AI的“纯真”,那么它也可能具有恶意。但是,你认为我们已经到达AI可以自己做出决定,给世界带来好处或坏处的这样一个阶段了吗?

    LP:我确实认为,如果我们想的话,我们是可以让AI做到的。AI是否能够产生决策影响,取决于我们是否已将此类能力委托给它。显然,我认为社会还没有就我们是否要这样做达成共识——这样做的前提是要有一个强有力的监管框架和普遍共识。目前,AI则最常被用作一种“优化器”。在应用中,AI的作用更像是一个智能代理,优化、迭代自身,以实现其被(人类)给予的任务目标。在这个层面上,我不认为AI会具有恶意,但有可能会被灌输恶意的目标。在许多应用中,AI肯定比人类更高效,但目前仍有必要让人类参与到可能影响决策的过程中

    PF:We saw something similar in multiple papers exploring bias in clinical studies or lack of diversity. And many people are afraid that if we introduce our own biases to models, the models might amplify them, right?

    LP:Absolutely. In most implementations, AI currently acts as an accelerator rather than having its own judgment. If bias is introduced to the system, it will likely amplify it. This is why I think it is crucial to be very considerate with how our data is constructed, and how our own models are trained – because this can lead to a butterfly effect of sorts, where originally small problems are later magnified.

    PF:我们在多篇探讨临床研究中的偏倚或缺乏多样性的论文中看到了类似的情况。许多人担心,如果我们将自己的偏倚引入模型,模型可能会放大这些偏倚,是这样的吗?

    LP:肯定的。AI目前在大多数实践中充当加速器,而不是有自己的判断。如果在系统中引入偏倚,它可能会放大这些偏倚。这就是为什么我认为——非常仔细而审慎地考虑我们的数据是如何构建,以及我们自己的模型是如何训练——是至关重要的,因为这可能会导致最初的小问题后来被放大,形成某种蝴蝶效应。

    PF: Are there any more specific applications of AI that you will be excited to see over the coming years? 

    LP: Quite a few. I think, for example, in biologic drug discovery, AI can analyse more complicated and heterogeneous datasets, through multiomics and better data integration – particularly for phenotypic drug discovery approaches. Obviously, a lot of other areas beyond that are being touched upon by AI – like diagnostics. I feel that AI will make its way to a majority of industrial spaces, at least in the beginning – before it settles on high-impact, cost-effective niches. I solidly believe drug discovery will be one of those, if only because of the sheer complexity of the process and predictive mechanisms needed. 

    PF:在未来的几年里,你会很高兴看到AI有什么更具体的应用吗?

    LP:很多。我认为,例如,在生物药发现中,AI可以通过多组学和更好的数据集成来分析更复杂和异构的数据集,尤其是对于表型药物发现方法。显然,除此之外的许多其他领域,如诊断,也正在被AI所触及。我觉得AI将进入大多数工业领域,至少在一开始是这样的——最终它会达成高影响力、高效益的目标。我坚信药物研发将是其中一个领域,因为其过程的超高复杂性和对机制预测的迫切需求。

    Nick Zoukas - PharmaFeatures主编

    毕业于牛津大学生物科学专业,在医疗保健、政策和病毒基因组学以及其他领域拥有丰富的经验和兴趣。他也十分关注生命科学领域的最新趋势,如AI药物研发。

    潘麓蓉博士 – 圆壹智慧创始人兼CEO

    在疾病生物学研究和药物研发领域的计算技术开发与应用方面拥有超过14年的经验,疾病领域涵盖神经退化性疾病、心血管疾病、癌症、罕见病和传染病。曾担任美国阿拉巴马大学伯明翰分校医学院研究员,工程院交叉学科中心计算总监,全球健康药物研发中心(GHDDI)人工智能部门负责人、副主任研究员。

    原文链接:

    https://pharmafeatures.com/int-lurong-ainnocence/