今年,信使核糖核酸(mRNA)在全球新冠病毒疫苗开发竞赛中成为英雄,向公众介绍了它。科学家在实验室中设计了mRNA来指导人类细胞如何识别并破坏刺突蛋白,而刺突蛋白是病毒的入口。
这种高效而精确的方法让我们得以一窥mRNA技术的威力。信使RNA有一天可以帮助人体以同样的效果治疗癌症等疾病。
弗吉尼亚大学工程与应用科学学院计算机科学副教授齐延军可能是实现这一目标的关键。
快乐联盟DNA是人类的遗传密码,掌握着指导细胞执行所有生物功能的指令。信使RNA将这些指令传递给细胞。科学家们希望利用人体的dna - mrna -细胞作用通路——一个被称为基因表达的过程——来进行精准医疗。
然而,在这种可能性成为现实之前,研究人员必须发现我们DNA中的基因通过信使RNA发送的指令是什么。
Qi处于这一发现的前沿。她正在使用强大的深度学习模型来分析生物医学数据,以揭示基因和信使RNA如何相互作用。
“DNA指令之间的关系;它们的信使rna;对于大多数疾病来说,它们是如何指导细胞活动的还不是很清楚。”“我们试图了解的是dna -信使- rna这一步骤,因为它告诉我们遗传密码是如何与疾病的表达联系在一起的。”
发现这些联系可能会导致未来的高靶向治疗。就像信使rna可以指示细胞阻止病毒入侵身体一样,DNA的信使有朝一日也可以在疾病还未形成之前,就根据相关指令武装细胞,建立起对抗疾病的一线防线。
他强调,这幅作品处于发现的最早阶段。
“大量关于基因密码的数据正在被汇编,”她说。“问题是如何从这些数据中获得有用的意义。我们正在创造人工智能工具来发现目前完全未知的东西。我们谈论的是长期目标,我们相信我们会实现这个目标。”
深远的终点线反映出这项任务的巨大规模。人类的遗传密码包含了60亿个有助于基因表达的数据点,这些数据点与人体的1013个(1000万个)细胞相连。
“从基因到信使rna再到执行数百万项功能的蛋白质,都有生物学途径,”齐教授说。“将如此大量的细节解码成疾病的特定途径是一项艰巨的任务。”
这就是强大的人工智能计算机模型发挥作用的地方。它们可以检测数据中的模式,从而更容易找到这些连接。
“一个模型可以从它以前看到的东西中归纳出推论,并将其应用到未知的事物上,从而更快地识别出新的东西,”齐说。“每一个新发现都有助于缩小正在进行的搜索的焦点,因为计算机正在从数据的历史中学习,以识别基本规则。”
当新规则被发现时,研究人员可以推断出它们,并超越现有的知识。
作为兼职教员在UVA医学院公共卫生中心的基因组学和数据的UVA学校科学、气与生物医学模型的不同领域的研究人员更好地理解基因编码的数据及其与疾病的关系。
对科学的整体和自然方法的终生兴趣,加上创造数学工具来解决复杂问题的强烈愿望,让“气”走上了人工智能与生物学和医学重叠的道路。
“计算机科学是一种技能和工具,因为我们创建的算法是不可知论的,可以处理任何任务,”她说。“一个好的工具可以深刻地解决这个任务。”
自2013年加入UVA工程以来,Qi与公共卫生基因组学中心的居民、医学院公共卫生科学系助理教授Clint L. Miller进行了最长时间的合作。他们两人创建了一种工具,可用于研究与心血管疾病风险相关的遗传因素的特定数据。
米勒最初是在他实验室的一名学生表示有兴趣学习更多的人工智能方法时,向齐勇寻求专业知识的。
“第一次见面后,我们意识到我们有互补的研究项目和相似的兴趣,所以我们自然开始合作,”他说。
Miller指出,由于DNA测序成本的直线下降,再加上可扩展的计算分析工具的兴起,基因组医学和基因信息药物发现领域正在迅速发展。
他说:“我们现在正处于一个关键的拐点,可以利用大规模人类遗传数据集与基于人工智能的预测算法的集成来开发下一代精准药物。”“我们在这一领域工作的目标是加快基因药物的发现和转化。阳城之窗”
在生物医学工程、生物化学和分子遗传学领域担任二级职位的米勒认为,创新的关键在于跨越学科之间的知识鸿沟。通过将他在疾病生物学方面的专业知识与齐向东在机器学习方面的知识相结合,他们希望能够回答该领域最紧迫的生物医学问题。
在每一次合作中,Qi都将倾听、学习和理解的力量与人工智能模型本身的力量同等权衡。
她说:“我一直在努力开发好的工具。”“为了创造好的工具,你必须了解你的用户。我试图理解与我合作的生物学家试图解决的问题,特别是他们使用的数据。”
今年,她被美国国家卫生研究院(National Institutes of Health)聘为国家数据与技术学者,因其在促进医学研究方面的贡献而获得认可。她将贡献想法和工具,将利用大型基因组数据集,以更好地了解阿尔茨海默病,寻求有效的治疗方法。