发现病毒变种的进展因菌株而异。然而,在人工智能的帮助下,美国能源部阿贡实验室的一组研究人员终于开发出一种追踪病毒进化的新技术。万博体育登录首页

目前,他们正在努力确定SARS-CoV-2是如何演变的,以便最终发现更多关于这种病毒未来变体的信息。

追踪COVID-19变异的基因组序列

研究人员训练大型语言模型来识别病毒如何进化
(图片来源:Fusion Medical Animation from Unsplash)

根据长成这样,美国能源部阿贡实验室的科学家被誉为2022年戈登·贝尔基于高性能计算的COVID-19研究特别奖的获得者。

他们与其他合作者一起发表的新论文旨在了解基因组序列如何帮助确定COVID-19变体。

通过人工智能,研究人员开发了大型语言模型或llm,其工作原理是预测第一个训练阶段出现的下一个单词。

语言数据集还通过将英语文本翻译成西班牙语来帮助学习过程。话虽如此,人工智能驱动的工具有助于快速跟踪llm,以了解病毒突变为致命变体的情况。

一种病毒的进化开始于成为一种更危险的病毒。科学家们过去常常将这些致命的变体归入VOC类别或关注的变体。

这种方法可以帮助他们了解这种变体的情况,这样他们就可以创造新的治疗方法,以及对抗病毒的新疫苗。

阿贡大学的计算生物学家阿温德·拉马纳坦说:“当大流行开始时,我们有几种非常有害的病毒变种,比如Delta变种。”

他们的论文题为GenSLMs:基因组尺度语言模型揭示SARS-CoV-2的进化动态包括一个训练有素的模型,该模型将跟踪VOCs和相关基因。

此外,科学家们还对COVID-19期间获得的数据进行了培训,旨在为卫生组织和官员提供一种识别VOCs的有效工具。

GenSLM与VOC识别非常相似,但不同之处在于它依赖于基因组尺度的基础模型。

相关文章:科学家从西伯利亚永久冻土中复活了古老的“僵尸病毒”

大型语言模型如何帮助科学家

在此之前,专家们只知道LLMs能够识别蛋白质在其结构内是如何进化的。这一次,Ramanathan和其他科学家首次在基因水平上使用了这个模型。

该研究的合著者Venkatram Vishwanath表示,大型语言模型有助于“在不同的科学领域实现人工智能的科学愿景”。

早期的测试证明,LLMs追踪蛋白质的进程是有效的。后来,他们发现他们也可以使用相同的模型跟踪VOCs医疗Xpress。

阿贡实验室语言模型研究的成功也归功于超级计算资产。这些任务不仅通过人工智能有效地分配。更强大的工具也参与了这项研究,包括Selene和Polaris,这两台得益于gpu的超级计算机。

读也:香港致力移除90%错误青霉素过敏标签

约瑟夫亨利
(图片来源:科技时万博体育登录首页报)
corber2万博体育登录首页022 TECHTIMES.com未经允许,请勿转载。