作者:记者 廖洋 周文燕 来源: 发布时间:2026-3-27 19:41:29
选择字号:
创新算法为海量病毒“验明正身”

   病毒是地球上最小且丰度最高的非细胞生物,其不仅对人类健康产生深远影响,而且是全球生物地球化学循环的幕后推手。它们如同隐形的“生态工程师”,调控微生物群落结构,驱动碳、氮等元素的全球循环。随着宏组学技术的迅速发展,人们发现了海量未知的脱氧核糖核酸(DNA)和核糖核酸(RNA)病毒。然而,全球约99%的病毒仍处于“黑户”状态——未被分类或命名。

   日前,中国海洋大学海洋生命学院和海德学院教授汪岷团队传来好消息,他们基于序列比对和图论方法,开发出病毒分类新工具——VITAP(Viral Taxonomic Assignment Pipeline),为病毒组学和病毒生态学研究提供了重要工具。近日,相关研究成果发表在《自然—通讯》上。

   “进入VITAP系统界面,输入一段基因序列,命令行瞬间输出从门到属的分类结果。这就像给病毒发‘身份证’,流程缩短至几分钟。”研究共同通讯作者、中国海洋大学海洋生命学院教授梁彦韬解释。

 

传统分类遇瓶颈

 

   “病毒分类如同给未知星系命名,我们已知的仅是冰山一角。”梁彦韬表示。

   过去鉴定病毒需要接近完整的基因组,但在现实中,科学家从环境样本中发现的病毒基因往往是碎片化的,传统工具难以识别。随着宏组学技术的发展,病毒基因组数据从2018年的5000多种,激增至如今的1000多万条序列。同时,病毒分类标准变化非常快,这让分类工具“捉襟见肘”,如同用老地图导航新大陆,结果自然漏洞百出。

   这些问题限制了人们对环境中复杂病毒群体的深入解析。因此,如何准确细致地对环境病毒进行分类,成为当今生物学、医学与生态学研究领域亟待突破的重要挑战。

   汪岷团队在研究海洋病毒时,也面临病毒分类的难题。

   “研究病毒,首先要知道其分类情况,属于哪一科、是什么类型的,再去确定它的宿主类型。传统的培养方法有很多弊端,如培养周期长、效率低。我们想从基因组学层面,通过算法快速、大批量分类病毒,提高准确率和效率。”梁彦韬说。

   于是,跨学科协作成为破局关键。拥有海洋生物学背景的成员提供生态视角,计算机专家优化算法,国际合作帮助引入前沿经验……研究共同通讯作者、澳大利亚塔斯马尼亚大学教授Andrew McMinn每周参与线上讨论,计算病毒学国际专家David Paez-Espino博士每月参与线上研讨,“时差会议”成为常态。

   “国际视野可以让我们进步更快、少走弯路。”团队成员感慨。  

 

从试错到最优路径

 

   2023年初,团队开启病毒分类新工具VITAP的研发工作。最初的设想是用人工智能(AI)训练模型,但病毒数据的高度多样性让AI“水土不服”。

   “病毒没有像动植物那样的‘标准证件照’,训练样本的匮乏让AI举步维艰。”研究第一作者、中国海洋大学海洋生命学院博士生郑凯阳回忆。团队转而回归传统方法,从序列比对和图论中寻找突破口。  

   序列比对如同人脸识别,通过基因片段寻找相似病毒;图论则像构建社交网络,分析病毒间的亲缘关系。团队创新性地将两者结合,寻找解决问题的“最短路径”——为每条病毒基因筛选出从门到属的最佳分类谱系。

   为提升准确性,团队为不同基因赋予权重。“这相当于给病毒基因贴上动态标签,即便是碎片化基因也能精准溯源。”研究共同第一作者、中国海洋大学海德学院助理教授孙建华比喻道。

   研发过程充满“试错”。例如,针对长基因组病毒,团队一度陷入“盲人摸象”的困境。“长基因组被‘切碎’后,每段特征模糊,就像把一头猪分割后,单凭一块肉很难判断其部位。”郑凯阳说。

   最终,团队通过动态权重调整,测试国际病毒分类委员会(ICTV)报道的1.8万多种病毒参考基因组,实现了高置信度分类。测试显示,VITAP在科级和属级的分类分析中,不仅能保持超过90%的准确率、精度和召回率,还显示出优于其他方法的注释率。具体而言,对于1000碱基对的短序列,VITAP在所有病毒门中的注释率均优于其他方法;在近完整基因组的分类中,VITAP对RNA病毒和大部分DNA病毒也表现出更高的注释率。

 

绘制生态蓝图

 

   “用户友好”是VITAP的一大亮点。传统工具安装复杂、更新滞后,VITAP能够实现“一键安装”以及与ICTV自动同步。上线后,VITAP下载量迅速突破2000次,被广泛应用于海洋、医学等领域研究。

   VITAP在保证高准确率的前提下,实现了更全面、稳定的病毒分类,并为病毒基因组学、分类学和生态学研究提供了一个高效的自动化新工具,就像给病毒研究装上了“智能搜索引擎”,让科学家能更快、更准地给海量病毒“验明正身”,无论是完整的还是碎片化的基因,都能高效分析。这对于理解病毒在自然界的角色、应对公共卫生问题有重要意义。

   未来,团队计划引入AI生成新病毒类群,突破现有分类框架的局限。“当前工具只能‘上户口’,下一步要让‘黑户’自立门户。”郑凯阳透露。

   在应用层面,VITAP将助力极地、深海等极端环境病毒研究,快速解析环境中庞大而复杂的病毒群落,了解它们如何影响生态系统。医学上,可更高效地发现与疾病相关的新病毒,辅助追踪流行病。

   “未来,我们会开发更多病毒学的生物信息工具,致力于南极、北极、马里亚纳海沟、青藏高原等极端环境的病毒研究,构建海洋病毒基因组数据库。”汪岷说。■

(作者周文燕单位为中国海洋大学)

 
 打印  发E-mail给: