Site map
CN EN
2025年07月29日 深圳市仙湖植物园
深圳市仙湖植物园刘阳团队构建用于评估苔藓植物基因组完整性的基因集

  苔藓植物(包括苔类、藓类和角苔类)是陆地植物中仅次于被子植物的第二大类群,全球约有22,000种,对极端环境具有很强的适应性。解析苔藓植物基因组对于揭示其环境适应机制至关重要。然而,目前广泛使用的绿色植物和陆地植物基因集(viridiplantae_odb10和embryophyta_odb10),在应用于苔藓植物基因组完整性评估时存在代表性不足和完整性被低估等问题。

  2025年7月26日,Journal of Genetics and Genomics在线发表深圳市中国科学院仙湖植物园刘阳研究员团队题为“Universal single-copy ortholog benchmark gene set for bryophytes”的研究论文。该研究基于系统发育分析预定义了1930个单拷贝直系同源基因,成功构建了专门运用于评估苔藓植物基因组完整性的基准通用单拷贝直系同源基因集(bryophyte_odb10)。

  该研究通过整合苔藓植物主要谱系(涵盖25目9纲)的27个染色体级别高质量基因组(包括小立碗藓和地钱两大模式物种),开发出包含1930个苔藓植物基准通用单拷贝直系同源基因的数据集。在BUSCO和complexasm两款软件中的可靠性测试结果显示,bryophyte_odb10在预测基因缺失方面与实际情况高度一致,平均偏差仅为0.79%,其准确性优于viridiplantae_odb10 (偏差约为1.54%)和embryophyta_odb10 (偏差约为7.71%)。将该基因集应用于156个苔藓植物基因组和73个苔藓转录组数据评估时,获得的基因完整性比例显著提升,能够更准确地反映基因组和转录组的组装质量。基于bryophyte_odb10基因集获得的单拷贝基因使用BUSCO软件生成的系统发育树,与先前研究结果高度一致。


苔藓植物基准基因集(bry)与绿色植物和陆地植物基准基因集(vir和emb)的比较

A:27个苔藓植物基因组的组装统计;B:基准基因集预期缺失值与预测缺失值比较;C:输入预期缺失值与预测缺失值比较;D:基因组组装完整性比较;E:蛋白集完整性比较;F:转录组完整性比较。




  综上所述,该研究构建的bryophyte_odb10基因集有效解决了长期以来苔藓植物基因组评估中存在的系统性偏差问题,显著提升了基因组完整性评估的准确性,为研究苔藓植物基因组学和系统发育基因组学提供了重要资源。

  深圳市中国科学院仙湖植物园研究助理周徐平为该论文第一作者。深圳市中国科学院仙湖植物园董珊珊副研究员和刘阳研究员为共同通讯作者。相关工作得到深圳市城市管理和综合执法局科研项目资助。

  引用本文:Xuping Zhou, Tao Peng, Jin Yu, Shanshan Dong, Yang Liu. (2025). Universal single-copy ortholog benchmark gene set for bryophytes.Journal of Genetics and Genomics.

  DOI: 1016/j.jgg.2025.07.009