国家生物信息中心开发针对长读长宏转录组数据的剖析工具Fungen
微生物在维持生态系统的稳固性和功效中饰演着至关主要的角色。细菌和古菌等原核生物的多样性及其功效已经被普遍研究,只管真菌及其他真核微生物在生态系统中同样施展着要害作用,但由于缺乏高质量的参考基因组,且其基因功效研究相对滞后,真核微生物的基因多样性和代谢潜力仍未被充分探索。
近年来,长读长测序手艺的兴起,为研究真核微生物的转录组提供了新机缘。长读长宏转录组(Long-read metatranscriptomics)测序成为剖析重大情形中真核微生物活性基因的强盛工具。然而,该手艺在应用历程中仍然面临着两个主要挑战:一是缺乏高质量的参考基因组,二是测序过失率较高。
Fungen:突破长读长宏转录组剖析瓶颈的新要领
针对上述挑战,国家生物信息中心高远团队开发了一款名为 Fungen 的立异性软件工具,Fungen是一种针对长读长宏转录组数据的剖析要领,能够在不依赖参考基因组的情形下,对长读长测序数据举行基因水平的聚类和测序过失校正,以更高效、更精准的方法剖析情形样本中的真核微生物转录本,相关研究克日揭晓于Science China Life Sciences 期刊。
Fungen的焦点优势在于其高效的算法设计,通过结适用于读段聚类的minimizer 3-mer快速匹配和网络数据结构,实现了对宏转录组数据的快速处置惩罚。与现有工具相比,Fungen不但镌汰了盘算资源占用,还在速率上相较现有要领提升了22至56倍。别的,Fungen战胜了近缘物种之间同源基因相似性带来的挑战,通过奇异的算法设计,能够准确地区分这些相似基因,从而获得高精度的转录本序列。
Fungen在真真相形数据中的应用
为了验证Fungen在真实宏转录组数据中的应用价值,研究团队使用该工具剖析了多种情形样本的长读长测序数据,包括宏转录组的模拟数据、真菌的合成宏转录组数据、远洋海水的direct RNA测序数据以及多种情形的全长rRNA扩增子测序数据。效果批注,Fungen不但能够对测序读段举行可靠的基因水平聚类,还能获得高精度的转录本序列。
值得一提的是,当应用于农田与湿地土壤的高深度 cDNA 测序数据时,Fungen能够在真菌物种水平上重修原位基因表达动态,展现了植物病原真菌在土壤情形中的特殊生涯战略,为明确植物病原真菌的生态行为提供了新的视角。
Fungen的意义与展望
Fungen为剖析重大的宏转录组全长数据提供了快速和准确的解决计划。其无参考基因组的要领不但适用于海洋、土壤等重大情形样本的研究,还为展现真核微生物的多样性和功效提供了要害手艺支持。
未来,随着长读长测序手艺的一直前进,Fungen可望被应用于更多情形微生物学、生态学和医学研究领域,例如人类肠道微生物组、真菌病原体判断、工业微生物代谢研究等,为探索微生物天下的神秘提供更强盛的工具支持。
该研究获得了国家重点研发妄想、九游会j9前瞻战略科技先导专项(A类先导专项),北京市优异青年科学基金等项目资助。
Fungen的焦点事情流程
Fungen在线软件
论文链接