加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 传媒扫描

【中国科学报】空间转录组分析算法哪家强?

2022-05-20 中国科学报 王敏
【字体:

语音播报

  中国科学技术大学生命科学与医学部教授瞿昆课题组设计了一整套分析流程,系统性评估了16种空间转录组和单细胞转录组数据整合算法在预测基因或细胞类型空间分布方面的性能。研究成果5月16日在线发表于《自然—方法学》。

  “细胞在组织器官内所处的空间位置,与其发挥生理功能或疾病产生过程密切相关。”论文共同第一作者、中国科学技术大学生命科学与医学部特任副研究员郭闯介绍。

  近年来,研究者开发了多种空间转录组技术,在保留细胞精确空间定位的同时,检测细胞内全转录组的表达情况,以此来研究在发育或疾病发生发展过程中起关键性作用的细胞亚群及其分子机制。

  但目前空间转录组技术存在两个不足,一是基于测序的空间转录组技术无法实现真正意义上的单细胞分辨率;二是基于成像空间转录组的技术能检测到的基因通量有限。

  为了突破技术的局限性,生物信息学家设计了多种算法整合空间转录组与单细胞转录组数据,预测细胞类型的空间分布和/或单个细胞的完整转录组信息。这些算法大大加深了人们对空间转录组学数据及相关生物学和病理过程的理解。

  然而,这些整合算法的工作原理和适用范围存在显著差异,研究者很难选择出最佳算法。

  瞿昆课题组长期致力于开发生物大数据分析算法和软件。在此项研究中,课题组收集了45对同一组织来源的空间转录组与单细胞转录组数据集、32个模拟数据集,并设计了多种指标,从准确性、鲁棒性、计算资源耗时等多维度系统性评估了16种整合算法的性能。

  结果显示,Cell2location、SpatialDWLS和RCTD算法能更加准确地预测细胞类型的空间分布;Tangram、gimVI和SpaGE算法则是预测基因表达空间分布的最佳算法。Tangram、Seurat和LIGER计算效率相对较高,适合处理大规模数据集。

  该研究总结了每种算法的属性、性能和适用性,以及高效算法的优势,为研究人员进一步提升算法性能提供了参考。同时,研究人员还在GitHub网站上提供了整合空间转录组和单细胞转录组数据的分析流程,有助研究人员在处理数据时选择最佳分析工具。

  相关论文信息:https://doi.org/10.1038/s41592-022-01480-9

  (原载于《中国科学报》 2022-05-20 第1版 要闻) 
打印 责任编辑:阎芳

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)