Skip to content

动植物特殊物种的单细胞注释方法讨论

前言

单细胞测序技术已广泛应用于人类、小鼠等模式物种,但在动植物特殊物种中,由于基因组注释不完善、研究较少等原因,在数据质控、细胞类型注释和功能分析等环节仍面临诸多挑战。本文将简要梳理特殊物种单细胞注释的常用思路和方法,帮助您快速了解相关内容。 本文将分别介绍非人鼠哺乳动物和植物的细胞注释方法,并补充同源基因转换和特殊物种的富集分析思路。文中涉及的参考文献已在文末列出,便于进一步查阅。随着领域不断发展,相关方法也在不断丰富,欢迎与我们交流探讨。


一、细胞注释方法

1. 非人鼠哺乳动物

对于动物研究,除人类和小鼠外,还有一些物种(如斑马鱼、线虫、果蝇等)已有较多研究,这类物种可以直接参考同物种的相关文献。例如,研究果蝇心脏发育的单细胞文章就参考了果蝇的相关基因特征[1]。然而,对于如鸡、牛、海鞘等研究相对较少的非模式物种,细胞注释可参考以下方法:

1.1 marker基因注释
  • 优先查找同物种文献:如有同物种的单细胞研究,优先参考其细胞注释所用的marker基因。
  • 参考近缘或模式物种:如同物种资料不足,可借鉴近缘或模式物种的相关文章,动物也可直接参考人/鼠的同源基因。
  • 结合保守基因功能:如以上均不能满足,可关注在未知细胞群中特异表达的基因,结合其已知功能特征推断细胞类型。一些具有保守功能或表达特征的基因也可作为参考。例如,研究鸡发育过程的单细胞文章就利用了保守基因进行注释[2]。
1.2 同源基因转换
  • 将该物种的基因转换为人类等研究较多物种的同源基因,再用这些基因进行细胞注释。这样可以充分利用人类丰富的基因功能和表达信息。例如,鸡视网膜的单细胞研究在跨物种比较时就采用了同源基因转换[3]。
1.3 差异基因富集分析
  • 对每个细胞群的差异基因进行功能富集分析(如GO/KEGG),结合富集结果描述细胞群特征。此方法主观性较强,但在缺乏注释信息时非常有用。通常先获得各未知细胞群的差异基因,再进行单基因或基因集的通路富集分析,结合富集结果来描述和定义细胞群特征。

2. 植物

对于植物,模式物种如拟南芥、水稻、烟草等已有较多研究,可直接参考同物种的相关文章。对于研究较少的物种,也可借鉴以下思路,并结合实验手段辅助注释:

2.1 marker基因注释
  • 优先查找同物种文献:如有同物种的单细胞研究,优先参考其细胞注释所用的marker基因。例如,拟南芥数据可直接参考其经典marker基因,并结合基因集打分等方法[4]。
  • 需注意,不同基因组版本的差异可能带来额外困难,如基因注释不一致、基因名不同等,建议提前核查。
  • 参考近缘或模式物种:如同物种资料不足,可借鉴近缘或模式物种的相关文章。例如,油茶可参考茶树或拟南芥的相关研究[5]。
  • 结合保守基因功能:如以上均不能满足,可关注在未知细胞群中特异表达的基因,结合其已知功能特征推断细胞类型,例如保守基因的功能特征。
2.2 同源基因转换
  • 将该物种基因转换为拟南芥等模式植物的同源基因,利用其丰富的表达信息和功能注释,作为参考。
2.3 差异基因富集分析
  • 同样地,对于研究较少的物种,可通过富集分析确定细胞群特征[5]。先获得各未知细胞群的差异基因,再进行单基因或基因集的通路富集分析,结合富集结果描述和定义细胞群特征。
2.4 实验验证
  • 如条件允许,可对未知细胞群的top差异基因进行RNA原位杂交等实验,直接验证基因表达分布。例如,一篇研究水稻的文章参考了经典marker,并结合原位杂交实验来定义部分细胞群[6]。

3. 注释结果的验证

  • 可以利用公共数据来辅助判断注释的可靠性。例如,可以计算细胞群与公共数据的表达相似性[7];也可以基于微阵列数据的基因表达信息来验证细胞注释结果[8];Wendrich等人将细胞群的top20差异基因与公共数据进行比较来确定细胞类型[9]。若存在已注释好的细胞类型表达谱,也可以通过SingleR、CellTypist等工具来自动注释。进一步,也可与已知细胞类型的单细胞数据进行整合分析,提高注释准确性。

二、同源基因转换方法

下面介绍几种常用的同源基因转换方法。

1. 代码工具

  • biomaRt:R包,支持Ensembl数据库的跨物种基因同源转换(支持125个动物类别和233个植物类别)。
  • homologene:R包,基于NCBI HomoloGene数据库,支持基因同源映射(支持21个物种)。
  • babelgene:R包,聚合多数据库信息,支持基因同源映射(支持19个物种)。

2. 在线工具

3. 序列比对

  • 数据库里能够进行同源转化的物种是有限的。对于数据库不支持的物种,可用BLAST等工具进行序列比对,结合InterProScan等工具预测蛋白功能。

三、特殊物种的富集分析

  • 特殊物种在富集分析上也有一些常用手段。常见富集分析工具需要相应的注释数据,例如Bioconductor的OrgDb,但该数据库目前仅包含了20个物种的注释数据集。对于数据库不支持的物种,可以首先尝试同源转换;其次也可以考虑用InterProScan、KOBAS等工具手动构建注释库,即先进行序列比对和功能注释,再进行GO/KEGG富集分析。

结束语

特殊物种的单细胞注释虽然面临挑战,但通过参考文献、同源基因转换和功能富集等方法,依然可以获得较为可靠的注释结果。希望本文能为您提供实用的参考。


参考文献

  1. Huang X, Fu Y, Lee H, et al. Single-cell profiling of the developing embryonic heart in Drosophila. Development. 2023;150(16):dev201936. doi:10.1242/dev.201936.
  2. Williams RM, Lukoseviciute M, Sauka-Spengler T, Bronner ME. Single-cell atlas of early chick development reveals gradual segregation of neural crest lineage from the neural plate border during neurulation. Elife. 2022;11:e74464. Published 2022 Jan 28. doi:10.7554/eLife.74464.
  3. Yamagata M, Yan W, Sanes JR. A cell atlas of the chick retina based on single-cell transcriptomics. Elife. 2021;10:e63907. Published 2021 Jan 4. doi:10.7554/eLife.63907.
  4. Yin R, Chen R, Xia K, Xu X. A single-cell transcriptome atlas reveals the trajectory of early cell fate transition during callus induction in Arabidopsis. Plant Commun. 2024;5(8):100941. doi:10.1016/j.xplc.2024.100941.
  5. Zhao S, Rong J. Single-cell RNA-seq reveals a link of ovule abortion and sugar transport in Camellia oleifera. Front Plant Sci. 2024;15:1274013. Published 2024 Feb 2. doi:10.3389/fpls.2024.1274013.
  6. Zhang TQ, Chen Y, Liu Y, Lin WH, Wang JW. Single-cell transcriptome atlas and chromatin accessibility landscape reveal differentiation trajectories in the rice root. Nat Commun. 2021;12(1):2053. Published 2021 Apr 6. doi:10.1038/s41467-021-22352-4.
  7. Brown CC, Gudjonson H, Pritykin Y, et al. Transcriptional Basis of Mouse and Human Dendritic Cell Heterogeneity. Cell. 2019;179(4):846-863.e24. doi:10.1016/j.cell.2019.09.035.
  8. Jean-Baptiste K, McFaline-Figueroa JL, Alexandre CM, et al. Dynamics of Gene Expression in Single Root Cells of Arabidopsis thaliana. Plant Cell. 2019;31(5):993-1011. doi:10.1105/tpc.18.00785.
  9. Wendrich JR, Yang B, Vandamme N, et al. Vascular transcription factors guide plant epidermal responses to limiting phosphate conditions. Science. 2020;370(6518):eaay4970. doi:10.1126/science.aay4970.
0 条评论·0 条回复