Skip to content

单细胞空间转录组分析指南

作者: SeekGene
时长: 15 分钟
字数: 4.3k 字
更新: 2026-06-25
阅读: 0 次
空间转录组 分析指南

单细胞空间转录组技术在保留组织空间位置信息的同时,获取单细胞分辨率的基因表达图谱,能够在原位解析“细胞类型—空间分布—微环境—细胞通讯”的复杂生物学网络。

基于单细胞空间转录组分析,不仅能刻画组织结构的精细分子图谱、识别具有空间特异性的基因表达模式,还可深入解析肿瘤微环境、免疫浸润状态、胚胎发育的空间动态以及脑组织的区域异质性。结合多重细胞通讯与共定位算法,可揭示细胞间复杂的相互作用机制,为生物学基础研究、疾病发病机制探索及潜在靶点挖掘提供强有力的空间证据链。

为帮助用户快速掌握空间转录组数据的挖掘与关键产出,寻因生物提供系统化的下游分析流程与教程,覆盖基础质控与降维聚类、多样本整合、空间微环境(Niche)识别、空间共定位以及多维度的细胞通讯分析等关键环节。每个教程均明确了输入文件规范、适用场景与可解释的输出结果,帮助用户高效完成数据解读与成果转化。


SeekSpace® Tools

SeekSpace® Tools 是寻因生物面向单细胞空间转录组数据的标准化分析软件,以 SeekSoul Tools 为内核处理转录组表达数据,并针对空间组学技术进行了专项扩展。它支持从原始测序数据(表达文库、空间文库、HDMI 文库)与切片图像(DAPI/HE)到细胞级别空间特征表达矩阵的全链路处理。

一站式覆盖了以下核心分析模块:

  • 空间细胞定位:通过解析芯片上空间标签(Spatial Barcode)与细胞标签(Cell Barcode)的映射关系,将单细胞精准定位至芯片的物理像素坐标。
  • 组织图像分割:自动处理组织切片图像,实现组织有效覆盖区域与背景的分割。
  • 下游数据分析:内置 Seurat 和 Scanpy 流程,对定位在组织区域内的细胞执行质控、降维、聚类与差异表达基因分析。
  • 空间可视化:将聚类结果与原位组织图像进行精准重叠展示。

经过 SeekSpace® Tools 处理后,将为后续高级空间挖掘提供高质量的标准输入(包括 filtered_feature_bc_matrix 表达矩阵及附带细胞真实像素坐标的 cell_locations.tsv.gz 文件)。


空间可视化与图像校正

在将空间坐标与组织图像进行重叠展示时,精准的对齐是确保最终可视化呈现效果与业务解读(如直观确认某类细胞是否准确落在肿瘤区或特定组织结构上)可靠性的重要前提。

相关教程

常见问题提示:如果在最终的空间可视化展示中,发现细胞分布散点与底层的 H&E 或 DAPI 组织图像存在明显的对齐偏差(未完全重合),您可以参考上述指南中的相关说明与代码,在保持细胞空间坐标矩阵完全不变的前提下,通过对 H&E 或 DAPI 图像进行放大、缩小、平移及旋转来完成精准对齐,并最终导出修改校正好的组织图像,用于高质量的文章配图或结果展示。


基础分析

在获取空间表达矩阵后,需进行系统的预处理、标准化、降维和聚类分析。同时,面对多样本研究,消除批次效应并将不同切片投射到统一坐标系,是构建一致性空间参考图谱的前提。基础分析的结果是后续所有高级空间挖掘的基础。

相关教程

涵盖了从单样本的质控、标准化(如 LogNormalize 或 SCTransform)、PCA 降维聚类、到 UMAP 可视化,用户可根据自身编程习惯(R 或 Python)选择合适的流程。

输入文件

  • 空间转录组标准输出:SeekSpace® Tools 输出的 filtered_feature_bc_matrix (表达矩阵) 及对应的空间坐标文件。
  • 多样本列表:若进行多样本整合,需提供包含多个样本路径的列表或元数据表。

输出文件

  • seurat_spatial.rds / adata_spatial.h5ad:包含降维(PCA/UMAP)、聚类与空间坐标信息的标准分析对象。
  • 可视化图片:质控小提琴图、空间聚类分布图 (SpatialPlot)、UMAP 图、特征基因空间映射图等。
基础分析示例

空间微环境与聚类分析

空间转录组数据特有的空间邻域信息,使得我们能够超越单纯基于基因表达的聚类,结合细胞的物理位置与邻居信息,定义空间微环境(Microenvironment / Niche)和空间结构域(Spatial Domain)。这对于解析肿瘤浸润边界、复杂组织分层(如大脑皮层)具有重要意义。

相关教程

输入文件

  • 已注释的空间分析对象:经过基础降维聚类或细胞类型注释的 .rds 文件,必须包含有效的空间坐标(如 reductions$spatial)。

输出文件

  • 微环境注释结果:新增的微环境/生态位标签。
  • 可视化图件:空间结构域分布图等。
空间微环境与聚类分析示例

空间共定位与密度分析

为了探究组织内部不同细胞类型、配体-受体对或特定基因在空间上的分布规律,需进行细胞类型的共定位与核密度估计(KDE)分析。这有助于发现哪些细胞类型倾向于在空间上聚集(如免疫细胞与肿瘤细胞的互作区域),或定位关键基因的高表达热点。

相关教程及各软件特性

1. 基于 CellCharter 的空间邻域富集分析

  • 教程链接单细胞空间转录组:空间邻域富集分析
  • 优势:擅长处理高分辨率/单细胞分辨率的空间数据,通过构建 Delaunay 或 kNN 空间邻近图,精确评估细胞类群在空间上的邻近富集或排斥关系。
  • 局限性:主要关注全局的邻域富集统计,对于多尺度(如近程 vs 远程)的空间依赖性刻画不如 MISTy 丰富。
  • 输入:包含细胞类型注释和空间坐标的 AnnData (.h5ad) 对象。
  • 输出:细胞类型间的邻域富集/排斥热图。
空间共定位与密度分析示例

2. 基于 MISTy 的细胞类型共定位分析

  • 教程链接单细胞空间转录组:细胞类型共定位分析
  • 优势:支持多尺度建模,不仅能分析细胞间的直接物理接触(近邻视图),还能基于距离衰减权重分析信号扩散范围内的远距离共定位模式。
  • 局限性:基于机器学习(如随机森林)预测细胞丰度,模型训练时间和内存消耗会随着细胞数量和视图数量显著增加。
  • 输入:包含细胞类型注释和物理空间坐标的 Seurat (.rds) 对象。
  • 输出:不同空间尺度下细胞类型的空间依赖性打分矩阵、MISTy 空间依赖性网络图、重要性分数条形图。
MISTy 细胞类型共定位示例MISTy 空间依赖性网络图

3. 基于 SpaGene 的空间受配体共定位分析

  • 教程链接单细胞空间转录组:空间受配体共定位分析
  • 优势:专门针对受体和配体在空间分布上的相似性进行评估,利用 Earth Mover's Distance (EMD) 等算法量化空间共定位程度,有效筛选具备潜在互作前提的 LR 对。
  • 局限性:仅评估“共定位”这一先决条件,并不直接计算细胞间的通讯概率或推断下游信号传导。
  • 输入:包含空间坐标和基因表达矩阵的 Seurat (.rds) 对象、感兴趣的受配体列表。
  • 输出:受配体对的空间共定位得分排名、特定 LR 对在组织切片上的共定位可视化图。
空间共定位与密度分析示例

细胞通讯分析

空间转录组在解析细胞通讯(Cell-Cell Communication)方面具有天然优势,因为它提供了真实的细胞物理距离限制,避免了传统单细胞测序中“假阳性”的全局通讯推断。结合空间坐标,可以精确定位通讯发生的具体组织区域,识别通讯热点。针对不同的研究需求,我们整合了多种主流的细胞通讯算法。

相关教程及各软件特性

1. 基于 CellChat 的细胞通讯分析

  • 教程链接单细胞空间转录组:细胞通讯分析(基于 CellChat)
  • 优势:数据库全面(包含信号通路级别注释);擅长进行多组/多样本的网络比较;可视化功能极为丰富。
  • 局限性:对空间物理距离的硬性约束较弱,本质上是对聚类后的细胞群进行概率推断。
  • 输入:包含细胞类型注释的归一化表达矩阵、空间坐标矩阵。
  • 输出:通路级别的通讯概率矩阵、和弦图 (Chord diagram)、气泡图、信号通路层级网络图。
细胞通讯分析示例

2. 基于 COMMOT 的细胞通讯分析

  • 教程链接单细胞空间转录组:细胞通讯分析(基于 COMMOT)
  • 优势:采用最优传输理论 (Optimal Transport),将细胞间的物理距离作为强约束条件,能精准刻画信号分子在组织中的空间扩散范围。
  • 局限性:算法计算复杂度高,处理超大规模细胞/Spot 数据时耗时较长。
  • 输入:已注释的 .h5ad 空间分析对象(含空间坐标 obsm['spatial'])。
  • 输出:细胞对 (Cell-pair) 级别的空间通讯流向图、信号发送与接收潜力的空间映射图 (Spatial flow map)。
细胞通讯分析示例

3. 基于 stLearn 的细胞通讯分析

  • 教程链接单细胞空间转录组:细胞通讯分析(基于 stLearn)
  • 优势:能够计算空间通讯得分,并通过 P-value 过滤识别显著互作的配受体对,直接定位出发生高频互作的“空间热点区域 (Hotspots)”。
  • 局限性:运行时间与内存消耗与数据规模成正比,在处理细胞数量极多的高清空间数据时(如全脑切片)可能需要借助“网格化 (Grid)”降采样。
  • 输入:结合了细胞类型注释的 AnnData 对象与空间坐标矩阵(如果只是做细胞通讯分析,不强制需要 H&E 图像特征,底图主要用于最终的空间可视化映射)。
  • 输出:LR 互作得分的空间热点分布图 (Hotspot plot)、显著交互的网络图 (cci_net)、和弦图 (chord plot) 及配受体互作热图。
细胞通讯分析示例

4. 基于 CellPhoneDB 的细胞通讯分析

  • 教程链接单细胞空间转录组:细胞通讯分析(基于 CellPhoneDB)
  • 优势:最大亮点在于其独有的数据库,充分考虑了受体和配体的多亚基结构,能够精确识别异聚体复合物。结合空间位置信息(通过预先定义的空间微环境),可以实现空间限制下的互作推断。
  • 局限性:默认版本不包含连续物理距离约束,需要用户通过聚类或切分先验定义好空间微环境(Spatial Microenvironment)后再分区域运行。
  • 输入:细胞类型注释文件 (meta.txt)、标准化后的表达矩阵 (counts.txt),以及差异表达基因文件 (DEGs.txt)。
  • 输出:显著互作的 P-value 矩阵、平均表达量矩阵 (means.txt)、经典的配受体互作气泡图 (Dot plot)。
细胞通讯分析示例

5. 基于 NicheNet 的细胞通讯分析

  • 教程链接单细胞空间转录组:细胞通讯分析(基于 NicheNet)
  • 优势:不仅推断配体-受体互作,还能预测配体结合受体后,在接收细胞内引发的下游靶基因转录变化,直指生物学效应。
  • 局限性:模型高度依赖其内置的基因调控先验网络,且需要用户明确指定“发送者”和“接收者”细胞群。
  • 输入:发送细胞与接收细胞的表达矩阵、感兴趣的下游基因集合(通常为 DEG)。
  • 输出:配体活性排名 (Ligand activity ranking)、配体-受体-靶基因的调控网络热图与 Circos 图。
细胞通讯分析示例

数据分析建议

提示:单细胞空间转录组分析是一项高度依赖组织特异性与具体生物学问题驱动的工作。本指南提供的多维度分析模块旨在构建完整的空间特征图谱,您可以根据样本切片的质量、细胞类型的复杂度以及核心研究目标,灵活组合或裁剪分析链路。

  • 核心分析路径建议

    1. 基础解析与图谱构建:依次进行 “基础数据分析”(如遇多样本/多切片需先进行 “多样本整合与批次校正”),完成细胞的无监督分群、差异基因筛选与细胞类型(Cell Type)的初步注释。
    2. 空间异质性与结构域划分:在获得细胞注释后,建议使用 Banksy 等工具开展 “空间微环境与聚类” 分析,将纯表达驱动的分类升级为结合空间邻域的组织结构域(Spatial Domain)划分,刻画组织原位微环境。
    3. 空间互作与机制挖掘:基于明确的结构域与细胞分布,选择 “空间共定位与密度分析”(如 CellCharter、SpaGene)寻找有强空间依赖性的细胞类群或受配体对;最后,结合这些线索,选用合适的工具深入挖掘 “细胞通讯网络”,从表型分布走向分子层面的机制解释。
  • 分析模块的递进与衔接

    • 基础细胞分群驱动Banksy 微环境 (Niche) 鉴定与组织分区
    • 细胞类型空间分布指导CellCharter 细胞类型共定位分析
    • SpaGene 受配体共定位筛选验证COMMOT / CellChat 空间通讯热点定位与流向推断
0 条评论·0 条回复