Skip to content

CellChat_spatial 分析

作者: SeekGene
时长: 18 分钟
字数: 5.1k 字
更新: 2026-01-21
阅读: 0 次
SeekSoul Online

前言

IMPORTANT

CellChat 是一个用于推断、分析和可视化单细胞和空间转录组数据中细胞-细胞通讯的 R 工具包。CellChat_spatial 是 CellChat v2 版本的核心功能,专门针对空间转录组数据,通过整合空间距离信息来推断细胞间的空间邻近通讯,为理解组织微环境中的细胞相互作用提供了强大工具。

在空间转录组学研究中,细胞不仅通过分泌信号分子进行通讯,其空间位置关系也对细胞间相互作用有重要影响。CellChat_spatial 通过整合基因表达数据和空间坐标信息,能够识别空间邻近的细胞间通讯,揭示组织微环境中的细胞相互作用网络。

CellChat_spatial 的核心功能

  • 空间邻近通讯推断:基于细胞空间距离,识别空间邻近的配体-受体相互作用。
  • 多样本比较分析:支持多个空间样本间的细胞通讯网络比较。
  • 信号通路分析:识别关键的信号通路及其在不同细胞类型间的传递。
  • 丰富的可视化:提供圈图、和弦图、气泡图、热图等多种可视化方式。
  • 空间因子设置:支持自定义通讯距离阈值,适应不同空间转录组技术。

本篇文档旨在为空间转录组学研究者提供一份详尽的 CellChat_spatial 技术指南,内容涵盖其基本原理、在 SeekSoul Online 云平台上的操作方法、结果解读、实战案例及常见问题,帮助您快速掌握并应用该工具。


CellChat_spatial 理论基础

CellChat_spatial 的核心思想是:通过整合基因表达数据和空间位置信息,利用质量作用定律建模配体-受体介导的细胞间通讯,并考虑空间距离对通讯的影响。这一过程可以概括为以下几个主要步骤:

  1. 差异表达基因识别:使用 Wilcoxon 秩和检验识别在不同细胞群中差异表达的信号基因。
  2. 集合平均表达量计算:计算每个细胞群中配体和受体的平均表达水平。
  3. 空间距离整合:基于细胞的空间坐标,计算细胞间的欧氏距离。
  4. 通讯概率计算:利用质量作用定律,结合空间距离因子,计算配体-受体相互作用的概率。
  5. 统计显著性检验:通过置换检验评估细胞间通讯的统计显著性。

云平台操作指南

在云平台上,CellChat_spatial 分析流程被设计得直观易用。您无需编写代码,只需通过参数配置界面即可完成分析。

分析前的准备

IMPORTANT

CellChat_spatial 分析的成功与否,很大程度上取决于输入数据的质量和空间信息的准确性。在开始分析前,请务必确认:

  1. 数据已完成预处理:您的空间转录组数据已经过标准的质控、降维、聚类和细胞类型注释。
  2. 空间坐标信息完整:确保每个细胞或斑点都有准确的空间坐标信息(存储在 spatial 降维中)。
  3. 细胞类型注释准确:细胞类型注释的准确性直接影响细胞通讯分析的结果。
  4. 样本选择合理:建议每个样本至少包含 1000 个细胞/斑点,且每种细胞类型至少有 10 个细胞。

参数详解

下表详细列出了云平台 CellChat_spatial 分析模块的主要参数及其说明。

界面参数说明
任务名称本次分析的任务名称,需以英文字母开头,可包含英文字母、数字、下划线和中文。
物种选择该分析流程数据对应的物种名称,目前支持人(human)、小鼠(mouse)和斑马鱼(zebrafish)。
分组因子meta 的列名,例如 CellAnnotation,用于指定细胞类型注释列,必填。
细胞类型基于 meta 的 col_celltype 列对应的对象,多选,选择要分析的细胞类型,必填。
分析方法计算方法,可选 triMean 或 truncatedMean。triMean 得到较少但更强的相互作用;truncatedMean 得到更多的相互作用。空间数据推荐使用 truncatedMean。
表达比例当分析方法为 truncatedMean 时才会被用到,表达比例低于百分之多少时,视基因表达平均值为 0。单细胞转录组默认为 0.25,空间数据推荐设置小一些,比如 0.1。
最小细胞数细胞数低于多少时,过滤掉该细胞类型。默认为 10,建议设置为 10-20 之间。
Downsample是否抽样分析。当数据量过大时(如 > 50,000 细胞),建议设置为 True 以加快分析速度。
Downsample_numdownsample 数目,downsample 为 True 时需要。建议设置为每个细胞类型至少抽取 100 个细胞。默认为 1000。
分组比较meta 的列名,例如 Sample。用于指定样本分组列,与“比较对象”配合使用,必填。
比较对象基于 meta 的 col_sam 列所对应的比较对象,多选,选择要分析的样本名称,必填。
备注自定义备注信息,可用于记录分析参数设置的原因或特殊说明。

重要注意事项

CAUTION

  • 空间坐标要求:确保空间坐标信息准确且完整,CellChat_spatial 需要 spatial 降维中的坐标信息。
  • 细胞数量要求:每种细胞类型至少需要 10 个细胞,否则可能导致分析失败或结果不可靠。
  • 内存限制:如果分析的细胞数量过多(> 50,000),建议使用 Downsample 功能。
  • 分析时间:CellChat_spatial 分析较为耗时,大数据集可能需要数小时完成。

TIP

参数调试建议

  • 初次分析建议使用默认参数。
  • 如果发现互作数量过少,可以降低 trim 值或将 triMean 改为 truncatedMean。
  • 如果发现互作数量过多且噪音较大,可以增加 trim 值或使用 triMean 方法。
  • 可以通过调整 mincell 参数来过滤低细胞数的类型。

操作流程

  1. 进入分析模块:在云平台导航至“高级分析”模块,选择“CellChat_spatial”。
  2. 创建新任务:为您的分析任务命名,并选择要分析的项目。
  3. 配置基本参数
    • 选择物种。
    • 设置分组因子和细胞类型。
    • 选择分析方法和表达比例。
  4. 配置过滤参数
    • 设置最小细胞数。
    • 根据需要设置 Downsample 参数。
  5. 配置样本参数
    • 设置分组比较列名。
    • 选择要分析的样本。
  6. 提交任务:确认参数无误后,点击“提交”按钮,等待分析完成。
  7. 下载与查看:分析结束后,在任务列表中下载并查看生成的分析报告和结果文件。

结果解读

CellChat_spatial 的分析报告包含丰富的图表和数据文件,以下是对核心结果的详细解读。

结果文件列表

文件名内容说明
*_netVisual_circle.pdf/png细胞间互作数目与互作强度圈图
*_netVisual_circle_split_weight.pdf/png各细胞类型的通讯强度圈图(分细胞类型)
*_netVisual_circle_split_count.pdf/png各细胞类型的互作数量圈图(分细胞类型)
*_netVisual_chord_LR.pdf/png配体-受体对和弦图
*_netVisual_chord_path.pdf/png信号通路和弦图
*_netVisual_bubble.pdf/png细胞间配体-受体对气泡图
*_roles_scatter.pdf/png细胞通讯角色散点图
*_outgoing_roles_heatmap.pdf/png外向信号热图
*_incoming_roles_heatmap.pdf/png内向信号热图
*_netVisual_embedding.pdf/png空间位置通讯可视化图
*.rdsCellChat 对象 RDS 文件(可用于后续分析)
*_LR_pair.xls配体-受体对详细信息表格
*_pathway.xls信号通路详细信息表格

细胞间互作数目与互作强度圈图

图表结构

  • 左图:显示细胞类型间的互作数量(Number of interactions)。
  • 右图:显示细胞类型间的互作强度(Interaction weights/strength)。

图形元素

  • 实心圆:不同颜色代表不同的细胞类型。
  • 圆的大小:与该细胞类型的细胞数量成正比。
  • 连线(边)
    • 颜色与信号发送者(配体表达细胞)保持一致。
    • 粗细与互作数量/强度成正比。
    • 箭头指向信号接收者(受体表达细胞)。

解读要点

  • 强互作:粗线表示细胞类型间存在强烈的通讯。
  • 互作方向:观察哪些细胞类型主要作为信号发送者,哪些作为接收者。
  • 互作网络:整体观察组织中的细胞通讯网络拓扑结构。

配体-受体对和弦图

图表结构

  • 外圈:每一段代表一个配体或受体基因。
  • 弧线:连接配体和受体,表示它们之间的相互作用。
  • 颜色:弧线颜色与信号发送者细胞类型一致。

解读要点

  • 主要配体-受体对:弧线越宽,表示该配体-受体对的通讯概率越大。
  • 多对多关系:一个配体可能与多个受体相互作用,反之亦然。
  • 细胞特异性:观察特定细胞类型表达的配体或受体。
  • 通讯方向:弧线从配体指向受体。
和弦图只显示通讯概率显著的配体-受体对(p < 0.05)。如果某些预期的互作未显示,可能是因为其统计显著性未达到阈值。

细胞通讯角色散点图

图表结构

  • X 轴:外向通讯(Outgoing communication)强度。
  • Y 轴:内向通讯(Incoming communication)强度。
  • 点的大小:该细胞类型参与的通讯数量(包括外向和内向)。
  • 点的颜色:不同细胞类型。

细胞角色分类

a. 信号发送者(Sender)

  • 特征:X 轴坐标大,Y 轴坐标小。
  • 生物学意义:主要作为信号源,向其他细胞发送信号。
  • 例子:内分泌细胞、神经元等。

b. 信号接收者(Receiver)

  • 特征:X 轴坐标小,Y 轴坐标大。
  • 生物学意义:主要接收来自其他细胞的信号。
  • 例子:靶器官细胞、效应细胞等。

c. 中介者(Mediator)

  • 特征:X 轴和 Y 轴坐标都大。
  • 生物学意义:既接收信号又发送信号,在通讯网络中起桥梁作用。
  • 例子:免疫细胞、成纤维细胞等。

d. 旁观者(Bystander)

  • 特征:X 轴和 Y 轴坐标都小。
  • 生物学意义:在细胞通讯网络中参与度较低。
  • 可能原因:该细胞类型的主要功能不依赖细胞间通讯,或者数据质量问题。

信号通路热图

外向信号热图(Outgoing signaling patterns)

  • :信号通路名称。
  • :细胞类型。
  • 颜色强度:该细胞类型在该通路中作为信号发送者的相对强度。
  • 右侧柱状图:每个通路的总体强度。
  • 上方柱状图:每个细胞类型的总体外向信号强度。

内向信号热图(Incoming signaling patterns)

  • :信号通路名称。
  • :细胞类型。
  • 颜色强度:该细胞类型在该通路中作为信号接收者的相对强度。

解读要点

  1. 细胞特异性信号通路:观察哪些信号通路在特定细胞类型中特别活跃。
  2. 信号通路模式:识别具有相似信号模式的细胞类型。
  3. 关键信号通路:右侧柱状图显示整体最重要的信号通路。
  4. 发送-接收配对:结合外向和内向信号热图,识别信号发送者-接收者配对。

空间位置通讯可视化

图表特点

  • 背景:显示细胞在组织中的空间位置。
  • 连线:表示空间邻近的细胞间的通讯。
  • 颜色:区分不同的细胞类型或信号强度。

解读要点

  • 空间模式:观察通讯在组织中的空间分布模式。
  • 局部微环境:识别特定区域的细胞通讯 hotspot。
  • 距离效应:验证通讯是否符合空间邻近性。

数据表格解读

LR_pair 表格(配体-受体对信息)

  • interaction_name:配体-受体对名称。
  • pathway_name:所属信号通路。
  • ligand:配体基因。
  • receptor:受体基因。
  • source:信号发送者细胞类型。
  • target:信号接收者细胞类型。
  • prob:通讯概率。
  • pval:统计显著性 P 值。

pathway 表格(信号通路信息)

  • pathway_name:信号通路名称。
  • source:信号发送者细胞类型。
  • target:信号接收者细胞类型。
  • prob:该通路的总通讯概率。
  • count:该通路包含的配体-受体对数量。

应用案例

CellChat v2 在空间转录组学中的应用

  • 数据来源:CellChat 官方 Nature Protocols 文章示例。
  • 背景:CellChat v2 版本专门针对空间转录组数据进行了优化,引入空间距离因子,能够更准确地推断空间邻近的细胞间通讯。
  • 分析策略:使用 Visium 空间转录组数据,整合空间坐标信息,设置通讯距离阈值(interaction.range=250 μm),识别空间依赖的细胞通讯。
  • 核心发现
    1. CellChat_spatial 能够准确识别空间邻近的细胞间通讯,过滤空间距离较远的假阳性互作。
    2. 通过调整通讯距离阈值,可区分短距离(接触依赖型)和长距离(分泌型)信号通路。
    3. 空间位置通讯可视化直观展示细胞通讯在组织中的空间分布模式。
    4. 相比传统单细胞 CellChat 分析,CellChat_spatial 提供了更符合组织生物学的结果。

图:CellChat 分析工作流程。通过整合基因表达数据、配体-受体数据库和空间信息,推断细胞间通讯网络。


注意事项与最佳实践

WARNING

避免过度解读:CellChat_spatial 结果是基于基因表达数据和空间位置的计算推断,不等于真实的细胞间相互作用。任何关键发现都需要后续的生物学实验(如免疫荧光共定位、受体阻断实验等)来证实。

CAUTION

数据质量至关重要

  • 空间坐标准确性:空间坐标的偏差会导致错误的空间邻近性判断。
  • 测序深度:测序深度不足会导致配体/受体基因检测不到,产生假阴性。
  • 细胞类型注释:错误的细胞类型注释会导致错误的通讯推断。

TIP

优化分析效果

  1. 参数调优:根据数据特点调整 trim、mincell 等参数。
  2. 生物学验证:结合已知的配体-受体相互作用知识验证结果。
  3. 多方法交叉验证:结合其他细胞通讯分析工具(如 CellPhoneDB, COMMOT)进行交叉验证。
  4. 功能富集分析:对识别出的信号通路进行功能富集分析,理解其生物学意义。

结果验证策略

计算验证

  • 一致性检验:检查配体和受体是否在预期的细胞类型中表达。
  • 空间一致性:验证通讯的细胞是否在空间上邻近。
  • 统计显著性:关注 p 值 < 0.05 的显著通讯。

文献验证

  • 已知互作:查阅文献,验证识别出的配体-受体对是否有文献支持。
  • 信号通路:确认信号通路是否在该组织/细胞类型中已知活跃。
  • 数据库查询:使用 CellChatDB, UniProt 等数据库验证配体-受体相互作用。

实验验证

  • 免疫荧光共染:验证配体和受体蛋白的表达和共定位。
  • 原位杂交(ISH):验证配体和受体 mRNA 的表达模式。
  • 功能实验
    • 受体阻断实验:使用抗体或小分子抑制剂阻断受体。
    • 配体刺激实验:外源添加配体观察下游效应。
    • 基因敲除/敲低:通过 CRISPR 或 RNAi 技术验证基因功能。

常见问题解答 (FAQ)

Q1: CellChat_spatial 与普通 CellChat 有什么区别?

A: 主要区别在于:

  • 空间信息整合:CellChat_spatial 利用细胞的空间坐标信息,只考虑空间邻近的细胞间通讯。
  • 距离因子:引入 distance.use, interaction.range 等参数,根据细胞间距离调整通讯概率。
  • 接触依赖型信号:能够区分接触依赖型和分泌型信号,更准确反映生物学实际。
  • 空间可视化:提供空间位置通讯可视化,直观展示通讯在组织中的分布。

Q2: CellChat_spatial 分析需要多长时间?

A: 分析时间取决于数据规模:

  • 小数据集(1,000-5,000 细胞):30 分钟 - 1 小时。
  • 中等数据集(5,000-20,000 细胞):1-3 小时。
  • 大数据集(> 20,000 细胞):3-8 小时或更长。
  • 建议对大数据集使用 Downsample 功能加速分析。

Q3: 如何设置合适的 interaction.range 参数?

A: 根据以下因素决定:

  • 空间技术分辨率:高分辨率技术(如 MERFISH)使用较小值(50-100 μm),低分辨率技术(如 Visium)使用较大值(200-300 μm)。
  • 组织类型:致密组织(如肿瘤)使用较小值,松散组织(如淋巴结)使用较大值。
  • 信号类型:研究短距离信号使用小值,研究长距离信号使用大值。
  • 默认值:大多数情况下,使用默认的 250 μm 是合理的。

Q4: triMean 和 truncatedMean 方法如何选择?

A:

  • triMean:更严格,适用于需要高置信度通讯网络的场景,结果更保守但可靠性高。
  • truncatedMean:更宽松,适用于探索性分析,能发现更多潜在通讯,推荐用于空间数据。
  • 建议:首次分析使用 truncatedMean(trim=0.1),如果结果噪音过大再尝试 triMean。

Q5: 为什么我的结果中互作数量很少?

A: 可能的原因和解决方案:

  • 参数过严:降低 trim 值(如从 0.25 降到 0.1),或将 triMean 改为 truncatedMean。
  • 细胞数量不足:确保每种细胞类型至少有 10-20 个细胞。
  • 测序深度低:配体/受体基因表达量低,检测不到,考虑使用更高深度的数据。
  • 细胞类型选择不当:某些细胞类型本身通讯就较少,尝试分析其他细胞类型。

Q6: 如何解释空间位置通讯可视化图?

A:

  • 连线密集区域:表示该区域细胞通讯活跃,可能是功能重要的微环境。
  • 长距离连线:可能是分泌型信号,或者需要检查是否为假阳性(调整 interaction.range)。
  • 连线方向:观察信号的空间传播方向,识别信号源和靶区域。
  • 结合细胞类型分布:将通讯模式与细胞类型的空间分布结合解读。

Q7: CellChat_spatial 对数据质量有什么要求?

A: 关键要求包括:

  • 准确的空间坐标:必须有 spatial 降维中的坐标信息。
  • 合理的细胞数量:每种细胞类型 ≥ 10 个细胞,总细胞数 ≥ 1000。
  • 足够的测序深度:能够检测到配体和受体基因的表达。
  • 准确的细胞类型注释:细胞类型注释准确性直接影响结果可靠性。

Q8: 如何进行多样本比较分析?

A:

  1. 在云平台上,可以在“比较对象”参数中选择多个样本。
  2. 系统会分别分析每个样本,然后进行比较。
  3. 结果会展示每个样本的通讯网络,以及样本间的差异。
0 条评论·0 条回复