SpaGene 受配体共定位分析
前言
IMPORTANT
SpaGene 是一个用于识别组织中在空间上显著邻近的配体–受体 (Ligand–Receptor, L–R) 对的工具,专门面向空间转录组/空间蛋白组数据的“受–配体共定位”检测。它通过空间邻域统计与置换检验,量化配体与受体在组织中的空间共定位强度与显著性,帮助研究者快速筛选具有空间邻近证据的候选通讯分子。
在空间组学研究中,单纯的共表达不足以说明通讯发生的可能性;空间上的邻近性是重要的补充证据。SpaGene 将表达与空间距离相结合,对每一个候选 L–R 对计算共定位得分与显著性,为后续通讯建模(如 CellChat_spatial、COMMOT)与实验验证提供高置信的候选清单。
SpaGene 的核心功能
- 受–配体空间共定位评分:计算每个 L–R 对在组织中的空间邻近度量与统计显著性
- 置换检验/多重校正:基于随机背景生成经验分布,输出 P 值与 FDR
- 参数化空间邻域:支持设定邻域半径/最近邻数,适配不同数据分辨率
本篇文档旨在提供一份详尽的 SpaGene 技术指南,涵盖其基本原理、在 SeekSoul Online 云平台上的操作方法、结果解读、实战案例、最佳实践与常见问题,帮助您高效开展受–配体空间共定位分析。
SpaGene 理论基础
SpaGene 的核心思想是:在空间坐标系中评估候选配体 L 与受体 R 的“空间邻近性”是否超出随机期望。典型流程包括:
- 候选对生成:从内置/用户提供的 L–R 数据库中筛选在数据中表达的 L–R 对(可设定表达阈值)
- 空间邻域定义:依据空间坐标构建邻域(固定半径 r 或 k 近邻),得到潜在“可邻近”的细胞对/spot 对集合
- 共定位得分计算:对每个 L–R 对,统计邻域内 L 高表达与 R 高表达的空间共现程度,计算共定位得分(例如基于加权邻接或距离衰减)
- 置换检验:随机打乱细胞标签或基因标签,生成背景分布,计算 P 值与 FDR

图:SpaGene 分析框架。先筛选候选 L–R 对并定义空间邻域,再计算共定位得分并通过置换检验评估显著性,可进一步在多组条件下比较差异。
关键方法要点
空间邻域构建:
- 半径法:设定物理距离 r,将距离小于 r 的成对细胞/spot 视为邻近
- kNN 法:对每个细胞/spot 选取 k 个最近邻作为邻域
- 距离权重:可对邻域边赋予距离衰减权重(越近权重越高)
表达阈值与二值化:
- L、R 的“高表达”可由阈值(如分位数/绝对值)定义,阈值越严谨,假阳性越少但敏感性下降
显著性评估:
- 置换策略:细胞标签置换、基因标签置换或空间位置置换,用以构建零假设背景
- 多重检验:对大量 L–R 对进行 FDR 校正,控制整体假阳性率
云平台操作指南
在云平台上,SpaGene 分析流程被设计得直观易用,您无需编写代码,只需配置参数并提交任务。

参数设置说明
在 SeekSoul Online 云平台的“高级分析”模块中选择“SpaGene”,需要配置以下参数:
基础参数
任务名称
- 说明:本次分析的任务名称
- 格式:以英文字母开头,可包含英文字母、数字、下划线和中文
- 示例:
SpaGene_analysis
筛选因子
- 说明:meta 数据中的样本列名
- 示例:
Sample、GD.N_A
筛选对象
- 说明:基于筛选因子列选择要分析的样本名称
- 示例:
A15、sample1
物种
- 说明:选择样本对应物种
- 选项:
human或mouse
备注
- 说明:自定义备注信息(选填)
操作流程
- 进入“高级分析”选择“SpaGene”模块
- 选择样本与物种
- 提交任务并等待运行完成
- 下载并查看 HTML 报告与导出数据文件
报告结果解读
分析完成后会生成包含图表与表格的报告,常见输出如下:
受配体基因空间表达图
图片示例:Top1_LR_coexpression.png

解读要点:
- 左图(表达分型图):灰色表示配体与受体均低表达;红色表示配体高表达、受体低表达;绿色表示受体高表达、配体低表达;蓝色表示二者均高表达。蓝色热点通常对应潜在的空间共定位区域,可结合细胞类型注释锁定候选细胞群。
- 右图(共定位得分图):颜色深浅表示该受–配体对的空间共定位得分或局部交互强度,数值越高说明在该区域内该受–配体对相较随机背景更倾向于空间邻近。
- 综合判读:优先关注左图蓝色聚集同时右图呈现高得分的区域,并结合邻域半径、样本分层信息及文献证据进行二次验证。
Exported Files
| 文件名 | 内容说明 |
|---|---|
LR_coexpression.txt | 配受体对共表达情况表 |
Top1_LR_coexpression.png | 受配体共表达空间图 |
TIP
阅读路径建议:先看曼哈顿图确定显著 L–R 对,再结合热图/空间分布定位关键信号热点,最后查阅表格获取定量结果以便下游分析或实验设计。
应用案例
案例一:鼻咽癌三级淋巴结构中受配体空间共定位与免疫治疗反应
- 背景:在鼻咽癌组织中识别三级淋巴结构 (TLS) 相关的关键受配体对,解析 TLS 中 CXCL13^{+} 癌相关成纤维细胞、CXCL13^{+}CD8^{+} T 细胞、B 细胞、T 滤泡辅助细胞以及成熟浆细胞之间的空间共定位关系,探究其与肿瘤进展和免疫治疗反应的联系
- 数据:鼻咽癌空间转录组数据(单细胞与空间转录组联合分析)
- 发现:通过 SpaGene 分析发现,CXCL13–CXCR5 在 TLS 区域显著共定位 (FDR < 0.01),CXCL13^{+} 癌相关成纤维细胞与 B 细胞、T 滤泡辅助细胞在空间上邻近,促进 B 细胞粘附和抗体产生,激活 CXCL13^{+}CD8^{+} T 细胞。生发中心反应使浆细胞成熟,这些浆细胞与肿瘤细胞聚集体在空间上显著共定位,相关的受配体对(如抗体–Fc 受体)在肿瘤–免疫界面区域呈现高共定位得分,促进 EBV 相关恶性细胞的凋亡
- 意义:揭示了 TLS 中细胞间通讯的空间组织模式,为理解鼻咽癌免疫微环境与免疫治疗反应提供空间证据。TLS 相关的细胞特征与预后和 PD-1 阻断反应相关,提示空间邻近的受配体互作在增强免疫治疗反应中的重要作用,为癌症治疗策略提供新的见解
SpaGene 分析结果:

图 5f:鼻咽癌 TLS 区域内 CXCL13–CXCR5 等关键 L–R 轴的空间邻近与共定位热点。高表达的配体与受体分别以不同颜色标注,热点区域可见 B 细胞与 T 滤泡辅助细胞 (Tfh) 等在空间上的共同富集,支持 TLS 形成与体液免疫活化的证据链。
注意事项与最佳实践
WARNING
- 空间共定位 ≠ 因果通讯:L–R 的空间邻近仅是通讯可能性的空间证据,需结合表达量、通路知识与功能实验进一步验证。
- 分辨率与混合效应:spot 级数据存在细胞混合,建议结合去卷积或在单细胞分辨率数据上验证关键发现。
- 参数敏感:邻域半径/最近邻数、表达阈值与置换次数会显著影响结果,应做敏感性分析。
TIP
最佳实践:
- 与 COMMOT/CellChat_spatial 结果交叉验证,优先关注在“空间共定位 + 通讯建模”两层面均显著的 L–R 对
- 统一预处理与注释,跨样本比较前确保流程一致以降低批次影响
- 使用空间可视化(散点/核密度/局部放大)直观审视共定位热点
- 结合多样本复现与文献证据,提升候选的可信度
常见问题解答 (FAQ)
Q1:低表达的配体/受体是否可以被检测到?
- A:低表达基因在空间上难以形成稳定信号,建议设定较严格的表达阈值或聚焦已知强信号的候选清单,以降低假阳性。
Q2:如何选择邻域半径 r 或 k?
- A:依据组织尺寸与平台分辨率调参。单细胞成像数据常使用较小 r 或 k。
Q4:结果为何与通讯工具不一致?
- A:SpaGene 强调空间邻近证据,而通讯工具强调配受体表达/通路建模,二者关注点不同。建议交叉验证取交集候选。
参考资料
- GitHub:
https://github.com/liuqivandy/SpaGene - [1] LIU Q, HSU C Y, SHYR Y. Scalable and model-free detection of spatial patterns and colocalization[J]. Genome Research, 2022.
- [2] LIU Y, YE S Y, HE S, et al. Single-cell and spatial transcriptome analyses reveal tertiary lymphoid structures linked to tumour progression and immunotherapy response in nasopharyngeal carcinoma[J]. Nat Commun, 2024, 15: 7713.
总结
SpaGene 为受–配体空间共定位提供了标准化、统计严格的检测流程,可作为空间通讯研究的关键前置步骤。通过与 COMMOT、CellChat_spatial 等工具的联用,研究者能够从“空间邻近证据 + 通讯建模”两条证据链更有把握地锁定功能性通讯,并指导后续的空间成像与功能实验验证。
