MISTy 共定位分析
前言
TIP
MISTy (Multiview Intercellular SpaTial modeling framework) 是一个多视角细胞间空间建模框架,专门面向空间转录组/空间蛋白组数据的“受–配体共定位”检测。它通过多视角机器学习方法,整合细胞内、邻近细胞和远距离细胞之间的相互作用,量化配体与受体在组织中的空间共定位强度与显著性,帮助研究者快速筛选具有空间邻近证据的候选通讯分子。
在空间组学研究中,理解细胞间的空间关系对于揭示组织功能和疾病机制至关重要。MISTy 通过多视角建模框架,将表达与空间距离相结合,对每一个候选 L–R 对计算共定位得分与显著性,为后续通讯建模(如 CellChat_spatial、COMMOT)与实验验证提供高置信的候选清单。
MISTy 的核心功能
- 多视角空间共定位评分:通过细胞内、邻近细胞和远距离细胞三个视角,计算每个 L–R 对在组织中的空间邻近度量与统计显著性。
- 机器学习建模:使用随机森林等机器学习方法,整合多视角信息,输出共定位得分与重要性。
- 参数化空间邻域:支持设定邻域半径/最近邻数,适配不同数据分辨率。
本篇文档旨在提供一份详尽的 MISTy 技术指南,涵盖其基本原理、在 SeekSoul Online 云平台上的操作方法、结果解读、实战案例、最佳实践与常见问题,帮助您高效开展受–配体空间共定位分析。
MISTy 理论基础
MISTy 的核心思想是:通过多视角机器学习框架,整合细胞内、邻近细胞和远距离细胞之间的相互作用,评估候选配体 L 与受体 R 的“空间邻近性”是否超出随机期望。典型流程包括:
- 候选对生成:从内置/用户提供的 L–R 数据库中筛选在数据中表达的 L–R 对(可设定表达阈值)。
- 多视角构建:
- 细胞内视角:分析细胞自身的基因表达。
- 邻近细胞视角:分析邻近细胞(基于空间距离)的基因表达。
- 远距离细胞视角:分析远距离细胞(基于空间距离)的基因表达。
- 机器学习建模:使用随机森林等机器学习方法,整合多视角信息,预测目标基因的表达。
- 共定位得分计算:基于模型的重要性得分,计算每个 L–R 对的共定位得分与显著性。

图:MISTy 分析框架。先筛选候选 L–R 对并构建多视角,再通过机器学习建模整合多视角信息,计算共定位得分并评估显著性。
关键方法要点
多视角构建:
- 细胞内视角:直接使用细胞自身的基因表达。
- 邻近细胞视角:基于空间距离定义邻近细胞(如 k 近邻或固定半径),计算邻近细胞的平均表达。
- 远距离细胞视角:基于空间距离定义远距离细胞,计算远距离细胞的平均表达。
机器学习建模:
- 使用随机森林等机器学习方法,整合多视角信息。
- 通过特征重要性得分,评估每个视角对目标基因表达的贡献。
- 共定位得分基于特征重要性得分计算。
显著性评估:
- 通过置换检验或交叉验证,评估共定位得分的显著性。
- 多重检验:对大量 L–R 对进行 FDR 校正,控制整体假阳性率。
云平台操作指南
在云平台上,MISTy 分析流程被设计得直观易用,您无需编写代码,只需配置参数并提交任务。

参数设置说明
在 SeekSoul Online 云平台的"高级分析"模块中选择"MISTy",需要配置以下参数:
基础参数
任务名称
- 说明:本次分析的任务名称。
- 格式:以英文字母开头,可包含英文字母、数字、下划线和中文。
- 示例:
MISTy_analysis。
分组因子
- 说明:meta 数据中的细胞类型列名。
- 示例:
CellAnnotation、celltype。 - 用途:用于定义细胞类型,分析不同细胞类型间的共定位。
样本筛选参数
筛选因子
- 说明:meta 数据中的样本列名。
- 示例:
Sample、GD.N_A。
筛选对象
- 说明:基于筛选因子列选择要分析的样本名称。
- 示例:
A15、sample1。
备注
- 说明:自定义备注信息(选填)。
操作流程
- 进入"高级分析"选择"MISTy"模块。
- 选择分组因子和样本。
- 提交任务并等待运行完成。
- 下载并查看 HTML 报告与导出数据文件。
报告结果解读
分析完成后会生成包含图表与表格的报告,常见输出如下:
细胞类型共定位热图
图片示例:celltype_colocation_heatmap.png

解读要点:
- 横轴:被预测响应的细胞类型 (target cell type)。
- 纵轴:潜在驱动方/邻域细胞类型 (source cell type)。
- 颜色:MISTy 估计的空间驱动强度或共定位得分,颜色越深表示该细胞对 pair 的空间互作越显著。
细胞类型共定位网络图
图片示例:celltype_colocation_network.png

解读要点:
- 节点:细胞类型;位于同一圆环(或簇)内表示互为重要空间驱动关系。
- 连线:线条粗细/颜色表示共定位得分的大小;边上的箭头(若存在)指示从驱动方 (source) 到受影响方 (target) 的方向。
- 圈层:不同圈层区分双向与单向互作;跨圈连接提示单向或不对称的空间影响,需要结合热图和生物学背景进一步验证。
结果文件列表
| 文件名 | 内容说明 |
|---|---|
celltype_colocation_heatmap.png | 细胞类型共定位热图 |
celltype_colocation_network.png | 细胞类型共定位网络图 |
TIP
阅读路径建议:先看曼哈顿图确定显著 L–R 对,再结合热图/空间分布定位关键信号热点,最后查阅表格获取定量结果以便下游分析或实验设计。
应用案例
人类心肌梗死的空间多组学图谱中受配体空间共定位分析
- 背景:在心肌梗死 (MI) 组织中识别关键的受配体对,解析不同细胞类型(心肌细胞、成纤维细胞、免疫细胞等)之间的空间共定位关系,探究其与炎症反应和组织修复过程的联系。
- 数据:人类心肌梗死组织空间多组学数据(来自 23 名患者的 31 个样本,包括单核 RNA 测序、单核 ATAC 测序和空间转录组学分析,涵盖缺血区、边缘区和远端区等不同生理区域)。
- 发现:通过 MISTy 分析发现,MI 区域存在显著的细胞异质性,不同细胞类型之间的受配体对在空间上显著共定位,特别是在炎症反应和组织修复过程中。受配体共定位分析揭示了心肌细胞、成纤维细胞、免疫细胞等之间的相互作用网络,这些共定位关系在不同生理区域(缺血区、边缘区、远端区)呈现空间异质性。
- 意义:揭示了 MI 后心脏组织中细胞间通讯的空间组织模式,为理解 MI 的病理生理机制提供了新的视角。该研究提供了人类心肌梗死后心脏重塑的高分辨率图谱,揭示了损伤、修复和重塑的组织结构,有助于识别潜在的治疗靶点,并为个性化治疗策略的开发提供了重要资源。
MISTy 分析结果:

扩展图 4:a. 不同空间区域(缺血区、边缘区、远端区)内关键细胞类型及其受–配体轴的空间邻近与潜在串话热点,如成纤维细胞–免疫细胞、内皮细胞–免疫细胞在炎症与修复阶段的交互增强。
原发性和转移性胰腺癌的空间转录组学分析中受配体空间共定位分析
- 背景:在胰腺导管腺癌 (PDAC) 的原发性和转移性肿瘤组织中识别关键的受配体对,解析肿瘤细胞、免疫细胞、成纤维细胞之间的空间共定位关系,探究其与肿瘤微环境异质性和肿瘤进展的联系。
- 数据:匹配的原发性和转移性 PDAC 样本空间转录组学数据(分析了不同解剖区域的纤维化、代谢和免疫抑制的空间生态类型)。
- 发现:通过 MISTy 分析发现,原发性和转移性 PDAC 在肿瘤微环境的空间组织和基因表达模式上存在显著差异,特别是在免疫细胞浸润和基质成分方面。受配体共定位分析揭示了肿瘤细胞与免疫细胞、成纤维细胞之间的复杂相互作用网络,发现了跨解剖区域的保守纤维化、代谢和免疫抑制的空间生态类型,这些共定位关系反映了肿瘤微环境的动态变化。
- 意义:揭示了 PDAC 肿瘤微环境中细胞间通讯的空间组织模式,强调了 PDAC 肿瘤微环境的空间异质性超出了先前对 PDAC 的认识。该研究强调了在个体患者中绘制肿瘤微环境景观以开发个性化治疗策略的必要性,有助于开发针对特定微环境特征的治疗策略,提高治疗效果。
MISTy 分析结果:

扩展图 2:a. 原发性与转移性 PDAC 在不同空间生态类型(如纤维化/代谢/免疫抑制区)上的细胞类型构成差异与空间分布格局。b. 突出显示免疫细胞(如巨噬细胞、T 细胞)与肿瘤细胞/成纤维细胞在特定生态类型边界的空间邻近与潜在串话热点。
注意事项与最佳实践
WARNING
- 空间共定位≠因果通讯:MISTy 识别的空间共定位关系仅表示空间邻近性,不能直接推断因果通讯。需结合表达量、通路知识、功能实验和下游验证来确认功能性通讯。
- 多视角参数需谨慎选择:邻近细胞和远距离细胞的邻域定义对结果影响显著。参数选择不当可能导致过度依赖某一视角或遗漏重要的空间相互作用,建议进行敏感性分析。
- 分辨率与混合效应:spot 级数据存在细胞混合,可能影响多视角建模的准确性。建议结合去卷积技术或在单细胞分辨率数据上验证关键发现。
- 机器学习模型的选择:不同机器学习模型(随机森林、梯度提升等)可能产生不同的结果。建议根据数据特点选择合适的模型,并比较不同模型的结果一致性。
- 数据质量要求:MISTy 对数据质量要求较高,低质量数据可能导致模型过拟合或结果不稳定。确保数据经过严格的质量控制,包括去除低质量细胞/spot、适当的归一化和批次校正。
TIP
最佳实践:
参数优化策略:
- 根据数据分辨率(单细胞 vs spot)选择合适的邻域参数。
- 对邻近细胞和远距离细胞的定义进行敏感性分析,确保结果稳定。
- 比较不同 k 值或半径设置下的结果,选择最能反映生物学意义的参数。
结果验证与交叉验证:
- 与 COMMOT、CellChat_spatial 等通讯工具结果交叉验证,优先关注在多个工具中均显著的 L–R 对。
- 使用交叉验证评估模型的稳定性和泛化能力。
- 结合已知的生物学知识验证发现的合理性。
多视角结果解读:
- 关注不同视角(细胞内、邻近细胞、远距离细胞)的重要性得分,理解空间相互作用的机制。
- 如果邻近细胞视角重要性高,说明存在短距离空间相互作用。
- 如果远距离细胞视角重要性高,说明可能存在长距离信号传递。
数据预处理与标准化:
- 统一预处理流程,确保跨样本比较的一致性。
- 进行适当的归一化和批次校正,降低技术变异的影响。
- 对低表达基因设定合理的阈值,平衡敏感性和特异性。
可视化与结果展示:
- 使用空间可视化(散点图、核密度图、局部放大)直观展示共定位热点。
- 绘制不同视角重要性的热图,展示空间相互作用的模式。
- 结合组织形态学信息,将共定位结果与组织结构关联。
生物学解释与验证:
- 结合多样本复现与文献证据,提升候选的可信度。
- 优先关注在多个样本或条件下一致的发现。
- 设计功能实验验证关键受配体对的功能性通讯。
常见问题解答 (FAQ)
Q1:MISTy 的多视角建模与传统的单视角方法有什么区别?
- A:MISTy 通过整合细胞内、邻近细胞和远距离细胞三个视角的信息,能够更全面地捕捉空间相互作用。传统的单视角方法通常只考虑细胞自身的表达或简单的空间邻近关系,而 MISTy 的多视角框架能够区分不同距离范围内的空间影响,提供更准确和可解释的共定位分析结果。
Q2:如何理解 MISTy 输出的共定位得分?
- A:MISTy 的共定位得分基于机器学习模型(如随机森林)的特征重要性得分计算。得分越高,表示该受配体对在空间上的共定位关系越强。得分通常反映了不同视角(细胞内、邻近细胞、远距离细胞)对目标基因表达的贡献,可以通过查看各视角的重要性来理解空间相互作用的机制。
Q3:如何选择邻近细胞和远距离细胞的邻域参数?
- A:邻域参数的选择取决于数据的分辨率和组织特征。对于单细胞分辨率数据,邻近细胞通常定义为固定半径(如 100-200 μm)。
Q4:MISTy 对数据质量有什么要求?
- A:MISTy 需要高质量的空间转录组数据,包括准确的基因表达矩阵和空间坐标信息。建议数据经过标准的质量控制流程,去除低质量细胞/spot,并进行适当的归一化和批次校正。对于低表达的配体/受体,建议设定表达阈值或聚焦已知强信号的候选清单。
Q5:MISTy 的结果如何与其他空间通讯工具(如 COMMOT、CellChat_spatial)的结果进行比较?
- A:MISTy 强调通过多视角机器学习方法识别空间共定位关系,而其他工具可能更关注通路建模或表达相关性。建议将 MISTy 的结果与其他工具的结果交叉验证,优先关注在多个工具中均显著的受配体对,这样可以提高发现的可信度。
Q6:MISTy 的计算时间如何?
- A:MISTy 的计算时间取决于数据规模、候选受配体对的数量和机器学习模型的复杂度。对于中等规模的数据(数千个细胞/spot,数百个受配体对),通常需要几分钟到几十分钟。
Q7:如何解释 MISTy 结果中不同视角的重要性?
- A:MISTy 会输出每个视角(细胞内、邻近细胞、远距离细胞)对目标基因表达的贡献。如果邻近细胞视角的重要性高,说明空间邻近的细胞对目标基因表达有显著影响;如果远距离细胞视角的重要性高,说明可能存在长距离的空间相互作用。这些信息有助于理解空间相互作用的机制。
参考资料
- GitHub:
https://github.com/saezlab/mistyR - [1] TANEVSKI J, FLORES R O R, GABOR A, et al. Explainable multiview framework for dissecting spatial relationships from highly multiplexed data[J]. Genome Biol, 2022, 23: 97.
- [2] KUPPE C, RAMIREZ FLORES R O, LI Z, et al. Spatial multi-omic map of human myocardial infarction[J]. Nature, 2022, 608: 766–777.
- [3] KHALIQ A M, RAJAMOHAN M, SAEED O, et al. Spatial transcriptomic analysis of primary and metastatic pancreatic cancers highlights tumor microenvironmental heterogeneity[J]. Nat Genet, 2024, 56: 2455–2465.
总结
MISTy 为受–配体空间共定位提供了多视角机器学习框架,通过整合细胞内、邻近细胞和远距离细胞的信息,更全面地捕捉空间相互作用。作为空间通讯研究的关键前置步骤,通过与 COMMOT、CellChat_spatial 等工具的联用,研究者能够从"空间邻近证据 + 通讯建模"两条证据链更有把握地锁定功能性通讯,并指导后续的空间成像与功能实验验证。
