scMetabolism 代谢通路分析文档
前言
TIP
scMetabolism是一个强大的单细胞转录组数据分析工具,专门用于量化和可视化单个细胞内的代谢活性。它通过对基因表达谱进行打分,评估细胞中特定代谢通路的富集程度,从而揭示在不同细胞亚群、不同发育阶段或不同疾病状态下代谢模式的异质性。
在单细胞研究中,细胞代谢的重编程在细胞分化、免疫应答和疾病发生(如癌症)等多种生物学过程中扮演着至关重要的角色。scMetabolism的出现,使得研究者能够超越传统的基因表达分析,从代谢功能的角度深入探索细胞状态和功能的动态变化。
scMetabolism的核心功能
- 代谢通路活性量化:基于预定义的KEGG和REACTOME代谢通路基因集,为每个单细胞计算代谢通路富集分数。
- 代谢异质性可视化:通过降维图(t-SNE/UMAP)、热图、箱线图等多种形式,直观展示不同细胞群间的代谢差异。
- 跨样本/跨组比较:轻松比较不同实验条件(如疾病组vs.对照组)下细胞代谢活性的变化。
本篇文档旨在为单细胞研究者提供一份详尽的scMetabolism技术指南,内容涵盖其基本原理、在SeekSoulOnline云平台上的操作方法、结果解读及实战案例,帮助您快速掌握并应用该工具进行深入的单细胞代谢分析。
scMetabolism理论基础
核心原理
scMetabolism的核心思想是:通过评估与特定代谢通路相关的一组基因在单个细胞中的整体表达水平,来推断该代谢通路的活性。 这个过程主要基于基因集富集分析(GSEA)的变体算法。
scMetabolism集成了多种单细胞基因集打分算法,包括VISION
、AUCell
、ssgsea
和gsva
。用户可以根据研究需求选择最适合的算法。其基本步骤如下:
基因集定义:scMetabolism内置了来自KEGG(京都基因与基因组百科全书)和REACTOME等权威数据库的代谢通路基因集。每个基因集包含了一组参与特定代谢途径(如“糖酵解”或“脂肪酸合成”)的基因。目前内置的基因集支持人和小鼠。
单细胞打分:对于每个细胞和每个代谢通路,scMetabolism会计算一个富集分数。该分数反映了该通路基因集在该细胞中的相对表达水平。简单来说,如果一个细胞高表达了某个代谢通路中的多个基因,那么它在该通路上的得分就会更高。云平台默认使用
AUCell
方法进行计算。统计与可视化:计算出所有细胞在所有通路上的得分矩阵后,就可以进行下游的统计分析和可视化,例如:
- 使用t-SNE或UMAP图,根据代谢通路得分对细胞进行着色,观察通路活性在不同细胞群中的分布模式。
- 绘制热图,展示不同细胞亚群中各个代谢通路的富集情况。
- 使用箱线图或小提琴图,比较不同组别(如处理组vs.对照组)之间特定代谢通路活性的差异。
TIP
scMetabolism的优势在于它提供了一个标准化的流程来分析单细胞代谢,将复杂的基因表达数据转化为直观的、可解释的代谢通路活性图谱,极大地简化了单细胞代谢异质性的研究。
云平台操作指南
在云平台上,scMetabolism分析流程被设计得直观易用。您无需编写代码,只需通过参数配置界面即可完成分析。
分析前的准备
TIP
在开始scMetabolism分析前,请务必确认:
- 数据已完成预处理:您的单细胞数据已经过标准的质控、降维、聚类和细胞类型注释。这是进行任何高级分析的基础。
- 明确生物学问题:您希望比较哪些细胞群之间,或哪些条件下(如用药前后)的代谢差异?明确的问题将指导您选择正确的分组和比较策略。
参数详解
下表详细列出了云平台scMetabolism分析模块的主要参数及其说明。
界面参数 | 说明 |
---|---|
任务名称 | 本次分析的任务名称,需以英文字母开头,可包含英文字母、数字、下划线和中文。 |
分组因子 | 选择要分析的细胞类型或者聚类对应的标签。假如想对注释好的细胞类型进行分析,则选择其对应的标签,例如CellAnnotation ,与<细胞类型>配合使用。 |
细胞类型 | 多选,选择要分析的细胞类型或者聚类结果,如T cell、NK Cell和Monocyte等。 |
拆分因子 | 绘图时的拆分标签。一般选择分组或者样本的标签,比如Group 或Sample 。 |
物种 | 只支持人和小鼠。 |
分析类型 | 单细胞转录组、全序列选择“SingleCell”,10X空间转录组选择“10x_Visium”,SeekSpace空间转录组选择“SeekSpace”。 |
分析方法 | 包括“VISION”和“AUCell”。 |
备注 | 自定义备注信息。 |
操作流程
- 进入分析模块:在云平台导航至“高级分析”模块,选择“scMetabolism”。
- 创建新任务:为您的分析任务命名。
- 配置参数:根据上述指南,选择分组因子、细胞类型、物种等关键参数。
- 提交任务:确认参数无误后,点击“提交”按钮,等待分析完成。
- 下载与查看:分析结束后,在任务列表中下载并查看生成的分析报告和结果文件。
结果解读
scMetabolism的分析报告提供了丰富的可视化图表和数据表格,帮助您全面理解单细胞代谢异质性。报告主要包含基于KEGG和REACTOME两个数据库的分析结果。
KEGG通路结果
分组的活性平均得分气泡图
- 图表解读:
- Y轴:代表不同的代谢通路。
- X轴:代表不同的样本或分组(由“拆分因子”参数决定)。
- 气泡大小:表示富集到该通路的基因数目。气泡越大,基因数越多。
- 气泡颜色:表示通路的富集分数(NES,Normalized Enrichment Score)。颜色越红,表示通路活性越高;颜色越蓝,表示通路活性越低。
- 分析要点:
- 快速识别在不同样本/分组中存在显著差异的代谢通路。例如,某个通路在疾病样本中普遍呈现红色,而在对照样本中呈现蓝色,说明该通路在疾病状态下被激活。
分组的活性平均得分热图
- 图表解读:
- 行:代表不同的代谢通路。
- 列:代表单个细胞,并根据细胞类型或分组进行组织。
- 颜色:表示每个细胞在对应通路上的富集分数。红色表示高活性,蓝色表示低活性。
- 分析要点:
- 观察特定细胞亚群的整体代谢特征。例如,肿瘤细胞群可能在“糖酵解”通路上呈现一片红色,而免疫细胞群可能在“氧化磷酸化”通路上更活跃。
- 识别细胞群内部的代谢异质性。即使在同一细胞类型中,也可能存在代谢状态不同的细胞亚群。
活性得分在降维图中的映射结果
- 图表解读:将特定代谢通路(如“精氨酸和脯氨酸代谢”)的富集分数投影到t-SNE或UMAP降维图上。
- 每个点代表一个细胞。
- 颜色:表示该细胞在该通路上的富集分数。颜色越红,活性越高。
- 分析要点:
- 直观地将代谢通路活性与预先定义的细胞群(如T细胞、B细胞)联系起来。可以清晰地看到某个代谢通路是否在特定的细胞亚群中特异性高表达。
KEGG代谢条目分组类型活性得分箱线图
- 图表解读:以箱线图或小提琴图的形式,展示特定代谢通路在不同样本或分组中的富集分数分布。
- 分析要点:
- 对不同组间(如肿瘤vs.癌旁)的代谢通路活性进行统计比较。图中通常会标出统计学显著性(p-value),为组间差异提供统计支持。
REACTOME通路结果
分组的活性平均得分气泡图
- 图表解读:与KEGG气泡图类似,展示REACTOME通路的富集情况。
分组的活性平均得分热图
- 图表解读:与KEGG热图类似,展示REACTOME通路的富集情况。
活性得分在降维图中的映射结果
- 图表解读:与KEGG降维图类似,展示REACTOME通路的富集情况。
REACTOME代谢条目分组类型活性得分箱线图
- 图表解读:与KEGG箱线图类似,展示REACTOME通路的富集情况。
结果文件列表
文件名/目录 | 内容说明 |
---|---|
KEGG/ | 存放所有基于KEGG数据库的分析结果图表和数据。 |
REACTOME/ | 存放所有基于REACTOME数据库的分析结果图表和数据。 |
KEGG/KEGG_scores.csv | 核心数据:包含每个细胞在每个KEGG代谢通路上的原始富集分数。 |
REACTOME/REACTOME_scores.csv | 核心数据:包含每个细胞在每个REACTOME代谢通路上的原始富集分数。 |
应用案例
案例:scMetabolism揭示结直肠癌肝转移中的代谢重编程
- 文献:Wu, Y., et al. (2022). Spatiotemporal Immune Landscape of Colorectal Cancer Liver Metastasis at Single-Cell Level. Cancer Discovery.
- 背景:结直肠癌肝转移(CRLM)是导致患者死亡的主要原因。研究者希望了解在肿瘤转移过程中,肿瘤微环境内的免疫细胞,特别是髓系细胞的代谢状态发生了怎样的变化。
- 分析策略:研究者利用scMetabolism分析了来自CRLM患者的单细胞转录组数据,重点关注髓系细胞(如巨噬细胞和单核细胞)的代谢特征。
- 核心发现:
- 识别出不同髓系细胞亚群的特异性代谢特征:分析发现,一类特殊的
MRC1+CCL18+
的巨噬细胞表现出极高的整体代谢活性,远超其他髓系细胞。 - 揭示了高代谢活性与促肿瘤功能的相关性:这类高代谢活性的巨噬细胞同时高表达多种与免疫抑制和肿瘤进展相关的基因,表明其代谢状态可能支持了它们的促肿瘤功能。
- 提供了潜在的治疗靶点:通过识别巨噬细胞中高表达的代谢相关基因(如
MMP9
,MMP12
等),为开发靶向肿瘤相关巨噬细胞代谢的治疗策略提供了新的思路。
- 识别出不同髓系细胞亚群的特异性代谢特征:分析发现,一类特殊的
(图注:(B) 髓系细胞的代谢活性分析,圆圈的大小和颜色代表代谢评分,LM_MRC1+ CCL18+巨噬细胞得分最高。(C) 该类巨噬细胞的平均代谢基因表达和代谢通路得分热图,红色基因代表潜在的药物靶点。)
注意事项
1. 基因集覆盖度:scMetabolism的分析结果依赖于预定义的基因集。如果某个代谢通路中的关键基因没有被包含在基因集里,或者在测序中没有被很好地捕获,可能会影响该通路得分的准确性。
2. 转录本水平不完全等同于代谢物水平:scMetabolism是基于转录组数据推断代谢活性,它反映的是细胞在“准备”进行哪些代谢活动。真实的代谢物水平还受到翻译后修饰、酶活性调控和底物可用性等多种因素的影响。因此,任何关键发现最好能通过代谢组学等实验手段进行验证。
3. 关注一致性趋势:单个通路的微小变化可能不足以得出结论。应重点关注那些在不同数据库(KEGG和REACTOME)、不同可视化方法(热图、气泡图、降维图)中都表现出一致性变化趋势的代谢通路。
常见问题解答 (FAQ)
Q1: scMetabolism的得分是如何计算的?我应该使用VISION还是AUCell方法? A: scMetabolism集成了多种打分方法。AUCell
(云平台默认)基于基因表达的排序来计算富集分数,对基因表达量的绝对值不敏感,较为稳健。VISION
则考虑了基因间的协变关系,在某些场景下能提供更丰富的信息。两者各有优劣,通常情况下,AUCell
的结果已经足够用于发现主要的代谢异质性。在云平台中,您可以根据需要选择不同的方法进行尝试和比较。
Q2: 为什么我的某个通路得分很低,但这与我的预期不符? A: 首先,检查该通路在您所选物种的基因集中是否包含足够数量的基因。其次,检查这些基因在您的数据中的整体表达水平是否过低(可能是由于技术原因如dropout)。最后,如前所述,转录本水平的下调不完全代表代谢活性的抑制,可能存在其他调控层面的变化。
Q3: 如何选择要进行下游分析的关键代谢通路? A: 您可以从气泡图中挑选在不同组间差异最显著(颜色和大小差异大)的通路。也可以从热图中选择在特定细胞亚群中表现出特异性高表达或低表达模式的通路簇。结合您的生物学问题,优先选择与您研究方向最相关的通路进行深入分析。
参考文献
- Wu Y, Yang S, Ma J, et al. Spatiotemporal Immune Landscape of Colorectal Cancer Liver Metastasis at Single-Cell Level. Cancer Discov. 2022;12(1):134-153. doi:10.1158/2159-8290.CD-21-0316