FFPE 单细胞数据处理:背景 RNA 去除、双细胞过滤与参数优化
时长: 3 分钟
字数: 663 字
更新: 2026-01-26
阅读: 0 次
案例背景
- 样本类型:胃癌 FFPE (甲醛固定石蜡包埋) 组织
- 问题描述:原始单细胞表达矩阵直接整合聚类效果不理想,cluster 分群不明显,细胞类型注释困难,存在较多背景 RNA 干扰。
数据处理与优化流程
预处理与质量控制
- 对每个样本的表达矩阵进行初步质控。
- 采用 SoupX 去除背景 RNA 污染。
- 使用 DoubletFinder 过滤双细胞 (doublets),过滤阈值:
- UMI 数:500-75,000
- 基因数:200-7,500
- 线粒体基因比例:<10%
TIP
FFPE 样本由于 RNA 降解和背景污染严重,建议务必进行背景去除和双细胞过滤。
聚类与注释效果对比
- 处理前:聚类分群不明显,细胞类型难以准确注释。
- 处理后:
- SoupX 去背景后,cluster 边界清晰,分群改善明显。
- DoubletFinder 进一步去除双细胞,提升聚类纯度。
- 细胞类型注释和 marker 基因表达分布更符合生物学预期。
图注:左为原始聚类,右为 SoupX 处理后聚类
图注:左为原始聚类,中为 SoupX 处理,右为 DoubletFinder 去除双细胞后,双细胞比例约 6%
细胞类型注释与 marker 基因表达
经验总结与优化建议
IMPORTANT
FFPE 样本常见问题包括 RNA 降解严重、总量低、片段短、细胞核完整性差、有核率低 (20-30%)、背景 RNA 多,导致分群弥散。
- 数据处理建议:
- 必须进行背景 RNA 去除 (如 SoupX)
- 过滤双细胞 (如 DoubletFinder)
- 严格质控 (UMI、基因数、线粒体比例)
- 特征选择高变基因,优化聚类参数 (如 PCA 数、分辨率)
- 批次整合建议用 Harmony 等方法优化参数
- 聚类后结合 marker 基因手动调整亚群,去除混合群体
NOTE
聚类和注释效果的提升依赖于多环节优化,建议结合样本特性灵活调整参数。
结论
本案例展示了针对 FFPE 及其它 RNA 表达文库样本,聚类分群不理想时的优化处理流程。通过背景去除、双细胞过滤和参数优化,可显著提升聚类和注释效果。该流程可作为类似问题的参考和建议,帮助用户提升 FFPE 及复杂样本的单细胞分析质量。




