Skip to content

辅助信息

作者: SeekGene
时长: 10 分钟
字数: 2.6k 字
更新: 2025-09-11
阅读: 0 次

“辅助信息”模块是您在云平台进行数据分析时的“仪表盘”和“工具箱”,它集成了多个关键功能,旨在确保您的分析工作流程清晰、可追溯且高效。本模块主要包含两大核心板块:

  • 标签管理:提供一整套强大的元数据(meta.data)编辑工具,让您可以灵活地创建、修改、合并和管理细胞标签,从而深入挖掘数据价值。
  • 操作日志:忠实记录您在平台上对meta.data的每一步操作,为您提供完整的历史记录,便于问题排查和流程回顾。

NOTE

辅助信息模块有助于追溯分析流程、标签变更和操作历史,建议定期检查以保障数据一致性。


标签管理

本节介绍的工具可帮助您管理和操作细胞的元数据(meta.data)标签。您可以对标签进行删除、修改、合并、新增等操作,以满足不同的分析需求。

可对当前流程内的标签进行删除、修改、合并和新增。点击“x”可删除该列标签,点击“✏”可对该列标签进行修改。

点击【新增标签】,可对标签进行合并和新增。

1. 新建分辨率

“新建分辨率”功能允许您调整聚类的粒度,从而影响细胞分群的精细程度。这与细胞注释模块中的功能一致。

核心优势:

  • 探索不同层级的细胞结构: 通过调整分辨率,您可以在不同尺度上探索细胞群体。较高的分辨率会产生更多、更小的细胞簇,适合精细分析;较低的分辨率则产生较少、较大的细胞簇,适合宏观观察。
  • 优化分析策略: 根据您的生物学问题,选择最合适的分辨率,以获得最佳的细胞分群结果。

该功能为探索性数据分析提供极大的灵活性,帮助您发现不同层次的生物学模式。

2. 添加标签

“添加标签”功能允许您根据一个或多个条件对细胞(Barcode)进行分组和标记,从而创建新的自定义标签。这对于从复杂数据中筛选、识别和分析特定细胞亚群非常有用。和“画图工具”添加标签模块功能一致。

功能优势

  • 精准筛选细胞群:通过设置多个筛选条件(例如,来自特定样本、表达特定基因、属于某个聚类),可以精确地定义和分离出您感兴趣的细胞群体。
  • 简化复杂分析:将符合多个条件的细胞归为一个新标签,可以简化后续的差异表达分析、可视化和功能富集分析。
  • 提高分析灵活性:您可以根据研究需求,动态创建任意复杂的细胞分组,而不受限于预设的注释信息。

操作步骤

点击【新增标签】后,选择“添加标签”功能。

进入“添加标签”页面后,您可以按照以下步骤操作:

  1. 命名新标签:在“名称”处为您的新标签输入一个描述性的名称。
  2. 设置筛选条件
    • 选择要筛选的(例如 seurat_clusters)。
    • 使用运算符(“==”等于 或 “≠”不等于)和来定义条件。
    • 如果需要多个条件,可以使用逻辑运算符(“and”交集 或 “or”并集)来组合它们。
  3. 定义默认值:为不满足条件的细胞设置一个默认标签,通常是“Undefined”,但也可以自定义。
  4. 完成添加:点击【添加标签】按钮,系统会根据您设置的条件创建一个新的标签列。这个新标签可用于后续的所有分析和可视化。

例如,您可以创建一个标签,用于标记所有来自“样本A” 并且 属于“T细胞”的细胞,以便专门分析这部分细胞的特征。

3. 合并亚群注释

在单细胞分析中,我们常常会对一个大的细胞群体(如T细胞)进行再次聚类,以鉴定更精细的亚群(如CD4+ T细胞、CD8+ T细胞)。“合并亚群注释”功能可以将这些更精细的亚群标签整合回原始的细胞注释列中,实现注释信息的更新和统一。

应用场景:当您完成对某个细胞亚群(例如B细胞)的精细注释后,希望将这些详细的标签(如“Memory B cell”、“Plasma B cell”)更新到主流程的总体细胞类型标签中,取代原有的“B cell”标签。

操作流程

  1. 首先,选择包含主要细胞群体(大群)的流程和标签列。
  2. 然后,选择包含精细亚群注释的流程和标签列。
  3. 系统会将亚群的注释精确地覆盖到大群对应的细胞上,生成一列新的、信息更丰富的细胞注释。

选择大群中要被覆盖的标签(如celltype_shoudong)和亚群中准备覆盖的标签(如sub_B_celltype)。

可看到标签“celltype_shoudong”中的“B cell”在标签“CellTypeWithSubB”中被覆盖为“Memory B cell”。

CAUTION

合并亚群注释时,原有标签内容会被新标签覆盖,请谨慎操作。

4. 合并列

“合并列”功能允许您将多个现有的元数据列(标签)合并成一个单一的、信息更丰富的列。这对于创建能够反映多重实验条件或细胞特征的复合标签非常有用。

使用场景:

  • 整合实验信息: 将“样本来源”(如Sample)和“处理条件”(如Treatment)合并,生成一个能唯一标识每个细胞组的标签(例如SampleA_DrugX)。
  • 创建精细注释: 将一个粗略的细胞类型注释(如T_cell)与一个更精细的聚类结果(如cluster_id)合并,以获得更精确的细胞亚群定义(例如T_cell_cluster1)。

操作步骤:

  1. 命名新标签: 为合并后的新列指定一个描述性名称。
  2. 选择分隔符: 选择一个分隔符(如“_”或“-”)来连接合并列的内容。
  3. 选择合并列: 勾选您希望合并的列。

合并后,新的复合标签将出现在您的元数据中,如下图所示,标签“Sample”和“CellAnnotation”通过分隔符“_”合并成了新标签“test”。

5. 上传合并meta

此功能是实现数据整合的关键。它允许您将本地存储的元数据文件(如临床信息、样本批次、或其他分析生成的注释)上传并合并到当前云平台的分析流程中。

核心要求:

  • 文件格式: 支持.txt.csv格式。
  • 匹配键: 您的本地文件必须包含一个名为barcode的列,其内容需要与云平台流程中的细胞条形码相对应。这是合并的依据。
  • 列名唯一性: 除了barcode列,本地文件需要至少包含另一个信息列,并且其他列名不能与流程中已有的元数据列名重复,以避免冲突。

应用价值:

  • 整合多源数据: 将外部的临床数据、样本信息或自定义注释与单细胞表达数据关联起来,进行更深入的整合分析。
  • 导入其他分析结果: 将使用其他软件(如Seurat、Scanpy)生成的聚类或注释结果导入平台,实现跨平台分析。

6. 复制列

“复制列”是一个简单但实用的功能,允许您创建一个现有列的精确副本,并为其指定一个新名称。

常见用途:

  • 备份与探索: 在对一个重要的注释列(如手动注释的细胞类型)进行修改或重新分类之前,先复制一份作为备份,以防操作失误。
  • 创建衍生标签: 将一个现有列作为新标签的基础,然后在此副本上进行修改(例如,合并或删除某些类别),而无需改动原始数据。

7. 格式转换

“格式转换”功能允许您更改元数据中特定列的数据类型。正确的数据类型对于后续的分析和可视化至关重要。

常见转换场景:

  • 数值转字符: 将数值型变量(如聚类cluster)转换为字符型变量。这在需要将这些变量作为分类条件进行分组或绘图时非常有用。
  • 字符转数值: 在某些需要进行数学计算的场景下,可能需要将标签转换为数值。

为什么重要

  • 分析兼容性: 某些统计分析或可视化工具要求输入特定类型的数据(例如,分组比较通常需要字符型变量)。
  • 数据解释: 正确的格式有助于平台和用户正确地解释数据,避免将分类信息误认为连续数值。

操作日志

“操作日志”板块是您项目分析历程的忠实记录者。它详细记载了每一次对meta.data进行的修改、新增、删除等操作,包括操作时间、具体内容等关键信息。

核心价值

  • 分析过程可追溯:当您或合作者对分析结果有疑问时,可以通过日志快速回溯,了解每一个标签是如何产生或被修改的。
  • 保障数据安全性:所有操作均有记录,有效防止误操作或恶意修改导致的数据混乱,保障了分析的严谨性。

0 条评论·0 条回复