Skip to content

我的数据

作者: 高瑞峰
时长: 5 分钟
字数: 1.2k 字
更新: 2025-09-11
阅读: 0 次
云平台 使用说明

“我的数据”可查看账号下可用于创建分析流程的数据,包括寻因关联标准分析数据及用户自行上传的数据。

快速创建流程

选择需要分析的样本数据,点击【快速创建流程】按钮可快速创建项目及其分析流程,保存后会跳转到新项目流程进行初始化,后续步骤可参考前文“基础分析”。

数据上传

数据上传主要用于本地上传需分析的单细胞数据,点击该按钮会跳转到数据上传窗口,根据信息填写选择数据上传,数据类型分为标准分析和单样本数据两种。

标准分析结果

标准分析结果指已基于Seuratscanpy完成单细胞标准分析(过滤、标准化、归一化、降维(整合)、聚类等分析)的文件,仅支持SeuratObject(rds)格式数据。

1.1 上传“标准分析结果”的“rds”类型文件,填写信息并点击【提交】,待校验信息显示“成功”后可创建流程进行分析,还可将数据“分享”给其他用户。

NOTE

上传标准分析结果可在基础分析阶段跳过过滤整合。

1.2 数据类型为“标准分析结果”的“rds”类型文件格式要求:

  • 数据结构必须为SeuratObject(rds)对象格式,文件必须以.rds结尾,metadata中必须包括nCount_RNA、nFeature_RNA和RNA_snn_res.x.x(或resolution.x.x,x.x为分辨率值,如RNA_snn_res.0.5或resolution.0.5)标签。
  • 若metadata中无Sample标签,则以上传时的文件名称作为样本名称。
  • 若metadata中无percent.mito信息,将自动计算以MT-、mt-或Mt-为起始的基因名占全部基因的比例,并以mito为列名。
  • 检验信息为“成功”时,说明上传数据成功。
nCount_RNA(必有)nFeature_RNA(必有)RNA_snn_res.0.5(必有)Sample(多样本时必有)percent.mt(可选)
AAACATACAACCAC-124197794A3.0177759
AAACATACAACTAC-1421917273A0.8897363
AAACATACAACGAC-19805452C1.2244898
AAACATACAACCCC-12631324C1.6643551

1.3 云平台如何读取“标准分析结果”的“rds”类型文件:

r
# 加载R包
library(Seurat)
# 读取数据
standard_demo_rds <- readRDS("standard_demo.rds")

1.4 文件核验未通过的常见原因:

  • 标准分析结果rds格式文件并非SeuratObject(rds)类型。
  • metadata中未检测到nCount_RNA、nFeature_RNA信息。
  • metadata中无RNA_snn_res.x.x或resolution.x.x分辨率标签。
  • metadata中无Sample标签,导致多样本数据被视为单样本。

单样本数据

单样本数据指单细胞的表达矩阵文件,支持SeuratObject(rds)、数据矩阵(matrix)、HDF5(h5)、Scanpy文件(h5ad)和基于HDF5的loom文件。

2.1 上传“单样本数据”可支持多种格式,包括“rds”、“matrix”、“h5”、“h5ad”和“loom”类型文件,填写信息并点击【提交】,待校验信息显示“成功”后可创建流程进行分析,还可将数据“分享”给其他用户。

2.2 云平台如何读取“单样本数据”的“rds”类型文件:

r
# 加载R包
library(Seurat)
# 读取数据
single_demo_rds <- readRDS("single_demo.rds")

2.3 “matrix”类型文件格式要求:

  • 包含barcodes.tsv(1列barcode)、features.tsv(2列,ensemble id和基因名)、matrix.mtx(表头和3列,分别为基因名、barcode、counts)。

barcodes.tsv示例:

AAACATACAACCAC-1
AAACATTGAGCTAC-1
...

features.tsv示例:

ENSG00000243485 MIR1302-10
ENSG00000237613 FAM138A
...

matrix.mtx示例:

%%MatrixMarket matrix coordinate real general
%
32738 2700 2286884
32709 1 4
...

2.4 云平台如何读取“matrix”类型文件:

r
# 加载R包
library(Seurat)
# 读取数据
dir = "./single_demo_matirx"
single_demo_matrix =  CreateSeuratObject(Read10X(dir))

2.5 云平台如何读取“h5”类型文件:

r
# 加载R包
library(Seurat)
# 读取数据
single_demo_h5 <- CreateSeuratObject(Read10X_h5("single_demo.h5"))

2.6 云平台如何读取“h5ad”类型文件:

r
# 加载R包
library(SeuratDisk)
# 读取数据
Convert('single_demo.h5ad', "h5seurat",overwrite = TRUE,assay = "RNA")
single_demo_h5seurat <- LoadH5Seurat("single_demo.h5seurat")

CAUTION

h5ad数据列应为分类变量,否则执行LoadH5Seurat时会报错Missing required datasets 'levels' and 'values'导致上传失败。

2.7 云平台如何读取“loom”类型文件:

r
# 加载R包
library(SeuratDisk)
# 读取数据
single_demo_loom <- LoadLoom("single_demo.loom")
0 条评论·0 条回复