运行
时长: 3 分钟
字数: 728 字
更新: 2026-02-26
阅读: 0 次
运行示例
示例 1:基本用法
为分析设置必要的配置文件,包括样本数据的路径、参考基因组路径等。使用以下命令运行 SeekArc Tools v1.1.0:
shell
seekarctools arc run \
--rnafq1 /path/to/demo/demo_GE_S1_L001_R1_001.fastq.gz \
--rnafq2 /path/to/demo/demo_GE_S1_L001_R2_001.fastq.gz \
--atacfq1 /path/to/demo/demo_arc_S2_L002_R1_001.fastq.gz \
--atacfq2 /path/to/demo/demo_arc_S2_L002_R2_001.fastq.gz \
--samplename demo \
--outdir /path/to/outdir \
--refpath /path/to/reference/GRCh38 \
--chemistry DD_AG \
--include-introns \
--core 16示例 2:设置阈值重新进行 call peaks 或 call cell
若觉得默认参数下判定出的 peaks 或 cells 不符合需求,可调整参数跳过比对等之前的步骤,重新运行以节省时间
shell
seekarctools arc retry \
--samplename demo \
--outdir /path/to/outdir \
--refpath /path/to/reference/GRCh38 \
--core 16 \
--qvalue 0.01 \
--snapshift 0 \
--extsize 200 \
--min_len 200 \
--min_atac_count 1000 \
--min_gex_count 500NOTE
需注意保持之前运行的文件没有删除或移动。--outdir 为 SeekArc Tools v1.1.0 第一次分析后的目录路径。--min_atac_count 需和 --min_gex_count 一起使用,否则不生效。
参数说明
| 参数 | 参数说明 |
|---|---|
| --rnafq1 | 表达文库 R1 FASTQ 数据路径。 |
| --rnafq2 | 表达文库 R2 FASTQ 数据路径。 |
| --atacfq1 | ATAC 文库 R1 FASTQ 数据路径。 |
| --atacfq2 | ATAC 文库 R2 FASTQ 数据路径。 |
| --samplename | 样本名称。 |
| --chemistry | 试剂类型。可选:DD_AG, DD5_AG。 |
| --outdir | 结果输出目录。默认值:./。 |
| --skip_misB | barcode 不允许碱基错配,默认允许一个碱基错配。 |
| --skip_misL | linker 不允许碱基错配,默认允许一个碱基错配。 |
| --skip_multi | 舍弃能纠错为多个白名单 barcode 的 Reads,默认纠错为比例最高的 barcode。 |
| --skip_len | 在适配器筛选后跳过筛选短读取,将使用短读取。 |
| --core | 分析使用的线程数。 |
| --include-introns | 不启用时,只会选择 exon Reads 用于定量;启用时,intron Reads 也会用于定量。 |
| --refpath | 参考基因组路径。 |
| --star_path | 外部 STAR 软件路径。如果参考基因组中的索引由其他 STAR 构建,请指定该路径。 |
| --qvalue | 峰值检测的最小 FDR(q 值)截止值。默认值:0.001。 |
| --nolambda | 若启用则 MACS3 将使用背景 lambda 作为本地 lambda。这意味着 macs3 不会考虑峰值候选区域的局部偏差。 |
| --snapshift | MACS3 峰值检测的移动幅度。默认值:0。 |
| --extsize | MACS3 峰值检测的拓展幅度。默认值:400。 |
| --min_len | 峰的最小长度。如果无,则设置为 "extsize"。默认值:400。 |
| --broad | 若启用则进行广泛的峰值调用,以 UCSC gappedPeak 格式生成结果,该格式封装了峰值的嵌套结构。 |
| --broad_cutoff | 广泛的峰值调用的阈值。默认值:0.1。 |
| --min_atac_count | 定义细胞条形码峰中 ATAC 转置事件的最小数量(ATAC 计数)。 |
| --min_gex_count | 定义细胞条形码中 UMI 的最小数量(GEX 计数)。 |
| -h,--help | 显示参数说明 |
