参考基因组数据库
时长: 1 分钟
字数: 248 字
更新: 2026-06-29
阅读: 0 次
概述
SeekSoul™ Methyl Tools 使用通过 --database_dir 提供的统一参考基因组数据库目录。该目录存储转录组和甲基化分析所需的所有资源,包括 STAR 索引、基因组 FASTA、基因注释、Bismark 基因组文件和染色体大小 BED 文件。
推荐的目录结构
text
<database_dir>/
|-- bed/
| |-- chr_len.bed
| `-- chr_nochrM.bed
|-- fasta/
| |-- genome.fa
| |-- genome.fa.fai
| `-- Bisulfite_Genome/
|-- genes/
| `-- genes.gtf
`-- star/构建指南
您可以使用 STAR、samtools 和 bismark_genome_preparation 从 FASTA 文件和 GTF 文件构建该目录。
完整的逐步教程请参见:
注意事项
- 确保
genome.fa和genes.gtf中的染色体名称一致。 - 强烈推荐使用
bed/chr_nochrM.bed,因为工作流更倾向于使用不包含线粒体序列的染色体列表。 - 使用 Docker 或 Kubernetes 运行时,请确保数据库目录已挂载到容器或 pod 内。
