Skip to content

参考基因组数据库

作者: SeekGene
时长: 1 分钟
字数: 248 字
更新: 2026-06-29
阅读: 0 次
甲基化 + RNA 双组学 参考

概述

SeekSoul™ Methyl Tools 使用通过 --database_dir 提供的统一参考基因组数据库目录。该目录存储转录组和甲基化分析所需的所有资源,包括 STAR 索引、基因组 FASTA、基因注释、Bismark 基因组文件和染色体大小 BED 文件。

推荐的目录结构

text
<database_dir>/
|-- bed/
|   |-- chr_len.bed
|   `-- chr_nochrM.bed
|-- fasta/
|   |-- genome.fa
|   |-- genome.fa.fai
|   `-- Bisulfite_Genome/
|-- genes/
|   `-- genes.gtf
`-- star/

构建指南

您可以使用 STAR、samtools 和 bismark_genome_preparation 从 FASTA 文件和 GTF 文件构建该目录。

完整的逐步教程请参见:

注意事项

  • 确保 genome.fagenes.gtf 中的染色体名称一致。
  • 强烈推荐使用 bed/chr_nochrM.bed,因为工作流更倾向于使用不包含线粒体序列的染色体列表。
  • 使用 Docker 或 Kubernetes 运行时,请确保数据库目录已挂载到容器或 pod 内。
0 条评论·0 条回复