写在这篇文章之前,笔者本人最近开始接触hic这一方面的流程,以此文作为一个记录(juicer+3ddna)
hic的作用是将你获得的contig级别的数据提升到染色体水平
juicer+3ddna
1.软件安装
在软件安装之前,你首先需要在工作设备拥有一下环境
Java >= 1.7
GNU Awk >= 4.02
GNU coreutils sort > 8.11
Python >= 2.7
scipy, numpy, matplotlib
GNU Parallel >=20150322 (不必要,但是强力推荐)
bwa
除了bwa之外,其他依赖在一个成熟的工作站上,基本都是不用操心的
接下来我们需要安装juicer开始我们的工作了
juicer的安装
1 | $ mkdir juicer && cd juicer |
记得对要执行的文件赋予755权限
3ddna的安装
1 | $ mkdir 3ddna && cd 3ddna |
这个就稍显简单很多
2,分析开搞
1.准备数据
在juicer的目录下面建立两个文件夹
1). refrence: 存放你contig水平的基因组文件,记得检查N50哦;
2). fastq : 存放你的hic双端测序结果R1.fq.gz和R2.fq.gz
2.为基因组建立索引
1 | $ bwa index genome.fa |
3.根据基因组构建创建可能的酶切位点文件
1 | $ python /data1/spider/ytbiosoft/soft/juicer/misc/generate_site_positions.py DpnII genome genome.fa |
4.运行juicer
1 | $ ./juicer.sh -g idesia_split_2m -s HindIII -z ./refrence/genome.fa -p assembly |
5.运行3d-dna
记得将reference文件夹和aligned文件夹软连接到你的3d-dna的工作目录
1 | ./run-asm-pipeline.sh -r 2 reference/genome.fa aligned/merged_nodups.txt &> 3d.log & |
最后输出文件中,包含FINAL就是我们需要的结果。
最后使用juicerbox进行手工纠错,在使用3d-dna重新生成基因组文件