应舍友所邀,写一个使用Tbtools进行基因家族共线性的分析
写在最前
第一点:
除了基因组成的相似性, 在不同基因组中基因排列顺序的一致性更能够体现基因组的共同起源, 这种基因排列顺序的一致性称为共线性(synteny, colinearity) 。
第二点:
而对于一个物种而言,基因组序列的稳定性比转录组序列的稳定性更强健。一个非常明显的事实是,换个组织或者时期测定转录组,那么得到的序列集合就会有所变化,而基因组的往往只存在极小的序列变化。基因组,更多的序列,也提供了更多的生物信息。从其中挖掘出有趣的信息,往往有助于我们日后“定向育种”。而简单的“比较基因组”分析,常常会让我们眼前一亮。
正文开始
首先说明,为了保证快速出图,只用咖啡的三条染色体做一下共线性。大家做不同基因组之间的比对时,也是同理。
首先使用TBtools里面的 One Step MCScanX功能来进行共线性分析;
不过我们需要先准备一下所需要的文件;一个是修改过后的基因组文件,一个是基因组的fasta文件。
fasta文件这里就不行进行示例,毕竟天下fasta序列一个样子,仅展示一下gff文件的格式
1 | $ less ../Coffea/Coffea.gff |
准备好文件按照guide对应位置放好文件之后
然后就是点击最下面的start就开始了
如果有在运行,就不用管那些报错。直到软件弹出窗口告诉你finished为止。
之后让我们打开分析结果的文件夹,里面我们需要的文件夹就三个,collinearity结尾的和ctl结尾的和gff结果的文件。
之后进入Dual Systeny Plot进行绘图
ps. 如果你比对的是全基因组,可根据修改ctl文件,修改展示顺序,或者删掉你不需要的部分。
到此为止,基因组共线性分析与可视化基本可以实现。辛辛苦苦写的,看完点赞哈。
这篇文章主要记录如何分析基因组之间共线性,如果你需求是 两个基因组指定区段的物种相似性 ,那么请你去看这篇文章,CJ大神真的写的非常非常清楚了,同样是保姆级教程,你值得拥有。
——————–
感谢观看