把scaffold水平的基因组数据拆分成contig水平

这个直接用ragtag软件里的ragtag_splitasm.py脚本来做就行
ragtag的github主页
https://github.com/malonge/RagTag
直接用conda安装就行
安装好以后这里的脚本就可以使用了
scaffold拆分成contig的命令
ragtag_splitasm.py ../00.qrys/An1.fa -o An1.agp > An1.contig.fa
An1.contig.fa 就是拆分以后得基因组数据
agp文件记录的是每条染色体拆分成了哪几条序列

有了这个文件还可以把拆分的contig基因组文件重新连成scaffold水平的基因组文件
用到的命令是 ragtag_agp2fa.py,这个脚本也来自于ragtag这个软件里,用到的命令是
ragtag_agp2fa.py An1.agp An1.contig.fa > An1.scaffold.fasta
在用ragtag 的patch命令补基因组上的gap的时候 有的时候可能会出现不同的scaffold之间连错的情况,这个时候就需要手动修改 ragtag.patch.agp这个文件,然后用ragtag_agp2fa.py命令重新生成基因组文件
ragtag的patch命令输出文件
ragtag.patch.ctg.agp 这个文件记录的是原始基因组根据gap拆分成contig , 原始ID和拆分以后得ID的对照表

ragtag.patch.agp
这个文件是最终的 那几个contig链接染色体的对照表

ragtag.patch.comps.fasta 这个文件吧需要补gap的基因组和用于补gap的基因组都合并到一起了,并且序列id是重新命名的

声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/425063.html

联系我们
联系我们
分享本页
返回顶部