我是在论文
The 1001G+ project: A curated collection of Arabidopsis thaliana long-read genome assemblies to advance plant research
中看到的这个工具
大规模测序应该还是有意义的(具体有啥意义还需要总结)
工具github主页
3个样本
seqkit grep -p Chr1 ../minimap2.syri/00.ref/at.col0.chr.fna -o 00.ref/col0.chr1.fa
seqkit grep -p Chr1 ../minimap2.syri/00.qrys/An1.fa -o 00.ref/An1.chr1.fa
seqkit grep -p Chr1 ../minimap2.syri/00.qrys/C24.fa -o 00.ref/C24.chr1.fa
seqkit grep -p Chr1 ../minimap2.syri/00.qrys/Kyo.fa -o 00.ref/Kyo.chr1.fa
minimap2比对
minimap2 -ax asm5 00.ref/col0.chr1.fa 00.ref/An1.chr1.fa -t 8 | samtools sort -@ 8 -O BAM -o 02.bam/An1.sorted.bam
minimap2 -ax asm5 00.ref/col0.chr1.fa 00.ref/C24.chr1.fa -t 8 | samtools sort -@ 8 -O BAM -o 02.bam/C24.sorted.bam
minimap2 -ax asm5 00.ref/col0.chr1.fa 00.ref/Kyo.chr1.fa -t 8 | samtools sort -@ 8 -O BAM -o 02.bam/Kyo.sorted.bam
samtools index 02.bam/An1.sorted.bam
samtools index 02.bam/C24.sorted.bam
samtools index 02.bam/Kyo.sorted.bam
检测变异
time ~/biotools/minipileup-master/minipileup -f 00.ref/col0.chr1.fa -vcC -s0 -a0 -q0 -l 20000 02.bam/An1.sorted.bam 02.bam/C24.sorted.bam 02.bam/Kyo.sorted.bam > var.vcf
速度非常快
输出文件
欢迎大家关注我的公众号
小明的数据分析笔记本
声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/424401.html