odgi paths 命令输出图形泛基因组里每个节点被多少个路径穿过
odgi paths -i input.og --coverage-levels 1,2,90,100 > chr1_nodes_classification.txt
比如有100个基因组构建图形泛基因组 1,2,90,100 这4个数字的意思是
节点只存在一个路径,
节点存在于2到89个路径
节点存在于90到99个路径
节点存在于100个路径
odgi paths 命令还可以输出每个节点的深度
odgi paths -i input.og -H -D "#" -p1 -t 16 > chr1_nodes_composition.txt
一下是输出文件的前几行
这个输出文件每行是样本,每列是节点,节点有很多,这个节点会有很多列,这种行不是很多,列确很多的文件R语言读取还挺费劲的,我想把这个文件做个转置,查了查有没有大文件的转置工具,找到了一个工具叫datamash
直接用conda就可以安装,转置命令
datamash transpose < nodes_composition.txt > nodes_composition.transpose.txt
转置以后用R语言的 data.table包的fread命令读取就可以了
欢迎大家关注我的公众号
小明的数据分析笔记本
声明:来自小明的数据分析笔记本,仅代表创作者观点。链接:https://eyangzhen.com/2222.html