大文件转置的工具datamash

odgi paths 命令输出图形泛基因组里每个节点被多少个路径穿过

odgi paths -i input.og --coverage-levels 1,2,90,100 > chr1_nodes_classification.txt

比如有100个基因组构建图形泛基因组 1,2,90,100 这4个数字的意思是

节点只存在一个路径,

节点存在于2到89个路径

节点存在于90到99个路径

节点存在于100个路径

odgi paths 命令还可以输出每个节点的深度

odgi paths -i input.og -H -D "#" -p1 -t 16 > chr1_nodes_composition.txt

一下是输出文件的前几行

这个输出文件每行是样本,每列是节点,节点有很多,这个节点会有很多列,这种行不是很多,列确很多的文件R语言读取还挺费劲的,我想把这个文件做个转置,查了查有没有大文件的转置工具,找到了一个工具叫datamash

直接用conda就可以安装,转置命令

datamash transpose < nodes_composition.txt > nodes_composition.transpose.txt

转置以后用R语言的 data.table包的fread命令读取就可以了

欢迎大家关注我的公众号

小明的数据分析笔记本

声明:来自小明的数据分析笔记本,仅代表创作者观点。链接:https://eyangzhen.com/2222.html

小明的数据分析笔记本的头像小明的数据分析笔记本

相关推荐

关注我们
关注我们
购买服务
购买服务
返回顶部