跟着Nature学作图:R语言ggplot2分组折线图展示多个基因组的Nx

论文

Graph pangenome captures missing heritability and empowers tomato breeding

https://www.nature.com/articles/s41586-022-04808-9

西红柿Nature.pdf

论文里提供了很多代码,链接是

https://github.com/YaoZhou89/TGG

这里有eQTL和WGCNA的代码 (明明记得之前是看到过eQTL的代码,但是这次再翻还找不到了)

今天的推文我们试着复现一下论文中的Figure1b 分组折线图

图片
image.png

如果要展示多个基因组的N50,用这个图还挺方便的,现在泛基因组相关的论文大部分都会放这个图,比如人类泛基因组的论文里。

图片
image.png

横轴对应的是N几,纵轴对应的是N几的长度,这篇论文里用不同线型代表不同的测序技术,个人认为用颜色来区分可能会好一些

部分数据截图

图片
image.png

读取数据

library(readxl)
library(tidyverse)
dat<-read_excel("data/20230721/41586_2022_4808_MOESM5_ESM.xlsx",
                sheet = "Fig1b",
                skip = 1)
head(dat)

作图代码

library(ggplot2)

ggplot(data=dat,aes(x=Nx,y=Contig,group=Name))+
  geom_line(aes(color=Tech))+
  theme_classic()+
  labs(x="Nx (%)",y="Contig length (MB)")+
  scale_y_continuous(labels = function(x){x/1000000})+
  scale_x_continuous(expand = expansion(mult = c(0,0)),
                     labels = function(x){x*100},
                     breaks = seq(0,1,0.2))+
  scale_color_manual(values = c('HiFi'="#3ba889","ONT"="#4593c3","CLR"="#f18e0c"),
                     name="Platform")+
  geom_point(data=dat %>% 
               filter(Name=="SL4.0"|Name=="SL5.0"),
             aes(x=Nx,y=Contig,shape=Name,fill=Name),
             size=3,color="gray")+
  scale_shape_manual(values = c(21,24))+
  scale_fill_manual(values = c("gray","gray"))+
  theme(panel.grid = element_blank(),
        legend.position = c(0.8,0.9),
        legend.direction = "horizontal")
图片
image.png

推文记录的是自己的学习笔记,大概率存在错误!

示例数据和代码可以给推文打赏1元获取

声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/239129.html

(0)
联系我们
联系我们
分享本页
返回顶部