小明的数据分析笔记本
-
R语言里将vcf文件转换为GenAlEx格式数据
GenAlEx 格式https://grunwaldlab.github.io/Population_Genetics_in_R/Data_Preparation.html在这个链…
-
minimap2+svim-asm+SURVIVOR流程基于基因组组装做结构变异检测
代码主要参考 GraffiTE 的代码,链接https://github.com/cgroza/GraffiTE/blob/main/main.nf这个工具是利用二代测序数据给TE…
-
R语言里做生态位分化分析(1)背景知识查询
使用到的R包是 ENMtools,这个R包对应的github主页是https://github.com/danlwarren/ENMTools发现ggtree的作者Y叔也关注了这个…
-
学习Nature正刊论文中eQTL分析前对基因表达量的预处理
论文 Graph pangenome captures missing heritability and empowers tomato breedinghttps://www.n…
-
评估 beagle 基因型填充的准确率
最简单的一个思路,只保留vcf文件中不包含任何缺失数据的位点。然后随机把某些样本的部分位点替换成缺失,用beagle做基因型填充,比较填充后和填充前的一致性。使用 Nature t…
-
如何随机选择vcf文件中的变异位点
现在做群体基因组的论文大部分会公开自己论文分析中的变异检测结果,通常是vcf文件,我们自己可以把vcf文件下载下来试着复现论文中的内容,有时候vcf文件过大,每一步处理起来都会花费…
-
跟着Nature学数据分析:plink计算SNP和SV之间的连锁不平衡R方值
论文 Graph pangenome captures missing heritability and empowers tomato breeding论文链接https://w…
-
生物信息学入门~在云服务器上利用蛋白序列构建进化树
阿里云服务器购买链接 https://www.aliyun.com/daily-act/ecs/activity_selection?source=5176.11533457&am…
-
R语言利用vcf文件计算等位基因频率和连锁不平衡(LD)R方
代码来源于论文Assessment of linkage disequilibrium patterns between structural variants and singl…
-
使用paragraph软件利用二代测序数据对已知结构变异(SV)进行基因型分型(genotyping)
paragraph软件对应的论文Paragraph: a graph-based structural variant genotyper for short-read seque…