蛋白序列无序区预测

引言


固有无序区 (intrinsically disordered regions, IDRs) 一般可以形成液液相分离来发挥生物学功能。一般认为,氨基酸的序列决定蛋白质的结构,结构决定功能。传统观念上,这里的结构指蛋白质的三维结构。然而,近 60 多年来,有一类没有特定三维结构的蛋白质不断被研究人员发现,它们无法折叠成稳定的三维结构,却具有特定生物学功能。这类蛋白质的全部或部分区域,自身不能折叠为明确唯一的空间结构,这些区域就是固有无序区域 (intrinsically disordered regions, IDRs)。在生命活动中,这类蛋白质发挥着重要的生物学功能,当和其他蛋白质结合时,可以折叠为有序结构。我们把这类具有固有无序区域的蛋白质称为固有无序蛋白质 (intrinsically disordered proteins, IDPs),也称为固有非结构化蛋白质 (intrinsically unstructured proteins, IUPs)。固有无序蛋白质依据无序区域的范围可以分为完全无序蛋白质(全序列无序)和部分无序蛋白质(局部含有超过 30 个残基的无序区域)。IDR 的存在,使得蛋白质更容易形成液滴状,通过液-液相分离形成生物分子凝聚物调控基因表达。 — 来自美周聊点生物学
相关见 预测蛋白质 IDR 区域, 也有多款软件基于不同的原理来进行 IDR 的预测, 我们使用 PONDR 和 AIUPred 来试试看。
预测 IDR

之前一篇 Nature 的文章表明 YTHDF 家族蛋白可以形成相分离液滴样结果来发挥生物学功能:

一般使用体外液体形成实验(Droplet formation) 和 荧光漂白恢复实验(FRAP)来观察形成的相分离结构:

文章还会带一张预测 IDR 的图:

文章使用的是 PLAAC (prion-like amino acid composition)软件http://plaac.wi.mit.edu/, 我们去 NCBI 下载 YTHDF2 的序列试试:

把序列复制进去然后提交:

这个地方可以下载 pdf 文件:

PONDR(http://pondr.com/)
复制序列提交即可:

会输出相关的结果, 我们也可以重新绘图:
library(ggplot2)

df <- read.delim(“ythdf2_VSL2.txt”)

idr <- data.frame(x = c(57,132,145,342),y = 0.5,group = rep(c(1,2),each = 2))

ggplot(df,aes(x = Num,y = VSL2)) +
geom_line(color = “#003399”,linewidth = 1) +
geom_line(data = idr,
aes(x = x,y = y,group = group),
linewidth = 4,color = “#CC3333”) +
geom_hline(yintercept = 0.5) +
theme_classic() +
xlab(“Amino Position”) +
ylab(“VSL2 Score”) +
ggtitle(“NP_001166299.1 YTH domain-containing family protein 2 isoform 2”)

AIUPred(https://iupred.elte.hu/)
提交序列:

结尾


路漫漫其修远兮,吾将上下而求索。
欢迎加入生信交流群。加我微信我也拉你进 微信群聊 老俊俊生信交流群 (微信交流群需收取 20 元入群费用,一旦交费,拒不退还!(防止骗子和便于管理)) 。QQ 群可免费加入, 记得进群按格式修改备注哦。

声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/416557.html

(0)
联系我们
联系我们
分享本页
返回顶部