Cell:邻近特异性核糖体分析揭示定位线粒体翻译的逻辑机制

引言
分享一篇 2025 年 8 月 27 日 发表在 cell 期刊的文章 Proximity-specific ribosome profiling reveals the logic of localized mitochondrial translation。

摘要
局域翻译广泛地实现了基因表达的空间和时间控制。在这里,我们介绍了一种光遗传学方法 LOV 结构域控制的连接酶用于局域翻译(LOCL-TL),该方法可以在生理条件下,在任何定义的亚细胞位置以密码子分辨率监测翻译。将 LOCL-TL 应用于线粒体局域翻译揭示了约 20%的人类核编码线粒体基因在线粒体外膜(OMM)上进行翻译。线粒体翻译的信使 RNA 分为两类,分别由编码蛋白长度、招募机制和细胞功能决定。一种进化上古老的机制允许新生肽链通过一个意想不到的二元靶向信号,在翻译过程中招募长蛋白。相反,短蛋白的 mRNA,尤其是真核起源的电子传递链(ETC)组分,以翻译独立的方式特异性地被 AKAP1(A-激酶锚定蛋白 1)招募,这依赖于 mRNA 的剪接。AKAP1 的缺失降低了 ETC 的水平。 LOCL-TL 从而揭示了一种分层策略,使某些蛋白质在 OMM 上的优先翻译成为可能。
研究背景
线粒体起源于约 15 亿年前的 α-蛋白菌。尽管大多数线粒体基因已经迁移到了核基因组,但仍有少数基因(人类中有 13 个)保留在线粒体基因组中。核编码的线粒体蛋白在细胞质中合成后被导入线粒体,核编码和线粒体编码的蛋白质通过多种过程进行协调合成。历史上,翻译后插入被认为是线粒体蛋白导入的主要机制。然而,最近观察到的翻译机器和一部分 mRNA 转录本靠近线粒体外膜(OMM)定位的现象表明,一部分蛋白质可能在翻译过程中同时被导入。在酵母中,局部翻译可以防止线粒体蛋白在非预期位置的不必要错误折叠或积累。局部翻译可能促进单个线粒体蛋白质组的快速变化,或促进复杂组装。 然而,线粒体局部翻译的生理普遍性和重要性,尤其是在高等真核生物中,仍不清楚。
这个问题在芽殖酵母 Saccharomyces cerevisiae 中得到了最全面的研究。电子 cryotomography 显示酵母线粒体表面存在核糖体。 线粒体外膜蛋白 OM14 参与招募新生肽相关复合体(NAC)和胞质核糖体到线粒体表面。 此外,Puf3 是一种 Pumilio 家族 RNA 结合蛋白,与一组局部翻译的转录本的 3′ UTR 结合,并将它们靶向线粒体外膜(OMM)。对于蛋白质定向到线粒体的局部翻译最直接的证据来自于 proximity-specific 核糖体测序技术的应用,该技术精确监测亚细胞位置的蛋白质合成。该技术特异性地标记与生物素连接酶 BirA 邻近的局部翻译核糖体。通过将 BirA 靶向特定的亚细胞位置,如酵母线粒体外膜,控制的生物素脉冲使 BirA 能够标记附近与生物素连接酶肽底物(Avi tag)融合的核糖体亚单位。 生物素标记的核糖体随后可以进行亲和纯化,并通过核糖体测序(深 sequencing 保护片段的核糖体)来揭示其正在解码的 mRNA 位置。 这种基于距离的核糖体测序方法揭示了一部分核编码的线粒体 mRNA,其中大多数编码内膜蛋白,在酵母 OMM 处局部翻译。
然而,在哺乳动物细胞中,线粒体蛋白的局部翻译远未得到充分探索。人类线粒体局部翻译很可能与酵母中的机制不同,因为尚未发现人类 OM14 和 Puf3 的同源基因。虽然有少数 RNA 结合蛋白与招募 mRNA 到外膜(OMM)有关,但它们的分子机制和底物范围仍不清楚。 最近应用 RNA 邻近标记方法,如 APEX 催化 RNA 的邻近标记并进行测序读出(APEX-seq), 发现一部分线粒体和细胞质转录本与 OMM 邻近,其中一些招募依赖于核糖体结合和翻译。然而,这种方法并不能直接检测翻译或确定翻译机器何时被激活。原始的邻近特异性核糖体测序方法原则上可以解决这些问题,但由于需要耗尽必需的维生素生物素以防止核糖体过早标记,因此在哺乳动物细胞中应用起来颇具挑战性。
在这里,我们采用光遗传学方法开发了一种通用工具,称为光感域控制的连接酶用于翻译定位(LOCL-TL),以在正常生长条件下实现近距离特异性核糖体测序。这使我们能够定义线粒体蛋白以及更广泛地说,任何亚细胞位置在哺乳动物细胞中的局部翻译的性质和机制,并提供了一种在生理条件下监测翻译的方法。
研究结果
LOCL-TL 建立:一种邻近特异性核糖体测序的光遗传学方法
邻近特异性核糖体分析在很大程度上依赖于精确控制核糖体标记的位置和时机。如果没有时间控制,标记的核糖体会迅速循环回到一般的胞质池中,失去空间信息。在含有充足生物素的标准培养基中,BirA 会连续标记其底物——一段被称为 Avi 标签的短肽序列(图 S1A)。在我们最初的实验中,时间控制是通过在生物素耗竭的培养基中培养酵母细胞,然后通过添加生物素启动标记来实现的。虽然酵母对生物素耗竭的耐受性相当好,但对于哺乳动物细胞来说,这会导致线粒体断裂、线粒体功能障碍和严重的细胞生长缺陷(图 1A、1B 和 1C)。为了解决这个问题,我们寻求使用蓝光作为替代方法来时间调节生物素连接酶活性(图 1D)。我们基于最近描述的 LOV-Turbo 构建,该系统允许对非特异性生物素连接酶进行光遗传学控制。具体来说,我们通过将光-氧-电压(LOV)光感受域(一个来自燕麦植物的 16 kDa 含黄素蛋白)整合到 BirA 中,设计了光调节生物素连接酶(LOV-BirA)。与非特异性生物素化酶不同,LOV-BirA 是一种位点特异性连接酶,需要与 Avi 标记的核糖体直接接触才能生物素化 Avi 标签。这种特异性产生是因为 LOV-BirA 仅将生物素从生物素-AMP 转移到直接停靠在其活性位点的 Avi 标记蛋白上。LOV-BirA 融合蛋白的优化使我们能够实现严格而快速的光控制(图 S1B 和 S1C):在暴露于蓝光之前,LOV-BirA 处于非活性状态,即使在正常生物素水平的培养基中也显示最小的背景生物素化(图 1E 和 S1A)。暴露于蓝光会导致 Avi 标记核糖体的快速生物素化。
fig 1:

fig s1:

我们通过监测内质网(ER)表面的翻译来验证 LOCL-TL 方法,内质网作为分泌蛋白共翻译转位的场所已被广泛研究。我们将 LOV-BirA 与 Sec61β 融合来靶向 ER 膜,Sec61β 是存在于 Sec61 转位子中的尾锚定 ER 膜蛋白。受体肽——Avi 标签——被融合到核糖体亚基 RPL10A 的 N 端(图 1D)。在用翻译延伸抑制剂环己酰亚胺(CHX)短暂处理细胞后,我们用 10 分钟的蓝光脉冲激活 LOV-BirA,对邻近的核糖体进行生物素化。然后我们用微球菌核酸酶处理标记的核糖体以产生单核糖体,接着进行生物素化核糖体的亲和纯化和受核酸酶保护的 mRNA 核糖体足迹的测序。每个基因的富集分数通过将沉淀物与总输入标准化来计算(图 1D)。使用 ER 定位的 LOV-BirA 时分泌基因高度富集,但胞质版本则没有这种富集(图 S1D)。我们的结果与之前需要生物素耗竭的邻近特异性核糖体分析方法获得的结果高度相关(图 S2A,Pearson r = 0.95,表 S1)。这些发现共同确立了 LOCL-TL 在正常生理生长条件下准确监测定位翻译的能力。
fig s2:

接下来我们确定了可以在其内源性位点标记而不影响功能的核糖体亚基。我们选择了四个亚基:RPL10A、RPL13、RPL29 和 RPL36(图 S2B),基于以下标准:(1)末端的表面暴露,(2)避免大小核糖体界面,(3)与 Sec61 转位子的适当距离,既避免干扰核糖体结合,又不会太远而影响有效标记。我们选择内源性标记的 RPL29 细胞系进行后续实验,因为 LOV-BirA 有效地生物素化了 Avi 标记的 RPL29(图 S2C),Avi 标记的 RPL29 不会明显影响整体翻译活性(图 S2D),并且纯合子 RPL29 基因敲入细胞系的生长与野生型 HEK293T 细胞相当(图 S2E)。此外,即使在处理过程中存在光照,裂解后标记也很少发生(图 S2G;参见 STAR 方法)。
我们使用设计的 RPL29-Avi 细胞系进行 LOCL-TL 实验,该细胞系表达 ER 定位的 LOV-BirA。两次重复实验高度相关(图 1F,Pearson r = 0.98,表 S1)。分泌蛋白在数据集中高度富集,而阴性对照(线粒体和胞质蛋白)则没有富集(图 1G;表 S1)。作为额外对照,我们使用了胞质 LOV-BirA,观察到分泌蛋白不再富集(图 1G)。RPL29-Avi 细胞系的结果也与 Avi-RPL10A 细胞的结果高度相关(图 S2F,Pearson r = 0.95,表 S1)。因此,除非另有说明,我们将研究重点放在内源性标记的 RPL29-Avi 细胞系上。
哺乳动物细胞线粒体定位翻译组的景观
为了研究线粒体外膜(OMM)的定位翻译,我们将 LOV-BirA 与多种外膜蛋白融合:TOM5、TOM70,以及 OMP25 的跨膜结构域(TMD)。我们选择 OMP25 TMD 而非全长蛋白的原因如下:(1)TMD 结构域能有效地将融合蛋白定位到 OMM,(2)我们旨在最小化过表达功能性 OMP25 的影响。每个融合蛋白中都包含了 GFP 用于亚细胞位置成像,这些融合蛋白在延伸因子 1-α(EF1α)基因启动子调控下表达,并通过慢病毒转导稳定整合到 HEK293T 细胞中。所有融合蛋白均正常表达且在蛋白质印迹分析中呈现预期大小(图 S3A)。荧光共聚焦图像证实了融合蛋白在线粒体的正确定位(图 2A 和 S3B)。在不同的 mito-LOV-BirA 融合蛋白中,OMP25 融合蛋白对 MitoCarta3.0 定义的核编码线粒体蛋白显示出最高的富集度(图 2B 和 S3D)。因此,我们选择 LOV-BirA-OMP25-TMD 细胞系进行后续研究。
fig 2:

fig s3:

使用这一设计系统,我们系统性地绘制了哺乳动物细胞线粒体定位翻译的图谱。LOCL-TL 技术揭示了约 20%的核编码线粒体蛋白优先在外线粒体膜(OMM)上翻译,但即使对于这一亚群,仍有可能存在在胞质中翻译的蛋白池。每个转录本在 OMM 上翻译富集的生物学重复实验显示出显著的一致性(图 S3C,Pearson r = 0.88,表 S2)。此外,在 OMM 上优先翻译的转录本集合在编码线粒体蛋白的基因中高度富集(图 2B;表 S2)。
尽管如此,我们发现了一个显著的编码非线粒体蛋白的转录本亚群也优先在 OMM 上翻译。这一亚群的表达水平与富集评分不相关,表明它们不是丰度的人工产物(图 S3F,Pearson r = 0.32)。
我们将数据集与之前检测 OMM 附近转录本的 APEX-seq 数据集进行比较,发现我们数据集中富集的约 85%编码胞质蛋白的转录本也在 APEX-seq 数据集中富集(图 S3G,Pearson r = 0.67)。相比之下,APEX-seq 发现在 OMM 上富集的编码胞质蛋白的转录本中,很大一部分在我们的数据中显示出最小的 OMM 翻译富集,这表明我们 LOCL-TL 数据中富集的非线粒体基因是真实信号,尽管它们大多数尚未与线粒体建立联系。
在我们数据集中显示 OMM 翻译富集的核编码线粒体基因中,绝大多数(99%)也在 APEX-seq 数据中富集(图 S3H,Pearson r = 0.62)。这些观察结果共同证明了 LOCL-TL 方法的高特异性。
相比之下,APEX-seq 发现在 OMM 上富集的转录本中,只有约 25%通过 LOCL-TL 方法优先在 OMM 上翻译(图 S3H)。这种差异可能部分归因于我们的方法直接检测活跃翻译的转录本,而 APEX-seq 检测附近转录本的总池,包括翻译和非翻译的转录本。
此外,APEX 标记通过释放的自由基中间体进行,其标记半径比这里使用的接触式标记机制更长,因此空间分辨率较低(图 S3E)。同样,我们最近描述的基于 TurboID 的核糖体位置标记方法具有更广泛的标记半径,使其更适合诸如突触后室翻译研究等应用,在这些应用中希望标记整个亚细胞区室。
在外膜上翻译的两类蛋白质
值得注意的是,局部翻译基因的蛋白质长度分布图显示出两个不同的群体:短编码序列(CDSes)(<200 个氨基酸)和长编码序列(>400 个氨基酸)(图 2C;表 S2)。这种双峰分布与核编码线粒体蛋白的整体大小分布明显不同。对短 CDS 组的基因本体论(GO)术语分析表明,它们在电子传递链(ETC)亚基和线粒体核糖体亚基中高度富集,而长 CDS 组则在 tRNA 合成酶和来自各种代谢途径的基因中富集(图 2D)。一致地,长 CDS 蛋白主要定位于线粒体基质,而短 CDS 蛋白,特别是那些少于 100 个氨基酸的蛋白,主要定位于 ETC 所在的内膜(图 2E)。
为了研究翻译定位到 OMM 的时间差异,我们利用核糖体分析的密码子分辨率优势,生成了 OMM 富集度与距离起始密码子距离的元基因图。对于在 OMM 上无整体富集的基因(非局部翻译),富集值在整个转录本中都很低(图 2F;表 S2)。对于局部翻译的短 CDS 基因,局部翻译从转录本开始就启动,并在整个转录本长度中保持一致,表明转录本以翻译非依赖性方式靶向 OMM。相比之下,对于在 OMM 翻译的长 CDS 基因,前约 250 个氨基酸没有富集,表明蛋白质合成在胞质中开始,核糖体/新生链复合物在接下来约 150 个氨基酸的过程中被招募到 OMM 以完成翻译。这些发现强调了 LOCL-TL 方法现在使哺乳动物线粒体中共翻译招募的密码子级测量成为可能的价值。
基于完整 mRNA 的 LOCL-TL 快速读取方法的开发
为了促进驱动局部翻译因子的机制分析,我们开发了 LOCL-TL 的正交完整 mRNA 读取方法(图 3A)。与核糖体分析读取方法不同,这里我们在分离生物素化核糖体之前不用核酸酶消化细胞裂解液。相反,我们使用链霉亲和素磁珠直接沉淀被标记核糖体结合的完整转录本,并纯化它们进行 RNA 测序(RNA-seq)或 qPCR 分析。
直接沉淀方法能够更快速地迭代,因为它省去了制作和测序核糖体足迹文库的需要,这在希望使用 qPCR 专注于有限基因集时特别有优势。值得注意的是,在完整 mRNA 策略中,单个标记的核糖体就足以沉淀整个转录本。
尽管存在这种差异,使用 OMM 沉淀数据测量的富集度与我们的核糖体分析数据相关性良好(图 S3J,Pearson r = 0.74,表 S2)。除了简化实验方案外,完整 mRNA 沉淀策略所需的起始材料减少了约 40 倍,虽然代价是失去了单密码子分辨率。
fig 3:

我们使用完整 mRNA 沉淀策略来评估 OMM 上的局部翻译是否是 CHX 处理的结果。CHX 抑制使人能够精确定义核糖体被招募时翻译的时间点,但也为线粒体靶向序列(MTS)招募到转运机器提供了更多时间。然而,当我们比较有无 CHX 处理的富集数据时(图 3B 和 S3I;表 S2),在没有 CHX 的情况下,我们没有看到短或长 CDS 的线粒体富集出现一致的减少。因此,两类底物的招募都发生在持续翻译的条件下。
双重蛋白靶向信号驱动长 CDS 的共翻译招募
对全套长 CDS 转录本的元基因分析显示,平均而言,共翻译招募开始于 250 到 400 个氨基酸之间(图 2F)。我们探讨了共翻译招募的定位在不同基因中是否一致,还是反映了一系列可能招募位点的平均位置。我们根据长度将长 CDS 转录本分为三组(400-600、600-800 和 800-1000 个氨基酸),并评估每组的元基因图。无论蛋白质长度如何,转换区域相对于 N 端的位置都相似(图 3C)。此外,这种转换可以在单个转录本中观察到,但在平均不在 OMM 上局部翻译的长转录本中完全不存在(例如 SUPV3L1;图 3D)。
因此,是距离 N 端的距离决定了信息何时被招募。尽管如此,单个转录本有不同的转换点,有些发生在 250 个氨基酸之后(例如,GTP 依赖性核糖体回收因子线粒体 2 [GFM2]和线粒体中间肽酶[MIPEP];图 S4A)。
fig s4:

接下来我们构建了一系列嵌合报告基因来定义驱动长 CDS 转录本共翻译招募的顺式作用元件。报告基因通过慢病毒导入,使用完整 mRNA 沉淀法结合 qPCR 读取来评估线粒体定位翻译富集程度。我们选择线粒体基质蛋白醛脱氢酶 18 家族成员 A1(ALDH18A1,795 个氨基酸)作为解析的起点,它是我们核糖体分析数据集中富集最强的基因之一(富集倍数 = 17.95 ± 0.02),并选择基质蛋白 Suv3 样 RNA 解旋酶(SUPV3L1,786 个氨基酸)作为阴性对照,该蛋白长度相似但局部翻译极少(富集倍数 = 0.85 ± 0.03)(图 3D)。用 SUPV3L1 CDS 替换 ALDH18A1 CDS 的蛋白编码区消除了定位翻译(图 3E)。用 SUPV3L1 的前 114 个氨基酸(包含典型 MTS)替换 ALDH18A1 包含预测 MTS 的前 105 个氨基酸并未影响定位翻译,表明定位翻译不需要专门化的 MTS。然而,功能性 MTS 是必需的,因为从 ALDH18A1 中删除预测的 MTS 完全消除了定位翻译(见下文)。
为了进一步定义编码序列中对定位翻译重要的区域,我们将 SUPV3L1 氨基酸 115-350 区域与 ALDH18A1 相应区域进行互换,发现这足以驱动融合蛋白的定位翻译(图 3E)。相反,反向互换消除了 ALDH18A1 的定位翻译。更精细的分析显示,ALDH18A1 的 200-350 残基不支持新生链招募,而 ALDH18A1 的 106-250 残基在很大程度上支持招募(图 S4B)。因此,翻译蛋白的招募是由新生链开始与线粒体接触点之前的蛋白编码区驱动的。
有趣的是,在 MTS 下游立即插入 100 个氨基酸(来自翻译后靶向蛋白 SUPV3L1 残基 100-200)能够阻止原本应进行共翻译靶向的 ALDH18A1 衍生蛋白的共翻译靶向(图 3E)。这表明翻译后蛋白中存在一种优势抑制机制,防止在翻译完成前发生转位。
抑制序列驱动翻译后转位的探索研究
为了进一步研究翻译后蛋白中的抑制机制,我们用非结构化肽段(例如 XTEN 连接子)或来源于弹性蛋白(ELN)和粘蛋白 6(MU)的内在无序序列替换这个关键区域,这些序列不来源于线粒体蛋白。这种修饰在多种情况下以 MTS 依赖的方式将翻译后蛋白(例如 SUPV3L1 和转化生长因子 β 调节基因 4 [TBRG4])转换为共翻译靶向蛋白(图 3F 和 S4C)(图 3E 和 3F)。
为了确定长 CDS 定位翻译的最低要求,我们设计了一个合成报告基因,包含来自 ALDH18A1 的 N 端 97 个氨基酸区域(包括一个推测的 64 个氨基酸 MTS),随后是 XTEN700(一个低复杂性非结构化区域)。这个构建体在翻译过程中强烈靶向 OMM(图 3F)。
这些实验表明,翻译后靶向蛋白在 MTS 下游立即包含特定的抑制区域。此外,我们在翻译后蛋白 SUPV3L1 的这个关键区域产生了移码变体,这也显著增强了其定位翻译,表明这种抑制机制是通过蛋白编码序列介导的,而非通过 RNA(图 S4C)。
mRNA 和内含子而非蛋白编码序列介导短 CDS 的局部翻译
接下来我们寻求定义短 CDS 转录本局部翻译所需的顺式作用元件。然而,与长 CDS 形成鲜明对比的是,通过慢病毒导入的 cDNA 报告基因即使包含 5′和 3′非翻译区(UTRs)也很难重现内源基因富集。相比之下,当我们使用 piggyBac 转座子系统导入包含内含子的完整内源基因组位点时,报告基因重现了内源基因富集。
在完整内源位点的背景下,去除内含子导致四个内源底物报告基因和一个缺乏线粒体编码序列的合成报告基因的线粒体富集显著减少(图 4A)。3′ UTR 对于短 CDS 底物的强效局部招募是必需的(例如 NADH:泛醌氧化还原酶亚基 B9 [NDUFB9]、细胞色素 c 氧化酶亚基 7A2 [COX7A2]和泛醌-细胞色素 c 还原酶复合体 III 亚基 VII [UQCRQ])(图 4B、4C 和 S5A)。此外,去除内含子并将 3′ UTR 替换为 β-肌动蛋白 3′ UTR 消除了线粒体转录本靶向(图 4B、4C、S5A 和 S5B)。
fig 4:

fig s5:

为了识别通过此途径有效靶向所需的最小元件,我们设计了一个合成报告基因,该基因仅包含来自 COX7A2(局部翻译短 CDS 的顶级命中基因之一)的内源 UTR,以及一个单一内含子和部分 mCherry 蛋白序列。这个合成报告基因的 mRNA 被有效靶向到 OMM,与内源 COX7A2 报告基因相当(图 4C)。
此外,另一个包含来自 NDUFB9 的内源 UTR、一个单一内含子和缺乏任何线粒体编码序列的短编码序列的合成报告基因也被有效靶向到 OMM(图 4A)。这些发现表明,来自内源短 CDS 的 UTR 以及单一内含子对于短 CDS 的转录本招募是必要且充分的。
线粒体短 CDS 的招募与蛋白质转运解偶联
与长 CDS 转录本相比,典型的 MTS 对招募并非必需的(图 4B)。此外,对先前 APEX-seq”嘌呤霉素抗性”数据的分析显示,短 CDS 的招募不依赖于持续翻译(图 S5C)。一致地,生物信息学分析表明,短 CDS 转录本,特别是那些少于 100 个氨基酸的转录本,趋向于不具有典型 MTS(图 S5D)。
然而,功能性 MTS 对蛋白质转运是必需的。从 NDUFB9 报告基因中去除 MTS 并不影响转录本招募(图 4B),但完全消除了蛋白质向线粒体基质的转运,这通过使用基质定位的 mNeonGreen2 (mNG2)1-10 和短 CDS-mNG211 的蛋白质互补试验得到证实(图 4D)。合成报告基因也是如此。只有当添加来自细胞色素 c 氧化酶亚基 5B (COX5B)的功能性 MTS 时,短报告基因才能被转运到线粒体基质中(图 S5E)。
综合我们的研究揭示,短 CDS 定位翻译的规则与长 CDS 完全不同:对于短 CDS,关键的是 UTR 和内含子的存在,而蛋白编码序列的影响很小。
线粒体外膜短 CDS 招募的机制和生理作用
接下来我们试图识别对短 CDS 转录本招募重要的线粒体定位 RNA 结合蛋白。在哺乳动物细胞和果蝇中的研究已经确定了一些有吸引力的候选蛋白,包括 La 核糖核蛋白域家族成员 4 (LARP4) 和 A 激酶锚定蛋白 1 (AKAP1),但它们作用的细节尚不十分清楚。AKAP1 是一个支架蛋白,招募蛋白激酶 A (PKA)、各种信号蛋白和 mRNA 到 OMM。已有研究提出 AKAP1 可能通过招募 LARP4 来调节线粒体定位翻译。在这里,我们使用 CRISPR-Cas9 敲除 AKAP1 或 LARP4 蛋白来评估它们在线粒体定位翻译中的作用(图 S6A)。AKAP1 缺失导致短 CDS 转录本定位翻译急剧减少(图 5A;表 S2),长 CDS 的富集度大约增加 2 倍(图 5A)。然而,LARP4 的完全缺失并未重现这种表型,表明 AKAP1 能够以不完全依赖 LARP4 的方式介导短 CDS 的定位翻译(图 S6B;表 S2)。为了功能性解析 AKAP 的分子机制,我们开发了一个拯救系统。为了最小化 AKAP1 过表达的影响,我们使用低表达水平的人泛素 C (UBC)启动子表达含有 Myc 标签的野生型 AKAP1 构建体,成功拯救了内源 AKAP1 的缺失(图 5B)。AKAP1 有四个关键功能域:MTS、PKA 结合螺旋、K 同源性(KH) RNA 结合域和 Tudor 域(结合 RNA 结合蛋白)(图 5B)。我们产生了三个 AKAP1 变体:一个缺乏 PKA 结合螺旋(PKA-helix-del),一个缺乏 Tudor 域(Tudor-del),以及一个在 KH 域的 GxxG 环内携带两个天冬氨酸替换(GDDG)的变体,这会消除其 RNA 结合功能。我们发现 RNA 结合的 KH 域和 Tudor 域对短 CDS 转录本的线粒体招募是必需的(图 5B)。这种效应不是由于 AKAP1 突变蛋白表达差异造成的(图 S6C)。相比之下,参与 PKA 信号传导的 PKA 结合螺旋对转录本定位是可有可无的。
fig 5:

fig s6:

使用 AKAP1-Myc 蛋白的 RIP-qPCR 实验表明,野生型 AKAP1 特异性且强效地与编码局部翻译短 CDS 的 mRNA 相互作用,但不与编码局部翻译长 CDS 的 mRNA 相互作用(图 5C)。关键的是,AKAP1 变体招募 mRNA 的能力与其介导局部翻译的能力精确相关(图 5C)。此外,损害定位翻译的短 CDS 报告基因突变,包括去除内含子和/或 3′ UTR,也破坏了 AKAP1 结合,支持了 AKAP1 通过直接 RNA 相互作用介导短 CDS 招募的假设(图 5D)。
通过 AKAP1 缺失特异性阻止短 CDS 定位翻译的能力为探索定位翻译的生理后果提供了机会。因此,我们进行了基于质谱的全球蛋白质组学分析,比较 AKAP1 敲除细胞与野生型细胞(表 S3)。总体而言,AKAP1 敲除细胞中来自线粒体内膜和基质的蛋白质减少,而外膜和膜间隙蛋白质没有显著变化(图 S6D)。
具体来说,局部翻译的短蛋白丰度在 AKAP1 敲除细胞中显著降低(图 5E)。与其他线粒体途径不同,氧化磷酸化(OXPHOS)亚基主要由短 CDS 蛋白组成(图 S6E),它们的蛋白丰度在 AKAP1 敲除细胞中也显著降低(图 5F)。然而,具有长短 CDS 的 OXPHOS 亚基丰度都下降,这可能是由于共调节复合体亚基丰度的反馈回路所致(图 S6F)。调节翻译的蛋白质也显著减少,这与线粒体核糖体亚基也富集在短 CDS 组这一事实相符(图 S6G)。
线粒体长 CDS 而非短 CDS 转录本的定位翻译在酵母中保守
为了研究线粒体定位翻译的保守性,我们转向了先前发表的酵母线粒体特异性核糖体分析数据集。在具有酵母同源物的哺乳动物局部翻译 mRNA 中,70%在酵母中也进行局部翻译,而其余 30%仅在哺乳动物中进行局部翻译(图 6A)。值得注意的是,我们观察到长蛋白在酵母中几乎都进行局部翻译,而短蛋白则不进行(图 6A)。
fig 6:

线粒体起源于真细菌祖先,超过一半的核编码基因具有细菌起源。在酵母中,进行局部翻译的长蛋白更可能起源于细菌。与此一致,在我们的人类数据集中,原核起源基因在局部翻译的长 CDS 基因中也更加富集(图 6B)。相比之下,进行局部翻译的短 CDS 富集在真核起源基因中。
由于短 CDS 在呼吸链复合体中富集,我们比较了所有具有酵母同源物的 ETC 亚基。有趣的是,所有原核起源基因在酵母中进行局部翻译,但在人类中不进行(图 6C)。相比之下,所有在人类中进行局部翻译的基因都是真核起源的。因此,AKAP1 依赖性 mRNA 向 OMM 的招募专注于 ETC 的真核衍生组分。
讨论
在这里,我们提出了一个多功能系统,称为 LOCL-TL,允许人们系统性地监测哺乳动物细胞中定义的亚细胞区室的翻译。该系统使用蓝光对 LOV-BirA 活性进行时间控制,因此允许细胞在生理条件下生长,同时保持严格的时间控制。LOCL-TL 因此提供了一个通用工具,可以在任何能够靶向 LOV-BirA 的亚细胞区室中以密码子分辨率精确监测全球翻译景观,原则上适用于任何易于基因操作的生物体。
将 LOCL-TL 应用于线粒体解决了关于哺乳动物线粒体局部蛋白质合成的性质、机制和范围的许多悬而未决的问题。总的来说,约 20%的核编码线粒体基因特异性地在外线粒体膜(OMM)翻译(表 S4)。我们进一步识别出两种不同的线粒体定位翻译模式,它们不仅在作用的蛋白质类别上有所不同,在进化起源和机制上也存在差异(图 6D)。
一条显然古老的途径具有从酵母到人类保守的底物,专门用于关键长 CDS 亚群的定位翻译。我们显示在人类细胞中,这些蛋白质在胞质中开始合成,但随后被共翻译招募到 OMM。另一条在酵母中不存在的途径介导短 CDS 的定位翻译,主要构成 ETC 复合体和线粒体核糖体亚基。这些转录本通过 mRNA 介导的系统在翻译起始前被靶向到 OMM。
多项证据表明,长 CDS 的局部翻译是一个真正的共翻译事件,由新生链使用一个意外的双重靶向信号介导。核糖体分析所实现的密码子分辨率揭示,蛋白质合成从胞质到线粒体的转换大约发生在 250 到 400 个氨基酸之间,无论蛋白质长度如何。N 端 MTS 的存在是招募所必需的,但不能区分共翻译和翻译后底物。相比之下,顺式元件分析确定了一个关键区域(残基约 100-250),紧接在 MTS 下游和结合点上游,决定靶向是否共翻译发生。
对这一关键区域的进一步分析表明,翻译后蛋白存在一种优势抑制机制,该区域阻止 MTS 在翻译过程中靶向新生链的能力。用非结构化或内在无序的多肽替换该区域能够在各种不同情况下实现共翻译招募,包括原本是翻译后靶向的底物。相反,在 MTS 下游插入来自翻译后靶向蛋白的 100 个氨基酸能够阻止共翻译靶向。
一个重要的开放性问题是这种抑制机制的性质,这可能涉及最近被认为在翻译过程中参与线粒体靶向的分子伴侣或辅助分子伴侣。这种抑制也可能保护新生链 MTS 免受整合应激反应的沉默因子(SIFI)介导的胞质质量控制,该控制降解胞质中未被保护的含 MTS 蛋白质。
为什么细胞要确保一部分长 CDS 共翻译插入线粒体,而其余的使用翻译后途径?这种策略可以为一部分 mRNA 提供共翻译插入的优先权,而不过度负担转位子机器。酵母研究表明,共翻译转运比翻译后转运慢,这是由于蛋白质合成相对较慢的速度对共翻译转运速率的限制(即,在共翻译转运中,转位子在合成蛋白质的整个时间内被占用)。鉴于线粒体膜上转位子数量有限,细胞因此需要将共翻译转运限制在线粒体蛋白质的一个亚群,以确保整个线粒体蛋白质组的及时转运。
我们的哺乳动物数据与酵母定位线粒体翻译研究的比较显示,在人类中局部翻译的长 CDS 集合在酵母中也进行局部翻译。有趣的是,原核起源的线粒体基因在这一组中强烈富集,这与先前的酵母研究一致。另一项酵母研究进一步将前体蛋白在 OMM 的存在与 mRNA 靶向相关联,发现原核起源的内膜和基质蛋白的一个亚群,特别是 ETC 亚基,在 OMM 局部翻译,而外膜蛋白(大多数是真核起源)则不是。这与我们对酵母线粒体特异性分析数据的分析一致。
这些考虑共同表明,定位翻译是一种古老的机制,用于优先确保原核起源蛋白质的正确产生,并将它们转运回线粒体基质。
与用于长 CDS 的策略相比,短 CDS 的局部翻译由转录本招募驱动,与蛋白质转运解偶联。短 CDS 的局部招募可以独立于蛋白编码序列发生,但依赖于 mRNA 剪接。鉴于剪接发生在细胞核中,内含子剪接在线粒体招募中发挥作用是令人惊讶的。然而,核剪接与胞质 mRNA 定位之间的联系已经在果蝇卵发生过程中的 Oskar 基因中得到很好的确立,并可能在招募一部分 mRNA 到中心体中发挥作用。
我们进一步显示,编码短蛋白的转录本的局部招募需要 OMM 定位的 RNA 结合蛋白 AKAP1。RIP-qPCR 实验表明,AKAP1 特异性且强有力地与局部翻译的短 CDS 相互作用,但不与长 CDS 或编码胞质蛋白的 mRNA 相互作用。关键的是,AKAP1 变体特异性招募 mRNA 的能力与其介导局部翻译的能力精确相关。因此,短 CDS 的线粒体定位翻译是由 AKAP1 特异性结合和招募靶向 mRNA 的能力介导的。
与该途径在酵母中不存在的观察一致,AKAP1 没有酵母同源物。鉴于酵母和人类 ETC 途径(例如,酵母缺乏复合体 I)和线粒体基因组之间的显著差异,短 CDS 的定位翻译可能与线粒体基因组共同进化,以协调来自核基因组和线粒体基因组的 ETC 亚基的表达。AKAP1 在各种人类癌症中高度表达,并通过上调 OXPHOS 促进癌细胞的代谢适应。我们的发现表明,AKAP1 可能通过增加 ETC 亚基的定位翻译来促进 OXPHOS,这些亚基在小蛋白组中高度代表。
更一般地,LOCL-TL 广泛地使定位翻译的研究成为可能。定位翻译在许多生物过程中发挥重要作用,如突触可塑性、细胞器稳态、细胞迁移和胚胎发育。mRNA 定位和翻译的失调已被牵涉到各种疾病中,特别是神经系统疾病和癌症。LOCL-TL 方法应该广泛地使在这些不同背景下研究定位翻译在生理条件下的位置和方式成为可能,以确保蛋白质有效递送到其正确位置。
结尾
路漫漫其修远兮,吾将上下而求索。
欢迎加入生信交流群。加我微信我也拉你进 微信群聊老俊俊生信交流群(微信交流群需收取 20 元入群费用,一旦交费,拒不退还!(防止骗子和便于管理)) 。

声明:来自老俊俊的生信笔记,仅代表创作者观点。链接:https://eyangzhen.com/2573.html

老俊俊的生信笔记的头像老俊俊的生信笔记

相关推荐

关注我们
关注我们
购买服务
购买服务
返回顶部