杜茁研究组报道基于mRNA表达解析胚胎发育的局限性及应对策略

发布时间:2024.03.12     

“蛋白是基因执行功能的主要形式”、“测量蛋白的表达可更直接地反映细胞的功能状态”、“mRNA丰度仅能部分指示蛋白水平”,这些观点是生命科学领域的共识。尽管如此,由于测定mRNA更为方便、经济、快捷,大量研究仍然倚重于mRNA组学数据来解析生物学过程。然而,蛋白翻译的延迟,转录终止后蛋白的持续存在,以及广泛的转录后调控等导致mRNA并不能十分可靠地指示蛋白表达及功能,并遗漏重要信息。这种局限性在研究基因表达和细胞功能转变迅速的胚胎发育中尤为凸显。

快速发育中,mRNA和蛋白表达有多不一致?仅测定mRNA对发育解析造成多大影响?如何弥补?带着这些问题,中国科学院遗传与发育生物学研究所杜茁研究团队利用数百个转录因子随线虫胚胎发育的单细胞mRNA和蛋白表达数据,高时空分辨率地比较了mRNA-蛋白表达一致性,解析了不一致的成因,并探究了如何利用时间序列mRNA信息预测蛋白表达,提升发育调控的解析度。这项成果,题为“Spatiotemporal Analysis of mRNA-Protein Relationships Enhances Transcriptome-Based Developmental Inference”,于2024年3月8日,在线发表于《Cell Reports》杂志(DOI: https://doi.org/10.1016/j.celrep.2024.113928)。

研究发现,在同一细胞中,同时检测到mRNA和相应蛋白的概率仅为27%,而在高达65%的情况下,虽然蛋白存在,却未能检测到相应的mRNA。因此,仅检测mRNA将遗漏大量信息。低一致性主要源于蛋白翻译的延迟和翻译后的长期稳定性,考虑上述因素,一致性显著提升至73%。上述发现提示,尽管mRNA表达可一定程度预示蛋白表达,但在基因表达和细胞组成高度动态变化的胚胎发育中,二者在细胞层面上往往是解偶联的。

忽视上述因素会造成什么影响。一是假阴性,常发生于依据mRNA判定基因是否在特定细胞发挥功能时。研究发现,没有mRNA并不意味细胞不存在相应的蛋白,它们可能表达于更早的细胞,并伴随细胞分裂继承而来,并在当前细胞中发挥功能。二是假阳性,常发生于利用mRNA来鉴定细胞特异性基因时。发育研究中,调控基因的预测经常依赖于鉴定细胞特异性表达基因,然而,研究发现许多基因,尽管其mRNA表达显示高度的细胞特异性,蛋白表达却十分广泛,不具备特异性。此外,研究还揭示并实验验证了某些广泛表达的mRNA只在特定细胞中翻译产生蛋白,凸显了转录后调控可对基因表达特异性产生质的影响。这些发现提示,基于转录组的发育解析存在很大的局限性。

如何应对?通过量化mRNA和蛋白表达特性,研究建立了基于时间序列mRNA表达信息推断蛋白表达的方法,拓展了mRNA可用信息量,并证实该策略可从多个层面提升对发育过程的解析度。在基因水平,有助于鉴定更多的组织特异性基因,并更准确地预测未知基因新功能。在细胞层面,有助于更清晰地辨别细胞之间状态及功能的关系。上述发现为提高基于mRNA的发育解析效率提供了思路。

综上所述,“闻其声,见其人”,该项研究揭示了动态发育过程中mRNA与蛋白之间的复杂关系,增进了对发育基因时空表达动态性的认知,并为发育过程的分子解析提供思路。杜茁研究组范渡长江为论文第一作者,丛俞林、刘瑾仪和张昊烨参与了研究,杜茁研究员为文章的通讯作者。研究得到了科技部重点研发计划、国家自然科学基金及中国科学院稳定支持基础研究领域青年团队计划的资助。

图:mRNA-蛋白表达一致性的连续动态比较及发育研究应用


附件下载: