韩方普研究组在植物着丝粒研究中取得进展

发布时间:2024.07.11     

    着丝粒是真核生物染色体的重要结构,其功能异常导致染色体在细胞分裂中无法正确分离,从而影响植物的正常生长和发育。着丝粒的一个显著特征是其核小体含有H3组蛋白变体CENH3。近年来,通过编辑CENH3基因,研究人员在拟南芥、玉米和小麦中成功获得了单倍体诱导系,展示了着丝粒研究在植物育种中的巨大潜力。此外,着丝粒也是人工合成染色体的关键组分。因此,解析着丝粒的结构和功能不仅是染色体生物学的基础研究重点,也是推进合成生物学发展的必要途径。
    中国科学院遗传与发育生物学研究所韩方普研究组长期从事植物着丝粒生物学研究。课题组围绕1)着丝粒序列组成及进化机制,2)着丝粒染色质形成和失活机制,3)着丝粒-动粒调控染色体分离机制这三个着丝粒领域重要的科学问题开展研究,取得了一系列进展[PNAS(2013,2015,2021,2022,2023),Plant Cell(2013a,2013b,2019,2020a,2020b),Genome Research(2021),PLoS Biology(2020), New Phytol (2014,2017,2024),SCIENCE CHINA Life Sciences (2024a,2024b),Plant J(2012,2016,2017a,2017b,2019),J Exp Bot (2021),PLoS Genet (2016)]。
    连翘(Forsythia suspensa),是木犀科内的一种落叶灌木,通常高度为1.5至3.0米。其早春开花,花朵繁茂、金黄且芳香,使其成为提升景观效果的备受青睐的观赏灌木。连翘的生态特性包括其保持土壤水分的能力及其显著的抗寒和抗旱性,这使其在丘陵地带和道路沿线的水土保持中得到广泛应用。此外,连翘具有重要的药用价值,其果实提取物是许多中药治疗感冒的关键成分。鉴于其在园艺、生态和传统医学中的重要性,连翘近年来受到了越来越多的关注。然而,尽管连翘基因组研究取得了一些进展,但仍然面临显著挑战。大量未组装序列的存在是连翘基因组研究的主要障碍。
    本研究以二倍体野生“连翘”为研究材料,整合PacBio HiFi、ONT ultra-long和Hi-C等多种先进测序技术以及多种组装策略完成了连翘的T2T gap-free基因组的组装。连翘基因组大小为688.79 Mb,N50序列大小为48.48 Mb,注释到了33,932个编码基因。我们详细进行了连翘着丝粒的序列、结构及功能分析。鉴定到了编码连翘着丝粒特异组蛋白CENH3的基因(FsCENH3),并制备了特异识别CENH3蛋白的抗体,通过染色质免疫共沉淀并结合二代测序的方法(ChIP-seq),精准确定了连翘着丝粒的位置和大小。同时通过生物信息学分析结合荧光原位杂交技术(FISH),鉴定了连翘着丝粒区特异重复序列,发现连翘的着丝粒区具有高度复杂的卫星重复序列(Satellite)结构。与拟南芥、玉米和水稻等主要由单一卫星重复序列组成的着丝粒不同,连翘的着丝粒区包含多种不同长度和类型的卫星重复序列。既有特异于单一染色体着丝粒区的卫星重复序列,也有特异于几对染色体着丝粒区的卫星重复序列,甚至还存在分布于所有染色体着丝粒区的卫星重复序列。这种复杂的卫星重复序列结构表明连翘的着丝粒区在基因组组织和功能上可能具有独特的特性和调控机制,这对于深入了解连翘的染色体分离机制以及其基因组稳定性有重要意义。此外,通过评估着丝粒区域内全长长末端重复序列(LTR)的插入时间,我们发现这些LTR的年龄比整个基因组范围内的LTR更为古老,这与其他物种中着丝粒逆转录转座子通常较年轻的观察结果形成对比。鉴于连翘主要通过无性繁殖,主要通过营养繁殖等方法而非有性繁殖,我们推出无性繁殖可能影响逆转录转座子侵入的动态,进而塑造了连翘着丝粒特有的演化过程。
    该研究成果以“The gap-free genome of Forsythia suspensa illuminates the intricate landscape of centromeres”为题于2024年7月10日上线(Advance Access, https://academic.oup.com/hr/advance-articles)于Horticulture Research,遗传发育所刘阳副研究员,内蒙古师范大学李永教授和遗传发育所韩方普研究员为通讯作者。博士研究生崔健、祝聪乐和申莉莎助理研究员为该文章的共同第一作者。该研究得到了国家自然科学基金青年基金的资助。 

图:连翘基因组组装
附件下载: