植物着丝粒是基因组中进化最剧烈、结构最复杂的区域,在物种形成和分化过程中发挥重要作用。大多数植物着丝粒结构复杂,主要是由高度重复的卫星DNA (satellite)以及中间穿插的反转座子序列 (CR) 组成,其中着丝粒satellite序列单元长度主要集中在150 – 180 bp之间,例如水稻CentO和玉米CentC序列,多年前已经发现并用于着丝粒结构与功能研究。普通小麦是重要的粮食作物,经过两次远缘杂交和多倍化过程,是染色体组进化及多倍体二倍化研究的模式材料。然而普通小麦基因组巨大,90%以上的序列均是高度的重复序列,给小麦研究带来巨大的挑战。前期对小麦着丝粒的研究基本局限于通过筛选着丝粒BAC等手段,获得某些着丝粒序列。对小麦着丝粒全面解析,包括小麦着丝粒DNA序列组成(尤其是功能性satellite序列)、结构以及其在基因组形成和进化过程中的动态变化及对多倍化适应的分子机制目前基本不清楚。
韩方普研究组长期从事植物着丝粒的遗传和表观遗传学研究。前期在小麦非整倍体及其野生近缘种杂交后代观察到丰富的着丝粒变异现象,染色体重排诱导着丝粒序列减少、丢失、扩增、新着丝粒以及多着丝粒形成,不稳定的着丝粒可能造成染色体频繁的断裂和接合,暗示着丝粒在异源多倍体小麦物种形成过程潜在的功能(Guo et al., 2016)。近年来随着小麦参考基因组的逐渐公布,对小麦着丝粒进行全面的解析成为可能。
利用我们实验室发表的中国春小麦着丝粒表观标记CENH3抗体的ChIP数据,重新比对到最新的中国春参考基因组上,确定小麦着丝粒大小及位置(图A)。在小麦中发现两类着丝粒特异的串联重复序列,和CENH3核小体结合,分别在其二倍体供体B和D亚基因组着丝粒富集分布(图B)。与传统着丝粒的串联重复序列单元大小150-180 bp不同,小麦着丝粒satellite序列单元大小超过500-bp,序列上包含特定的CENH3结合位点,表现出周期性CENH3结合特点。系统进化树分析表明小麦麦着丝粒串联重复序列在不同亚基因组间发生分化,更同质的串联重复序列保持和CENH3核小体的结合(图C)。多倍化过程中小麦着丝粒结构发生重排,基因位置和表达水平发生变化,着丝粒串联重复序列发生局部扩增,整体拷贝数减少,但是序列的遗传多样性增加。异源六倍体小麦着丝粒在不同亚基因组之间的不对称性可能参与小麦减数分裂过程同源染色体的配对,促使多倍体小麦的稳定传递。
该论文于2019年7月16日在线发表于The Plant Cell(DOI:10.1105/tpc.19.00133),韩方普研究组已毕业博士研究生苏汉东和刘亚林为该文章的共同第一作者,韩方普研究员为通讯作者。该研究得到国家自然科学基金、国家重点研发计划等项目的资助。
图 小麦着丝粒串联重复序列在不同亚基因组之间的分布
A:中国春小麦第一同源群着丝粒位置,
B:两个亚基因组着丝粒富集的satellite序列分布;
C: 小麦着丝粒satellite序列在不同亚基因组间系统发育分析