表观遗传学

表观遗传学表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门 遗传学分支学科表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因 组印记(genomic impriting), 母体效应(maternal effects), 基因沉默(gene silencing), 核 仁显性,休眠转座子激活和RNA编辑(RNA editing)等目录1简介2染色质重塑3基因组印记4染色体失活5非编码RNA表观遗传学卄甲41网n 酒卞m询表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门 遗传学分支学科表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因 组印记(genomic impriting), 母体效应(maternal effects), 基因沉默(gene silencing), 核 仁显性,休眠转座子激活和RNA编辑(RNA editing)等表观遗传学表观遗传学是与遗传学(genetic)相对应的概念遗传学是指基于基因序列改变所致基因 表达水平变化,如基因突变、基因杂合丢失和微卫星不稳定等;而表观遗传学则是指基于非 基因序列改变所致基因表达水平变化,如DNA甲基化和染色质构象变化等;表观基因组学 (epigenomics)则是在基因组水平上对表观遗传学改变的研究。
所谓DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧 啶5'碳位共价键结合一个甲基基团正常情况下,人类基因组“垃圾”序列的CpG二核苷酸 相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100—1000 bp左右 且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56%的人类基因组编码基 因相关人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染 色体每1 Mb就有5—15个CpG岛,平均值为每Mb含10. 5个CpG岛,CpG岛的数目与 基因密度有良好的对应关系⑼由于DNA甲基化与人类发育和肿瘤疾病的密切关系,特别 是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基化已经成为表观遗传学和表观基因 组学的重要研究内容表观遗传学-染色质重塑依赖的染色质重塑与人类疾病染色质重塑复合物依靠水解ATP提供能量来完成染色质结构的改变,根据水解ATP的 亚基不同,可将复合物分为SWI/SNF复合物、ISW复合物以及其它类型的复合物这些复 合物及相关的蛋白均与转录的激活和抑制、DNA的甲基化、DNA修复以及细胞周期相关ATRX、ERCC6、SMARCAL1均编码与SWI/SNF复合物相关的ATP酶。
ATRX突变引 起DNA甲基化异常导致数种遗传性的智力迟钝疾病如:X连锁a-地中海贫血综合征、 Juberg-Marsidi 综合征、Carpenter-Waziri 综合征、Sutherland-Haan 综合征和 Smith-Fineman-Myers综合征,这些疾病与核小体重新定位的异常引起的基因表达抑制有关 ERCC6的突变将导致Cerebro-Oculo-Facio-Skeletal综合征和B型Cockayne综合征前者表 现为出生后发育异常、神经退行性变、进行性关节挛缩、夭折;后者表现出紫外线敏感、骨 骼畸形、侏儒、神经退行性变等症状这两种病对紫外诱导的DNA损伤缺乏修复能力,表 明ERCC6蛋白在DNA修复中有重要的作用SMARCAL1的突变导致Schimke免疫性骨质 发育异常,表现为多向性T细胞免疫缺陷,临床症状表明SMARCAL1蛋白可能调控和细胞 增殖相关的基因的表达BRG1、SMARCB1和BRM编码SWI/SNF复合物特异的ATP酶, 这些酶通过改变染色质的结构使成细胞纤维瘤蛋白(Retinoblastoma protein, RB蛋白)顺利的 行使调节细胞周期、抑制生长发育以及维持基因失活状态的功能,这三个基因的突变可导致 肿瘤形成。
组蛋白乙酰化、去乙酰化与人类疾病组蛋白乙酰化与基因活化以及DNA复制相关,组蛋白的去乙酰化和基因的失活相关 乙酰化转移酶(HATs)主要是在组蛋白H3、H4的N端尾上的赖氨酸加上乙酰基,去乙酰化 酶(HDACs)则相反,不同位置的修饰均需要特定的酶来完成乙酰化酶家族可作为辅激活因 子调控转录,调节细胞周期,参与DNA损伤修复,还可作为DNA结合蛋白去乙酰化酶 家族则和染色体易位、转录调控、基因沉默、细胞周期、细胞分化和增殖以及细胞凋亡相关 CREB 结合蛋白(CREB binding protein,CBP)、E1A 结合蛋白 p300(ElA binding protein p300,EP300)和锌指蛋白220(zinc finger 220,ZNF220)均为乙酰化转移酶CBP是cAMP应答 元件结合蛋白的辅激活蛋白,通过乙酰化组蛋白使和cAMP应答元件作用的启动子开始转 录,它的突变导致Rubinstein Taybi综合征,患者智力低下、面部畸形、姆指和拇趾粗大、 身材矮小o CBP和EP300均可抑制肿瘤的形成,在小鼠瘤细胞中确定了 CBP的突变,在结 肠和乳房瘤细胞系中确定了 EP300的突变,另外ZNF220异常和人的急性进行性髓性白血 病相关。
如果突变导致错误的激活去乙酰化酶或错误的和去乙酰化酶相互作用,将可能导致疾病 的发生甲基化CpG-结合蛋白-2(methyl cytosine binding protein-2,MeCP2)可募集去乙酰化酶 到甲基化的DNA区域,使组蛋白去乙酰化导致染色质浓缩,MeCP2的突变导致Rett综合 征,患者出生即发病、智力发育迟缓、伴孤独症若阻碍去乙酰化酶的功能,则可抑制癌细 胞的增殖和分化,可用于急性早幼粒细胞性白血病,急性淋巴细胞性白血病和非何杰金氏淋 巴瘤的治疗染色质重塑异常引发的人类疾病是由于重塑复合物中的关键蛋白发生突变,导致染色质 重塑失败,即核小体不能正确定位,并使修复DNA损伤的复合物,基础转录装置等不能接 近DNA,从而影响基因的正常表达如果突变导致抑癌基因或调节细胞周期的蛋白出现异 常将导致癌症的发生乙酰化酶的突变导致正常基因不能表达,去乙酰化酶的突变或一些和 去乙酰化酶相关的蛋白的突变使去乙酰化酶错误募集将引发肿瘤等疾病表观遗传学-基因组印记基因组印记是指来自父方和母方的等位基因在通过精子和卵子传递给子代时发生了修 饰,使带有亲代印记的等位基因具有不同的表达特性,这种修饰常为DNA甲基化修饰,也 包括组蛋白乙酰化、甲基化等修饰。
在生殖细胞形成早期,来自父方和母方的印记将全部被 消除,父方等位基因在精母细胞形成精子时产生新的甲基化模式,但在受精时这种甲基化模 式还将发生改变;母方等位基因甲基化模式在卵子发生时形成,因此在受精前来自父方和母 方的等位基因具有不同的甲基化模式目前发现的印记基因大约80%成簇,这些成簇的基 因被位于同一条链上的顺式作用位点所调控,该位点被称做印记中心(imprinting center, IC) 印记基因的存在反映了性别的竞争,从目前发现的印记基因来看,父方对胚胎的贡献是加速 其发育,而母方则是限制胚胎发育速度,亲代通过印记基因来影响其下一代,使它们具有性别行为特异性以保证本方基因在遗传中的优势印记基因的异常表达引发伴有复杂突变和表型缺陷的多种人类疾病研究发现许多印记 基因对胚胎和胎儿出生后的生长发育有重要的调节作用,对行为和大脑的功能也有很大的影 响,印记基因的异常同样可诱发癌症基因组印记与脐疝-巨舌-巨人症综合征(BWS )BWS患者表现为胚胎和胎盘过度增生,巨舌,巨大发育,儿童期易发生肿瘤该病主 要是由11号染色体上的IGF2和CDKN1C两个印记基因的错误表达引发,IGF2为父本表达 的等位基因,CDKN1C为母本表达的等位基因。
父本单亲二体型(uniparental disomies, UPDs) 是引发BWS的主要原因,即IGF2基因双倍表达,CDKN1C基因不表达;次要原因是母本 的CDKN1C等位基因发生突变[22];极少数病例是由于母本的染色体发生移位造成CDKN1C 基因失活和(或)造成母本的IGF2基因表达其它一些印记基因在胚胎发育过程中的过量或 缺失表达也可导致类似于BWS的综合征,如原来母本表达的IPL基因的不表达或母本的 ASCL2基因逃避印记都将导致胚胎的过度发育这表明父本表达的等位基因对胚胎的生长 有促进作用,而母本表达的等位基因对胚胎的发育起到限制作用基因组印记与 Prader-Willi/Angelman综合征(PWS/AS)PWS表现为肥胖、身材矮小和轻度智力发育迟缓;AS表现为共济失调、过度活跃、严 重智障、少语、表情愉悦,这两种疾病都和神经功能失调相关PWS是由于突变导致父本 印记基因在大脑中高表达所致,如SNPNP基因高表达;AS是由于母本的UBE3A基因的缺 失或受到抑制所致,该基因编码泛素蛋白连接酶并在脑中表达父本表达的SNRNP基因的 微缺失可导致PWS,而在其上游进一步缺失则可导致AS,这说明这两个区域就是印记中心 所在的位置。
如果缺失父本染色体上的PWS印记中心将导致SNRNP基因以及附近的父本 表达的等位基因被抑制,而缺失父本染色体上的AS印记中心则没什么变化,但若缺失母本 染色体上的AS印记中心将导致UBE3A被抑制而导致AS基因组印记与癌症印记丢失不仅影响胚胎发育并可诱发出生后的发育异常,从而导致癌症发生如果抑癌 基因有活性的等位基因失活便提高了发生癌症的几率,例如IGF2基因印记丢失将导致多种 肿瘤,如Wilm's瘤和印记丢失相关的疾病还有成神经细胞瘤,急性早幼粒细胞性白血病, 横纹肌肉瘤和散发的骨肉瘤等与基因组印记相关的疾病常常是由于印记丢失导致两个等位基因同时表达,或突变导致 有活性的等位基因失活所致调控基因簇的印记中心发生突变将导致一系列基因不表达,引 发复杂综合征基因组印记的本质仍为DNA修饰和蛋白修饰,所以和印记相关的蛋白发生 突变也将导致表观遗传疾病表观遗传学-染色体失活X染色体失活X染色体失活女性有两条X染色体,而男性只有一条X染色体,为了保持平衡,女性的一条X染色 体被永久失活,这便是“剂量补偿”效应哺乳动物雌性个体的X染色体失活遵循n-1法则, 不论有多少条X染色体,最终只能随机保留一条的活性。
对有多条X染色体的个体研究发 现有活性的染色体比无活性的染色体提前复制,复制的异步性和LINE-1元件的非随机分布 有可能揭示染色体失活的本质[27]哺乳动物受精以后,X染色体发生系统变化首先父本 X染色体(paternal X chromosome, Xp)在所有的早期胚胎细胞中失活,表现为整个染色体的组 蛋白被修饰和对细胞分裂有抑制作用的Pc-G蛋白(Polycomb group proteins, Pc-G)表达,然后 Xp在内细胞群又选择性恢复活性,最后父本或母本X染色体再随机失活X染色体随机失活是X失活中心(X inactivation center, Xie)调控的Xic是一个顺式作用 位点,包含辨别X染色体数目的信息和Xist基因,前者可保证仅有一条染色体有活性,但 机制不明,后者缺失将导致X染色体失活失败X染色体失活过程为:Xist基因编码Xist RNA,Xist RNA包裹在合成它的X染色体上,引发X染色体失活;随着Xist RNA在X染 色体上的扩展,DNA甲基化和组蛋白的修饰马上发生,这对X染色体失活的建立和维持有 重要的作用;失活的染色体依旧持续合成Xist RNA,维持本身的失活状态,但有活性的X 染色体如何阻止Xist RNA的结合机制还不明确。
与X染色体失活相关的疾病和X染色体失活相关的疾病多是由X染色体的不对称失活使携带有突变等位基因的X 染色体在多数细胞中具有活性所致Wiskott-Aldrich综合征表现为免疫缺陷、湿疹、伴血小 板缺乏症,该病是由于WASP基因突变所致因为染色体随机失活导致女性为嵌合体,携 带有50%的正常基因,通常无症状表现,该病患者多为男性存在女性患病的原因在于不 对称X染色体失活,即携带有正常WASP基因的染色体过多失活但女性体内还存在另一 种机制,通过不对称失活使携带有突变基因的X染色体大部分失活对Pelizaeus-Merzbacher 病的研究表明这种机制的存在,它使带有突变PLP基因的X染色体倾向于失活RTT综合 征也和不对称X染色体失活有关,携带有MeCP2突变基因的女性,X染色体失活时倾向于 使携带有发生突变的等位基因的染色体失活即便是失活的X染色体,也有一部分基因可以逃避失活而存在两个有活性的等位基因, 但逃避失活的等位基因的表达水平有很大的差异由于逃避失活而易使一些抑癌基因丧失功 能,这是引发女性癌症的一个重要原因也有一些逃避失活的基因过量表达而增加某些疾病 的易感性,如TIMP1基因随着年龄的增加表达量逐渐增加,导致迟发型疾病。
女性易感的 自身免疫性疾病也和X染色体失活相关,因为女性为嵌合体,如果自身免疫性T细胞不能 耐受两个X染色体所编码的抗原,则会导致自身免疫缺陷性疾病,如红斑狼疮等 表观遗传学-非编码RNA功能性非编码RNA在基因表达中发挥重要的作用,按照它们的大小可分为长链非编码 RNA和短链非编码RNA长链非编码RNA在基因簇以至于整个染色体水平发挥顺式调节 作用在果蝇中调节“剂量补偿”的是roX RNA,该RNA还具有反式调节的作用,它和其它 的蛋白共同构成MSL复合物,在雄性果蝇中调节X染色体活性在哺乳动物中Xist RNA 调节X染色体的失活,其具有特殊的模体可和一些蛋白共同作用实现X染色体的失活Tsix RNA是Xist RNA的反义RNA,对Tsix起负调节作用,在X染色体随机失活中决定究竟哪 条链失活air RNA调节一个基因簇的表达,该基因簇含有3个调节生长的基因[38]长链 RNA常在基因组中建立单等位基因表达模式,在核糖核蛋白复合物中充当催化中心,对染 色质结构的改变发挥着重要的作用短链RNA在基因组水平对基因表达进行调控,其可介导mRNA的降解,诱导染色质结 构的改变,决定着细胞的分化命运,还对外源的核酸序列有降解作用以保护本身的基因组。
常见的短链 RNA 为小干涉 RNA(short interfering RNA, siRNA)和微小 RNA(microRNA, miRNA),前者是RNA干扰的主要执行者,后者也参与RNA干扰但有自己独立的作用机制非编码RNA与疾病非编码RNA对防止疾病发生有重要的作用染色体着丝粒附近有大量的转座子,转座 子可在染色体内部转座导致基因失活而引发多种疾病甚至癌症,然而在着丝粒区存在大量有 活性的短链RNA,它们通过抑制转座子的转座而保护基因组的稳定性在细胞分裂时,短 链RNA异常将导致染色体无法在着丝粒处开始形成异染色质,细胞分裂异常,如果干细胞 发生这种情况可能导致癌症的发生siRNA可在外来核酸的诱导下产生,通过RNA干扰清 除外来的核酸,对预防传染病有重要的作用RNA干扰已大量应用于疾病的研究为一些重 大疾病的治疗带来了新的希望非编码RNA不仅能对整个染色体进行活性调节,也可对单个基因活性进行调节,它们 对基因组的稳定性、细胞分裂、个体发育都有重要的作用RNA干扰是研究人类疾病的重 要手段,通过其它物质调节RNA干扰的效果以及实现RNA干扰在特异的组织中发挥作用 是未来RNA干扰的研究重点。