长读长洞察单细胞:第三代测序与单细胞表观基因组学的融合揭示生命复杂性的新维度
北京大学生物医学前沿创新中心(BIOPIC)汤富酬课题组与清华大学基础医学院纪家葵课题组合作在《Science》上发表题为“Chromatin Accessibility Landscape of Mouse Early Embryos Revealed by Single-cell NanoATAC-seq2”的研究论文。
技术与方法
该研究首次开发使用了scNanoATAC-seq2,这是一种使用长读长测序对稀缺样本进行转座酶可及染色质的单细胞检测方法,简单来说是长读长测序的单细胞ATAC-seq。该技术开发了创新的单管反应体系,将多个实验步骤集成在单个反应管中完成,最大程度降低了样品损失。通过长片段富集,极大降低了文库的线粒体DNA污染比率,实现了从单个细胞起始样本获取高质量的染色质可及性信息。
主要成果
在哺乳动物中,受精卵经历全基因组表观遗传重编程以产生生物体。然而,目前对单细胞分辨率下受精卵着床前发育过程中表观遗传动力学的理解仍然不完整。该研究开发了 scNanoATAC-seq2,展示了小鼠植入前发育的详细染色质可及性概况,揭示了谱系分离过程中外胚层、原始内胚层和滋养外胚层中不同的染色质特征。合子和双细胞胚胎之间的差异凸显了母体到合子过渡期间染色质可及性的重编程。单细胞长读测序能够深入分析非规范印记、印记 X 染色体失活和低可映射性基因组区域(如重复元素和旁系同源物)中的染色质可及性。该研究的数据提供了对哺乳动物植入前发育和谱系分化过程中染色质动力学的见解。
1、scNanoATAC-seq2 用于分析小鼠植入前胚胎中的染色质可及性
研究人员采用scNanoATAC-seq2技术对小鼠着床前胚胎各发育阶段进行了系统、深入的单细胞分辨率染色质可及性分析。从受精卵到囊胚不同阶段的胚胎细胞收集情况,以及通过严格质量控制后生成的染色质可及性谱图。每个细胞的染色质可及性特征通过UMAP降维可视化,清晰地区分了不同的细胞类型和发育阶段。此外,拟时轨迹分析显示细胞在发育过程中的动态变化,与实际胚胎发育阶段紧密对应,验证了数据的可靠性。
2、次要和主要 ZGA 期间的染色质可及性动态
基于scNanoATAC-seq2数据,图中展示了Obox6基因在早期二细胞胚胎中启动子附近开放的染色质区域,这些区域在短读长ATAC-seq中未被检测到。同时,图中呈现了与ZGA相关的转录因子基因的染色质可及性模式,这些模式与它们的结合位点可及性从受精卵到晚期二细胞胚胎的变化相一致。此外,图2还揭示了染色质可及性与RNA表达之间的关系,表明在ZGA过程中,部分基因的染色质开放先于其RNA表达,这种时间滞后现象对于理解基因表达调控具有重要意义。
3、细胞系分化中染色质可及性的调控
为验证scNanoATACseq2捕获的染色质可及性的细胞类型特异性差异,作者确定了受精卵到囊胚阶段的染色质可及性和表达变化差异一致的基因,其中Sox2、Lgr4、Gdf3和Bmp4在ICM中特异性上调。相反,在TE中,Oct4、Oboz6、Klf2、Klf4、Wdr5、Sp110、Spic和aeal的染色质可及性降低。Jakl、Krt8、Krt18、Tfap2a、Klf6及Gata2在TE中表现出染色质可及性和RNA表达的增加(Fig.3A)。在EPI和PE的谱系分离过程中,Sox2、Fgf4、Nanog、Fgfr1、Epcam在PE中表达下调,而在EPI中表达稳定。相比之下,Gata6和Pdgfra在EPI中下调,而在PE中稳定(Fig.3B)。Nanog是EPI发育最早激活的转录因子之一,与PE相比,EPI中的染色质更开放(Fig.3C),其启动子附近的几个峰为Nanog裂解阶段的cCREs。作为TE标记基因,Gata3在桑葚胚和TE早期、晚期表现出开放的染色质特征,并揭示其下游的几个cCREs。TE谱系中GATA3下游靶位点的染色质可及性也特异性增加(Fig.3E)。
4、常染色体非经典印记基因和印记X染色体失活的等位基因特异性开放染色质景观
通过比较不同遗传背景下的胚胎细胞,图中展示了在八细胞阶段鉴定出的325个非经典印记基因,其中大多数为父系特异性印记基因。这些基因的印记特征在后续发育阶段逐渐减弱。此外,图4还深入分析了X染色体失活(XCI)的动态特征,特别是Xist和Tsix域的染色质可及性变化。在雌性胚胎中,Xist域在受精卵到八细胞阶段表现出父系特异性开放,而Tsix域则在后续发育中逐渐显示出母系特异性开放,这种变化反映了XCI调控机制的复杂性。
5、小鼠着床前发育过程中重复元件染色质的可及性动态
重复序列(REs)在小鼠胚胎发育过程中具有显著的染色质可及性变化:LINE1、ERV等重复序列在ZGA过程中染色质可及性增加,并与多个关键调控基因的表达相关。这些重复序列的开放状态可能为转录因子的结合提供平台,从而促进ZGA和后续的基因调控。这些结果支持了重复序列不是基因组中的“垃圾DNA”,而可能在调控胚胎发育中发挥积极作用。
6、Zscan4 同源基因的染色质可及性及RNA表达
Zscan4同源基因是2细胞胚胎和2细胞胚胎样ESCs的自我更新标记,在ZGA中起到关键作用。作者对Zscan4相似的全长基因进行整理并聚类(Fig.6A),展示了它们在顺式调控中逐渐变化的模式与表达水平(Fig.6B)。在2细胞晚期,与ZGA相对应,scNanoATAC-seq2清除的描述了每个Zscan4平行序列的内含子区域中关键CRE的激活(Fig.6C)。而短读长ATAC-seq数据未检出这一激活(Fig.6D)。对于Zscan4b和Zscan4e下游LTR元件中检测到的染色质开放特征在短读长ATAC-seq中很大程度上缺失。再次展现出了长读长测序的优势。
总结
该研究利用单细胞起始的scNanoATAC-seq2技术,构建了涵盖小鼠着床前发育全过程的高精度单细胞染色质可及性图谱,系统鉴定了不同发育阶段、不同谱系细胞的关键转录因子,揭示了调控合子基因组激活和谱系分化(上胚层、原始内胚层和滋养外胚层)的顺式调控网络。此外,还解析了雌性胚胎中父本X染色体的印记失活与重新激活,以及非经典印记基因的表观调控基础。这些发现为理解包括人类在内的哺乳动物早期胚胎发育的分子机制提供了新的线索。
scNanoATAC-seq2技术的成功开发与应用,无疑为单细胞组学领域注入了强劲的活力。它巧妙地将单细胞分辨率的精准性与长读长测序的深度解析能力相结合,突破了传统短读长单细胞ATAC-seq在分析重复序列、复杂结构区域以及等位基因特异性可及性等方面的局限。这不仅解决了稀缺样本处理中的关键痛点,如样品损失和线粒体污染,更重要的是,它充分印证了以长读长测序为代表的第三代测序技术在组学研究领域,特别是在解析复杂表观遗传调控网络方面,所蕴含的巨大潜力。
从更宏观的视角来看,每一项前端技术的重大进步,都如同打开了一扇新的窗户,往往能为整个科研领域带来革命性的影响,催生新的研究范式和发现。scNanoATAC-seq2正是这样一个例证。未来,将长读长测序技术与其他单细胞多组学技术(如转录组、蛋白质组等)进行叠加和整合应用,有望构建更全面、更精细的细胞状态图谱,使我们能够从多维度、高分辨率地审视生命过程,从而更深入地逼近复杂生物学问题的核心真相。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-03,如有侵权请联系 cloudcommunity@tencent 删除编程基础开发数据网络发布者:admin,转转请注明出处:http://www.yc00.com/web/1747983052a4714773.html
评论列表(0条)