191-生物背景-染色质和染色体的结构与功能

刘小泽写于2020.5.25

染色体的三维结构

每一条染色单体由单个线性DNA分子组成。细胞核中的DNA是经过高度有序的包装,否则就是一团乱麻,不利于DNA复制和表达调控。这种有序的状态才能保证基因组的复制和表达调控能准确和高效进行。

包装分为多个水平:核小体核心颗粒(nucleosome core particle)、染色小体(chromatosome)、 30 nm水平染色质纤丝(30 nm fibre)和高于30 nm水平的染色体包装。

在细胞周期的不同时期,DNA的浓缩程度不同:间期表现为染色质具有转录活性,而中期染色体是转录惰性。细胞主要处于分裂间期,所以DNA大部分时间都是染色质而不是染色体,只不过大家喜欢用染色体泛指染色质和染色体。

因此技术都是对染色质进行操作,比如染色质可接近性(ATAC-seq)、染色质免疫共沉淀(ChIP-seq)

DNA Packaging: Nucleosomes and Chromatin | Learn Science at Scitable

之前我们对染色体的印象停留在中期,因为比较好观察(光学显微镜只能看到这种高度浓缩的DNA结构),导致提到染色体研究就会想到排列整齐的中期。而实际上,中期染色体在转录上是惰性的,没有研究间期的意义大

8 有絲分裂時,那一時期染色體會排列在赤道板上? (https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-25-011427.jpg)前期(B)中期(C …

后来技术发展了,大家就开始通过荧光蛋白标记技术以及显微镜技术研究间期染色质的三维结构和动态。比如说,间期染色体其实并非随机地弥漫在细胞核中,不同的染色体占据相对独立的空间,染色体在细胞核所占的空间称之为染色体领地(chromosome territory, CT)。研究发现,贫基因(gene-poor)的染色体领域一般倾向于靠近核膜,而富含基因(gene-rich)的染色体领地通常位于细胞核内部=》富人处于核心区,穷人在边缘地带。

与转录调控相关的染色质核小体

内切核糖酶–微球菌核酸酶(micrococcal nuclease, MNase, MN酶)处理染色质可以得到单个核小体。

核小体是染色质的基本结构,由DNA、蛋白质和RNA组成的一种致密结构。组蛋白是由2个H3-H4二聚体,2个H2A-H2B二聚体形成的八聚体,直径约为10 nm, 组蛋白八聚体和DNA结合在一起形成的核心颗粒包含146bp DNA。DNA暴露在核小体表面使得其能被特定的核酸酶接近并切割。

染色质结构改变会发生在与转录起始相关或与DNA的某种结构特征相关的特定位点。

当用DNA酶I(DNase)消化染色质时,就会在双链结构的超敏位点(hypersenitive site) 引入缺口,这种敏感性可以反映染色质中DNA的可及性(accessible),也就是说这些是染色质中DNA由于未组装成通常核小体结构而特别暴露出的结构。

敏感位点实际上是一段长约200bp的DNA序列特异暴露的染色质区域,甲基化程度较低,富含HMG14,HMG17蛋白。一般在转录起始附近或者相关部位。 当一个基因处于转录活性状态时,含有这个基因的染色质区域对DNase(一种内切块酶)降解的敏感性要比无转录活性区域高得多。仔细分析具有转录活性基因周围的DNA区域,表明有一个中心区域存在,称为超敏感区域(hypersensitive region)或超敏感位点(hypersensitive site),它对DNaseⅠ是高敏感的。这些位点或区域将首先受到DNaseⅠ的剪切。 每个活性基因在启动子区域都存在一个超敏位点。大部分超敏位点仅存在于相关基因正在被表达的或正在准备表达的细胞染色质中;基因表达不活跃时他们则不出现。

ATAC-seq的诞生

已知超敏位点和基因表达有关,并且超敏位点反应了染色质的可及性

因此,染色质结构区域的“可及性”可能与基因表达调控相关

于是2015年文章 Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNDNA-binding proteins and nucleosome position 就使用超敏Tn5转座酶切割染色质开放区域,然后加上接头进行测序

文章的几个核心结论:

  • ATAC-seq insert sizes disclose nucleosome positions
  • ATAC-seq reveals patterns of nucleosome-TF spacing
  • ATAC-seq footprints infer factor occupancy genome wide
  • ATAC-seq enables epigenomic analysis on clinical timescales

Illumina对Greenleaf教授的采访:https://www.illumina.com/content/dam/illumina-marketing/documents/icommunity/greenleaf-stanford-interview-miseq-hiseq-cancer-immune-1070-2015-003.pdf About 95% of the genome is folded and sequestered away in the chromatin. Only a small percentage is accessible to the transcription machinery. Deciphering how that all works is intriguing and important

绿叶教授是应用物理学博士,因此他的思考角度更新颖: One of the significant questions is how a cell can mark and use these different elements to change their biological state. I like to think of chromatin as a physical landscape that tells the cell which parts of the DNA to use and which parts to ignore We’ve been interested in transposase because it has an ability to insert sequencing adapters in a single step

它的建库过程如下:

image-20200525093147451

需要注意的是:ATAC-seq是在全基因组范围找开放区域,但这些开放区域未必是转录因子引起的,因此后续找到peak还需要进行预测工作

ATAC-seq具有容易操作,不需要交连,有高信噪比,以及对样品总量要求低等优点。很多实验室纷纷使用ATAC-seq 与 RNA-seq, 及epi-genomics的数据结合在一起分析,以达到更加准确地分析基因差异表达与调控关系的目的。

原理图:

image-20200525103024207

图中可以看到:Tn5 transposase可以随机插入到打开的chromatin中,因为Tn5 transposome中设计有PCR primer。当我们随后进行PCR扩增以后,每两个Tn5插入位点之间的序列就会被扩增出来。因为大多数的Linker DNA的大小介于10-80bp之间,所有得到的大多数片段都会是小于100bp的。而每个Nucleosome的DNA大小为180bp左右,加上两边插入进的冗余,我们会得到大约200bp长度是mono-nucleosome的DNA。如果是两个Nucleosome之间的片段的话,就是400bp左右。

ATAC-seq在本质上还是与ChIP-seq一样,是DNA-seq的一种,pipeline和ChIP-seq非常类似: bowtie + MACS + peak annotation。现在很多流行的ATAC-seq分析的流程多半是直接将ChIP-seq的流程拿过来稍做甚至不做修改就直接使用在ATAC-seq上,这显然是应该注意修正的。

关于三种酶

上面提到:

  • 内切核糖酶–微球菌核酸酶(micrococcal nuclease, MNase, MN酶)处理染色质可以得到单个核小体。
  • 当用DNA酶I(DNase)消化染色质时,就会在双链结构的超敏位点(hypersenitive site) 引入缺口
  • ATAC-Seq需要用到 Tn5 transposase
Yunze Liu
Yunze Liu
Bioinformatics Sharer

Co-founder of Bioinfoplanet(生信星球)

Next
Previous

Related