控制基因表达的重要分子是转录因子。 通常它们是蛋白质,尽管它们也由短的非编码 RNA 组成。 转录变量通常也以组或复合体的形式工作,创建多个连接,允许对转录速率进行不同程度的控制。
转录因子 (TF)
附着在可获得或“开放”的启动子和增强子区域,通过促进或阻碍 RNA 聚合酶结合,在调节基因表达中发挥关键作用。
各种结合作用导致基因表达异质性以及细胞群,这可以产生特定的细胞身份。 细胞植物的监督者是转录因子,它调节从细胞个体到对外部刺激的反应的一切。
由于转录因子在分析基因组中的重要意义,成千上万的人受到生活在转录因子中的突变的影响,从而导致了广泛的症状。
此外,在调节位点中发现了许多其他引起疾病的突变,例如富含 TF 结合位点的增强子。 因此,TF
结合谱的表征对于了解基因调控系统和细胞分化成不同的亚群至关重要。
分析转录因子相互作用需要了解转录因子的两个主要作用:与
DNA 结合和转录重构。 转录因子,一种 TF 识别基序,附着在特定的 DNA 序列上。 为了确定和分类这样的识别基序,已经使用了许多方法。
评估整个基因组中转录因子结合活性的一种技术是分析染色质可及性测定,例如脱氧核糖核酸酶过敏位点测序
(DNase-seq)、甲醛辅助分离调节元件测序 (FAIRE-seq) 和转座酶可及染色质测序测定(ATAC-seq)。 蛋白质和 DNA
之间的连接也可以通过测序前的染色质免疫沉淀 ( ChIP-seq ) 在全基因组范围内进行测量。 不幸的是,多项证据表明并非所有的约束条件都会影响转录。
另一种识别单个蛋白质-DNA 结合区域的方法是通过 DNA
足迹来推断大量的结合事件。 通过 DNase I 切割位置的密集定位来识别因存在结合的转录因子而免受切割的小区域。
虽然最初的足迹研究定义了大量最近未描述的防止切割的基序,这意味着许多新的转录因子,但目前的研究表明,这些区域可能会影响 DNase I
酶基于序列的切割偏差。 此外,现在也很明显,大多数 TF (80%) 没有表现出可量化的足迹,从而限制了这种方法的有效性。
TFs 作为调节因子的一些最早研究是根据表达数据进行的,因为
TFs 会改变转录。 近二十年来,大量的表达信息已被用于推断基因调控网络。 通常,这些方法在不同情况下寻找成分、共同调控基因的汇编。
通过检测附近的 TF 识别基序或共同调节的转录因子,特定的 TF 与它们控制的基因模块相关联。
基因调控网络的技术已参与解释大规模调控网络,但天生受限于它们依赖信息进行稳态表达的现实。 稳态表达分析(微阵列或
RNA-seq)不仅代表转录,还代表 RNA 的加工、成熟和稳定性。 因此,它们是对干扰对转录变量影响的间接解读。
相对而言,如果没有不切实际的重复次数,它们通常无法在短时间内可靠地检测到微小的变化。
新生转录分析有效地描述了与所涉及的细胞聚合酶(GRO-seq 和 PRO-seq)相关的 RNA。
因此,新生化验是直接读取由干扰引起的转录修饰。
用于全基因组检测开放染色质的两种常用方法是 DNase-I 超敏感位点测序和转座酶可及染色质测序分析。 DNase-seq 和 ATAC-seq 建立在使用在开放染色质区域识别和切割
DNA 的切割酶(分别为 DNase-I 和 Tn5)。 通过区分具有许多读数的基因组区间,测序和这些片段的读数排列可以识别开放染色质。
然而,在其他没有核小体的区域中,与 DNA 连接的转录因子 (TF) 的存在限制了酶的切割。
这给出了称为足迹的小区域,其中读取范围在重范围峰值区域内突然减小。
伴随测序 (ATAC-seq) 的转座酶可及染色质测定是一种分析开放染色质区域的方法,特别有趣,因为在小细胞计数样本中,它快速、简单、负担得起且便携。 ATAC-seq 特征通常用于区分开放染色质区域,如果这些区域与蛋白质结合位点交织,则可用于推断 TF 结合发生。 与此相关,最近的研究表明 TF 的作用可以通过染色质可用性的调整来实现。 特别是,BagFoot 将足迹与差异可用性相结合,以在存在干扰的情况下定义与染色质可及性改变相关的 TF。 他们主要关注来自 DNase I 的超敏反应信息,但也分析了来自 ATAC-seq 的一小部分数据集。
图 1. 单细胞 ATAC 测序分析
根据批量 ATACseq 数据或单细胞 ATAC-seq
(scATAC-seq) 数据的组合作为批量数据,已开发出先前发布的模型 HINT-ATAC 来评估细胞群水平的 TF 结合。
近年来,深度学习方法已成为分析 TF 结合结构的有效技术,例如协同进化神经网络 (CNN)。 FactorNet 和深度 ATA
等技术利用基于深度学习的方法来定义开放染色质区域,并使用大量染色质可访问性信息来推导 TF 结合区域。 然而,所有这些技术都做出了群体水平的
TF 结合假设,因此没有考虑细胞群落内的异质性。
单细胞表观基因组测序的最新进展允许表征单细胞水平的染色质可用性。 例如,scATAC-seq
已成为可行的测试单细胞内染色质的可用性,允许识别顺式和反式调节器,并测试这些调节器如何合作以影响各种细胞中的细胞命运。与所有单细胞测序技术一样,仅使用 scATAC-seq 信息是困难的,因为它们不仅由于浅测序等技术限制而且由于细胞均匀性等生物学现实而受到限制。
参考文献
1. Fu L, Zhang L, Dollinger E, et al. Predicting transcription factor binding in single cells through deep learning. Science Advances. 2020 Dec 18;6(51).
2. Baek S, Lee I. Single-cell ATAC sequencing analysis: From data preprocessing to hypothesis generation. Computational and structural biotechnology journal. 2020 Jan 1;18.
3. Tripodi IJ, Allen MA, Dowell RD. Detecting differential transcription factor activity from ATAC-seq data. Molecules. 2018 May;23(5).
©2011-2024 广州辉骏生物科技股份有限公司 主营业务:RNA pull down DNA pull down GST pull down CoIP LC-MS/MS TAP-MS 抗体测序 版权所有 粤ICP备19156356号 | 网站地图