一个由近百名科学家组成的国际团队通过破译剩余的和迄今为止未知的序列,揭示了完整的、无间隙的人类基因组——为治疗各种疾病的新方法打开了大门。 这项开创性的历史研究发表在著名的学术期刊《Science》。
早在 2003 年,历史悠久的 人类基因组计划 就能够对 92% 的人类基因组进行测序。 这些本质上是人类常染色质的代码,其中包含许多松散包装的基因,这些基因编码许多在我们的生理学中起关键作用的基本蛋白质。
然而,近二十年来,研究人员一直在努力破译剩余的 8%,这是基因组中一个较小且紧密包装的片段,称为异染色质,它的显着特点是它不负责产生蛋白质。
这是科学家最初选择优先考虑常染色质的原因之一,也是因为对异染色质进行测序的要求极高。 换句话说,我们需要更先进的基因组工具来深入研究这部分基因组。
这意味着长期以来,我们在某些基本细胞功能方面的知识存在巨大差距。 如果我们查看参考基因组,会发现有许多长期的未知碱基,甚至不是所有的常染色基因组都已被充分测序,因为已经注意到许多错误(例如重复)。
现在,这项由端粒到端粒 (T2T) 联盟进行的旗舰研究改变了这种情况,该联盟加入了来自不同学术机构和美国国立卫生研究院 (NIH) 的研究人员。
凭借最先进的技术和新的决心,这组研究人员已经能够 人类基因组计划 通过修改在常染色区域中发现的错误,同时提供异染色区域的完整显示。
他们用于该任务的最重要工具之一是 Merfin,它可以方便地清理人类基因组中发现的一些最困难的序列。 更具体地说,该工具可以进行序列准确性测试并找到可能未对齐的代码,然后纠正这些错误。
此外,在这项研究中,研究人员还利用了 PacBio HiFi 和 Oxford Nanopore 超长读长测序的互补性,它们都用于以几乎 100% 的精度解析大型和复杂的基因组。 这两种方法都称为长读方法。
简而言之,这项研究的工作包括所有 22 个人类常染色体和 X 染色体的无间隙端粒到端粒组装(即从染色体的一端到另一端),产生 3,054,815,472 个碱基对的核 DNA - 以及 16,569 -bp 线粒体基因组。
完成和测序的区域现在包括所有着丝粒卫星阵列、近端染色体的短臂和最近的节段重复,这将这些以前未知的区域解锁到复杂的功能和变异研究。
在某种程度上,这是对人类DNA蓝图的第一次细致观察。上述长读长方法为理解人类基因组中最繁琐、重复丰富的片段打开了大门。
我们距离在个体水平上完成基因组测序还有很长的路要走,但这将为与异染色基因组相关的疾病的研究提供信息,主要是与着丝粒异常相关的癌症(着丝粒是一个狭窄的染色体区域,将它分成短的和长的手臂)。
无论如何,这项研究(以及相关的研究工作)将对基因组分析产生重大影响,并且是朝着代表人类遗传密码的组装模型迈出的重要一步。 使我们所有人受益也将为未来的个性化医疗和基因组编辑打开大门。
©2011-2024 广州辉骏生物科技股份有限公司 主营业务:RNA pull down DNA pull down GST pull down CoIP LC-MS/MS TAP-MS 抗体测序 版权所有 粤ICP备19156356号 | 网站地图