新一代测序技术(上):
Illumina 2005年454公司首推划时代的新一代测序仪,从而引发了测序市场上454、Illumina、ABI等公司在新一代测序技术上的比拼高潮。也正是这种你追我赶,让绘制人类全基因组图谱由过去的耗费4.37亿美元和13年时间,骤然缩短到如今SOLiD 3运行一次即获得50GB可定位测序数据。我们逐个解析Illumina、ABI、Roche(454)的新一代测序仪,并汇集世界各大基因组中心诸多牛人对新一代测序仪的选择标准及使用反馈。
Illumina公司的新一代测序仪Genome Analyzer最早由Solexa公司研发,利用其专利核心技术\"DNA簇”和\"可逆性末端终结(reversible terminator)”,实现自动化样本制备及基因组数百万个碱基大规模平行测序。Illumina公司于2007年花费6亿美金的巨资收购了Solexa,就是为了促成Genome Analyzer的商品化。Genome Analyzer作为新一代测序技术平台,具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。
Genome Analyzer自上市以来,已经为千人基因组计划立下了赫赫战功。今年早期,荷兰科学家利用它首次绘出女性的基因组图谱。而就在前两周,《Nature》杂志上一连出现三个人类基因组图谱:炎黄一号-第一个亚洲人图谱;第一个癌症病人图谱;第一个非洲人图谱。它们全是依赖Genome Analyzer完成的。这和第一个人类基因组图谱的13年形成了多么鲜明的对照。
根据去年底的数据,Genome Analyzer已售出约200台,估计是市场占有率最广的。前不久,华大基因再添置了12台,准备放在香港和深圳的实验室,至此华大基因已经有29台Genome Analyzer。而著名的麻省理工学院和哈佛大学Broad研究院拥有47台Illumina测序仪。众多实验室之所以选择Illumina,看中的无疑是Genome Analyzer的高性价比。
2009年,Illumina将Genome Analyzer II升级到Genome Analyzer IIx,距年底实现单次运行获得95 GB数据的宏伟目标又近了一步。Genome Analyzer IIx有两个核心特征:其一是更大的试剂冷却器,支持超过100个测序循环,进一步提升了系统的易用性和自动化;其二是全新的流动池支架,让每轮运行所得的高质量数据增加20%。依靠系统软件和试剂的改进,Genome Analyzer IIx现在能够支持100 bp以上的配对末端读长,并在每次运行中产生超过20 GB的高质量数据。
Genome Analyzer技术的基本原理:
1.
文库制备
将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。
2. 产生DNA簇
利用专利的
芯片,其表面连接有一层单链
引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端\"固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被\"固定”住,形成\"桥(bridge) \"。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。
3. 测序
Genome Analyzer系统应用了边
合成边测序(Sequencing By Synthesis)的原理。加入改造过的
DNA聚合酶和带有4种荧光标记的dNTP。这些
核苷酸是\"可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。
4. 数据分析
自动读取碱基,数据被转移到自动分析通道进行二次分析。
Genome Analyzer系统之所以如此畅销,关键在于其技术上的优势。
1. 可扩展的超高通量
Genome Analyzer系统目前每次运行后可获得超过20 GB的高品质过滤数据。这个技术的可扩展性保证了更高的数据密度和输出,能用更少的经费完成更复杂的项目。到今年底,通量还有望上升到95 GB,相当于人类基因组的30倍覆盖度。
2. 需要样品量少
Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。这也是很多研究人员所考虑的因素。
3. 简单、快速、自动化
Genome Analyzer系统提供了最简单和简洁的工作流程。即使是最小的实验室也能像大型基因组中心一样进行大规模的实验。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。Cluster Station可以说是Genome Analyzer的核心。由独立软件控制的自动生成DNA簇的过程可以在5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行Emulsion PCR,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。
4. 新颖的测序化学技术
Genome Analyzer通过合成测序来支持大规模并行测序。利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的误差。
5. 单个或配对末端支持
Genome Analyzer系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和制备的时间。制备基因组DNA的单个片段或配对末端文库需要6个小时,只有3个小时需要手工操作。2×50个碱基或更长的读长增加了比对基因组的能力,并拓展了在其他方面的应用。
然而,精明的用户更看重的是性价比,这也是他们选择Illumina的重要原因。Illumina的售价约为45万美元,低于454 GS FLX的50万和SOLiD系统的59万(以上皆为美国的售价)。此外,运行成本也是一个关键因素。美国凤凰城翻译基因组学研究院(TGen)的主管David Duggan曾表示,当年购买新一代测序仪时,每次运行的费用就成为他下决定的主要因素。他最终选择了Illumina Genome Analyzer,因为每轮的运行费用为3000-4000美元(2007年的数据),较为合理,而其他测序仪可能更高。当然,他也综合考虑了通量、运行时间和样品量。
弗吉尼亚联邦大学的高原(音译)博士认为:\"Genome Analyzer的操作费用、易用性和可扩展性让我实现了大规模基因组实验。现在,我的小型实验室正在进行过去只能在大型基因组中心才能完成的实验。低样品需求、简单的流程、高质量的数据以及应用灵活性让Illumina Genome Analyzer从其他高通量测序技术中脱颖而出。”