2017 年11 月,黄岩谊组在谢晓亮教授首创的荧光发生测序技术基础上发展了一种全新概念的测序方法——纠错编码(ECC) 测序法。ECC 测序法采取一种独特的边合成边测序(SBS)策略,利用多轮测序过程中产生的简并序列间的信息冗余,大幅度增加了测序精度。
ECC 测序法的化学基础是谢晓亮课题组于2011 年首次报道荧光发生SBS 反应,该方法在DNA 互补链合成时可以释放同所延伸核苷酸数目相等的荧光分子(Nat. Methods 2011)。黄岩谊课题组在此基础上,对该方法进行了拓展(ChemBioChem 2015),对化学反应的细节进行和探索。随后,该团队从化学原理上对荧光发生测序技术中的荧光标记分子进行了进一步结构优化, 设计合成了具有不同波长、更优性能的测序底物分子,并对聚合酶参与的各阶段反应动力学进行了细致的测量和建模;在深入理解荧光发生测序化学反应速度、完成度、副反应等关键技术细节的基础上,完善了ECC 测序原理样机的搭建(Nat. Biotechno l. 2017),不断迭代优化测序反应条件和信号采集流程;从数据入手,构建了精确的测序信号失相模型并提出了次级延伸理论,并据此开发出算法软件对测序反应失相过程做出了合理简化使其具备了实用性(NSR 2020)。
在ECC 测序法中,序列信息的冗余来自黄岩谊课题组提出的“对偶碱基荧光发生”SBS 测序策略,通过对测序试剂按对偶碱基分为两两匹配的三组,并对待测DNA 序列进行三轮独立测序,继而产生三条互相正交的简并序列编码。这三条编码可互为校验, 后续不但能够通过解码推导出真实碱基序列信息,而且具备对单轮测序错误位点的校正能力。ECC 编码和解码策略曾广泛应用于信息通讯和存储等其它领域中,并被证实可以有效检测和纠正数据传输或存储时发生的错误。此次黄岩谊团队在测序技术中首次引入冗余编码概念,通过和低错误率的荧光发生测序技术巧妙结合,在实验室搭建的原理样机上获得了单端测序超过200 碱基读长无错误的实验结果。目前,该研究团队正在研发基于这一全新策略的高通量ECC 测序仪。