Applications of Single-cell Sequencing Technology in Microbial Ecology
通讯作者: 邓晔,男,博士,研究员,研究方向:环境微生物生态;E-mail:yedeng@rcees.ac.cn
责任编辑: 朱琳峰
收稿日期: 2020-03-27 网络出版日期: 2020-10-26
基金资助: |
Received: 2020-03-27 Online: 2020-10-26
作者简介 About authors
Single-cell sequencing technology,allowing nucleic acid molecules sequenced at the level of single cell,has become a hot spot in molecular biology,and from it there are remarkable achievements in medicine,biochemistry,life science,thus it become an important part of single-cell ecology. The combination of single-cell sequencing and amplicon or metagenomic techniques can more accurately identify microbial species,explore population heterogeneity,intensively study the function of specific species,and obtain the complete genome of rare species. Here,we briefly review the generation and development process of single-cell sequencing,focus on introducing the new technologies of cell isolation and genome amplification,and illustrate the application of single-cell sequencing in microbial ecology.
王丹蕊, 沈文丽, 魏子艳, 王尚, 邓晔.
WANG Dan-rui, SHEN Wen-li, WEI Zi-yan, WANG Shang, DENG Ye.
单细胞测序技术是指在单细胞水平上,通过全基因组或转录组扩增,对核酸分子进行高通量测序的技术。该技术能够揭示单个细胞的基因结构和基因表达水平,反映细胞间的异质性,剖析单个细胞对生态系统或有机体的贡献[1,2]。1990 年,Iscove等[3]首次提出对单细胞进行转录组分析的构想,并用 PCR技术实现了对 cDNA 分子的指数级扩增。1992年,Telenius等[4]开发出寡核苷酸引物PCR(Degenerate oligonucleotide primed PCR,DOP-PCR)的方法,用简并寡核苷酸序列扩增基因组,为单细胞测序提供了思路。直到2001年,Dean等[5]首次使用随机六聚体引物和φ29 DNA聚合酶进行反应实现了DNA的滚环扩增,随后Raghunathan和Lasken等[6,7]于2005年发明了多重置换扩增技术(Multiple displacement amplification,MDA),实现了对单细胞全基因组的扩增与测序。但此时的单细胞扩增技术在覆盖度和扩增偏好性方面有明显的局限性,随后一些研究者致力于克服这些问题。例如,Stepanauskas等[8]于2017年使用φ29 DNA聚合酶的热稳定突变体提高了单细胞基因组测序的覆盖度;哈佛大学谢晓亮团队[9]于2012年发明了多次退火环状循环扩增技术(Multiple annealing and looping based amplification cycles,MALBAC),通过拟线性的扩增过程降低了指数扩增的序列偏好性。发展至今,单细胞测序技术在神经生物学、微生物学、胚胎发育、器官发生和免疫学研究中取得了广泛应用,临床上也已用于辅助生殖和肿瘤的诊断与治疗[10]。Nature Methods于2011年将单细胞研究方法列入最值得关注的技术领域,又于2013 年将相关应用列为年度最重要的方法学进展;近日Nature再次将单细胞测序技术评为2020年度最受期待的技术之一。
相比扩增子测序和宏基因组测序,单细胞扩增和测序技术有其独特的不可替代的优点。扩增子测序是指对微生物的特定基因进行测序[11],传统针对16S rDNA、18S rDNA或ITS(内转录间隔区)基因进行的扩增子测序虽然可以满足检测微生物群落多样性的需求,但这种方法很难准确鉴定到属以下的分类等级,也无法深入探究物种的功能信息[12]。宏基因组测序又称环境基因组测序或群落基因组测序,直接对样本中所有微生物的全基因组进行测序,可以同时对物种和功能基因做出鉴定,也有助于发掘潜在代谢途径。然而该方法容易忽视某些稀有种[13],且测序结果的组装也始终是一大难题[14,15]。如果说宏基因组数据集是捕获整个群落信息的一张巨网[16],那么单细胞测序方法则是分离目标基因组的“手术刀”和深入探究目标群落的“放大镜”,能不断细化、深化我们对微生物群落的认识[17]。
1 单细胞分离与全基因组扩增
1.1 细胞分离技术
细胞分离是单细胞测序的第一步,其准确性将直接影响后续的测序和分析。提高通量、减少样品与试剂的消耗、提高细胞分离捕获的灵敏度和精确性一直是研究者的目标。常用的细胞分离技术包括有限稀释法(Limited dilution)、显微操作法(Micromanipulation)、激光捕获显微分离技术(Laser capture microdissection)、拉曼镊子(Raman tweezers)、涡旋与相分隔(Vortex and phase-separation)、荧光激活细胞分选技术(Fluorescence-activated cell sorting,FACS)和微流控技术(Microfluidics)[19,20,21](表1)。其中微流控技术因其较低的成本、较高的通量和理想的分离效果在近10年发展迅速,成为细胞分离技术的主流方向[22]。
表1 常见单细胞分离技术一览
细胞分离技术 | 技术简介 | 优点 | 局限性 | 应用案例 |
有限稀释法 | 培养液稀释至约每0.1mL含有1个菌或细胞,根据泊松分布计算 | 简单廉价 | 准确性差,不具有针对性 | 对HIV-1病毒的全长序列进行测序[23] |
显微操作法 | 机械显微操作,用毛细管从各类样品中捕获单个细胞 | 对细胞进行可视性评估 | 通量极低,易对细胞造成机械损伤 | 分离并检测食物中的致病菌[24] |
激光捕获显微分离技术 | 将细胞进行固定和显色处理后直接分离 | 显色标记与分离结合,可分离复杂基质中的单细胞 | 通量低,易引入杂质或导致遗传信息丢失 | 研究动植物宿主-微生物的相互作用,鉴定未培养细菌,对单核原核细胞进行分析[25] |
拉曼镊子 | 通过拉曼显微镜区分生化特性不同的细胞,再用激光将其捕获 | 不需标记处理 | 只能分离生化特性显著不同的细胞 | 结合拉曼光镊和单细胞芯片分离癌细胞、红细胞、淋巴细胞和大肠杆菌[26] |
涡旋与相分隔 | 通过高速涡旋形成油包水体系 | 通量高,效率高,成本低 | 难以保证过程的精确性 | 用于探究硫酸盐还原功能类群[20] |
荧光细胞分选技术 | 基于所需细胞属性,结合多参数对特定细胞进行检测分离,同时评估生理学和分类学特性 | 灵敏度高,自动化程度高,可依据大小、粒度、荧光等属性分选 | 通量中等,成本高 | 分离丝状真菌并进行分类[27] |
微流控技术 | 通过微流控芯片原件等设备包裹和分离单细胞样品 | 通量高,精确稳定 | 需要特定仪器装备,开发周期较长 | 单细胞全基因组测序及抗性基因分析[21] |
1.2 单细胞基因扩增技术
A:简并寡核苷酸引物PCR技术(DOP-PCR)。随机引物的3' 端含6bp的随机序列,可以随机和基因组DNA结合,实现对全基因组的扩增;B:多重置换扩增技术(MDA)。随机六聚体引物与模板DNA结合,并在φ29 DNA聚合酶的作用下延伸;随后引物与延伸链结合,以多分支结构的形式延伸扩增;C:多次退火环状循环扩增技术(MALBAC)。首先引物与模板DNA结合,在具有置换活性的DNA聚合酶作用下延伸产生半扩增产物;随后随机引物与半扩增产物结合并延伸形成完整产物;最后对尾部互补成环的完整产物进行扩增;D:Tn5转座酶技术。Tn5转座酶随机将样品DNA片段化,并在小片段DNA两端加上特定的接头,便于后续的扩增和测序;E:细胞内融合基因技术(epicPCR)。两段目标基因被封装在同一微球中,在3条特殊引物的作用下产生融合片段;随后通过巢式PCR消除半扩增产物的影响,特异性扩增融合片段,并缩短其长度供二代测序
多重置换扩增技术(图1-B)是目前环境微生物领域最为成熟也是应用最广的单细胞基因组扩增技术。由于φ29 DNA聚合酶具有3'-5'核酸外切酶活性和校正活性,因此与DOP-PCR相比,多重置换扩增技术(Multiple displacement amplification,MDA)具有更高的序列覆盖度和保真度[30],但也存在外源DNA污染、序列覆盖不均、嵌合体干扰、序列组装与分析困难等不足[31]。由于MDA的偏差在一定程度上是随机的,所以通常可以通过多个数据集的混合拼接来减小这种偏差同时提高组装的完整性[32]。研究表明,2-5个单细胞扩增基因组数据集混合组装得到的基因组完整性中位数>97%,高于单个单细胞组装完整性的中位数(30%-90%)[33]。随后Povilaitis等[34]基于多重置换扩增的原理改进得到全基因组扩增技术WGA-X,使用耐热的突变体φ29 DNA聚合酶将延伸温度从30℃提高到45℃,大大提高了从CG含量高的单个环境细胞或病毒体回收基因组的能力。
多次退火环状循环扩增技术(Multiple annealing and looping-based amplification cycles,MALBAC)(图1-C)通过准线性预放大来减少与非线性放大相关的偏差。该技术利用特殊引物,使得扩增子的结尾互补而成环,从而很大程度上防止了DNA的指数性扩增[9]。MALBAC所使用的引物3'端是8个随机的核苷酸序列,5'端是27个固定的核苷酸序列,最大的特点在于它是准线性扩增而非指数扩增,因此拷贝数变异(Copy number variation,CNV)检测的准确性高且单核苷酸变异(Single nucleotide variants,SNV)检测的假阴性率低;而且,MALBAC的偏差具有可重复性,因此可进行降噪和归一化处理。然而,由于该技术使用的DNA聚合酶保真度低于φ29 DNA聚合酶,SNV检测的假阳性率高于MDA。目前MALBAC主要用于医疗诊断[35],在微生物单细胞的准确组装方面相比MDA优势不明显,在微生物生态学领域的应用前景不及MDA[36]。
Tn5转座酶(图1-D)最初用于二代测序的文库构建,将DNA片段化、末端修复、接头连接等简化为一步,大大简化建库步骤的同时为单细胞测序提供了有力工具。基于Tn5转座酶,谢晓亮团队[37]于2017年提出了改良的单细胞全基因组扩增方法(Linear amplification via transposon insertion,LIANTI),用Tn5转座子结合T7启动子形成的转座复合体随机插入单细胞基因组DNA,将基因组片段化并与T7启动子连接。随后T7启动子行使体外转录功能,用转录获得大量线性扩增的转录本,再经逆转录得到大量扩增产物,进行建库测序。该过程进行的是线性扩增,大大增强了扩增的稳定性,使LIANTI在遗传疾病的检测方面更加有效和精确。同年,Lan等[21]利用微流控技术将单细胞测序技术的通量提高到50 000个细胞/次,使得转座酶适用于环境基因组研究。
2 单细胞测序技术在微生态研究中的应用
2.1 获得单细胞基因组
单细胞测序技术对细菌和古菌的暗物质基因组百科(GEBA-MDM)项目有很大贡献,推动了微生物的功能预测和系统发育鉴定[51],极大拓展了系统发育树上的微生物多样性[52]。2017年,Yu 等[53]基于微流控技术开发出一种具有单细胞分辨率的微型宏基因组方法,并用它分析了黄石国家公园的两个温泉样本,从中获得了29个新的基因组草图。Sieracki等[54]用单细胞基因组学方法研究了一系列海洋样品中小型原生生物的多样性,揭示了生态系统中新的相互作用和代谢途径。Ahrendt等[55]使用单细胞基因组学方法对8种不可培养真菌的基因组进行了测序,结果表明,通过结合多个扩增基因组,可以获得90%以上的单细胞基因组。
2.2 剖析种群异质性
Kashtan等[60]利用从1 000个原氯球菌细胞产生的大型单细胞扩增基因组文库来确定同一物种的不同生态型在整个季节变化中的基因组变异。测序结果显示,该种群由数百个具有不同“基因组骨架”(Genomic backbones)的亚种群组成,每个骨架包括一组不同的关键等位基因和一些特有的可变基因。Yoon等[61]对3个海洋原生生物(皮胆虫)进行单细胞鸟枪法测序,发现这些细胞代表了3种不同的微生态系,也为红藻亚界存在异养门提供了证据。Engel等[62]成功地应用单细胞基因组学评估了蜜蜂肠道微生物群中两个共生菌在物种水平上的异质性,揭示了菌株和生态位在代谢方面的特异性。2018年,Jochum等[63]对来自奥胡斯湾沉积物中的7个单细胞基因组进行了测序和分析,以了解它们在芳香化合物降解和能量代谢方面的潜力。研究证实了该种群具有代谢多样性,反映出微生物应对不同的能量条件和硫酸盐限制的生存策略。微生物所表现的这种种群异质性是一种适应性特征,可以提高微生物对多变或非均质环境条件的适应能力[64]。
2.3 探究种间关系
除此之外,单细胞测序也可用于探究细胞间的相互作用,发现微生物间的共生体,例如Nanoarchaeota和Ignicoccus的共生关系[71]、Actinomyces odontolyticus 和Candidatus Saccharibacteria 的寄生关系等[72]。低温透射电镜显示,酸性矿山废水中古菌之间常常存在物理性的胞间连接,例如细胞质桥、菌毛等[73]。如果胞间的相互作用足够强,不会在细胞分离过程中被破坏,单细胞测序技术则可将两个或多个细胞视作一个整体进行测序。Munson-McGee等[41]结合单细胞基因组测序和宏基因组测序发现,高温酸性温泉中专性共生纳米古菌与宿主的物理关联。2019年,Nakayama等[74]为了深入了解海洋蓝藻共生,对宿主远洋鞭毛藻进行单细胞测序并分析其中的蓝藻基因组。系统发育分析显示,样本中蓝藻属于新的分支,它与宿主鞭毛藻严格共存且经历了独立的进化,这种密切的共生关系导致它无法被传统宏基因组学检测到。因此,单细胞测序对发掘物种的多样性、生活方式、代谢途径和进化过程具有重大意义。
2.4 联合系统发育和功能信息
2016年,Spencer等[20]首先开发了epicPCR技术,并将其用于硫酸盐还原细菌的研究,拓展了硫酸盐还原菌(Sulfate-reducing bacteria,SRB)的系统发育多样性。2019年,Qin等[78]用该技术对青藏高原盐湖沉积物中硫酸盐还原原核生物(Sulfate-reducing prokaryotes,SRPs)的系统发育进行了鉴定,研究表明西藏盐湖中有多种新的特有的SRP。随后,研究者将epicPCR技术用于抗性基因及其宿主的研究。由于抗性基因相对丰度较低且易在宿主间转移,传统的研究方法存在很大局限性,epicPCR技术的应用大大提高了抗性基因风险评估的精确度水平[79]。
2017年,Lan等[21]首先提出了结合微流控技术、片段化和序列标签的单细胞基因组测序Sic-seq,并使用这种方法来分析了环境样本中微生物耐药基因、毒力因子和噬菌体序列的分布。2020年,Chijiiwa等[80]发现借助单细胞基因组测序技术可以在没有参考基因组的情况下在物种水平上识别代谢应答者,为区分鉴定微生物群落中具有特定功能的未培养微生物提供了方法。Doud等[81]通过识别和捕获基于其原位功能或特征的单个微生物,扩充了功能驱动的单细胞基因组学。该方法先用荧光标记微生物含有的纤维素颗粒,然后通过荧光激活细胞分选方法分离单细胞进行宏基因组鸟枪法测序,结合16S rRNA基因扩增子测序进行系统发育定位,并对纤维素酶进行基因鉴定、表达检测和活性测试。这种功能驱动的单细胞方法可以将微生物分类直接与原位功能联系起来,具有广泛的应用前景和重大的实际意义。
3 总结与展望
2018年12月,英国皇家学会举办了一场以“单细胞生态学”为主题的跨学科会议,使用物理和分子领域相关的最新方法,在单细胞尺度研究生物现象,揭示同一物种的个体(或个体群)与其他个体、环境,以及不同种个体的相互作用[82]。操纵细胞的物理学家、研究微生物群落性质的微生物学家和开发新的单细胞方法的基因组学家齐聚一堂,产生了诸多新的见解与灵感。现在正是单细胞测序技术的飞速发展期,它的产生与完善推动了多个学科的进展,在各领域的广泛应用又促进了技术的成熟。目前已有一些较成熟的单细胞测序平台和商品化试剂盒上市,如10×genomic公司的10×Chromium Single Cell Gene Expression Solution 和Chromium Single Cell DNA Reagent Kits,BD公司的BD RhapsodyTM Single -Cell Analysis System,Wafergen公司的ICELL8 Single-Cell System,Bio-Rad公司的SureCell ATAC-Seq Library Preparation Kit和与Illumina合作开发的llumina® Bio-Rad® Single-Cell Sequencing Solution等。但由于单细胞测序的成本依然较高而能够同时检测的细胞数量也较为有限,其主要的应用热点依然以医学领域为主,环境微生物和微生物生态的应用才刚刚起步。而根据微生物生态研究的特点,领域内也有专家对单细胞测序的仪器使用方法进行了一系列优化,如结合单细胞测序技术将复杂群落分割成多个微型亚群再进行宏基因组测序的微型宏基因组(Mini-metagenome)技术[83],该技术降低了样品复杂性,同时具有传统宏基因组测序所不具备的单细胞分辨率,与单细胞技术相比又提高了测序通量,解决了嵌合体问题,非常适用于环境样本。单细胞测序技术有望成为微生物生态研究强大有力的主流技术力量,对于深入研究不可培养的微生物、加深对微生物生命之树的探索具有重大意义。
