你是伐木的還是劈柴的?幾個世紀以來,生物學家一直在思考這個基本的認識論二分法問題:他們是應該對廣闊的生命領域進行全面的研究,還是走還原主義的道路,將其分解成最基本的組成部分?
分子生物學家們長期以來以還原主義者自居,但是卻始終有一個令人沮喪的制約條件。當他們以驚人的速度和精準度對DNA和RNA進行測序時,他們的數據所展現的是整個細胞群體的混合信息,而非單個的基因組。無論是一個組織切片,一個腫瘤活檢樣品,還是一個細菌培養樣品中所得到的測序數據展現的都是樣品中所有細胞基因組的平均信息,雖然研究人員知道每個樣品中細胞與細胞之間都可能有著驚人的多樣性。
在過去的幾年里,研究人員和設備商終于開始打破這個技術瓶頸,開發出一系列新的工具和技術用于單細胞測序。單細胞RNA測序現在能夠完整地繪制單個樣品中的轉錄活性譜圖,而單細胞DNA測序數據可以揭示那些從前看起來一樣的細胞之間基因組中的微小差異。新的結果是令人振奮的,但是有些技術,尤其是DNA測序,也對新手隱藏了一些陷阱。
讀通轉錄組
在兩種技術中,單細胞RNA測序得到了更多的支持。有些公司在出售相關的試劑盒設備,用來從單細胞中分離RNA,同時可以獨立保存數以千計的樣品。還有些公司將這些技術作為一種服務來提供,他們拿走客戶裝有細胞的樣品管,再送回完整的單細胞RNA測序數據。計劃進行大量單細胞RNA分析的研究人員甚至可以購買完整的系統。
“任何人都可以購買我們的系統,我們就是打算把它做成一個高度分布式,易于使用的平臺。”位于加州普萊森頓的10X Genomics公司的首席科學官和共同創始人Ben Hindson解釋說。10x系統使用微流控芯片將細胞樣本分割成數十萬個微小液滴。然后這些液滴與凝膠珠混合,每個凝膠珠都帶有獨特的寡核苷酸“條形碼”。10x的專有條形碼合成和混合系統確保幾乎每個細胞都有一個對應的條形碼珠。然后,使用標準的RNA測序技術就可以產生數百萬個短序列,包括細胞RNA和條形碼。通過將RNA序列與條形碼連接,系統的開源軟件可以為每個細胞重建RNA序列池。
整理這么多數據顯然需要復雜的計算,但Hindson表示,他們公司非常重視保持系統的用戶友好性。“我們的目標是把萬能鑰匙型解決方案交給那些生物信息學功底不太深厚的用戶,”他還補充道,“這使得系統的受眾更加廣泛”。10x的軟件不僅包括解碼單細胞數據所需的基本功能,還包括一套用于分析和可視化的工具。因為10x軟件是開源的,經驗豐富的用戶可以對其進行修改,甚至將原始數據導出到自己的程序中。
然而,在購買單細胞RNA系統或將樣本送給外包服務公司之前,研究人員應該仔細考慮他們的需求。他們應該問問自己:“你在分析什么類型的樣品,你需要達到什么樣的靈敏度,從這些細胞中你想要獲得什么樣的信息?”Hindson解釋說。專精于這些技術的公司樂于和潛在客戶討論這些問題。Hindson補充道,那些看起來簡單的問題,比如測序之前細胞如何分離和保存,都可能對數據的質量造成巨大的影響。
選取任何一個細胞
小心細致的樣品處理是許多單細胞分離策略的基本要求,這一類型的方法近年來呈指數增長。分析DNA比RNA更需要選擇好的單細胞分離方法,這一點尤為重要。
“有很多選項,但是每一個選項都有它的優點和缺點。對于研究人員來說,根據他們的具體應用來選擇合適的分離方法,這很重要。”德國希爾登的Qiagen公司的生命科學部高級市場經理Mary Langsdorff說。
對于那些知道目標細胞是什么樣子的研究人員來說,最好是手工挑選。為了盡量溫和地做到這一點,Qiagen公司的QIAscout細胞分離系統將細胞分散在一個有磁性的膜片微陣列上。從而,研究人員只需使用一臺普通的倒置顯微鏡就可以將所需的細胞取出,并將其轉移到單獨的樣品管或微滴孔中。
一旦完成細胞分離,下一步就是選擇一種分析策略。對于DNA測序,首先需要擴增每個細胞的基因組,以便構建測序庫。雖然聚合酶鏈反應(PCR)仍然是大多數實驗的標準DNA擴增技術,即使是高保真的PCR技術在從單個基因組為模板進行復制時也會引入數以百萬計的錯誤。這就是為什么大多數單細胞DNA測序現在依賴于多重置換擴增(MDA)的原因。
MDA在恒定溫度下工作,不需要有序列特異性的引物,并且很少引入錯誤。“多重置換技術使用的酶具有很高的流變性,也是一種非常高保真的酶。所以我們可以在這個過程中保證基因組得到一致的覆蓋率……和非常高的序列復制準確性。”Langsdorff說。
DNA擴增結束后,研究人員就可以進行建庫和測序了。即使基因組測序的價格下降到每個人類基因組1000美元以下,但對數十或數百個單個細胞的基因組測序顯然也很昂貴,這凸顯了事先仔細選擇和處理細胞的重要性。盡管如此,在嘗試識別變異之前對多個細胞進行測序仍至關重要。那是因為單細胞DNA測序的深度通常很淺,一般只有1倍或更少。“然后你需要對比一下……你已經建立的所有測序庫。只有當一種突變同時出現在多個庫中時,你才能將其稱為突變。” Langsdorff解釋道。
盡管與單細胞RNA研究相比,單細胞DNA測序仍面臨挑戰。但顯然,它越來越受歡迎了。研究人員已經在使用單細胞分析技術來識別腫瘤和組織內的基因突變,Langsdorff說這項技術也很快在微生物學領域站穩腳跟。
非自然選擇下的突變
使用者需要比較多個細胞的DNA序列來鑒別真性遺傳突變和人為誤差,這限制了單細胞測序的應用潛力。對于想要識別單核苷酸突變的研究人員來說,這是一個特別嚴重的問題。最近的報道指出,傳統的細胞分離和基因組擴增策略,即使是MDA,也會在人類基因組中引入多達上百萬的假陽性單核苷酸突變,超過了真正的陽性突變(1)。
這些差錯大部分源于研究人員習慣使用的細胞裂解實驗流程。“當你進行細胞裂解和DNA變性時,會引入一種叫做脫氨胞嘧啶的人為突變,這是由過程中的加熱步驟造成的。”加州丘拉維斯塔的Novogene公司的全球市場總監Joyce Peng解釋說。但最近紐約的SingulOmics公司的研究人員開發了一種新的技術,可以避免對細胞和DNA進行加熱。將該方法與高保真MDA擴增相結合,可以將假陽性率降低兩個數量級。
SingulOmics和Novogene正在合作,他們把完整的單細胞基因組工作流程作為一項服務。研究人員可以將他們的細胞送到SingulOmics進行樣品制備和基因組擴增,然后再將擴增后的DNA送到Novogene進行測序。一旦測序完成,SingulOmics還可以提供數據分析服務。過程的兩個部分也可以單獨進行。傾向自己進行測序和分析的研究人員可以在這個過程中略過Novogene,而單純地獲取來自SingulOmics擴增的DNA。而那些能夠輕松分離細胞,只需要測序的客戶,就可以直接去Novogene公司。“有兩類客戶。一類是按照我們的講解,自己分離細胞;另一類是由我們分離細胞,所以他們只需要提供一個細胞懸浮液。”來自Novogene的Peng介紹。
雇傭外包公司來處理整個過程對單細胞測序新手來說尤其有效。因為服務提供商“為了完善這些技術,犯過很多錯誤,花過很多錢,”Peng強調,研究人員應該“為了節約時間而雇傭服務提供商”。
單細胞DNA工作的新手為了適應復雜和不斷發展的擴增技術,可能也需要幫助。“有很多全基因組擴增實驗流程,但有些研究人員不太清楚哪種流程對他們的研究最有利。”馬薩諸塞州坎布里奇的BGI的領域應用專家Zonghui Peng介紹。
雖然MDA已成為鑒定單核苷酸突變類項目的首選擴增方法,但尋找基因拷貝數突變的實驗室通常更熱衷于一種稱為“多退火和環基擴增循環”(MALBAC)的方法。與PCR一樣,MDA允許基因組的擴增產物作為進一步擴增的模板;但MALBAC只擴增原始基因組的DNA。這使MALBAC成為精確計算每個細胞中基因拷貝數的理想方法;蚪M擴增方法的多樣性凸顯了一個必要步驟的重要性,那就是在開始單細胞測序實驗之前,研究人員應該有一個明確的科學問題。
需要仔細規劃實驗的另一個原因是成本。“全基因組、單細胞測序的成本與大量細胞測序的成本大致相同。”BGI的Peng解釋。由于研究人員不可避免地需要對樣本中的數十或數百個細胞進行測序,錯誤或設計不當的實驗可能很快就會吞噬掉大量經費。
與SingulOmics和Novogene一樣,BGI也提供一系列單細胞基因組學服務。“BGI能夠處理已經分離的單個細胞和大批量細胞這兩種類型的樣品。”Zonghui Peng介紹?蛻暨可以讓BGI提供各種類型的對照樣本,并選擇他們想要的數據類型。“如果我們的客戶自己有能力做生物信息學分析,他們通常會要原始數據,否則我們會建議BGI來完成生物信息學分析。”他補充道。
與業內其他人一樣,BGI的Peng也強調了從一開始就認真處理樣品十分重要。他還建議對部分樣本進行普通的大量細胞測序,以便與單細胞DNA數據進行比較。
BGI和Novogene也都提供單細胞RNA測序服務。
個體與整體
隨著設備制造商和服務提供商試圖讓更多實驗室能夠接觸到單細胞測序技術,這個領域里最前沿的研究人員正為這項技術開拓一片全新的疆土。對于單細胞DNA測序來說尤其如此,這個工具的潛在用戶剛剛開始探索。
雖然新技術提高了研究人員分離和擴增單個基因組的能力,但另一個重大問題隨之逼近,它映射出了人們耳熟能詳的整體論和還原論之間的矛盾關系。“歸根結底,我們談論的是生物系統——我們對單獨的一個細胞并不感興趣,我們感興趣的是如何通過分析許多個單細胞來幫助我們更好地理解整個系統。”加州大學舊金山分校藥學院的生物工程專業副教授Adam Abate說。例如,即使是對一個小腫瘤,要構建一個完整的基因突變圖譜,也需要對數萬億個單細胞進行測序。“現在這根本不可能。”他表示。
然而,這也許很快就會成為可能。在最近的一項概念驗證實驗中,Abate和他的同事對海水樣本進行了單細胞基因組測序。“我們希望在不進行任何培養的情況下,盡可能地獲取樣本中每個細胞的全基因組序列。”Abate說。通過這個項目,他們開發了一套高通量測序實驗流程。只需單次運行,就可以檢測到超過50,000個微生物細胞的部分基因組(2)。
這項技術在很大程度上依賴于定制化的微流控芯片。這種器件可以將細胞分離到單個的凝膠液滴內,它使得研究人員在分離細胞的同時,裂解細胞并對其DNA進行擴增。隨后,這些液滴與另一組含有寡核苷酸條形碼的液滴合并。盡管這些條形碼與10X Genomics公司的RNA測序條形碼合成方式不同,但它們的作用是相似的。條形碼將對每個細胞基因組擴增得到的片段與一個獨特的識別序列聯系起來。最后,研究團隊對帶條形碼標記的基因組進行測序并分析數據。
盡管這些實驗結果允許Abate的實驗室區分單個微生物物種,鑒定抗生素抗性基因,并發現毒性因子,但他認為還有很大的改進空間。“在每個基因組里,我們平均只能得到1%的覆蓋率,而且統計分布差異非常大。很多細胞的覆蓋率遠遠超過1%,還有很多細胞的覆蓋率卻遠遠不到1%。”他解釋道。Abate的研究團隊正在努力改進這些統計方法,他位于加州南舊金山的公司Mission Bio,正在開發微流控芯片的商業化版本,以便讓其他研究人員能夠使用這項技術。
隨著成本的降低和方法的標準化,該領域的專家期待單細胞測序將成為轉錄組學和基因組學研究的新模式。研究人員不再需要在大塊樣品的整體分析和單個成分的簡化分析之間做出艱難抉擇,而是能夠把這兩種方法結合起來,得到整個生物系統的綜合圖譜。“這是一項真正具有變革性的技術,它產生的影響在之前是絕對無法想象的,” Abate評價說。■
(譯者李楠是中國科學院深圳先進技術研究院的副研究員。)
引用文獻:
1. X. Dong, et al., Nat. Methods14, 491-493 (2017), doi:10.1038/nmeth.4227.
2. F. Lan, et al., Nat. Biotechnol.35, 640-646 (2017), doi:10.1038/nbt.3880.
作者Alan Dove是常駐馬薩諸塞州的科學作家和編輯。
鳴謝:“原文由美國科學促進會(www.aaas.org)發布在2017年11月2日《科學》雜志”。官方英文版請見http://www.sciencemag.org/features/2017/11/singles-seen-sequencing-gets-specific。