一個被遺忘的第四類分子生物學可能是最貼近表型的。幾十年來,人們一直專注于三個分子:DNA產生RNA,RNA產生蛋白質,F在,許多科學家都開始注意到了另一個組分:代謝產物,它們是由機體內的生化途徑中的蛋白質所產生的。人們聽到了太多關于基因和基因型的信息,但同樣重要的是,人們想要探究基因與環境因子互作時發生了什么,同樣也想找到區分健康與疾病的分子表型,這些正是代謝組學的用武之地。
毫無疑問,那些著眼于生命科學的相互元素的系統生物學家想要將代謝組學與基因組關聯起來。“沒有基因組序列,代謝組學不能真正發揮自身作用,”位于美國加州門洛帕克的專門從事基因組學分析的Pacific Biosciences公司首席科學官Jonas Korlach說 。“一旦你發現了代謝產物并想將它們作為新抗生素或新途徑進行分析,就需要基因組信息來鑒定出相關的酶并克隆這些基因。”
西澳大利亞莫道克大學的分離科學和代謝組學實驗室主任Robert Trengrove同意這種看法,盡管代謝組學對系統生物學的影響尚處于起步階段,但他看到了積極的開始,而且關鍵在于團隊合作。 “在 ‘組學’方面我們有很擅長做信息學的人,”Trengrove說,“但很少有人能跨多個‘組學’領域,包括脂類組學和表觀遺傳學。”
Trengrove的團隊已經聯合其他團隊,通過從ICU采集血液樣本構建患者的代謝譜。他說,“通過這種方式,我們能夠開始評估各種化合物作為生物標記物和病人康復指示物的用途。”為了確切知道發生了什么,生物標記模塊必須與蛋白質組學和基因組學相關聯,但這項工作才剛剛展開。
盡管如此,系統生物學已經成為了生物學的核心。傳統上,生物學已將機體或細胞分解為各個部分,F在,系統生物學似乎接受了亞里士多德的觀點——“整體大于其組成部分的總和”,并借用包括代謝組學等多個領域的方法。用于處理來自這些領域統稱為“大數據”的工具正在涌現。
關于數據的再思考
總體來說,代謝組學創造了一個數字挑戰。“代謝組學目前的用處包括:在生物樣品庫中研究大規模基因組隊列,將基因型和具有特定表型的基因組變異相關聯,通過監測食品成分或內源性代謝物的營養研究,或為流行病學研究中的檢測提供支持,”總部位于馬薩諸塞州沃爾瑟姆市的賽默飛世爾科技公司蛋白質組和代謝組學部門的營銷總監Andreas Huhmer說。這些研究會產生大量的數據。在人類中已經發現的7500多種代謝物中,只有2500種直接來自于人體;剩余的則有其他來源,包括人體消化的食物和藥物。
從數字上來說,我們可能只是在起點。正如Huhmer所說,“未來,預計將確定更多的代謝物,特別是在對腸道中代謝物以及關聯新陳代謝的微生物的解析中持續出現新的進展。”腸道菌群在代謝的刻畫中發揮重要作用,為研究與生活方式和飲食習慣有關的慢性和急性疾病的影響提供了信息寶庫,例如二型糖尿病和肥胖病。
目前,代謝組學有Metabolomics Workbench和MetaboLights兩個數據平臺,它們都能給科學家團隊提供更多的數據可供分析,使他們能夠在全球范圍內共享數據。
利用脂類組學
脂類是代謝組學拼圖的另一塊完整組成,但至少與DNA,RNA和蛋白質相比,對這些分子的研究相對較少,是一個一直被忽視的組學領域。然而,脂類為系統生物學提供了一個有用的工具,因為“它們是可以被量化的,告訴我們關于細胞或組織的狀態,”位于德國德累斯頓的Lipotype公司首席執行官Kai Simons解釋道。
該公司的Lipotype Shotgun Lipidomics技術提供了量化的方案。這種技術對整個萃取液進行質譜分析,而不是先用液相色譜法分離。只用一微升血液,這種技術便可達到Simons所謂的“識別多達2300的脂質的絕對量化。”
科學家寄送樣品到Lipotype公司,它們會在短短兩個星期完成測試。如果需要的話,該公司的軟件可向希望查看數據的研究人員開放。盡管如此,生物學家還需要收集更多關于各種代謝物的數據,并確定它們的作用。事實上,理解更多代謝產物的功能可能對理解完整的生物系統產生最大的影響。
揭示功能
即使我們能夠檢測任何生物基質中的所有的蛋白質和代謝產物,位于馬薩諸塞州米爾福德的Waters 公司健康科學營銷總監Jose Castro-Perez說道,“我們也僅知道其中一小部分的功能。”科學家們需要能完成代謝物檢測并同時解析其生物學功能的方法。這就需要分析和生物信息學工具來進行結合多種形式組學數據的疾病或治療相關的途徑分析。
為此,Waters 公司開發了SONAR軟件,這是配合該公司的Xevo G2-XS QToF系統的一種數據采集模式,該系統提供了四極桿飛行時間質譜(QToF)。SONAR軟件可以在單樣本注入的數據獨立分析(data independent analysis ,DIA)實驗中,將完整的前體和碎片離子光譜樣品進行歸類,使研究人員獲得蛋白質或代謝物的定量和定性信息。“這種新的DIA采集模式比其他的DIA方法更先進,因為它提供了更快和更多選擇性的復雜樣品的數據采集,”Castro-Perez說。“此外,這種新方法可以提高數據庫的檢索和定量精度的可靠性。”Xevo G2-XS QToF系統可以與Waters公司的色譜工具進行諸如用于高通量的超高效液相色譜法的集成。
“生成高質量的數據是很重要的,但最終你需要的是從原始數據中得到有意義并可操作的生物信息,”Castro-Perez說。為了綜合信息、簡化數據處理以及處理流程,Waters公司開發了一款客戶機/服務器應用的Symphony 軟件,允許一個或多個數據分析,或處理功能按順序的自動化。該工具甚至可以在儀器運行后立即啟動數據處理,并在沒有用戶干預功能的情況下完成數據處理,這一特點在大規模研究中是非常重要的。
整合互補的方法
除了所有這些存儲和數據分析方面的進展,科學家們仍在研究代謝組學上面臨的重大阻礙。“在非定向工作流程中的瓶頸之一是鑒定未知的化合物,”總部設在德國不萊梅的 Bruker Daltonics 公司代謝組學市場經理Aiko Barsch說。“這是質譜和核磁共振同時具有的優勢。”
例如,高分辨率,精量化(HRAM)質譜可以揭示未知化合物中的元素組成。“質譜技術已經取得了長足的發展,而且提供‘極端方法’的系統可以使研究人員從所謂的‘同位素精細結構’中讀出元素的構成,”Barsch說,“但如果樣品中出現一個真正未知的,完全不在數據庫中記錄的東西,這就需要從頭進行結構解析的能力,那將主要由核磁共振完成。”所以,質譜和核磁共振可以一起使用,作為代謝組學中的互補技術。
為了進一步深挖復雜樣品,研究人員常常將質譜與液相或氣相色譜聯用。“這將有助于確定代謝特征,”Barsch解釋說,“因為將分離和高分辨率檢測聯用可以校準樣品中的特定成分。”
核磁共振的進展也很有用。如今的平臺中的標準操作程序允許科學家將方法從一個平臺傳輸到另一個平臺。在代謝組學中,團隊協作水平的不斷提高使得這些改進對科學家在國際上的合作至關重要,因為他們需要尋求來自不同實驗室核磁共振數據的一致性。
盡管代謝組學研究人員同時用到質譜和核磁共振,但位于加州圣克拉拉的安捷倫科技公司的代謝組學和蛋白質組學的市場總監Steve Fischer說,“由于儀器的成本、測量的廣度和靈敏度,目前的趨勢強烈傾向于質譜分析解決方案。”
由于大量的可被檢測的代謝物的質譜是重疊的,色譜與質譜聯用能夠對樣品進行分離、提供深入的分析。“從廣義上講,一個液相色譜 / 質譜系統可以比氣相色譜 / 質譜系統測量更多的東西,”Fischer說。一些樣品不易揮發,這就可以用到氣相色譜。然而,“這兩個系統都提供了質譜信息,這些信息可以用來追蹤并最終鑒定出那些已被發現的代謝物,以及代謝物的豐度,”他說。通過比較樣本,這些信息揭示了哪些代謝物正在發生變化,數量是多少。
分析這些變化需要專門的軟件。2016年,安捷倫科技公司發布了VistaFlux軟件,可以進行穩定標記同位素示蹤。由于各種生物途徑都能產生代謝產物,“解析產生代謝產物途徑的唯一辦法是通過跟蹤從中間代謝物到最終產物過程中示蹤劑的消耗,”Fischer解釋道。“VistaFlux能將數據分析時間從手工處理的數周縮短到幾個小時,同時增加了可檢測的代謝產物的數量。”
對于一個完全依賴代謝組學的解決方案,科學家可以聯用安捷倫科技公司的1290 UHPLC系統和6470 Triple Quadrupole液相色譜 / 質譜系統,并使用安捷倫科技公司的dMRM代謝組數據庫和方法,該平臺可以測量21種代謝物。
其他公司也為科學家提供了更多的分析選項。例如,賽默飛世爾科技公司的HRAM Orbitrap-based質譜系統能夠在不到一小時時間內從幾微升的人血漿中檢測多達1000個代謝產物。“對于高通量非靶向分析來說,”Huhmer說,“賽默飛世爾科技公司的Q Exactive質譜,配合色譜分離(包括離子色譜和氣相色譜)的廣度可以在代謝組中檢測解析多種化學組分。”該技術能夠與賽默飛世爾科技公司的Compound Discoverer軟件聯用,可以充滿信心地將數據轉變成有意義的結果,Huhmer表示。
系統水平上的綜合
為了理解代謝產物的系統生物學,或它們是如何一起作用的,科學家必須將這些通路聯系起來,這正是基于云的XCMS在線平臺的目的。“只需要點一下鼠標,你就能從液相色譜 / 質譜系統的反應中得到需要的數據,去除那些預測為異常的通路,”XCMS在線平臺的創始人Gary Siuzdak解釋道,他是位于加州拉荷亞市的斯克里普斯研究所代謝組學中心的主任和教授。“它還可以將蛋白質組和基因組數據集成在分析中。”該平臺提供了多重水平的驗證。
最重要的是,XCMS在線平臺可以輕松地瀏覽結果。例如,它創建了一種通路云圖,是由通路構成的代謝物交互圖。通過單擊通路的氣泡就可以提供通路的名稱、與之關聯或不相關的代謝產物、相關的統計數據以及更多。
已經有超過14000名的科學家使用了XCMS在線平臺,該平臺可以讓他們進行分析并共享結果,因為它是基于云計算的技術。“我們已經看到來自每個大陸——甚至包括南極洲——的使用者,”Siuzdak說。
隨著分析設備的不斷完善,生物信息系統功能的日益強大,還更容易使用,系統生物學方法將延伸到更多的領域。“系統生物學中這一強烈的趨勢正在愈發明朗,”德國亥姆霍茲聯合會計算生物學研究所主任Fabian Theis說,“并且醫學研究正在產生大量的‘組學度量’。”
代謝產物在一天中會產生波動,血液是追蹤變異的良好樣本。觀測來自大量病人同類群的血液樣本是特別有趣的。Theis 說,“由此,我們可以整合各種‘組學’,建立網絡,然后將它們與同類群或臨床試驗進行關聯。”
亥姆霍茲聯合會專門研究這些大的同類群。他們使用質譜技術測量了幾千名患者的代謝物,然后將代謝物濃度與單核苷酸多態性(SNPs)相匹配。“你通常發現數十或數百個代謝物與SNPs關聯,如果你把某個SNP與兩個代謝物的比例相關,這兩個代謝物在一個生化途徑中相鄰或產生反應,你就可以看到這個SNP對該反應的效果,”Theis解釋道。“例如,我們可以選擇健康和疾病組,或更簡單的表型,如男性和女性,回答我們是否找到這組變量的代謝足跡。
然而,這些數據不能提供易于解釋的結果。許多關聯來自于間接效應,因為通路中的某種反應可能會對其他反應產生深遠的影響。通過計算和統計工具,Theis及其同事在清除了所有其他影響之后,將兩個代謝物進行了關聯。“隨后,這個相關性表現出清晰的途徑,”Theis 說,“然后你就可以進行跨疾病的比較。”
隨著科學家和生產商開發更多的工具來更詳細地分析代謝組學,我們將更多地了解生物系統——它們如何在健康和疾病狀態中起作用,以及它們如何隨著時間和環境的變化而改變。這其中的關鍵在于更多的以收集更大量的數據集為中心,并與世界各地的科學家分享這些數據!
(譯者高大海是中國科學院海洋研究所助理研究員)
Mike May是佛羅里達州的自由作家和編輯。。
DOI: 10.1126/science.opms.p1700115
鳴謝:“原文由美國科學促進會(www.aaas.org)發布在2017年5月12日《科學》雜志”。官方英文版請見http://www.sciencemag.org/features/2017/05/big-data-big-picture-metabolomics-meets-systems-biology。