古有中醫懸絲診脈,今有軟件聽音診脈。
長期以來,關于多聽病人聲音的必要性的討論在醫學上不絕于耳。如今,這一觀點越來越得到人們的關注。
當然,這里所說的“聽音診脈”并不是醫生去聽你的聲音來看病,而是通過一種新的軟件技術檢測并分析人的聲音,從而判斷其是否患有某種疾病。
如今,在學術界和企業界,大家都在努力開發一種能診斷并預測包括躁狂發作、心臟病、腦震蕩等在內的所有疾病的技術,而這一技術卻是基于一種與眾不同的數據來源:即人說話的方式。
健康與人的聲音息息相關
越來越多的證據表明,大量精神和生理疾病能使人說話含糊不清,語調拖長或者說話帶有更多的鼻音,甚至能使人的聲音發出短暫的吱吱聲或抖動音,以致人耳無法察覺并區分。
原來,當人說話時,哪怕只是一個簡單的詞語都需要大腦相應的肌骨系統、呼吸系統區域之間進行極其復雜的協調,這樣才能控制整個聲道發音的清晰度。而當人體一旦出現疾病,疾病的特異性干擾會對某個系統或多個系統產生細微且難以覺察、但卻具有特性的變化。然而,這種變化是可以通過機器來進行分析計算的。
盡管目前有關分析說話方式是否能夠進行精確(或者有效)的診斷還尚未清晰,這一領域的“競賽”已悄然拉開帷幕。
聲音診斷領域的“激烈廝殺”
最近,登上這一競技舞臺的選手是剛成立不久的Sonde Health公司。這家來自波士頓的公司是由風險投資公司PureTech投資,并基于美國麻省理工學院(MIT)研究人員的技術而成立的。Sonde致力于為用戶開發一款能夠篩查抑郁癥、呼吸道和心血管疾病的軟件。
“說話是我們每天自然而然要做的事情。”Sonde首席運營官Jim Harper表示。
然而,要想在這場競賽中脫穎而出、站穩腳跟,初創的Sonde公司靠的正是過硬的技術。就在不久前,Sonde公司宣布了其對健康監測音頻分析技術獨占許可證。
這項技術能從簡短講話的樣本中以最佳的準確性識別出抑郁癥并估計癥狀的嚴重程度。而且在試點研究中,這項技術也展現出了其具有檢測輕度創傷性腦損傷(MTBI)、腦震蕩、認知障礙和帕金森病并客觀評測癥狀的能力。為此,該技術獲得了Audio/Visual Emotion Challenge(AVEC)下治療抑郁癥的大獎。
下一步,Sonde公司將從分析病人大聲朗讀的音頻片段入手,但是其目標是開發一種能夠無需記錄說話內容而提取聲音特征的技術。Harper認為,這一目標是“使用人們已經具備的設備去監測和收集聲音背后的東西。”
毋庸置疑,Sonde公司將會面臨諸多競爭與挑戰。IBM公司正在讓沃森超級計算機和研究人員協同運作,試圖從人的說話方式中來預測病人是否有患上精神失調癥的可能。
一家來自柏林的公司已經開始研發用錄音來診斷注意力不集中癥(ADHD)。而另一家波士頓公司Cogito正在開發一款聲音分析app,這款app目前正被美國退伍軍人事務部用來監測服役人員的情緒狀況;它還能診斷躁郁癥和抑郁癥。
對于這項技術,軍方甚至也表示出極大的興趣。今年上半年,美國軍方發起了麻省理工學院研究人員和Sonde公司技術人員的合作,其共同的目標是開發出一款通過美國食品藥品監督管理局審批的裝備,主要用于腦部損傷的檢測。
聲音診斷領域的異�;钴S,無疑吸引了一些企業的眼球。他們匆忙進入到消費者市場,更在幾乎沒有臨床證據的情況下“大膽”地宣傳這些技術。其中,有一個團隊在眾籌網站Indiegogo上籌集了超過2.7萬美元的資金,承諾在今年夏天發布一款將通過分析“聲音模式來幫助你達到最佳的健康與活力狀態”的app。(該眾籌團隊還計劃收集與癌癥癥狀相關的生物標識物的數據。)
顧慮重重
在臨床上利用聲音進行有效的診斷并非易事,圣母大學從事神經疾病標志物研究的計算機科學家Christian Poellabauer一語中的。找到說話方式改變的真正原因非常困難,他說。必須要有高質量的有效聲音記錄,而這就需要購置非常昂貴的設備。不僅如此,你還需要大量數據來確保診斷的相關性是可靠的。
接下來,文化差異也是影響診斷準確性的因素之一。比方說,當通過聲音分析診斷腦震蕩時,Poellabauer的團隊發現許多年輕運動員在說“hell”這個詞時會猶豫不決或者改變他們的語調,這樣聲音測試就可能顯示其與腦損傷沒有什么關聯。
“說話是極其復雜的機制”,Poellabauer說,它并不是簡單的音調或音量。
不過,這些語音診斷信息究竟會有多大用處,而且臨床醫生是否會準備接受它們,以及如何來處理這些信息,對病人而言十分關鍵。
“如果你使用聲音診斷app,它顯示你說話含糊,將會患有中風,這對你來說是有用的。因為你知道之后就會立刻去醫院。另一方面,如果它顯示下個星期你患有偏頭疼的幾率有38%,那么我就不能確定這是否會對你有用。你可能只是簡單地了解一下而已。”紐約大學醫學倫理學家Arthur Caplan表示。
Caplan還指出,這種技術可以對病人突然大發雷霆或失去自我控制進行診斷,并認為這可能是患有某種疾病。“我們該如何讓聲音診斷的app知道哪些是我們想要讓它監測的,哪些是不想讓它監測的?兩者的界限究竟在哪里?”他不禁問道。
此外,一些對聲音診斷持批評態度的人還提到了隱私安全問題。他們認為聲音分析技術可能已經發展得非常復雜,即便聲音樣本上沒有標記病人的姓名,也可以根據這一技術對病人聲音的節奏和語調進行分析以鑒別其身份。這樣一來,容易泄露非常私密的個人語音信息,直接危及個人的隱私安全。
“我認為,現在我們還沒有能夠僅僅根據人的聲音就能識別人身份的技術。”曾與IBM公司開發的人工智能產品Watson合作研究聲音課題的哥倫比亞大學精神分裂癥研究人員Cheryl Corcoran表示,“但是這項技術在不久的將來肯定會出現。”■