人工智能和機器人的關系
近年來,人工智能的話題非常熱門。不過,大多數人對人工智能存在誤解,很多人認為人工智能是用機器來模擬人類的智能,實則不然。實際上,人工智能是用機器來模擬人類的智能行為。
模擬智能和模擬智能行為是完全不同的。比方說,我們沒法模擬人類的情感,因為我們不知道怎么來定義快樂、痛苦等,因為當我們快樂和痛苦的時候,我們的大腦和心理發生了什么變化,到今天為止人們并不很清楚。在這種情況下,不能用機器來模擬人類的感情,而只能模擬感情的表現——即痛苦或高興所表現出來的行為。
眾所周知,情感主要從三個渠道表現出來:即臉部表情、語言(聲音)和肢體動作。從人類的面部表情、發出的聲音(語言)和做出的動作能夠判定某人對某事的態度,這是情感分析。反過來,則稱為情感生成。人工智能主要用機器來模擬人類的以下四個方面的智能行為:理性行為、感知、動作以及情感、靈感等。
有人可能會說,人工智能要模擬人類的這四個智能行為,這和機器人很相似。但人工智能和機器人是有顯著區別的。機器人做的是機器,人工智能做的是智能體(intelligent agent),為什么用Agent來描述它,而不是用智能機器。這是因為人工智能不光要做機器,還包括軟件、系統和零部件等。
那么該怎么定義機器人呢?現代機器人問世已有幾十年,對其定義仁者見仁,智者見智,沒有一個統一的意見。目前,對機器人的理解寬度很大,最低的只指可編程的機器,最高的則是指各種各樣智能化的機器。在我看來,對機器人的定義是一個逐步發展的過程,主要包括三大部分:前端指感覺(傳感器)或者感知,可能通常做不到感知,只能做到感覺,后端就是可控的操作器、效應器等等,中間的部分目前主要還是集中在控制、編程這些領域,智能成分會逐步增加。
從機器人和人工智能發展的整個進程來看,機器人和人工智能有很多重疊的地方,但機器人更加面向任務、面向應用。
現代機器人的研究始于20世紀中期。最早在二戰后,美國阿貢國家能源實驗室為了解決核污染機械操作問題,首先研制出遙控操作器用于處理放射性物質。緊接著于第二年,又開發出一種電氣驅動的主從式機械手臂。
20世紀50年代中期,“可編程”“示教再現”機器人面世。1960年,第一臺真正意義上的工業機器人由美國聯合控制公司研制成功。隨著傳感技術和智能技術的發展,20世紀80年代開始進入智能機器人研究階段。
經過近40多年的發展,機器人已從傳統的工業制造領域迅速向醫療服務、教育服務、家庭服務、勘探勘測、生物工程、救災救援、深空深海探測、智能交通、智能工廠等領域擴展。
擴大應用場景本身就是創新
機器人的誕生是人類高新技術革命的結晶,經過短短幾十年的發展已取得了很大的進展,但對于人類的理想而言,這還僅僅是開始。
在各種類型的機器人中,應用于生產過程與環境的工業機器人較早得到大規模應用。作為各種機器人分類中較為成熟的板塊,工業機器人應用已經滲透到幾乎所有工業生產制造的場景中,包括:機器人碼垛、沖壓、注塑、分揀、焊接、激光切割、噴涂、機床上下料,另外結合視覺技術或機床,還能創造出更多的可能。
協作機器人近兩年也開始在機器人市場嶄露頭角。其常見的應用場景包括拾取和放置、設備看護、包裝碼垛、加工作業、精加工作業、質量檢測等。此外,它還被應用于加工作業、醫療外科手術、倉儲物流、機器維護等其它非制造業和非傳統的領域。
隨著人工智能與物聯網技術的不斷發展,服務機器人在不斷豐富自身功能及實現更強大性能的基礎上成為當之無愧的后起之秀。新零售、智慧城市、智慧醫療、銀行、智能安防、機器人STEM教育等應用場景遍地開花。
為了讓機器人在更多場景落地應用,很多機器人行業已經開始探索AI、VR、5G等更廣泛的技術融合。其實,想要為機器人選擇一個好的應用場景并不容易。特別是對于制造傳統機器人而言,不斷擴大應用場景,本身就是一種創新。
如何突破從結構化到非結構化的環境
目前,機器人在某些領域應用比較普遍,比如無人機、水下機器人等。為什么機器人在這些領域能得到應用,而其它領域卻比較困難?我認為,關鍵在于如何突破從結構化到非結構化的環境,這就需要人工智能。這里,我想通過幾個例子來說明。
PUMA型機械臂是最早的多關節機器人,在20世紀70年代被推出,在20世紀80年代變成了工業機器人,并進入迅猛發展的階段。如今,要把它推廣到一個相對非結構化的環境。所謂機械臂的非結構化環境就是有人參與,能夠與人交互,這樣環境就變成非結構化了。
要想解決非結構化環境的問題,必須把感知和動作結合起來,也就是說要做的動作是把感知和動作連接起來。從事機器人研究的人對反饋的概念非常清楚,因為這里必須要用反饋,而人工智能缺少反饋的概念,所有從事計算機領域的研究人員都缺少這個概念,因為他們研究的對象都是開環的算法,所以我認為這是人工智能和機器人結合的非常重要的點,而且可以做好。
協作機器人可以柔順控制,不會碰到周圍的事物,一旦碰到會立刻降速,但協作機器人目前還未形成產業。就我國而言,在非結構化的環境下,發展協作機器人產業是一個巨大的考驗,但當前有很大的市場需求,只有在有需求的情況下,才能找到應用場景。
過去我們也做過不少移動機器人,中國早期也是集中在研究越野,慢慢地越野的任務就轉向軍方和自動駕駛車輛。就目前而言,全世界都非常重視汽車的自動駕駛,汽車必然走向自動駕駛的道路。
目前自動駕駛主要是通過數據驅動的學習方法,學習不同場景下的圖象分割,判別是車輛、行人還是道路等,基于此建立三維模型,在三維模型上規劃行駛路徑,但是自動駕駛的這種方案并不能解決復雜路況下的行駛問題。
自動駕駛最重要的就是感知部分,也就是說汽車必須可以感知周圍的環境,主要是視覺傳感器,包括多模態,用攝像機或者其它設備感知周圍環境,這在人工智能看來就涉及深度學習。眾所周知,采用淺層神經網絡對標準圖像庫ImageNet進行圖像識別,原來誤識率是50%,但采用深度學習之后誤識率降到3.57%,盡管誤識別率降低了很多,但算法的脆弱性令人擔憂。在很多情況下,基于深度學習的人工智能系統非常脆弱、容易受攻擊和受欺騙,這就是計算機視覺算法的不安全性。如果這種不安全性不消除,很難想象在實際應用中會出多大的事故?
人工智能現有的方法只能處理結構化環境下的問題,而非結構化環境下的問題,人工智能的方法還有待提高,所以我們提出第三代人工智能就是要解決非結構環境下的有關問題。
早期,我們從事人工智能研究主要是靠知識、算法和算力,進入數據驅動時代以后,則主要靠的是數據、算法和算力,僅僅依靠數據、算法和算力做出來的系統總是存在不安全問題,怎么解決這種不安全問題?我們的辦法就是發展第三代人工智能,其核心思想是全面利用知識、數據、算法和算力這四個要素。
自動駕駛從L2、L3、L4走到L5,必須要解決計算機視覺不安全性的問題,現在世界各國都在做這件事。有人說未來汽車是四個輪子上的超級計算機,換句話說,將來只要用很少的錢買車本身,而需要用大量的錢買車上的各種計算機設備。
我們現在是用大數據的方法對圖像進行分割和識別,然后建模、規劃,目前這些任務完全可以做到實時,這樣車能不能就可以讓計算機來開?我認為在復雜路況下還是不能開,因為計算機視覺是不可靠的。當一個系統中有人(在交通系統中,包括行人和汽車駕駛員)存在時,這個系統就會變成復雜的系統。由于在現實情況中,駕駛員和行人都存在有意無意地違反交通規則的情況,所以必須從實際情況出發去考慮這種問題。其實,解決這樣的問題并不難。我們可以讓計算機自動駕駛車,累計開幾十萬邁,從中暴露計算機中存在的錯誤,找到解決各種突發事件的辦法,如同駕駛員在駕駛中積累經驗一樣,有了這些“經驗”,就可以放心地讓計算機單獨駕駛了。
總之,當機器人往前發展的時候,與人工智能會有更多的交集,通過和人工智能的交叉融合,最后達到二者互利共贏的目的!
(作者系中國科學院院士、清華大學人工智能研究院名譽院長,記者倪偉波整理)