【新智元導讀】機器學習專家、著名的計算機科學和統計學家 Michael I. Jordan 近日在《哈佛數據科學評論》上發表文章,評論當前的人工智能炒作,認為現在被稱為 AI 的許多領域,實際上是機器學習,而真正的 AI 革命尚未到來。
人工智能(AI)已經成為當今時代的口號。
技術專家、學者、記者、風險投資家都在說這個詞。跟其他許多從技術或學術領域流入普通大眾的詞語一樣,“AI”這個詞的使用也存在嚴重的誤解。
然而,跟其他領域中公眾不理解科學家在做的事情不一樣,對于“AI”,科學家們經常和公眾一樣困惑。
某種程度上,我們這個時代正在看到一種與我們人類的智能相匹敵的硅基智能的出現,這既讓所有人感到興奮,讓我們著迷,同時也讓我們感到恐懼。不幸的是,它分散了我們的注意力。
Michael I. Jordan
我們急需發展構建推理和決策系統的原則
我們可以從另一個角度來講述這個時代。有這樣一個故事,其中涉及人類、計算機、數據和生死抉擇,但重點不僅僅是硅基智能這類的幻想。
14年前,我的妻子懷孕時,我們做了超聲波檢查。醫生是一位遺傳學家,她指出胎兒心臟周圍有一些白點。“這些都是唐氏綜合癥的標志,”她說,“現在你的風險已經上升到20分之一了。”她告訴我們,可以通過羊膜穿刺術了解胎兒是否真的有唐氏綜合癥基因畸變,但羊膜穿刺術存在風險——在穿刺術過程中胎兒死亡的幾率大約是300分之一。
作為一名統計學家,我決定找出這些數字的來源。在我的研究中,我發現十年前英國有人做過一項統計分析,這些反映鈣沉積的白點確實被認為是唐氏綜合癥的預測因子。我還注意到,我們做檢查時使用的成像機每平方英寸的像素比英國研究中使用的成像機多幾百個像素。我回去告訴遺傳學家,我相信那些白點很可能是假陽性,也就是字面上的白噪音。
她說:“啊,這就解釋了為什么我們幾年前開始發現唐氏綜合癥的診斷有上升趨勢。那恰好是新機器運來的時候。”
我們沒有做羊膜穿刺術,幾個月后妻子生下一個健康的女孩。但這件事一直讓我放不下,尤其是我知道由于一次粗略的計算,那天可能有成千上萬的人得到同樣診斷,然后許多人選擇做羊膜穿刺術,造成許多嬰兒不必要的死亡。
這件事揭示的問題不是我個人的醫療問題;它關乎一個醫療系統,在不同的地點和時間測量變量和結果,進行統計分析,并在其他情況下使用結果。
這個問題不僅與數據分析本身有關,而且與數據庫研究人員所稱的“溯源”(provenance)有關——數據來自哪里,從數據中得出了什么推論,這些推論與當前的情況有多大關系?雖然專業人士可能在遇到個案時能逐步解決這些問題,但問題是設計一個行星級規模的醫療系統,該系統要能在不需要如此詳細的人類監督的情況下做到這一點。
我也是一名計算機科學家,我突然想到,在我所受的教育中,根本找不到構建這種行星級規模的推理和決策系統所需要的原則,這些原則融合了計算機科學和統計學,并考慮到人類的效用。在我看來,發展這些原則至少與構建玩游戲之類眼花繚亂的AI系統同樣重要,這些原則不僅在醫學領域,而且在商業、交通和教育等領域都需要。
一個新的工程學分支:將人類和計算機結合起來
無論我們是否很快就能理解“智能”,我們都面臨著一項重大挑戰,那就是如何將計算機和人類結合起來,從而增強人類的生活。
盡管一些人認為這一挑戰只是AI創造的一種輔助,但另一種觀點認為,這是一個新的工程學分支。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是圍繞一些關鍵思想,為人們帶來新的資源和能力,并確保安全。土木工程和化學工程建立在物理和化學的基礎上,而這門新的工程學科將建立在上個世紀賦予了實質的思想之上,如信息、算法、數據、不確定性、計算、推理和優化。此外,由于新學科的大部分重點將放在來自人類和關于人類的數據上,因此,它的發展將需要社會科學和人文學科的觀點。
雖然各種構建塊已經就位,但是將它們組合在一起的原則還沒有到位,因此目前將這些塊組合在一起的方式是臨時的。因此,就像人類在土木工程出現之前建造建筑物和橋梁一樣,人類也在繼續建造涉及機器、人類和環境的社會規模的推理和決策系統。正如早期的建筑和橋梁有時會以無法預見的方式倒塌,并帶來悲劇性的后果一樣,我們早期的許多社會規模的推理和決策系統已經暴露出嚴重的概念缺陷。
不幸的是,我們并不擅長預測下一個可能出現的嚴重缺陷是什么。我們缺少的是一個分析和設計原則的工程學科。
目前大多數AI,實際上是機器學習
目前關于這些問題的公開討論中,經常使用“AI”這個術語作為一個智能的通用詞,這使得人們很難推斷出新興技術的范圍和后果。因此,我們有必要深入了解AI在最近和曾經被用來指代什么。
如今大多數被稱為AI的東西,尤其是在公共領域,實際上是機器學習(ML),這個術語在過去幾十年里一直在使用。ML是一個算法領域,融合了統計學、計算機科學和許多其他學科的思想(見下文),設計處理數據、做出預測和幫助做出決策的算法。
就對現實世界的影響而言,ML是真實存在的,而不僅是最近才火起來的。事實上,在20世紀90年代初期,ML就已展現出將為產業界帶來巨大改變的苗頭。到了世紀之交,亞馬遜等具有前瞻性的公司就已經在他們的業務中使用機器學習、解決關鍵任務、后端檢測和供應鏈預測中存在的問題,以及建立面向消費者的創新服務,如推薦系統。
在隨后的20年里,隨著數據集和計算資源的迅速增長,很明顯,ML很快將不僅為亞馬遜提供動力,而且將為任何一家可以將決策與大規模數據關聯在一起的公司提供動力。新的商業模式將會出現。