機器可以理解語音、識別面部和安全駕駛汽車。這讓人們十分訝異于近期的技術方面的進步。但是,如果人工智能領域想要實現革命性的跨越,從而建造出類人式的機器,它首先將要掌握嬰兒的學習方式。
「在相對最近的人工智能中,人們從想直接設計一個可以完成成人做的事情的系統轉變成一種認識即如果想要有一個靈活和強大的系統來完成成人做的事情,這個系統需要能夠學習嬰兒和孩子做事情的方式。」加州大學伯克利分校的發展心理學家AlisonGopnik說,「如果你將現在計算機可以完成的事情與10年前可以完成的事情相比較,它們已經取得了很大的進步,但是如果你將這些事情與一個4歲兒童可以做的事相比較,仍然有相當大的差距。」
嬰兒和孩子使用一種和科學家用來構建科學理論的相同的方法來構建關于他們的周圍的世界的理論。他們以一種系統的和實驗性的努力來探索和測試他們周圍的環境以及環境中的人,這對于學習至關重要。
Gopnik最近和一組研究人員一起研究揭示了15個月大的孩子相比年齡更大的孩子是如何使用統計數據來更好地學習因果關系的。嬰幼兒也許是更好的學習者,因為他們的大腦更加靈活或者「可塑性」更強;他們較少地被背景知識所影響,這也讓他們有著更加開放的頭腦。大腦并非是不變的,而是隨著每一次學習的經驗而改變。
通過將發展心理學家和計算學家的專業知識相結合,人們可以揭示出世界上最好的學習型大腦是如何工作的,并且將其計算能力轉化到機器的身上。最近,人工智能需要大量的數據來提取模式和結論,但那些對周圍世界有相對較少數據的嬰兒使用的是一種被稱為貝葉斯學習(Bayesianlearning)的統計評估方法(參閱機器之心文章《深度|大腦認知機制是貝葉斯式的嗎?》)。也就是說,這種理解并非是基于一個結果的已知頻率(嬰兒所沒有的信息),而是基于當前的知識推斷出的事情發生的可能性,其隨著新接收到的信息而連續調整。
「令人震驚的是,嬰兒可以只看到一次或聽到一個新單詞的時候,他們就已經對這個新詞的可能意思和可能的使用方法等有了一個很好的認識了;」Gopnik說。「所以這些貝葉斯方法很好地解釋了在沒有充足數據的情況下,這些孩子為什么如此擅長于學習。」
嬰兒們使用概率模型通過組合概率和可能性(probabilitiesandpossibilities)來得出結論,從而創造出各種假設。隨著大腦的成熟,它變得更加專業化以便執行復雜的功能,因此也變得不那么靈活,越來越難以隨著時間而改變。年長的學習者發展出了有偏見的觀點,因為他們更多地了解世界并且加強某些神經連接,這阻礙了他們基于很少的信息來形成具有創新性的假設和抽象理論的能力。這種能力使得5歲以下的嬰兒和兒童茁壯成長。
「這種權衡關系就是,你知道的越多,你就越難以考慮新的可能性,」Gopnik說。「你知道的越多,你就越依賴于你知道的東西,而對新的東西則不能保持一個開放的態度。從進化的角度來看,嬰兒的整體情況就是他們不知道那么多,所以他們可以更好地學習新的東西。」
在嬰兒剛出生的幾年,每一秒都有700個新神經連接生成,這是讓一個靈活的大腦處理快速積累的來自環境和社交的信息所必需的部分。比起在成年時期重新組合大腦回路,生命早期的可塑性使得從零建立大腦的架構更加容易。貝葉斯學習已經被證明是兒童發展中的一個強大工具,計算機科學家正在使用該模型設計智能學習機。
麻省理工學院大腦和認知科學系的教授、計算認識科學家JoshuaTenenbaum說:「貝葉斯算法正在試圖捕捉嬰兒的學習模式,機器人維修,」他正在與Gopnik合作進一步研究其計算機和心理學的混合領域。「當這些孩子進入了真實的世界時,就已經有準備好的基本的構建模塊來讓他們理解一些最復雜的概念。然后,他們有學習機制即以這些最初的構建模塊來嘗試從稀疏數據推理,并創造因果理論。」
人類的大腦,不管處在哪一個發展階段,都是被設計通過一系列的感覺系統,包括視覺、聽覺、嗅覺、味覺、觸覺、空間取向和平衡從而進入物理世界。當一個人只有有限的數據時,大腦就會填補空白,這是一種被稱為「退化(degeneracy)」的神經結構現象。盡管嬰兒的大腦缺乏一個或多個感知,但是他們還是尤其擅長處理信息。
Tenenbaum說:「為了理解世界,孩子們會像科學家一樣學習,庫卡機器人驅動器維修,這包括形成理論、進行試驗、玩耍并且看看到他們可有所發現的東西,積極思考什么是正確的方法來測試他們的理論或者應對一些他們沒有想到的東西,并試圖找出什么是錯,什么是對。」
采取孩子的措施
Tenenbaum和來自紐約大學和多倫多大學的研究人員團隊合作設計了一種能夠以更有效和更復雜的方式捕獲新知識的人工智能軟件。在2015年12月,他們的研究論文《Human-levelconceptlearningthroughprobabilisticprograminduction》指出用于創建計算機的機器學習算法接近我們所處理信息的方式;該論文已發表在Science雜志上。
新的人工智能程序可以在看到一個樣本之后就像人類一樣準確地識別手寫字符。使用貝葉斯程式學習框架,軟件能夠為每個至少看到一次的手寫字符生成一個獨特的指令。但是,當機器面臨一個不熟悉的特性的時候,這種算法的獨特功能就發揮了作用。它從數據搜索轉換到尋找匹配,使用概率程序并通過組合已經見過的字符的部分和子部分來創建一個新的字符以此檢測其假設即當嬰兒面對他們從未見過的角色和對象時,他們如何從有限的數據中學習到豐富的概念。
然而,軟件仍然無法通過形成原始假設自主學習方式模仿孩子學習的方式。當研究人員能夠設計具有原始假設和真實的目標的軟件時(例如產生識別字符的愿望而非遵循研究者的指令),人工智能系統的潛力將會有里程碑式的轉變。沒有自我驅動的目標,人工智能系統就限制了他們自主運作的潛力。
Tenenbaum說:「使用越來越多的數據進行的持續性學習是任何人工智能系統都想要做到的,但自主學習卻是棘手的,因為總會有人來操控整件事情,數據的數量與類型也由他們給出。嬰兒是自主選擇的,機器人維修,但是要讓人工智能系統能夠更自主地構建自己學習過程仍舊是一個眾所周知的挑戰。目前的人工智能系統并沒有建立任何目標,應此它們也無法為自己的學習負責。當一個機器人按指示拿起一個盒子時,看著它們做著和人類一樣的事情是非常令人欣喜的,然而它們并不會擁有像孩子那樣復雜的思維水平。」
Tenenbaum和他的同事采用了在神經元的虛擬網絡上建模的深度學習算法。它建造了一個非常初步模仿人腦的工作方式。當機器處理一個對象時,它搜索其巨大的數據庫來獲取與機器匹配的像素以進行識別。而人類依賴于更高形式的認知功能來解釋對象的內容。
「我們正在試圖編寫像大腦的軟件一樣的計算機程序,這通常被稱之為思維。思維是程序且運行于大腦這個硬件上,我們就是試圖在對準軟件層面。神經網絡在人工智能中就像計算機程序的軟件層面一樣。」