五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 當人工智能擁有好奇心,結果可能沒你想象的那么糟糕

當人工智能擁有好奇心,結果可能沒你想象的那么糟糕

日期:2019-12-06   人氣:  來源:互聯網
簡介:當人工智能擁有好奇心,結果可能沒你想象的那么糟糕 好奇心,是人和人工智能最顯著的差異之一。從我們睜開雙眼看這個世界開始,我們就在努力的了解著周圍的一切,我們了解世界的方式很多樣;一開始是試圖把所有東西放進嘴巴里,到后來我們走遍了這世界的每……

當人工智能擁有好奇心,結果可能沒你想象的那么糟糕

好奇心,是人和人工智能最顯著的差異之一。從我們睜開雙眼看這個世界開始,我們就在努力的了解著周圍的一切,我們了解世界的方式很多樣;一開始是試圖把所有東西放進嘴巴里,KUKA機器人示教器維修,到后來我們走遍了這世界的每一個角落。

這也是生命中最美妙的東西,在滿足好奇心的過程中,我們獲得了快樂。人類了解一切,不是為了完成某一個目標,而僅僅是一種來自本能的沖動。

可人工智能所做的,只有根據既定目標進行學習、搜索和計算。掃地機器人會探索周圍環境,可這不是因為好奇,而是為了建立房間中的SLAM以完成工作。這也是強人工智能不會出現的證據之一:人類自己都沒弄明白意識為何會存在,更沒法將本能加在人工智能頭上。

不過在現有技術下,我們能否讓人工智能做出類似好奇的行為呢?比如給予無意義的探索行為一些獎勵,或者是把探索行為和完成工作相結合進行評分。

答案是可以。

好奇心幫助人工智能成為更棒的水管工

還記得我們第一次玩超級瑪麗的時候嗎?或許我們中很多人玩的都是小霸王學習機里的超級瑪麗式英語學習軟件。不管是什么,進入游戲的第一時間,我們通常都是試一試手柄上的每一個按鍵是做什么的,然后跳來跳去,嘗試觸碰游戲里的每一個小方塊。這就是好奇心最基本的表現。

那么人工智能在玩超級瑪麗時是怎樣的呢?通常情況下是應用了增強學習算法,用正負反饋機制幫助人工智能快速通關。踩死一只烏龜,獲得正向反饋,掉入懸崖,獲得反向反饋。問題時,只要能夠繼續過關,人工智能很難學會新的動作,這也就造成了遇到新的關卡時,人工智能常常需要耗費很大力氣才能通過。

在一篇關于人工智能好奇心的論文中提到,人工智能利用傳統的增強學習方法訓練,在超級瑪麗的游戲過程中,人工智能卡在了游戲的30%處,因為人工智能需要越過一個坑,而想要越過那個坑,需要15到20個特定順序的按鍵操作。由于在墜落進坑里時已經獲得了反向反饋,人工智能常常在坑的位置止步不前。

上述論文的作者,來自UCBerkeley的研究團隊提出了一種新的思路,庫卡機器人,為人工智能加入了內部好奇心構型。以自監督的方式,預測自身行動會造成何種結果,并將這種算法稱作自監督預測算法。

當外部反饋減少時,內部好奇心構型會激勵人工智能通過探索環境去檢驗自我對于行動的預測。結果是,采取內部好奇心構型的人工智能不會盲目重復那些有正向反饋的動作,而是開始了解游戲環境,把握整體游戲進程。最終戰勝了那個坑。

好奇心不僅會害死貓,還會讓人工智能得多動癥

接下來,在DeepMind計算機科學家Hester和德州大學奧斯汀分校的PeterStone的研究中,同樣的概念被進一步的具象化。

在強化學習的基礎上,他們開發了一種名為TEXPLORE-VANIR的算法。和自監督預測算法不同的是,TEXPLORE-VANIR為人工智能設立了內部獎勵機制,當人工智能探索環境時,即使這種行為對達到最終目標沒有好處,人工智能也會因為減少了外部環境的未知性而獲得來自內部的正向反饋。同時,在探索環境中發現了新事物時,人工智能也會獲得正向反饋。

這么聽起來,是不是很人類的好奇心非常相像了?

并且TEXPLORE-VANIR也讓人工智能的好奇心不再止步于游戲中。在關于機器人工作的實驗中,面臨多項工作安排,TEXPLORE-VANIR算法能讓機器人表現更好。原因是面臨多項工作時,普通深度學習算法會讓機器人不斷重復某一項工作中的動作,因為機器人曾經在完成這一項工作時獲得過正向反饋,當其他工作出現時,它還是會重復那些讓自己獲得過正向反饋的動作。這樣一來,就會浪費很多時間。

當人類表現出過度好奇時,會有怎樣的結果?最常見的,注意力無法集中,常常將手頭的工作半途而廢。同樣,人工智能擁有好奇心后也會有同樣的表現。搭載TEXPLORE-VANIR算法的機器人在一項給門開鎖的任務上表現較差,就是常常因為好奇而去探索環境,導致任務完成的延遲。甚至有學者稱,這是人工智能的多動癥。

這樣看來,如何平衡內部和外部的反饋將是如何讓人工智能好奇心發揮作用的最大問題。

沒有好奇心的人工智能只是機器?

我們更關心的是,讓人工智能擁有好奇心這件事究竟有什么用?是為了他們在游戲中更好的打敗我們?還是讓他們在執行任務時分心而變得低效?或者說讓他們更接近人類,可以更好的打敗我們?

(電影超能查派中的人工智能自己研發出了如何轉移意識,超越了電影中人類現有的科技水平)

首先,好奇心會讓人工智能在學習時更加高效。減少對外部環境反饋的依賴,意味著對已有數據的利用率更高。比如在機械手臂試圖抓起物品時,常常是把可能抓起物品姿勢都嘗試一遍,直到把物品抓起來。對于人來說,這是根本不能接受的低效,可換到了一個充著電的機器上,似乎就沒人在意了。可笑的是,人工智能本應該替人類完成重復勞作的工作,結果卻是用更多的人工智能重復勞作,代替人類的重復勞作。可有了好奇心,人工智能可以先對環境、環境中的物體進行初步的了解,然后再加以行動,而不是無腦的用暴力窮舉解決問題。

其次,好奇心可以讓人工智能更好的適應現實應用環境,畢竟現實和游戲或者實驗不一樣,沒人會為人工智能的每個動作打分。當缺少外部環境反饋時,庫卡機器人,好奇心驅使的內部反饋就可以發揮很大作用。只有可以自我驅動的AI,才能在真正意義上幫助到人類,發現那些我們在設立目標時沒有發現的事,而不是像所有機器一樣根據指令行動。

看到這里,是不是加重了對人工智能的恐懼?別擔心,大多數有關好奇心的算法目前還都停留在實驗階段,一是上文提過的,由于無法平衡內部反饋和外部反饋,好奇心常常會降低人工智能的工作效率。畢竟100%的專注,是所有機器的優勢。第二則是,傳統深度學習的蘿卜加大棒政策已經能滿足當下很多人工智能的應用。暴力窮舉雖然低效,但是十分有效。

但我們相信,不管以何種形式,未來的人工智能一定會出現類似好奇心的機制,在更了解這個世界的前提下,更好的服務人類。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
主站蜘蛛池模板: 蓬安县| 上蔡县| 凤庆县| 清镇市| 乐东| 垦利县| 石台县| 阳春市| 浦县| 宁陕县| 格尔木市| 革吉县| 光泽县| 全椒县| 汉阴县| 漳州市| 涪陵区| 墨玉县| 文昌市| 平塘县| 邹城市| 台东县| 延长县| 土默特左旗| 榆中县| 云安县| 密云县| 思南县| 南雄市| 资兴市| 松原市| 恭城| 绥江县| 莲花县| 阿合奇县| 旌德县| 札达县| 祁连县| 泊头市| 海口市| 祁东县|