五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 這臺對世界好奇的機器,竟然還玩起了超級馬里奧?

這臺對世界好奇的機器,竟然還玩起了超級馬里奧?

日期:2019-08-01   人氣:  來源:互聯網
簡介:這臺對世界好奇的機器,竟然還玩起了超級馬里奧? 十年前我們就能讓機器人完成那些可以被完美建模的任務了,那些機器人完美地運轉在工廠的車間里,完成一個特定的操作。但真正的人工智能需要在一個無法被建模的情境中,走出去,學會獨自探索需要完成什么任……

這臺對世界好奇的機器,竟然還玩起了超級馬里奧?

十年前我們就能讓機器人完成那些可以被完美建模的任務了,那些機器人完美地運轉在工廠的車間里,完成一個特定的操作。但真正的人工智能需要在一個無法被建模的情境中,走出去,學會獨自探索需要完成什么任務。這就是「好奇心」,是通向強人工智能的必經之路。

你也許不記得自己第一次玩超級馬里奧兄弟時的感受了,但是讓我們試著回想這個8-bit的游戲世界閃亮登場:淡藍色的天空,有紋路的石頭地面,一個矮胖的、紅色著裝的小人靜靜站在那里。他面朝右邊:你將他朝右推動。走幾步之后便會有一排磚頭在頭頂盤旋,上面盤旋著一堆「憤怒的蘑菇」。游戲手柄的另一個按鍵能夠讓那個小人兒跳起來,他的四個像素大的拳頭指向天空。然后呢?或許是把「向右」和「跳躍」動作結合起來。好了,驚喜不驚喜:他會用自己的頭部撞擊懸浮在空中的磚塊,磚塊會像裝了彈簧一樣迅速向上彎曲并且彈回,把小人兒彈向正在靠近的蘑菇的身上,將其迅速壓平。馬里奧輕輕地從被征服的蘑菇身上跳開。然后出現一個帶有問號的棕色的對話框,似乎在問,「現在呢?」

對于20世紀80年代長大的人來說,這個場景特別熟悉,但你可以在PulkitAgrawal的YouTube頻道上看到更年輕的玩家。加利福尼亞大學伯克利分校的計算機科學研究員Agrawal正在研究天生的好奇心如何讓學習完成一個不熟悉的任務的過程更有效率就像你第一次玩超級馬里奧兄弟一樣。重點是,Agrawal的視頻中的新手玩家不是人類,甚至是沒有生命的。它就像馬里奧一樣,僅僅是一個軟件。但是這個軟件配備了Agrawal和他在伯克利人工智能研究實驗室(BAIR)的其他同事DeepakPathak,AlexeiA.Efros和TrevorDarrell一起開發(fā)的實驗性機器學習算法。這個算法有一個讓人驚嘆的目標:讓機器具有好奇心。

Agrawal說,「你可以把好奇心想象成是智能體內部自動生成的一種獎勵,有了好奇心之后它們可以更進一步的探索這個世界」。這個內部生成的獎勵信號在認知心理學中被稱為「內在激勵」。這種感覺你或許在讀我寫的游戲描述時有間接的體會就是一種想要看看視野之外有什么的欲望,或者想要走出你的能力范圍,去看一下到底會發(fā)生什么這就是內在激勵。

人類也會響應源于外界環(huán)境的外在激勵。這類例子包括你從工作中獲得的薪水、你必須在特定時點完成的需求等。計算機科學家利用一種類似的,被稱為「強化學習」的方法來訓練他們的算法:軟件程序在按照被期望的方式執(zhí)行任務的時候會得到「分數」,然而在以不被期望的方式執(zhí)行的時候會受到懲罰。

但是這種胡蘿卜加大棒的方法對機器學習而言是有局限性的,并且人工智能研究者開始將內在激勵視為能夠高效靈活學習的軟件智能體的一項重要組成部分,也就是說,它們不太像脆弱的機器,而是更像人類和動物一樣。在人工智能中使用內在激勵的方法受啟發(fā)于心理學和神經生物學幾以及那些有數十年歷史的原始人工智能研究,現在重新變得有用了起來。(「機器學習領域里無新鮮事。」OpenAI研究員ReinHouthooft如是說。)

這種智能體現在已經可以被訓練用于視頻游戲中,但是開發(fā)「具有好奇心」的人工智能的吸引力超越任何現有工作。伯克利人工智能實驗室的聯合主管Darrell說,「你列舉一個你最喜歡的應用領域,我會給出一個例子」。「在家里,我們希望自動化地清理房間、收拾東西。在物流領域,我們希望貨物能被自動化地搬運、完成各種操作。我們希望汽車能夠在復雜的環(huán)境中自動駕駛,我們希望救援機器人能夠在建筑里搜救需要幫助的人。在所有這些例子中,我們都在嘗試解決這個非常棘手的問題:你如何創(chuàng)造一臺能夠自己想明白要完成什么的任務機器?」

「打分」問題

強化學習是讓Google的AlphaGo軟件得以在圍棋中戰(zhàn)勝人類玩家的利器。在此之前,圍棋作為一款古老的直覺游戲,向來被認為是機器無法企及的。如何在特定的領域成功使用強化學習的細節(jié)是很復雜的,但是通用的思想是簡單的:給算法或者「智能體」一個獎勵函數,一個用數學方法定義的信號來追尋并最大化。然后把它自由地置于一個環(huán)境中,可以是任何的虛擬世界或者現實世界。隨著智能體在環(huán)境中運行,能夠增加獎勵函數的值的動作會被強化。只要有足夠多的重復如果說計算機在某一件事上百分百勝過人類,KUKA機器人示教器維修,那就是重復智能體就會學會這個動作的模式或者策略,以最大化它的激勵函數。理想情況下,這些策略會導致智能體達到期望的最終狀態(tài)(例如在圍棋游戲中獲勝),在這個過程中程序員或者工程師不必在智能體進化的每一步都手動編碼。

換句話說,一個獎勵函數就是能夠讓配備了強化學習算法的智能體能夠鎖定目標的指導系統。目標定義得越是清晰,智能體就運行得越好這就是為什么目前很多智能體都是在較老的視頻游戲上做測試的原因,因為這些游戲都有基于分數的明確獎勵制度。(游戲的塊狀的、二維的圖像也是研究者選擇它們的理由:因為游戲相對比較容易模仿,研究者可以快速地運行并測試他們的實驗。)

加州伯克利的計算機科學家PulkitAgrawal

Agrawal說,「然而現實世界中并沒有分數」。計算機科學家希望讓他們創(chuàng)造的智能體去探索一個不是預加載了可量化對象的世界。

此外,如果環(huán)境沒有快速并且有規(guī)則地提供顯式的激勵,那么智能體「就沒有一個用來判斷它是否做得正確的準則」,Houthooft說。就像熱引導的導彈不能鎖定目標一樣,「它沒有任何自己通過環(huán)境引導自己的方法,所以只能亂飛」。

最后,即使是煞費苦心定義的激勵函數能夠指導智能體表現出不同凡響的智能行為就像AlphaGo打敗頂級人類玩家一樣這種激勵函數也不可能在未經大量修訂的情況下遷移到任何其他情境中。并且,這種修改必須是人工完成的,確切地說這就是機器學習首先應該幫助人類完成的事。

除了像導彈一樣能夠可靠地命中目標的偽人工智能體之外,我們真正想要從人工智能獲得的更像是一種內部引導能力。「你是可以自己給自己創(chuàng)造激勵的對吧?」Agrawal說,「并不存在一個天天指導你做這件事要『加1』或者『減1』的神」。

好奇心作為協同引導力

DeepakPathak從未嘗試過給「好奇心」這么虛無縹緲的概念建模。「『好奇心』一詞指的是『引導一個智能體在存在噪聲的環(huán)境中有效地探索的模型』」。隸屬于伯克利Darrell的實驗室研究員Pathak如是說。

但是在2106年,Pathak著迷于強化學習中的稀疏獎勵問題。含有強化學習技術的深度學習軟件最近在玩分數驅動的雅達利游戲(比如太空入侵者和打磚塊)中獲得了顯著的進步。但是在像超級馬里奧兄弟一樣的稍微復雜的游戲就超出人工智能的能力范圍了。因為在這些復雜的場景需要在時間和空間上朝著一個遙遠的目標前進,而且沒有一個明確的獎勵,更不用說學習并成功地執(zhí)行游戲中的組合動作(例如在奔跑中同時跳躍)。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言
亚洲卡通欧美制服中文| 欧美日韩三级视频| 亚洲成色www8888| 国内精品久久久久久久影视蜜臀| 午夜精彩视频在线观看不卡 | 欧美日韩午夜剧场| 中文精品一区二区三区 | 亚洲国产欧美精品| 91久久在线视频| 在线一区亚洲| 亚洲免费影视| 久久夜色撩人精品| 欧美日韩视频在线| 国产一区二区无遮挡| 亚洲国产精品视频一区| 亚洲国产精品悠悠久久琪琪| 一区二区久久久久久| 久久婷婷激情| 国产精品专区h在线观看| 亚洲欧洲精品一区二区精品久久久| 一区二区成人精品| 毛片精品免费在线观看| 久久精品91久久香蕉加勒比| 午夜精品福利一区二区三区av| 欧美99在线视频观看| 国产香蕉97碰碰久久人人| 在线一区日本视频| 欧美日本不卡| 一本久久a久久精品亚洲| 狼狼综合久久久久综合网| 国产一区二区三区在线免费观看| 国产精品99久久99久久久二8| 久热精品视频| 亚洲国内自拍| 欧美色播在线播放| 99精品国产在热久久婷婷| 午夜伦欧美伦电影理论片| 国产精品美女久久久久久免费| 亚洲图片你懂的| 国产亚洲精品aa| 久久久免费精品视频| 国产欧美在线视频| 欧美freesex8一10精品| 影音先锋亚洲精品| 欧美日韩黄视频| 欧美在线一区二区| 亚洲国产美女| 国产精品一区二区三区乱码| 久久免费观看视频| 亚洲激情第一页| 国产精品亚洲аv天堂网 | 亚欧成人精品| 亚洲精品小视频| 久久大综合网| 亚洲国产欧美日韩精品| 欧美日韩一区二区三区| 欧美一区三区二区在线观看| 99精品国产在热久久婷婷| 韩国精品在线观看| 国产在线观看精品一区二区三区| 欧美视频在线观看一区二区| 欧美成人资源网| 免费在线观看日韩欧美| 久久综合网hezyo| 噜噜爱69成人精品| 美国十次成人| 欧美三级第一页| 欧美日韩国产小视频| 欧美喷水视频| 国产精品手机视频| 国产区在线观看成人精品| 国产精品外国| 国语精品中文字幕| 亚洲激情视频网| 亚洲性图久久| 久久久久九九九| 欧美激情自拍| 国产伦精品一区二区三区免费迷| 国产精品美女午夜av| 国产视频欧美视频| 国产午夜精品美女毛片视频| 国产精品你懂的| 一区二区三区视频免费在线观看| 亚洲国产精品成人久久综合一区| 亚洲精品免费一二三区| 久久久久久久综合日本| 欧美精品色网| 正在播放亚洲一区| 欧美网站在线观看| 亚洲欧美在线磁力| 亚洲欧美在线播放| 免费的成人av| 国产精品丝袜白浆摸在线| 国产精品九九| 午夜亚洲影视| 国产精品黄视频| 亚洲永久在线| 欧美一区二区三区四区夜夜大片| 国产精品白丝av嫩草影院| 一区二区在线观看视频| 欧美亚洲视频在线观看| 亚洲男人的天堂在线aⅴ视频| 影院欧美亚洲| 亚洲九九精品| 最近中文字幕mv在线一区二区三区四区 | 性欧美在线看片a免费观看| 99国产精品久久久| 欧美夜福利tv在线| 免费一级欧美片在线观看| 欧美 日韩 国产 一区| 国产精品久久久久久久久搜平片| 国产精品久久久亚洲一区 | 午夜一区二区三区在线观看 | 亚洲国内精品在线| 亚洲精品一区久久久久久| 香蕉成人伊视频在线观看| 久久综合电影| 尤物视频一区二区| 亚洲免费在线观看视频| 欧美黄色视屏| 狠狠久久亚洲欧美专区| 亚洲在线成人| 欧美人与性动交cc0o| 亚洲激情av在线| 欧美日韩亚洲综合| 亚洲级视频在线观看免费1级| 一区二区三区久久网| 久久精品视频va| 国产精品久久久久久久久久直播| 国产综合在线视频| 欧美国产精品一区| 一区二区自拍| 欧美精品日韩| 亚洲精品国产精品国自产在线 | 欧美在线视屏| 国产精品久久久久久一区二区三区 | 亚洲国产精品成人| 欧美高清自拍一区| 国内精品久久久久久久97牛牛| 国产精品99久久久久久白浆小说| 欧美一级久久| 在线欧美影院| 国产欧美一区二区精品婷婷| 久久久久久午夜| 正在播放日韩| 国产亚洲精品美女| 欧美偷拍另类| 欧美插天视频在线播放| 欧美在线视频导航| 亚洲国产三级| 国产伊人精品| 免费看精品久久片| 欧美日韩成人在线播放| 久久精品国产成人| 亚洲自拍都市欧美小说| 亚洲巨乳在线| 亚洲人成啪啪网站| 日韩视频在线观看国产| 亚洲国产精品久久久久久女王| 国产麻豆9l精品三级站| 久久久夜精品| 久久亚洲综合网| 国产欧美精品国产国产专区| 欧美极品一区二区三区| 欧美日韩三级视频| 欧美久久在线| 欧美日韩一本到| 国产精品一区二区久久久久| 国产精品亚洲产品| 国产一区二区三区高清| 亚洲国产精品t66y| 国产精品资源在线观看| 欧美一区二区三区免费看| 欧美精品日韩www.p站| 尤妮丝一区二区裸体视频| 国内精品久久久久久久97牛牛| 国内激情久久| 亚洲视频在线观看免费| 欧美国产精品v| 国产欧美日韩视频一区二区三区| 国内激情久久| 一本色道久久综合| 欧美日韩大陆在线| 欧美91大片| 国产一级揄自揄精品视频| 99re6热在线精品视频播放速度| 亚洲性感美女99在线| 久久久一区二区| 亚洲人体偷拍| 老司机成人网| 国产精品日韩欧美大师| 亚洲高清资源| 久久青草欧美一区二区三区| 永久域名在线精品| 久久成人精品视频| 国产精品高潮呻吟久久av无限| 国产偷久久久精品专区| 国产一区二区三区在线免费观看| 欧美一级理论片| 国产日韩欧美亚洲|