五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > AI根據“記憶”生成超逼真場景,游戲終于要以假亂真了

AI根據“記憶”生成超逼真場景,游戲終于要以假亂真了

日期:2019-03-03   人氣:  來源:互聯網
簡介:AI根據“記憶”生成超逼真場景,游戲終于要以假亂真了 最近十多年來,人工神經網絡的研究工作不斷深入,取得了很大的進展:在模式識別、智能機器人、自動控制、預測估計、生物、醫學、經濟等領域已成功地解決了許多現代計算機難以解決的實際問題。這一次AI……

AI根據“記憶”生成超逼真場景,游戲終于要以假亂真了

最近十多年來,人工神經網絡的研究工作不斷深入,取得了很大的進展:在模式識別、智能機器人、自動控制、預測估計、生物、醫學、經濟等領域已成功地解決了許多現代計算機難以解決的實際問題。這一次AI又一次向人類展現了極大的潛能。不僅能記憶,識別,甚至開始自己想像?!斯坦福大學的陳啟峰利用人工神經網絡生成了現實感極強的虛擬世界。但是,AI的想象要想呈現逼真的效果,不僅要技術,工業機器人維修,還需大量人力。本文編譯自NewScientist發表的原題為AIartistconjuresupconvincingfakeworldsfrommemories的文章。

世界不思議

上圖的照片是德國街道的景象。乍看上去像是行車記錄儀拍下的模糊照片,或者是經過修圖軟件修過的快照,讓照片看起來有點朦朦朧朧。

然而,你在Google地圖上哪里也找不著這個地方。因為它是由人工神經網絡想象出來并生成的圖像,神經網絡經過訓練后,由它對真實街道的記憶拼接而成。

人工神經網絡是由多個非常簡單的處理單元彼此按某種方式相互連接而形成的計算機系統,該系統考其狀態對外部輸入信息的動態響應來處理信息。

--美國神經網絡學家HechtNielsen對人工神經網絡的定義

圖中沒有一樣東西真實存在。加州斯坦福大學陳啟峰說。事實上,他的AI通過大致的布局,知道圖中每一個部分大概是什么物件。圖像中心可能標記著路,途中其他地方可能寫著樹,車等等。這幅圖是由AI藝術家用數字繪制的。

左邊是輸入的圖像語義布局,右邊是生成的圖片

陳啟峰說,這項技術最終可能用來創造與真實世界非常相似的游戲世界。運用深度學習來制作電子游戲或許是我們未來的發現。他已經開始試著用算法來替代俠盜獵車手5的游戲世界了。

要做到逼真前路漫漫

紐約康奈爾大學的NoahSnavely贊嘆不已。他解釋說,要實現逼真的人工世界是很難的,即使是現有的最棒的技術也做不到。陳啟峰的系統的成果是他所見過的同類型實驗結果中規模最大,細節最豐富的。

Snavely還說,這項技術能夠讓人們能夠創造虛擬世界:先由人作描述,再用AI在虛擬現實中搭建這個世界。如果只要通過描述便能夠構造現實般逼真的世界,那就太棒了。

陳啟峰的系統首先處理一張它未見過的照片,照片上是現實中存在的街道。但是這張照片上做了標記,所以AI知道哪個部分是車,哪個部分是人,哪個部分是路等等。然后AI就用這張圖的布局作為一個向導,來生成一張全新的圖像。

第一行是輸入的語義布局,第二行是陳啟峰AI得出的結果,第三行是別的系統得出的結果,可見陳啟峰的AI得出的結果更具實感

這個AI接受三千張德國接到圖片的訓練后,當它處理到照片上標記這車到地方學習,庫卡機器人何服電機維修,他就用已有知識來獨立生成一輛車。我們想讓這個網絡記住他在數據中曾經看過什么。陳啟峰說。

英特爾的研究人員將在今年10月末在意大利威尼斯舉行的計算機視覺*國際大會上展示他們的成果。

如夢如幻似真非真

還有一個較小的室內家居數據庫用以訓練和測試這個算法,Snavely覺得要發揮這個算法的潛能,需要一個能夠真實反映世界多樣性的數據集。但是,說起來容易做起來難,因為用于訓練的圖像中每個成分都需要人力親手進行標記,即使是創造一個較小的數據集,由于其細節豐富,也需要大量人力。

最左側是給AI提供的語義布局,庫卡機器人,左二是AI得出的結果。右邊三列是其他不同質量的效果。

陳啟峰說,他的系統還需要經過漫長的努力才能夠打造真實的世界。目前它生成的圖像仍然朦朦朧朧,亦真亦幻,因為神經網絡還無法將我們期待的細節巨細無遺地填充到照片中。陳啟峰已經開始開發一個規模更大的系統,希望新系統的功能更完善。

然而,在虛擬現實中構建場景時,或許朦朦朧朧的質感并不是件壞事。Snavely說,我們對電影和游戲中精細現實的場景已經見怪不怪,習以為常,但是大家對虛擬現實精細程度沒有抱有那么高的期待。不需要做到完全跟現實一樣

*計算機視覺是一個跨學科領域,涉及如何使計算機理解數字圖像或視頻。從工程學的角度來看,它的目標是將人類視覺系統的功能自動化。計算機視覺任務包括一系列方法,讓計算機能獲取、處理、分析和理解數字圖像以及從真實世界中提取的高維數據,從而產生數字或符號信息。理解這個環境,意味著視覺圖象(視網膜的輸入)轉換成對世界的描述,這些描述可以與其他思考過程接口并引發適當的行動。這種對圖像的理解,可看做是用幾何、物理、統計學和學習理論構建出模型來解析圖像數據中符號信息。計算機視覺的子域包括場景重建、事件檢測、視頻跟蹤、目標識別、3D位姿估計、學習、索引、運動估計和圖像恢復。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
主站蜘蛛池模板: 湾仔区| 邓州市| 凉山| 于都县| 黎城县| 开平市| 横峰县| 泊头市| 于都县| 汕尾市| 晋城| 蒙城县| 上蔡县| 左贡县| 松原市| 上杭县| 孟村| 湘乡市| 济南市| 大余县| 阜康市| 贵港市| 大洼县| 图木舒克市| 清徐县| 锦屏县| 晋州市| 法库县| 嘉善县| 桦南县| 塔河县| 白银市| 永吉县| 贵州省| 突泉县| 大兴区| 奈曼旗| 开鲁县| 定远县| 紫云| 施甸县|