五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 在深度學習大熱的同時,我們也要直面這六個挑戰

在深度學習大熱的同時,我們也要直面這六個挑戰

日期:2020-02-10   人氣:  來源:互聯網
簡介:在深度學習大熱的同時,我們也要直面這六個挑戰 深度學習已經成為人工智能領域最主要的研究方向,我們熟知的人工智能應用(語音識別、圖像處理和自然語言處理)背后都有深度學習在支撐。深度學習算法通過模擬人腦的神經結構來學習處理特定的問題,在各個領……

在深度學習大熱的同時,我們也要直面這六個挑戰

深度學習已經成為人工智能領域最主要的研究方向,我們熟知的人工智能應用(語音識別、圖像處理和自然語言處理)背后都有深度學習在支撐。深度學習算法通過模擬人腦的神經結構來學習處理特定的問題,在各個領域都取得了很驚人的成果,但目前深度學習還面臨著一系列挑戰。今天我們就一同來直面這些挑戰。

一個神經網絡架構

AndrewNg有句名言:我相信深度學習是實現真正人工智能的最佳途徑。

如果你用心觀察周圍的世界,你就會明白這句話里包含的重量。從蘋果的Siri到微軟的小娜,KUKA機器人維修,從谷歌照片到Facebook的圖像識別,從搜索引擎里的文本自動糾錯到在線音樂平臺的推薦引擎,這些技術為我們的生活帶來了無限的便利,而它們的背后都有深度學習在支撐。當然這僅僅只是深度學習應用的幾個例子,它已經深入到我們生活的方方面面并改變著我們的生活。

但是這項偉大的技術同樣面臨著一系列復雜的挑戰,主要包括以下幾個方面:

龐大的數據需求

模型的過擬合

模型的優化

高性能的硬件需求

神經網絡的不可解釋性

缺乏泛化性

接下來讓我們一起逐一分析這些挑戰!

龐大的數據需求

深度學習是一種數據驅動的算法,大量的數據是建立精確模型的前提和保證。就像人類需要從經歷中總結經驗學習和提取信息一樣,人工神經網絡也需要巨量的數據來分析、提取和總結。越抽象越強大的模型就需要越多的參數,同時也意味著需要更多的數據來支撐。

舉個栗子,如果我們要訓練一個語音識別程序,我們需要不同方言不同長度的語音數據以及人口數據,并將這上萬G的數據送到算法中,經過漫長的訓練和調優后才能得到一種語言的語音識別程序。這是一個十分漫長的過程并且需要巨大的算法處理能力,IBM、微軟、蘋果等等都是經過了許多年的技術積累才打到了今天的程度。在一定程度上,可以說利用深度學習解決某一個問題就是一個如何充分利用巨量數據的問題。

同時神經網絡的復雜性可以通過其中所包含的參數數目來表示。在深度神經網絡中,參數的數目都達到了上百萬甚至上億的量級。如果我們把這個數字記為P的話,那么訓練出一個較好性能的神經網絡所需的數據規模至少是P*P。

神經網絡的過擬合問題

有時,訓練數據集中出現的錯誤和新的未看到的數據集中遇到的錯誤有很大差異。它一般發生在復雜的模型中,比如對于觀察目標來說有過多的參數。一個模型是否有效一般是通過事先不可見的數據集判斷的,而不是通過對提供給它的訓練數據的性能進行評估。

這主要是模型在訓練的過程中為了優化在訓練集上的表現不斷調整參數,使得模型記住了訓練樣本的樣子,但卻失去了對于新情況下樣本和數據的適應能力,使得模型使其泛化性。在深度學習中,一般使用正則化方法來處理這一問題,但在一些情況下還面臨著許多尚未解決的問題。

超參數優化

超參數是那些在訓練和學習過程前預先定義好的神經網絡參數,這些參數對于神經網絡有著巨大的影響,差之毫厘謬以千里。超參數調優是深度學習中一項重要的工作,一個網絡的性能優劣很可能就取決于超參數的細微差別,這也是深度學習和神經網絡中的最需要經驗的地方。

高性能計算的需求

為了解決真實世界中的問題,我們的深度學習算法需要巨量的數據,同時也需要機器擁有處理龐大數據的能力。為了縮短訓練的時間提高效率,深度學習領域一般會使用多卡高性能GPU工作站,甚至是超算中心來進行訓練。這些設備不菲的價值外還會帶了很高的能耗。

工業界使用的產品級深度學習系統往往會運行在高端的數據中心,而智能手機、無人機可穿戴設備等卻需要小型的高效處理單元。在現實世界中部署神經網絡需要平衡效率和能耗以及成本的關系。訓練和實現深度學習解決方案是一件耗時耗力耗錢的工作!

神經網絡的不可解釋性

對于神經網絡,我們知道了模型的參數、也知道了輸入的數據以及如何將這些連接成網絡的方式,但是我們卻還無法知道它是如何實現這一過程的。神經網絡就像一個神經的黑箱,它有十分神奇的功能但是我們對它如何工作如何推演的過程卻無從知曉。

神經網絡的不可解釋性阻礙了這一技術的抽象和總結,機器人維修,限制了高水平認知智能的研究和發展。同時神經網絡的操作對于人類來說太過抽象,我們無法很好的驗證它的工作過程是否合理。

但最近帝國理工的教授MurrayShanahan及其團隊發表了一篇討論深度符號強化學習的論文,正在致力于解決這一問題。

缺乏靈活性和適應性

深度學習模型一旦訓練完成就可以十分精確和高效的處理特定的問題,KUKA機器人電路板維修,然而目前的神經網絡具有高度分化的專一性,只能在特定的問題上具有良好的表現。

DeepMind的科學家RaiaHadsell對目前這種狀況進行了精辟的總結:這個世界上沒有那個神經網絡可以同時完成物體識別、音樂識別和玩星際入侵游戲這些任務!

今天絕大多數的深度學習系統對于一個特定的問題有令人十分滿意的表現。但只要面臨的任務稍微改變一點,哪怕是相似的任務,它也需要重新進行訓練和評估,更別提不同的任務了。目前研究人員正致力于創造出一種可以適應多種任務的神經網絡架構。

目前科學家們在利用進步神經網絡(ProgressiveNeuralNetworks)獲得了些許的進展。

同時在多任務學習(MTL)同也獲得了重大的突破。

來自谷歌大腦和多倫多大學的研究人員們發表了一篇關于多模型的論文,通過綜合視覺、語言和語音神經網絡的優勢可以實現同時解決多種不同任務的深度學習模型,包括圖像識別、翻譯和語音識別等方面。

結語

深度學習是當今人工智能最為火熱的研究領域,但它并不是無所不能的。但我在拓展認知科學的新邊疆時,勢必會遇到無數的困難和調整,這個過程和所有的技術進步一樣在曲折中不斷進步。深度學習會是實現AI的最好方式嗎?只有未來才知道答案,作為AI領域的研究人員,我們一起拭目以待!

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
主站蜘蛛池模板: 嘉义县| 阿巴嘎旗| 湖州市| 永康市| 吉木乃县| 莎车县| 资阳市| 东山县| 三台县| 柏乡县| 安乡县| 东源县| 神农架林区| 宿松县| 平远县| 香格里拉县| 双江| 屏东县| 玉环县| 闵行区| 襄樊市| 宣汉县| 青海省| 衡东县| 赞皇县| 临西县| 驻马店市| 西昌市| 巩留县| 阿坝县| 安泽县| 克山县| 称多县| 马龙县| 吴桥县| 闸北区| 莒南县| 门源| 察雅县| 济南市| 长沙市|