深度|從基礎設施到API:亞馬遜AWS的人工智能拼圖
無論是人工智能技術的開發者還是應用者,當你按照自己需求構建架構時,都可以自然地從AWS的產品列表里找到適合的服務,像拼圖一樣完成你的人工智能產品。
作為亞馬遜旗下的云計算服務平臺,AWS如今已邁入第11個年頭,KUKA機器人維修,成為年化收入140億美元,卻仍然保有43%年增長的龐然大物。
在亞馬遜AWS全球副總裁、大中華區執行董事容永康看來,AWS取得今天的成績是一個水到渠成的過程。當其他企業還在討論亞馬遜提出的新概念的可行性時,公司就已積累了大量內部測試經驗,當一項技術達到一定的成熟度,AWS則順理成章地將相關資源開放給客戶。
從一個眾人眼中的公有云平臺,到被公認為企業轉型與創新所需的技術平臺,亞馬遜的技術儲備,就是AWS提供云服務的底氣。與谷歌、微軟以軟件即服務(SaaS)起家,逐漸下移到平臺即服務(PaaS)和基礎設施即服務(IaaS)的路線不同,亞馬遜一開始就提供基礎設施,在此基礎上,為滿足不同開發者的需求,進一步提供平臺與軟件。如今,AWS提供超過90個大類的服務,擁有數百萬月活躍用戶,涵蓋了不同的企業類型與企業規模。
7月27日,2017AWS技術峰會北京站在國家會議中心舉行,會上,容永康與亞馬遜首席技術執行官WernerVogels對AWS的業務進行了梳理,眾多AWS的客戶和合作伙伴也分享了他們使用AWS云服務的經驗。人工智能作為一個對云計算有巨大需求的領域,作為AWS眼中未來十年的大趨勢之一和近期投入大量資源的方向,也引發了廣泛的關注和討論。AWS為人工智能領域提供了哪些產品?其優勢體現在哪些方面?機器之能在采訪了相關負責人及行業用戶之后結合演講內容進行了以下梳理。
應用云計算的人工智能相關公司可以從「開發者」和「應用者」的角度簡單分為兩類。開發者以人工智能模型本身作為產品,以算法為核心建立新的行業秩序、劃定新的分配原則,創造或顛覆一種商業模式。他們對云的需求是數據存儲、計算能力基礎設施以及機器學習框架平臺。此類業務中最典型的莫過于自動駕駛。
應用者則利用人工智能的技術加強自己原有的產品與服務,這類企業的工程師未必有人工智能核心算法的開發能力,因此以SaaS的形式提供通用的,可以進行有針對性微調的人工智能接口更符合他們的需求。這類公司可以通過調用相應API與自身的產品或服務配合。智能家居、智能農業公司都是常見的應用者。
AWS為兩種類型的公司都提供了豐富的產品線。
致力于自動駕駛領域的圖森未來是開發者中的AWS「重度用戶」,其COO郝佳男在媒體溝通會上提供了近十種圖森未來使用AWS的典型場景。他表示,AWS吸引他的地方在于,當他按照需求構建架構時,可以像拼圖一樣從AWS的產品列表中找到合適的產品。
Vogel也在演講中表示,規模龐大、來源復雜的數據是人工智能領域面對的首要挑戰,首先要對數據進行管理和處理,然后是使用GPU進行訓練,最后在邊緣設備上運行模型做出預測。
對于圖森來說,車就是「邊緣設備」,而為了讓車運行,主要的工作其實都在車外的云端完成。研發車背后的系統需要大規模的基礎架構平臺支持,這就是圖森未來與AWS結合之處。
首先是數據,郝佳男介紹,需要解決的問題涉及數據的上傳、存儲、標注、抓取等多方面。用于數據收集的車輛上搭載大量傳感器,每輛車每小時產生的原始數據就有TB級別。如何讓不同來源的數據從車上流暢地流向云端并不是一件容易的事情。而數據上傳之后,還需要上千人對數據進行標注,之后才能訓練監督學習類型的人工智能算法。標注完成,在使用數據時,并非每次都抓取所有的數據,比如訓練雨天的算法,就需要對雨天的數據進行查詢和操作。
為了解決這些復雜的問題,圖森未來使用了多種AWS產品,將數據從本地傳到云端,穩定的鏈路需要DirectConnet,傳輸大量數據需要Snowball。數據和大部分產品在S3上,數據到達S3就會觸發Lambda做預處理,Glacier提供數據備份,RDS提供元數據檢索。
在架構和算法層面,庫卡機器人驅動器維修,以可擴展性聞名的MXNet是AWS的官方深度學習平臺,使用者可以通過MXNet的AMI快速構建MXNet環境。一個典型的訓練,可能需要8個GPU花費數小時才能完成,EC2提供的彈性計算資源則從基礎架構層面解決了資源調度的問題。
作為一家自動駕駛公司,庫卡機器人驅動器維修,郝佳男認為,他們應該把更多精力和成本投入在自動駕駛上,AWS則以低運營成本、高可用性,滿足了人工智能開發者在研發過程中對基礎架構的需求,使他們的研發得以順利進行,減少車輛在路測時的問題。
Vogel展示了一張在AWS上運行的人工智能企業的列表,包括用機器學習算法評估房地產價值的Zillow、依靠推薦系統起家的視頻流網站Netflix以及GPU發明者英偉達等。Vogel表示,服務這些人工智能最前沿公司的底氣來源于亞馬遜自己的機器學習經驗,因為亞馬遜電商網站的庫存管理、搜索排序、對評論的整理、對新產品的預測都使用了機器學習和深度學習。
除了讓人工智能開發者的注意力集中在自身算法的開發之外,AWS提供了三種可以立刻應用的人工智能服務:對話服務Lex、語音服務Polly以及視覺服務Rekognition,使人工智能應用者節省了模型搭建的時間,從而將注意力集中在服務本身。
Lex來源于亞馬遜語音服務Alexa背后的技術,使用自動語音識別(ASR)技術將語音轉為文本,然后用自然語言理解(NLU)技術理解文本的意圖,能讓開發者將對話接口用于任何使用語音或文本的應用中。作為Lex的客戶之一,NASA用Lex復制了一個火星探測車Rov-E,使學生通過對話的形式學習火星相關知識。iRobot則開發了能用語音控制的掃地機器人。
語音服務Polly利用深度學習技術將文本轉換成類似人聲的語音。華盛頓郵報作為Polly的客戶,正在利用這一功能開發語音版報刊。
視覺服務Rekognition則幫助人們識別圖形,提取其中的信息。比如判斷圖片中是否有人,通過面部檢測、判斷這個人是否佩戴眼鏡、有什么樣的表情,也可以找出做不同表情的同一個人。美國的有線電視網絡C-SPAN在Rekognition發布兩周之后,就通過對近十萬條數據的學習建立了一個精確到秒的甄別器,用于快速識別視頻內發表演說的政治家。
通過向應用者提供人工智能服務,AWS提供了一個大公司將深度學習技術民主化的良好范例:所有開發者都能運用亞馬遜級別的技術創建自己的應用,這些應用可以服務于任何有需要的群體。而這些用戶和合作伙伴又進一步構成了一個活躍的生態系統,正如AWS首席云計算企業顧問張俠所言,「當你有特定需求的時候,在我們的生態系統里能找到一批可以直接借鑒的成功案例。」