2019年被稱為AI元年,在這一年,谷歌公布了第三代人工智能芯片TPU,專門對自家TensorFlow進行了優化,這塊芯片比傳統CPU運算快30倍,能效比高出200倍,如此驚艷表現讓大量AI公司著手規劃自己的芯片,AI技術的芯片化成為了當前AI產業發展的一種世界級現象。
除了谷歌,AWS,微軟,蘋果,百度等世界IT巨頭,依圖,地平線,寒武紀等本土AI獨角獸也在積極研發自己的AI芯片。新近AI創業公司大多選擇以算法的芯片化作為市場的切入點。AI產業也正處在從算法輸出走向芯片研發的轉型過程中。
目前主流的芯片架構主要分為GPU、FPGA、ASIC等技術流派,代表玩家分別為英偉達、賽靈思、谷歌。
GPU其實就是我們平時用到的顯卡芯片,每塊顯卡當中都會有一塊GPU協同電腦的CPU來進行圖形加速運算,與CPU相比GPU擁有更多的算數邏輯單元ALU,這可以很方便地執行AI這種相對小型化的零散型任務,GPU擁有更多算數邏輯單元,可以形成數量可觀的任務流水線,將運算進行并行處理。
談到GPU就不得不提及計算機圖形顯示領域的巨人英偉達,英偉達在人工智能領域起步很早,積累扎實,從2007年以后通用計算需求下降,CPU市場企穩,在游戲市場的推動下GPU的性能和帶寬不斷提升,DNN的需求也在這一時間顯現,英偉達的GPU恰好滿足了當時AI市場需求,從此以后AI便成為了英偉達投資的一個重要市場。
英偉達在算力和開發環境方面一直處于業界領先地位,2019年英偉達上市了最新的Volta架構GPU,算力高達960 Tensor TFLOPS,其基于C語言的CUDA編程環境擁有廣泛的開發者基礎。與AWS的合作,讓開發者能夠在云端執行深度學習運算,不需要額外購買GPU設備。
無處不在的安裝基礎讓英偉達在用戶生態和采購成本方面上占絕有對優勢,很多初創公司以及院校研究機構都會選擇英偉達GPU作為主要平臺切入市場,這也使得英偉達生態擴張很快,市場占有率不斷走強,根據最新公布的數字,英偉達在AI芯片市場占有率已經達到了50%,絕對的NO.1。
雖然GPU運算能力很強但缺點也不少,比如在訓練型運算如ADAS等應用上表現出色,占絕對支配地位,但對于推理類運算相對FPGA較弱,此外由于內部是采用的是公版架構設計,所以GPU的晶體管數量非常龐大,要比ASIC高出十倍,這樣最直接的問題就是堆料嚴重,導致成本高和功耗巨大,這也是英偉達GPU被詬病最多的地方。市場目前對于這些缺點還算比較能容忍,客戶現階段最關心的還是算力,畢竟節約AI訓練時間更加關鍵。英偉達目前也擁有自己的ASIC產品Xaier專門用于ADAS,這是一款車規級的產品,雖然已經實現了量產,但規模小,庫卡機器人,價格偏貴,主要面向與L5級自動駕駛高端市場。
ASIC全稱Application Specific Integrated Circuits專用集成電路,這種架構可以被理解為專門為某一項算法定制的芯片,這樣的產品優點非常突出,比如由于其依據特定算法設計,不像GPU那樣堆料,容易控制硬件成本,功耗自然也低,但缺點也很突出,由于沒有重構能力,一旦算法發生迭代,其優化的效果就會失效,比如此前的比特大陸ASIC礦機,挖礦機制更新后性能就會變差,設備只能進行重新設計。
TPU Tensor processing unit就是ASIC類型芯片的代表,財力雄厚的谷歌不僅在軟件算法上投資發力,也在定制自己的AI芯片,TPU同時也是Alpha Go的大腦。其實谷歌最早采用的也是英偉達的GPU,但后期出于多種考慮開始轉向研發自家芯片,這也導致了英偉達轉向與AWS進行深度合作。谷歌的商業模式一直非常具有創意,在AI上也是一樣,雖然開放了底層架構TensorFlow,但在芯片業務上,選擇了只租不賣,對比英偉達的芯片出售模式,谷歌似乎規劃更長遠,希望開發一套通用平臺直接服務最終用戶,當然這樣的商業模式最后能不能成功暫且不論,單單是開發ASIC就非常具有戰略意義,相比FPGA和GPU,ASIC無論是在功耗還是堆料成本上都要節約得多,計算效率也要高出很多。但谷歌這枚TPU從嚴格的意義上講是擁有少部分可重構能力的,所以應該算是FPGA與ASIC之間的芯片,但隨著谷歌算法不斷的升級和完善,這部分重構能力很可能會被谷歌抹掉,將其設計成為完全獨立的ASIC芯片。值得注意的是,依圖也借鑒了谷歌這種商業模式,開發自研芯片,而且只供自己的服務器使用,不對外出售,亞馬遜的AWS也可能是出于對功耗的顧慮,近期也在轉向自家ASIC的研究。
FPGA全稱FieldProgrammable Gate Array,現場可編程邏輯門陣列,可以被理解為一種半成品的ASIC,擁有極其優秀的可重構能力,其硬件加速性能比DSP更加優秀,擁有類似GPU那樣多的小單元來將任務流水線并行處理掉,在推理運算方面明顯優于GPU。
FPGA 的主要玩家是賽靈思,很多AI初創公司都選擇賽靈思平臺作為市場切入工具,如深鑒科技(已被賽靈思收購),這樣的趨勢下也進一步擴大了FPGA的市場占有率,讓賽靈思成為了能夠和英偉達分庭抗禮的另外一個生態陣營,其老對手Altera被英特爾收購后,在AIOT領域明顯發力不足,在AI市場上的競爭基本不足為慮。
FPGA很好的解決了現階段AI開發者面臨的問題,在大多數初創公司都還處在尋找應用場景的階段,FPGA給算法的迭代提供了一個比較節約的選擇。利用FPGA的可重構能力,開發者可以多次改變項目的特征,實現芯片的復用。使用FPGA雖然能夠省掉了流片成本,但相對來說還是較貴,而且由于其追求可重構的能力,在設計上就沒能達到極致優化,功耗比ASIC要高出不少,且技術難度較大,高級開發人員較少,項目成本較高,在訓練型計算中表現中低于GPU。
就像GPU一樣,雖然FPGA有不少缺點,但也沒辦法擋住其火爆的趨勢,大量AI公司選擇FPGA來進行算法的開發驗證以及芯片的前期定制,甚至蘋果這種大公司也將FPGA嵌入到自家A12芯片中,提供AI能力。