IBM宣稱:POWER9加InfiniBand的組合才是AI最優解
IBM公司在本月早些時候于紐約召開的AI紐約峰會上指出,其POWER9方案在支持AI以實現認知工作能力方面優于通用或專用型X86商業現成(簡稱COTS)工具。
藍色巨人最近公布了一項演示,據稱其能夠利用自有專有服務器配合低延遲/高帶寬技術接入FlashSystem陣列例如PCIeGen4、EDR與QDRInfiniBand以及NVMeoverFabrics,從而在性能表現上將COTS服務器及存儲方案遠遠甩在身后。
當然,E8、Excelero、Pavilion以及FarmationDataSystems等初創企業都已經在推出NVMeoverFabrics訪問型存儲陣列,而PureStorage也有意作出嘗試這一切都能夠支持立足X86服務器的訪問能力。
另外,庫卡機器人驅動器維修,IBM公司在展示中還使用了NVMeoverFabricsInfiniBand(簡稱NVMe-oF)。IBM公司并沒有正式公布在AC922服務器或者FlashSystem900陣列上支持NVMe-oF協議,但從目前的技術預覽來看確有這種可能。
此次展示于今年12月5日到6日召開的AI紐約峰會上正式亮相。薦AC922采用PCIe第四代總線,速度是目前大多數服務器所使用的PCIe第三代總線的兩倍。
IBM公司還向與會者們展示了基于POWER9的AC922與五臺FlashSystem900陣列利用NVMe-oF實現對接的預覽方案,并表示其能夠有效降低數據訪問延遲并提升傳輸帶寬。
藍色巨人Flashsystem產品組合與賦能戰略經理WoodyHutsell在博文中指出,這臺AC922服務器能夠將I/O數據吞吐能力提升至目前x86服務器內所使用的PCIe第三代總線的5.6倍。
IBM公司表示,其將成為AI實現方案的理想之選其能夠攝取海量數據,同時完成實時推理(對象檢測)。
Hutsell表示,FlashSsytem900已經能夠利用InfiniBand連接支持SRP(即SCSIoverRDMA協議),并可將SCSI代碼替換為NVMe代碼以進一步降低延遲水平。
IBM公司在技術預覽中使用的硬件配置
在展示中,AC922服務器通過一個雙閊NVMe-oFEDR100GbitMellanox適配器接入一臺MellanoxSwitch-IB27800交換機后者又接入五臺FlashSystem900陣列,每臺陣列配有4個每秒40GbitQDRInfiniBand端口。
這套配置可提供每秒41GB總傳輸帶寬,其中讀取與寫入能力最高可分別達到每秒23GB與每秒18GB。不過IBM方面并沒有給出訪問延遲數據。
IBM公司指出,KUKA機器人維修,庫卡機器人,POWER9服務器加FlashSystem900/NVMe-oFInfiniBand的組合能夠為企業AI提供必需的低延遲與高傳輸帶寬,意味著其在性能表現上要優于采用NVMe連接的其它一切x86服務器加閃存存儲陣列方案。然而由于延遲數字尚未提供,這樣的結論似乎很難令人信服。
評論意見:COTS配置能否與之匹敵?
Excelero公司為美國宇航局艾姆斯實驗室打造的一套NVMeoverFabrics虛擬SAN系統可為4KIOPS提供平均199微秒的延遲水平,其最低延遲甚至僅為8微秒。這套系統的傳輸帶寬在1MB存儲塊大小的情況下可超過每秒140GB。
該系統擁有128個計算節點,因此不能直接與IBM公司演示的單服務器進行比較。盡管如此,我們還是能夠借此發現一些端倪,也許某家至強SP服務器供應商會采用PCIe第四代總線、NVMeoverFabrics外加每秒100Gbit以太網連接全閃存陣列系統來觀察所能達到的性能峰值。