IBM AI 模擬芯片包括 64 個模擬塊,每個塊都可以用作神經網絡中的一層。圖片由IBM提供
矩陣乘法是人工智能模型的重要組成部分,它使用內存計算架構來防止數據進出處理器的混洗。然而,盡管此功能具有速度和效率優(yōu)勢,但設計人員仍然必須結合數字電子設備來調整和讀取內存計算單元中的權重,以便為設計提供足夠的多功能性。
本文著眼于 IBM 的最新進展,讓讀者了解該芯片的模擬和數字電子器件如何運行,以提高人工智能部署的效率。
IBM 芯片執(zhí)行一對一矩陣數學運算
現(xiàn)有計算機系統(tǒng)的一個關鍵限制是馮·諾依曼架構,它對處理器和內存之間傳輸數據的計算施加了上限。對于生成式 AI中的矩陣乘法,需要執(zhí)行數千或數百萬次乘法運算,這種限制可能會導致顯著的延遲和性能低下。
神經網絡層之間的每個橋梁都需要矩陣乘法,這可能會對大型網絡提出主要的計算要求。然而,IBM 的模擬 AI 芯片幾乎可以立即實現(xiàn)這一目標。圖片由邁向數據科學提供
為了規(guī)避這一限制,IBM 采用了模擬內存計算方法來消除昂貴的數據傳輸和乘法運算。通過對記憶電阻元件網格的權重進行編程,芯片只需輸入必要的信號并讀取模擬輸出即可執(zhí)行矩陣乘法。
一種新型混合信號人工智能芯片
幾個小組已經證明了使用模擬計算機與數字計算機來執(zhí)行復雜數學運算的可行性。然而,從根本上來說,計算世界是在數字化的基礎上運行的。雖然模擬計算確實可以更快地執(zhí)行計算,但要使產品真正可用,需要模數“橋”。
IBM 的目標是為這座“橋”提供由64 個“塊”組成的新芯片,每個“塊”包含一個 256×256 相變存儲器突觸單元陣列。每個單元都包含模數轉換器和數字處理單元,以在編程時執(zhí)行所需的縮放和激活。
該芯片本身在 CIFAR-10 圖像數據集上表現(xiàn)出 92.81% 的準確率,表明它可以執(zhí)行高質量的神經網絡任務。此外,吞吐量高達63.1 TOPs,能效高達9.76 TOPs/W,不僅體現(xiàn)了計算性能,還體現(xiàn)了設備的能效。
在數字領域利用模擬
隨著更復雜的計算需求的出現(xiàn),其中要求最高的(在本例中為人工智能)可能會引導設計人員采用新的架構和技術。雖然模擬計算機尚未準備好取代數字計算機,但其獨特的優(yōu)勢與可編程內存計算操作相結合,使其成為研究人員前進的有用工具。
IBM 模擬 AI 芯片縮小了模擬與數字之間的差距,展示了模擬計算機采用的關鍵一步。通過添加仿照 IBM 設備建模的芯片,數字計算機可以輕松調整和使用具有更好性能和效率的復雜 AI 模型。
本文由EETOP編譯自allaboutcircuits
報名提醒: