制約AI芯片發(fā)展的核心瓶頸將是連接
11月23日,芯動科技(北京)有限公司首席技術(shù)官羅彤在第七屆全球IC企業(yè)家大會上指出,AI芯片的發(fā)展與算力、存儲、連接三大要素深度綁定,而“連接性”將成為未來行業(yè)突破的關鍵詞。
供需錯配導致算力、存儲、接口瓶頸
“在思考未來趨勢的時候,我們要樹立一個基本框架,要清晰需求在哪里,以及我們當前能做的極限在哪里。”羅彤表示,“現(xiàn)在需求在于AI,瓶頸在于硬件。”在需求側(cè),一個普遍的共識是,AI對于數(shù)據(jù)、信息乃至知識的需求量十分龐大,進而對算力的依賴是沒有上限的。羅彤以機器人產(chǎn)生的數(shù)據(jù)量舉例:“假設存在一個人形機器人,其行動由40個360度全方位轉(zhuǎn)動的關節(jié)來控制,理想狀態(tài)下其自由度的可能性數(shù)值大約為360的40次方——而這個數(shù)值已經(jīng)超過當前估算的可觀測宇宙所有的基本粒子總數(shù)了。”
在供給側(cè),摩爾定律發(fā)展接近極限的情況下,算力指數(shù)增長的來源,主要是芯片集成度,而這方面的提升也是極其有限的。羅彤表示,提高芯片系統(tǒng)算力有Scale-up(縱向拓展)和Scale-out(橫向拓展)兩種路徑。Scale-up旨在通過提升計算單元的密度來提高單一節(jié)點的計算能力;Scale-out希望通過增加更多節(jié)點來提升整個系統(tǒng)的處理能力。但Scale-up的高密度集成受散熱、制程極限限制,Scale-out多節(jié)點協(xié)同需異構(gòu)芯片互通,最終都要依賴芯片間的高效連接——這也讓接口成為供給側(cè)突破的核心短板,其增長滯后將制約算力釋放。
AI的需求是無底線的,而硬件的性能存在上限,因此瓶頸問題本質(zhì)上是當下供需兩側(cè)錯配。數(shù)據(jù)顯示,以兩年為周期,算力指數(shù)增長達3倍,內(nèi)存為1.6倍,接口僅有1.4倍。“算力和內(nèi)存的瓶頸是顯而易見的,而橫向?qū)Ρ鹊脑?,最大的瓶頸反而在接口。原因在于,算力提升和內(nèi)存提升都是在單個物質(zhì)內(nèi)部進行的本地化加法工作,我們運算、存取一個數(shù)據(jù)都是發(fā)生在一個電容器內(nèi)部。但是接口的特點在于,其發(fā)生在兩個實體之間,因此其難度本質(zhì)上就比較高。”羅彤解釋道。
通用算力和通用接口將成趨勢
在算力結(jié)構(gòu)層面,自2019年起,提供算力的主要處理器開始從CPU向GPU轉(zhuǎn)移,到現(xiàn)在也誕生了ASIC以及谷歌TPU等多種專注于人工智能計算的方案。面向未來,適配性更強、靈活性更高的通用算力單元將成為供給主流。“因為通用算力更加適合Scale-out。如果把每個處理器視作一個具有高作戰(zhàn)素質(zhì)的士兵,Scale-out就是將士兵組建連接成為軍隊的過程,其目標指向處理人工智能應用龐大的計算任務。”羅彤說道,“CPU與GPU需要連接,否則作為加速芯片的大量GPU根本不知道需要去做什么,處理好的中間數(shù)據(jù)和存儲器之間的連接也要高效,否則算力系統(tǒng)的能力也發(fā)揮不出來。”
在計算過程中,信息量越大,需要的一致性和整體性就越高,在面向不論是同質(zhì)芯片,還是CPU、GPU、DRAM乃至光芯片等芯片之間互聯(lián)時,就需要通用接口來保證不同處理器之間能夠進行流暢且高效的連接。
“從感知到計算、到存儲、到信息傳遞以及最后執(zhí)行,每個環(huán)節(jié)都需要有連接,否則效率就會大打折扣。此外,連接不僅是硬件概念,也是軟件概念和產(chǎn)業(yè)概念——軟件連接意味著AI的不同應用需求的數(shù)據(jù)互通和一致;產(chǎn)業(yè)概念層面的連接能力則表現(xiàn)在如何調(diào)動產(chǎn)業(yè)鏈上多家技術(shù)提供方進行協(xié)同合作,進而實現(xiàn)如3D封裝等技術(shù)訴求。事實上,封裝行業(yè)不是包裝業(yè),而是連接。核心不是把幾塊芯片封起來,而是實現(xiàn)芯片之間高效、可靠和穩(wěn)定的連接。”羅彤強調(diào),想要在未來AI芯片的競爭中占領高地,要重視“連接能力”,一是要突破整體內(nèi)存和互連帶寬限制,二是提供系統(tǒng)場景優(yōu)化的IP,三是通過定制化設計服務,大幅度提升軟硬設計的效能。圍繞這些方面,芯動科技愿與產(chǎn)業(yè)鏈各方通力合作,共同提高系統(tǒng)算力,滿足人工智能行業(yè)不斷增長的需求。
(來源:中國電子報/JSSIA整理)