最近更新2019中文在线视频_免费嗨片直播网中文字幕_歪歪私人影院午夜伦y4484_免費一區二區視頻_日本成人激情视频_无码国产精品一区二区免费VR_国产一二三四区嫩模视频_亚洲高清尤物在线精品_麻豆av+高潮+在线播放_亚洲国产精品电影久久

綜合信息
 
異構(gòu)AI基礎(chǔ)設(shè)施是未來(lái)發(fā)展趨勢(shì)
 2025-11-28
 

11月23日,第二十二屆中國(guó)國(guó)際半導(dǎo)體博覽會(huì)(IC China 2025)在北京國(guó)家會(huì)議中心開(kāi)幕。在同期舉行的第七屆全球IC企業(yè)家大會(huì)上,英特爾公司副總裁、英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)發(fā)表演講。他表示,當(dāng)前,AI計(jì)算的重心已從通用基座大模型擴(kuò)展至推理應(yīng)用。未來(lái),80%的AI計(jì)算將用于推理領(lǐng)域。異構(gòu)的AI基礎(chǔ)設(shè)施是未來(lái)發(fā)展的趨勢(shì)。

 

宋繼強(qiáng)表示,智能體AI是推理領(lǐng)域真正產(chǎn)生客戶價(jià)值的部分,其算力需求將從2025年起逐步上升,并超越用于訓(xùn)練基座大模型與微調(diào)大模型的規(guī)模,今年,其規(guī)模已有140倍的增長(zhǎng),達(dá)到每月1400萬(wàn)億Token的使用量。為應(yīng)對(duì)智能體AI的高速增長(zhǎng)需求,算力支持是首要的,算力基礎(chǔ)設(shè)施的帶寬、存儲(chǔ)等都要跟上。Token服務(wù)供應(yīng)商,如云服務(wù)和數(shù)據(jù)中心供應(yīng)商也需對(duì)構(gòu)造成本結(jié)構(gòu)的方式進(jìn)行系統(tǒng)級(jí)的優(yōu)化。

 

宋繼強(qiáng)指出,早期的智能體AI在中間層專門(mén)對(duì)應(yīng)某一種語(yǔ)言模型,在底層則與具體的硬件和軟件組合相對(duì)應(yīng),是在某種專門(mén)的應(yīng)用架構(gòu)上調(diào)優(yōu)出來(lái)的,擴(kuò)展比較受限。新出現(xiàn)的思維鏈技術(shù)得以支撐更廣泛、更高級(jí)別的能力,但也需要更多的執(zhí)行步驟、更多不同的模型,運(yùn)用思維鏈方式完成一個(gè)問(wèn)題使用的Token數(shù)比之前多10倍。而智能體內(nèi)部不止一個(gè)思維鏈,對(duì)Token的使用量與調(diào)用復(fù)雜度將增長(zhǎng)百倍以上。

 

因此,宋繼強(qiáng)強(qiáng)調(diào),異構(gòu)的AI基礎(chǔ)設(shè)施一定是未來(lái)發(fā)展的趨勢(shì),既能提高當(dāng)前應(yīng)用的性能、效率和成本效益,也能夠保持對(duì)于未來(lái)智能體AI應(yīng)用的長(zhǎng)期有效性。

 

宋繼強(qiáng)表示,這樣的計(jì)算架構(gòu)需要至少3個(gè)維度的技術(shù)支撐。

 

第一,在硬件層,為避免受限于特定架構(gòu)或供應(yīng)商,必須構(gòu)建異構(gòu)的硬件架構(gòu)基礎(chǔ)。這也是目前算力中心與公有云服務(wù)建設(shè)中常常討論并采納的方式。

 

第二,在中間的系統(tǒng)級(jí),越來(lái)越多的推理應(yīng)用存在于某一個(gè)企業(yè)的工作范圍內(nèi),所以一定要對(duì)企業(yè)應(yīng)用開(kāi)發(fā)、服務(wù)器部署友好。要針對(duì)企業(yè)所需要、所能夠支持的尺寸交付算力,對(duì)于互聯(lián)互通也需要采用開(kāi)放的、基于以太網(wǎng)方式的能力規(guī)模擴(kuò)展方案。

 

第三,是更開(kāi)放的軟件棧和軟件框架,需要具備可編程性、可調(diào)配組合,能支持多種AI框架。

 

宋繼強(qiáng)表示,針對(duì)未來(lái)多元的應(yīng)用需求,希望有更多能效比優(yōu)先、具備定制化特點(diǎn)的芯片方案。

 

(來(lái)源:中國(guó)電子報(bào))