2月22日,Arm控股有限公司宣布推出基于全新第三代Neoverse IP構(gòu)建的新的Arm Neoverse 計(jì)算子系統(tǒng)(CSS)。與上一代Neoverse CSS N2相比,Neoverse CSS N3的每瓦性能可提高20%。據(jù)介紹,CSS N3的首個(gè)實(shí)例具備32 核,熱設(shè)計(jì)功耗 (TDP) 低至 40W。該芯片可擴(kuò)展性非常強(qiáng),可覆蓋電信、網(wǎng)絡(luò)和 DPU 等一系列應(yīng)用。
此外,Arm 還首次將計(jì)算子系統(tǒng)引入性能優(yōu)先的V系列產(chǎn)品線,Neoverse CSS V3單芯片性能可比Neoverse CSS N2提高 50%。Arm 基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll表示,CSS V3在使用兩個(gè)芯粒 (Chiplet) 的情況下,單芯片最高可支持 128 核心,如果客戶需要實(shí)現(xiàn)更高的核心數(shù)量,可以借助 Arm 所提供的 IP 平臺(tái)實(shí)現(xiàn)。
發(fā)布會(huì)上介紹了部分基于Arm Neoverse CSS研發(fā)的芯片實(shí)例,以及基于Arm全面設(shè)計(jì)生態(tài)項(xiàng)目中合作伙伴的協(xié)作成果,其中包括Socionext 和臺(tái)積公司共同打造的 32 核 Neoverse V3芯粒產(chǎn)品、智原科技基于英特爾代工服務(wù)構(gòu)建的64 核服務(wù)器 SoC、由 ADTechnology 與三星代工廠共同打造的 16 核邊緣服務(wù)器 SoC等等。
Dermot O’Driscoll表示,隨著生成式 AI 廣泛應(yīng)用于實(shí)際業(yè)務(wù)場(chǎng)景,服務(wù)器的工作重點(diǎn)將轉(zhuǎn)向推理。有分析師估計(jì),已部署的 AI 服務(wù)器中有高達(dá)80%專用于推理,且這一數(shù)字還將持續(xù)攀升。這一轉(zhuǎn)變意味著要找到合適的模型和模型配置,并加以訓(xùn)練,然后將其部署到更具成本效益的計(jì)算基礎(chǔ)設(shè)施上。但并非所有AI處理都在CPU上進(jìn)行。打造AI加速器的公司非常多。據(jù)最近統(tǒng)計(jì),這一領(lǐng)域的公司已接近 80 家。
記者在發(fā)布會(huì)上了解到,采用芯粒技術(shù)已成為芯片廠商管理良率的常用方法,能讓企業(yè)在單個(gè)芯片上利用到多種工藝節(jié)點(diǎn)。例如,使用較舊的工藝節(jié)點(diǎn)處理 I/O,同時(shí)搭配先進(jìn)的工藝節(jié)點(diǎn)處理邏輯功能。企業(yè)也在努力尋找巧妙的方法來(lái)復(fù)用芯粒,但當(dāng)他們將不同團(tuán)隊(duì)的設(shè)計(jì)組合在一起時(shí),還是面臨一些挑戰(zhàn),比如協(xié)議層存在多種標(biāo)準(zhǔn),包括 PCIe、CXL和 AMBA等。
Dermot O’Driscoll表示,Arm正在深入?yún)⑴c到 AMBA CHI,引入芯片到芯片 (C2C) 的擴(kuò)展功能,但系統(tǒng)架構(gòu)層面仍面臨難題,包括怎樣在設(shè)計(jì)時(shí)對(duì)芯粒進(jìn)行邏輯分區(qū)、如何設(shè)置直接內(nèi)存訪問(wèn) (DMA) 和中斷、電源和安全等管理功能等問(wèn)題仍有待解決。Arm近期發(fā)布芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA),旨在解決上述問(wèn)題,幫助整個(gè) Arm生態(tài)系統(tǒng)釋放芯粒技術(shù)的潛力。
- QQ:61149512