
華為日前發(fā)(fā)布最新算力超節(jié)點(diǎn)(diǎn)和集群。這是基于中國(guó)可獲得的芯片制造工藝提出的算力解決方案,以解決中國(guó)發(fā)(fā)展人工智能對(duì)算力的大量需求,可以說(shuō)是一條有中國(guó)特色的AI算力創(chuàng)(chuàng )新之路。
發(fā)(fā)展人工智能,算力是關(guān)(guān)鍵基石。無(wú)論是AI模型訓(xùn)練,還是實(shí)(shí)時(shí)(shí)應(yīng)用場(chǎng)(chǎng)景,都需要海量強(qiáng)大的算力作支撐。近年來(lái),從大模型參數(shù)呈指數(shù)級(jí)增長(zhǎng)(cháng),到各類(lèi)AI應(yīng)用對(duì)實(shí)(shí)時(shí)(shí)性、穩(wěn)定性要求的持續(xù)攀升,對(duì)算力的需求呈井噴式增長(zhǎng)(cháng)。我國(guó)AI產(chǎn)(chǎn)業(yè)(yè)發(fā)(fā)展迅速,但算力基礎(chǔ)設(shè)施受供給不足、成本高企、生態(tài)(tài)待建等制約,仍存在算力缺口,尤其是高端算力。一個(gè)(gè)重要原因是算力芯片受制于人,不僅前期開(kāi)發(fā)(fā)成本高、研發(fā)(fā)實(shí)(shí)力存在差距,而且面臨斷供風(fēng)(fēng)險(xiǎn)。
芯片制造工藝受限怎么辦?華為給出“數(shù)學(xué)(xué)補(bǔ)物理、非摩爾補(bǔ)摩爾、群計(jì)算補(bǔ)單芯片”的辦法。通俗點(diǎn)(diǎn)說(shuō),就是單顆芯片的性能可能不如別人,但是“人多力量大”,多顆芯片加起來(lái)就可以做到比別人強(qiáng)。這背后的戰(zhàn)略是以系統(tǒng)能力替代單點(diǎn)(diǎn)優(yōu)(yōu)勢(shì),以互聯(lián)(lián)躍遷替代線(xiàn)性趕超。傳統(tǒng)摩爾路徑強(qiáng)調(diào)一顆芯片解決所有計(jì)算問(wèn)題,非摩爾路徑更強(qiáng)調(diào)整合優(yōu)(yōu)勢(shì),對(duì)產(chǎn)(chǎn)品開(kāi)發(fā)(fā)、軟件工程、芯片設(shè)計(jì)、網(wǎng)(wǎng)絡(luò)(luò )架構(gòu)、能源系統(tǒng)、場(chǎng)(chǎng)景應(yīng)用等全鏈條打通協(xié)(xié)作提出了更高要求。
由此可見(jiàn),AI算力不等于單顆芯片性能。算力是芯片性能、架構(gòu)設(shè)計(jì)、資源協(xié)(xié)同等多方面因素綜合作用的結(jié)果。在芯片制造工藝受限的情況下,通過(guò)創(chuàng)(chuàng )新架構(gòu)設(shè)計(jì),同樣能實(shí)(shí)現(xiàn)算力大幅提升。正是基于這個(gè)(gè)辦法,“超節(jié)點(diǎn)(diǎn)+集群”成為應(yīng)對(duì)算力持續(xù)增長(zhǎng)(cháng)的重要解決方案。其中,超節(jié)點(diǎn)(diǎn)在物理層面是多機(jī)柜、多個(gè)(gè)卡組合而成,但從邏輯上看,它像一臺(tái)計(jì)算機(jī)一樣進(jìn)(jìn)行學(xué)(xué)習(xí)、思考與推理。集群則是把多個(gè)(gè)超節(jié)點(diǎn)(diǎn)通過(guò)網(wǎng)(wǎng)絡(luò)(luò )聯(lián)(lián)結(jié)在一起,形成一個(gè)(gè)大規(guī)模的計(jì)算群組,再借助軟件來(lái)實(shí)(shí)現(xiàn)高效調(diào)度管理。
“超節(jié)點(diǎn)(diǎn)+集群”構(gòu)建起獨(dú)特的技術(shù)(shù)優(yōu)(yōu)勢(shì)。AI有個(gè)(gè)重要屬性叫并行計(jì)算,是將復(fù)雜任務(wù)(wù)拆分為多個(gè)(gè)小任務(wù)(wù),通過(guò)多個(gè)(gè)計(jì)算單元同時(shí)(shí)處理以提升效率。立足這一屬性,打造數(shù)百顆甚至上萬(wàn)顆芯片的規(guī)模組合,再通過(guò)網(wǎng)(wǎng)絡(luò)(luò )聯(lián)(lián)結(jié)形成規(guī)模算力池,將持續(xù)突破算力供給天花板。這種戰(zhàn)略既發(fā)(fā)揮了已有的技術(shù)(shù)積累優(yōu)(yōu)勢(shì),包括芯片設(shè)計(jì)、聯(lián)(lián)結(jié)能力等,規(guī)避外部硬件限制,又能通過(guò)基礎(chǔ)設(shè)施提供算力服務(wù)(wù)掙錢(qián),最終達(dá)成技術(shù)(shù)突破與市場(chǎng)(chǎng)收益雙贏(yíng),為AI算力可持續(xù)發(fā)(fā)展提供了可行路徑。
生態(tài)(tài)建設(shè)是AI算力發(fā)(fā)展的重要一環(huán)(huán)。華為為何堅(jiān)持開(kāi)源開(kāi)放戰(zhàn)略?因?yàn)殚_(kāi)源開(kāi)放能吸引更多開(kāi)發(fā)(fā)者參與生態(tài)(tài)建設(shè),不斷反饋問(wèn)題、提出優(yōu)(yōu)化建議,形成以用促建的良性循環(huán)(huán),讓產(chǎn)(chǎn)品更好用。硬件賣(mài)得多了,開(kāi)源開(kāi)放的成本自然也就回來(lái)了。比如,若是產(chǎn)(chǎn)業(yè)(yè)鏈上下游企業(yè)(yè)基于華為開(kāi)放的靈衢互聯(lián)(lián)協(xié)(xié)議技術(shù)(shù)規(guī)范,研發(fā)(fā)光模塊、交換機(jī)、服務(wù)(wù)器等配套產(chǎn)(chǎn)品,就能逐步構(gòu)建起完整的自主AI生態(tài)(tài)體系。這種開(kāi)放共建模式,將有效增強(qiáng)協(xié)(xié)同創(chuàng)(chuàng )新,避免重復(fù)研發(fā)(fā)造成的資源浪費(fèi),提升我國(guó)AI產(chǎn)(chǎn)業(yè)(yè)整體競(jìng)爭(zhēng)力。
中國(guó)AI算力的創(chuàng)(chuàng )新發(fā)(fā)展之路,是一條融合架構(gòu)創(chuàng)(chuàng )新與生態(tài)(tài)構(gòu)建的特色之路。憑借在技術(shù)(shù)創(chuàng)(chuàng )新、基礎(chǔ)設(shè)施建設(shè)以及產(chǎn)(chǎn)業(yè)(yè)協(xié)(xié)同等方面的獨(dú)特優(yōu)(yōu)勢(shì),中國(guó)有望在全球AI算力競(jìng)爭(zhēng)中占據(jù)領(lǐng)(lǐng)先地位,為我國(guó)AI產(chǎn)(chǎn)業(yè)(yè)蓬勃發(fā)(fā)展、新質(zhì)(zhì)生產(chǎn)(chǎn)力培育注入源源不斷的動(dòng)(dòng)力。(本文來(lái)源:經(jīng)(jīng)濟(jì)日?qǐng)?bào) 作者:黃鑫)