自從今年春節(jié)以來,DeepSeek掀起了一撥AI熱潮,而自此以后,整個業(yè)界和社會的母親光焦點都在DeepSeek及AI大模型上。在阿里巴巴達摩院主辦的“2025玄鐵RISC-V生態(tài)大會”上,阿里達摩院首席科學家、知合計算CEO孟建熠也分享了自己對于DeepSeek創(chuàng)新的理解,同時也拋出了一重要的課題——RISC-V該如何與AI共同發(fā)展?
DeepSeek時代,機遇在哪里?
孟建熠認為,DeepSeek的出現(xiàn),為整個市場帶來了更多的可能性,使得算力、內(nèi)存、互聯(lián)原有平衡發(fā)生劇變,新算力架構(gòu)機會再次進入同一起跑線,同時開源大模型單機部署成為可能,進一步推動實際應用落地。具體的創(chuàng)新包括:
MOE實現(xiàn)更低的激活比:以更低的激活比達成更低的計算成本,并使模型的單機部署成為可能;
稀疏計算與模型壓縮技術(shù):識別并跳過模型中不重要的計算節(jié)點(如權(quán)重接近零的部分節(jié)點),同時結(jié)合模型壓縮技術(shù)減少參數(shù)量;
混合精度計算與量化技術(shù):浮點計算轉(zhuǎn)化為低精度計算(如INT8、FP8、FP16)同時保持模型精度;
動態(tài)計算圖優(yōu)代技術(shù):實時調(diào)整計算結(jié)構(gòu)減少冗余計算;
內(nèi)存優(yōu)化與數(shù)據(jù)流重構(gòu)技術(shù):通過內(nèi)存優(yōu)化技術(shù)(包括內(nèi)存池、數(shù)據(jù)預取等)和數(shù)據(jù)流重構(gòu)技術(shù),減少內(nèi)存訪問延遲以及數(shù)掘傳輸開銷;
分布式計算與負載均衡技術(shù):將大規(guī)模模型推理任務拆分到多個計算節(jié)點,并通過負載均衡技術(shù)優(yōu)化任務分配。
DeepSeek的出現(xiàn),也讓業(yè)界產(chǎn)生了三個不同觀點的爭論:
第一,開源還是閉源架構(gòu)。DeepSeek證明了開源也是很好的一個模式;
第二,用DENSE模型還是用MOE模型。一個是更好的全能模型,一個是更好的專屬模型,兩種模型都擁有不錯的未來;
第三,內(nèi)存容量成為AI大模型在算力以外的另一個指標。
DeepSeek的出現(xiàn),也推動行業(yè)更關注底層硬件能力的適配,強調(diào)算力資源的精細化匹配,改變了過去'大炮打蚊子'式的資源浪費現(xiàn)象(即過度依賴高精度計算資源處理簡單任務),采用軟硬件深度融合的視角重構(gòu)系統(tǒng)設計,通過算法與硬件的聯(lián)合優(yōu)化提升整體效率,形成更高效的AI計算范式。
盡管模型的參數(shù)量和計算量持續(xù)增長,但核心算子類型呈現(xiàn)出顯著收斂態(tài)勢,主流架構(gòu)(如Transformer)的核心算子已趨于標準化。通過開源社區(qū)的開放協(xié)作,各類大模型在基礎架構(gòu)設計上相互借鑒,形成技術(shù)方案趨同的行業(yè)現(xiàn)象。開放生態(tài)加速了技術(shù)方案的迭代優(yōu)化,促使行業(yè)在統(tǒng)一的技術(shù)路徑上持續(xù)精進,既降低重復研發(fā)成本,又推動硬件針對性優(yōu)化。
云端協(xié)同是最近一段時間高頻出現(xiàn)的詞語,DeepSeek將大模型蒸餾,無疑讓更多的模型能夠走向端側(cè)。孟建熠強調(diào),端側(cè)包括大量的應用,這無疑是一個正向促進,使得高性能AI應用能夠在邊緣設備上順利運行。
架構(gòu)創(chuàng)新的最終答案:用RISC-V實現(xiàn)AI原生
當然,DeepSeek、Llama、Grok等開源大模型不斷出現(xiàn)對行業(yè)帶來的改變,并非只會是RISC-V機會,而是所有架構(gòu)的機會,包括GPGPU、x86、DSA、ASIC等。但RISC-V架構(gòu)能夠以包容性實現(xiàn)AI原生,“RISC-V+AI”無疑會是現(xiàn)階段架構(gòu)創(chuàng)新的最終答案。
RISC-V在AI領域,無疑具備很高的適應性,這些都源于其開放性和可擴展性。與x86和Arm等架構(gòu)相比,RISC-V的ISA(指令集架構(gòu))完全開放,無需任何授權(quán)費用,允許任何參與者自由使用。同時,RISC-V的國際合作開發(fā)模式確保了其在全球范圍內(nèi)的兼容性,無論是歐洲、中國還是美國,基于RISC-V的芯片設計均可實現(xiàn)無縫對接。此外,RISC-V允許在芯片設計過程中添加定制指令,以滿足特定需求。這一特性使得RISC-V芯片在保持與舊有軟件兼容的同時,能夠支持新的功能。
另外,RISC-V在AI領域,還具備很高的包容性,可以支持做CPU/DSA,也支持做GPU、多核產(chǎn)品或者近內(nèi)存計算。隨著開源RISG-V架構(gòu)的快速發(fā)展,重新自研架構(gòu)已意義不大以RISC-V為基礎構(gòu)建處理芯片是未來的主流。“今天就是做RISC-V具有非常重要的意義,最終行業(yè)一定走向生態(tài)統(tǒng)一的位置。”孟建熠如是說。
打造標桿產(chǎn)品:RISC-V發(fā)展的關鍵一步
不過,雖說RISC-V本身很契合AI,但更多人關心RISC-V究竟該如何走出去?孟建熠表示,事實上現(xiàn)在RISC-V在一些領域的生態(tài)已經(jīng)做得很好了,比如從低功耗IoT場景到服務器場景都有相關產(chǎn)品和生態(tài),同時也產(chǎn)生一些標桿產(chǎn)品。但這僅僅是RISC-V的第一步,未來RISC-V一定要從小的標桿產(chǎn)品,走向更大的標桿產(chǎn)品。大的標桿產(chǎn)品是奠定RISC-V未來生態(tài)發(fā)展的重要一步。
目前,國內(nèi)企業(yè)正在嘗試打造RISC-V的標桿產(chǎn)品。比如說,2019年7月,玄鐵發(fā)布業(yè)界最高性能RISC-V處理器C910發(fā)布,為全球首個運行頻率超過2GHz、SPECINT2K6達到7分/GHz的RISC-V處理器;隨后在2021年10月,玄鐵C910成功兼容安卓系統(tǒng),可運行Chrome瀏覽器等應用,這是芯片行業(yè)首次實現(xiàn)RISC-V架構(gòu)對安卓的支持,意味著RISC-V架構(gòu)有望打破場景壁壘,成為高性能芯片設計的新選擇。
國際上的RISC-V企業(yè)也在做標桿產(chǎn)品,比如Tenstorrent、Vantana和SiFive。比如說,Tenstorrent采用獨特的硬件和軟件緊密結(jié)合的方法,硬件專門用于AI任務,但軟件并不復雜,整個軟件堆棧只有大約50000行代碼。
孟建熠認為,下一代RISC-V標桿產(chǎn)品有著一些關鍵指標:
服務器場景:x86架構(gòu)的Intel EMR(Xeon 5)在SPEC CPU 2006達到了SPECint 54.46/SPECfp 62.69,在SPEC CPU 2017達到了SPECint 6.98/SPECfp 9.06,同時Intel Xeon 6相比上一代產(chǎn)品單核性能提升1.2倍;Arm的架構(gòu)的AWS Graviton4在SPEC CPU 2006達到了SPECint 66.26/ SPECfp 77.84,在SPEC CPU 2017中達到了SPECint 8.26/SPECfp 9.19;
AI PC場景:x86架構(gòu)的Intel Lunar Lake NPU性能達到了48TOPS;Arm架構(gòu)的Qoualcomm Snapdragon X Elite NPU性能達到了45TOPS;
AI場景:Xeon Platinum 8490H性能達到了430TOPS;Google TPU v5p性能達到了918TOPS;NVIDIA H100性能達到了3985TOPS。
“要真正從產(chǎn)業(yè)中走出來,還是要做更好的性價比。RISC-V如何用二十分之一做到這個主流AI芯片的效果,是需要RISC-V廠商要考慮的問題。”孟建熠如是說。
碎片化是現(xiàn)在RISC-V目前生態(tài)的現(xiàn)狀,因此標準化建設也是RISV-C在下個階段發(fā)展非常重要的工作之一。
目前,國際上在指令架構(gòu)上的貢獻明顯高于國內(nèi),國內(nèi)力量的參與度不夠。因此,國內(nèi)產(chǎn)業(yè)需要在標準建設中盡快形成合力。國內(nèi)已經(jīng)建立多個組織,都在進行相關的指令集的制定工作,需要聯(lián)合起來統(tǒng)一到一個平臺工作。他建議,技術(shù)路線上要考慮相對集中,以AI為目標先做一輪國內(nèi)制定標準的嘗試,同時CPU、GPGPU、TPU在擴展上要形成一定的梯度,不能讓指令集做成很多套并行大而全的擴展,這樣生態(tài)無法形成。
目前國際上AI標準建設包括兩條技術(shù)路線——IME和AME,達摩院兩個標準都在參與建設,并且一直主導AME向前推,一起制定這個標準。此外,RISC-V工委會“并行計算SIG組”在今年1月正式成立,阿里巴巴達摩院作為工委會的輪值會長單位,不斷推動標準的推進。
在介紹的最后,孟建熠表示,RISC-V是一個技術(shù)創(chuàng)新,在技術(shù)創(chuàng)新一定要有很好的標桿產(chǎn)品去發(fā)布。而3月即將交付的玄鐵C930就是一個很好的標桿產(chǎn)品,通過這一產(chǎn)品不斷推動生態(tài)發(fā)展,形成“技術(shù)創(chuàng)新-產(chǎn)品研發(fā)”與“產(chǎn)品研發(fā)-生態(tài)建設”的正面雙循環(huán)。“這樣,上下游一定可以在廣袤的領域在RISC-V+AI的領域中真正地突破,真正賺到錢,做出心儀的產(chǎn)品。”
上一篇:阿里巴巴達摩院:RISC-V將在高性能和AI等領域廣泛應用,C930即將在3月開啟交付
下一篇:英飛凌將RISC-V引入汽車行業(yè),并將率先推出汽車級RISC-V MCU系列
推薦閱讀最新更新時間:2025-06-07 11:26




- 聚積科技參與infoComm 2025,參觀人飽覽聚積新產(chǎn)品系列 - 達芬奇
- 黃仁勛反駁AI威脅就業(yè):程序員將被淘汰 就業(yè)不必恐慌
- AMD舉辦Advancing AI 2025大會:Instinct MI350系列GPU發(fā)布,35倍推理性能提升
- 英偉達正在用“物理AI”,徹底顛覆自動駕駛、工業(yè)、機器人和智慧城市
- 基于東芝TB9103FTG的車載電機設計
- 英康仕國產(chǎn)化工控機基于RK3568平臺的跨場景自動化節(jié)能部署
- 國產(chǎn)RK3588高性能邊緣計算工控機助力企業(yè)工業(yè)數(shù)據(jù)全鏈路智能化升級
- 在PLC中創(chuàng)建基于Web的人機界面可視化
- TPS274C65CP 12V 至 36V、65mΩ 四通道高側(cè)開關數(shù)據(jù)手冊
- NCP1729開關電容電壓逆變器的典型應用
- 朱飛龍 1810300339
- 使用 Broadcom Inc 的 HCPL-7850 的參考設計
- C841191_TPS54xxx系列DC-DC芯片方案驗證板
- LT1634AIS8-5 微功率電壓和電流基準的典型應用
- TWR-MC36XSDEVB: 嵌入式組件:36V塔式系統(tǒng)eXtreme開關模塊
- 使用 Richtek Technology Corporation 的 RT8280 的參考設計
- STM32F030R8T6最小系統(tǒng)
- DC1332B-C,用于 LTC2631ACTS8-HM12 的演示板,12 位 I2C DAC(4.096V 參考,復位至零電平)
- LT3091HFE 正輸出電流監(jiān)視器的典型應用
- 座椅、天窗、電動尾門應用 國產(chǎn)車規(guī)級高壓霍爾效應傳感器推薦
- 突發(fā)!又一車企車機“崩了”
- 寧德時代為陳立泉院士頒發(fā)“卓越貢獻獎”
- 一文速覽吉利雷神 AI 電混 2.0 發(fā)布會重點
- 2025年1-4月ADAS供應商裝機量排行榜:頭部集中與國產(chǎn)突圍并存
- 國內(nèi)飛行汽車無線通信測試成功,通信安全新突破
- SPAD席卷車載激光雷達市場
- 大聯(lián)大品佳集團推出基于Microchip和ams OSRAM產(chǎn)品的10Base-T1S萬級像素大燈方案
- 哈曼推出采用三星Neo QLED技術(shù)的全新顯示屏
- Syntiant推出超低功耗汽車AI創(chuàng)新技術(shù) 提升車輛安全性和用戶體驗