作者:是德科技高級(jí)副總裁Marie Hattar
人工智能正在改變世界。然而,它需要大量的處理能力。需求每一百天就會(huì)翻一番。這推動(dòng)了人工智能基礎(chǔ)設(shè)施的投資熱潮。
數(shù)據(jù)中心是未來(lái)人工智能創(chuàng)新的基礎(chǔ),其性能備受矚目。由于涉及的規(guī)模和復(fù)雜性,確保數(shù)據(jù)中心的穩(wěn)健性和可靠性是一項(xiàng)艱巨的任務(wù)。從芯片到GPU,再到服務(wù)器、網(wǎng)絡(luò)組件和軟件,基礎(chǔ)設(shè)施的每一個(gè)元素都必須在網(wǎng)絡(luò)層面進(jìn)行單獨(dú)和綜合評(píng)估,以確保其無(wú)縫運(yùn)行并消除任何薄弱環(huán)節(jié)。這給服務(wù)提供商帶來(lái)了沉重的負(fù)擔(dān);然而,考慮到其中的利害關(guān)系,每一次效率的提高都意義重大。
在深入探討測(cè)試的必要性之前,我們先來(lái)看看人工智能是如何給數(shù)據(jù)中心帶來(lái)負(fù)擔(dān)的。當(dāng)前人工智能技術(shù)的迅猛發(fā)展,源于其應(yīng)用所依賴的復(fù)雜算法與模型體系;與特定任務(wù)軟件相比,它們消耗了更多的計(jì)算資源,因此也消耗了更多的能源。這是因?yàn)橛?xùn)練支持生成式人工智能的大語(yǔ)言模型(LLM)需要龐大的計(jì)算資源。而且,隨著人工智能解決方案變得越來(lái)越精細(xì)和復(fù)雜,對(duì)更多處理資源和數(shù)據(jù)存儲(chǔ)的需求并沒(méi)有緩解的跡象。
例如,Sam Altman最近聲稱(chēng),由于公司“缺少GPU”,OpenAI最新模型的推廣速度放緩。更重要的是,高盛預(yù)測(cè),到2030年,人工智能將推動(dòng)數(shù)據(jù)中心電力增長(zhǎng)165%。這使得基礎(chǔ)設(shè)施成為業(yè)界關(guān)注的焦點(diǎn),因?yàn)闃I(yè)界正在尋找各種方法來(lái)創(chuàng)建一個(gè)能夠支持未來(lái)迭代的技術(shù)環(huán)境。
前方道路上的坑洼
人工智能數(shù)據(jù)中心需要滿足和管理對(duì)計(jì)算資源前所未有的需求;這些集群必須高效地支持智能時(shí)代,并提供必要的計(jì)算、內(nèi)存和網(wǎng)絡(luò)性能。測(cè)試在幫助克服挑戰(zhàn)方面具有舉足輕重的作用。要驗(yàn)證、優(yōu)化和提高人工智能數(shù)據(jù)中心的性能,需要能夠再現(xiàn)人工智能工作負(fù)載的復(fù)雜性和規(guī)模的系統(tǒng)級(jí)仿真器。隨著基礎(chǔ)設(shè)施的發(fā)展,系統(tǒng)級(jí)評(píng)估對(duì)于確保性能的穩(wěn)健性和可靠性至關(guān)重要。
規(guī)模:數(shù)據(jù)中心運(yùn)營(yíng)的各個(gè)方面都必須增長(zhǎng),包括電力、冷卻、基礎(chǔ)設(shè)施、存儲(chǔ)和帶寬。實(shí)現(xiàn)這一目標(biāo)的一個(gè)關(guān)鍵方面是解決分布式計(jì)算環(huán)境中的延遲問(wèn)題。人工智能集群(在GPU上分配任務(wù))很容易因尾部延遲(系統(tǒng)最慢組件的滯后時(shí)間)而出現(xiàn)性能瓶頸。有效的擴(kuò)展需要通過(guò)工作負(fù)載均衡來(lái)檢測(cè)并盡量減少這種情況。
然而,僅僅符合標(biāo)準(zhǔn)是不夠的,還必須對(duì)組件的性能進(jìn)行評(píng)估,看它是如何處理網(wǎng)絡(luò)協(xié)議數(shù)據(jù)和前向糾錯(cuò)的。例如,符合標(biāo)準(zhǔn)的收發(fā)器可能會(huì)因?yàn)闆](méi)有在協(xié)議/網(wǎng)絡(luò)層進(jìn)行適當(dāng)測(cè)試而失效。
測(cè)試可幫助服務(wù)商識(shí)別系統(tǒng)效率低下的問(wèn)題,優(yōu)化資源分配,并確保系統(tǒng)在所有節(jié)點(diǎn)上都能保持高性能。通過(guò)微調(diào),數(shù)據(jù)中心可以在發(fā)展過(guò)程中提高效率,改善運(yùn)營(yíng)和資源利用率。
專(zhuān)用硬件:人工智能專(zhuān)用硬件對(duì)于提供更多計(jì)算資源至關(guān)重要。例如,NVIDIA的最新超級(jí)芯片將性能提高了30倍,同時(shí)能耗降低了25倍。不僅是芯片,人工智能要求所有組件全面提速——從互連架構(gòu)、內(nèi)存模塊、網(wǎng)絡(luò)推理卡到交換機(jī),均需提升運(yùn)行速度,同時(shí)能效要求也需同步提升。
然而,這些技術(shù)進(jìn)步需要超越合規(guī)性測(cè)試的嚴(yán)格評(píng)估,以驗(yàn)證峰值負(fù)載下的性能表現(xiàn)。系統(tǒng)級(jí)驗(yàn)證對(duì)確保設(shè)備在實(shí)際運(yùn)行環(huán)境中穩(wěn)定可靠至關(guān)重要。壓力測(cè)試可確保人工智能設(shè)備的性能,而互連架構(gòu)與網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化(通過(guò)網(wǎng)絡(luò)驗(yàn)證)能避免瓶頸;內(nèi)存與存儲(chǔ)評(píng)估則保障快速數(shù)據(jù)訪問(wèn)。通過(guò)整合全方位測(cè)試,服務(wù)提供商可實(shí)現(xiàn)高效擴(kuò)展。
智能工作負(fù)載:要滿足計(jì)算需求,就必須采用分解式架構(gòu),以便動(dòng)態(tài)分配資源。測(cè)試可以驗(yàn)證智能管理,并應(yīng)結(jié)合仿真技術(shù),對(duì)網(wǎng)絡(luò)結(jié)構(gòu)以及動(dòng)態(tài)資源分配和自動(dòng)縮放進(jìn)行基準(zhǔn)測(cè)試。
要確保網(wǎng)絡(luò)性能,就必須使用真實(shí)世界模型進(jìn)行壓力測(cè)試、制定基準(zhǔn)并找出尾部延遲,所有這些都能改善工作負(fù)載分配。這使服務(wù)商能夠?qū)崿F(xiàn)性能目標(biāo),同時(shí)根據(jù)當(dāng)前和預(yù)測(cè)的需求動(dòng)態(tài)管理資源。在堆棧中添加先進(jìn)的軟件對(duì)于最大限度地提高性能至關(guān)重要。
人工智能模型將繼續(xù)推動(dòng)更多計(jì)算資源的指數(shù)級(jí)增長(zhǎng),這也推動(dòng)了基礎(chǔ)設(shè)施現(xiàn)代化的軍備競(jìng)賽。然而,要想讓高盛的預(yù)測(cè)成為現(xiàn)實(shí),就必須在組件和系統(tǒng)層面進(jìn)行嚴(yán)格評(píng)估,以發(fā)現(xiàn)效率低下的問(wèn)題,確保數(shù)據(jù)中心的每個(gè)方面都穩(wěn)健、可靠,并在必要的規(guī)模上進(jìn)行優(yōu)化。
上一篇:普源精電:科技創(chuàng)新引領(lǐng)聚合力,產(chǎn)教融合賦能電子教育
下一篇:最后一頁(yè)
推薦閱讀最新更新時(shí)間:2025-05-30 17:30



- 算力突圍:破解人工智能的基礎(chǔ)設(shè)施困局
- 普源精電:科技創(chuàng)新引領(lǐng)聚合力,產(chǎn)教融合賦能電子教育
- 細(xì)數(shù)高速脈沖測(cè)試的挑戰(zhàn)與應(yīng)對(duì)策略,釋放PDV檢測(cè)潛力
- 品英Pickering公司仿真方案和測(cè)試系統(tǒng)滿足航電設(shè)備可靠性和安全性等更高要求
- 萬(wàn)用表如何測(cè)色環(huán)電感的好壞?色環(huán)電感如何選型
- 重新思考數(shù)據(jù)中心架構(gòu),推進(jìn)AI的規(guī)模化落地
- 面對(duì)AI數(shù)據(jù)中心測(cè)試挑戰(zhàn),是德科技給出了什么“解”?
- 艾默生在測(cè)試和測(cè)量領(lǐng)域加大投資,根植立身之本,持續(xù)投資核心產(chǎn)品研發(fā)
- 泰克:本土深耕四十余年,賦能中國(guó)科技新征程
- 典型應(yīng)用顯示使用 A8510 LED 驅(qū)動(dòng)器的 P-MOSFET 感應(yīng)進(jìn)行 VIN 到 GND 短路保護(hù)
- AD8310-EVAL,評(píng)估板經(jīng)過(guò)精心布局和測(cè)試,以展示 AD8310 的指定高速性能
- KeyBoard.Juk.Mx.32.Rev.A
- 簡(jiǎn)單易懂的SWD(JTAG20P)-SWD轉(zhuǎn)接板
- 曼塔R2遙控器改裝版
- LT3990IMSE-3.3 3.3V 降壓轉(zhuǎn)換器的典型應(yīng)用
- 【航順】云臺(tái)小豬手
- 使用 Analog Devices 的 LT1317BCS8 的參考設(shè)計(jì)
- LTC2376-16、16 位、250ksps、低功率 SAR ADC 的典型應(yīng)用電路
- NCV33174DTBR2G 直流耦合反相放大器最大輸出擺幅的典型應(yīng)用,采用單 +5V 電源
- 通用汽車(chē)轉(zhuǎn)向LFP電池,LG新能源和三星SDI擬在美建廠
- 蓋世汽車(chē)研究院:政策助推疊加技術(shù)迭代 全固態(tài)電池蓄勢(shì)待發(fā)
- 小鵬汽車(chē)董事長(zhǎng)預(yù)測(cè):2027年激光雷達(dá)非智能駕駛必備
- 解碼大眾汽車(chē)中國(guó)戰(zhàn)略 - 決戰(zhàn)智能化電氣化的三板斧
- 2025從具身智能大腦展望人形機(jī)器人發(fā)展
- “荊楚”人形機(jī)器人即將量產(chǎn),智能時(shí)代的新篇章!
- 小鵬純視覺(jué)方案:技術(shù)突圍與市場(chǎng)下沉的雙重博弈
- 為什么無(wú)人出租車(chē)能“零”事故,而智能駕駛輔助卻事故頻發(fā)?
- 重磅!一顆要顛覆全球智駕的芯片點(diǎn)亮了!
- 3D視覺(jué)技術(shù)為工業(yè)自動(dòng)化帶來(lái)新“視界”