英偉達(Nvidia)在其年度GPU技術大會(GTC 2018)發表多項系統級升級功能,以提升其繪圖處理器(GPU)在人工智慧(AI)神經網路訓練方面的性能,并與ARM合作將其技術擴展到推論領域。
針對可能會在2019年或之后推出的7nm GPU,Nvidia并未提供詳細的開發藍圖。不過,由于其他競爭對手——如AMD才剛進入這個領域、英特爾(Intel)預計要到明年后才會推出Nervana加速器,而新創公司Graphcore至今仍不動聲色,這讓Nvidia還有時間慢慢琢磨。就在幾個月前,英特爾和Graphcore都計劃在今年發布量產芯片。
Nvidia的高階Tesla V100 GPU現可提供32GB HBM2 DRAM,較去年5月發布時支援更高2倍的記憶體容量。此外,該公司還宣布推出采用臺積電(TSMC) 12nm FinFET制程制造的100W芯片——NVSwitch,支援18個NVLink 2.0埠,可鏈接16個GPU至共享記憶體。
Nvidia率先打造出可支援10kW功率與高達2 petaflops性能的強大AI訓練系統。其DGX-2在10U機箱中封裝了12組NVSwitch芯片和16組GPU,足以支援兩個Intel Xeon主機、Infiniband或乙太網路(Ethernet)以及多達60個固態硬碟(SSD)。
Cray、慧與科技(Hewlett Packard Enterprise;HPE)、IBM、聯想(Lenovo)、美超微(Supermicro)和泰安電腦(Tyan)等公司都已宣布將在今年6月前開始出貨搭載這款32GB芯片的系統。甲骨文(Oracle)則計劃今年底在云端服務中搭載該芯片。
Nvidia透過廣泛地升級記憶體、互連與軟件最佳化,以提高AI性能。Nvidia表示,它在兩天內完成FAIRSeq翻譯模型的訓練,較去年9月時采用8組GPU與16GB記憶體的測試提高了8倍。此外,SAP則指采用ResNet-152模型,使其于影像辨識方面取得10%的進展。
為了超越Nvidia,英特爾計劃在明年量產支援12組100Gbit/s鏈路的Nervana芯片,而Nvidia Volta則支援6個25Gbit/s NVLinks。Nervana芯片支援非同相記憶體,可在打造加速器叢集(包括環狀網路)時提供更大的靈活性,但在編程時將會更加困難。
為了簡化編碼作業,英特爾宣布開放其Ngraph編譯器,目的在于來自第三方AI架構(如Google TensorFlow)的軟件轉變為可在英特爾Xeon、Nervana及其FPGA芯片上執行的程式碼。
英特爾和幾家資料中心合作伙伴正針對執行于加速器原型上的程式碼進行微調。該公司計劃在5月下旬的開發者大會上發布其計劃細節,但預計要到明年之后才會量產芯片。屆時,Nvidia將英特爾計劃升級加速器開發藍圖的壓力,而必須盡快推出下一代芯片。
Tirias Research資深分析師Kevin Krewell說 :“目前的Nervana產品將成為一款真正的軟件開發工具。它是在英特爾收購該公司之前,以28nm制程技術打造的,因而不至于與Nvidia 12nm Volta設計相互競爭?!?/p>
他補充說,為Volta升級記憶體和NVSwitch,“讓Nvidia得以在競爭中保持領先。我們都期待采用更先進的下一代制程技術,但是,就量產出貨的芯片而言,Volta目前還沒有競爭對手。”
至于幾家新創公司,Wave Computing預計今年推出首款針對資料中心和開發人員打造的訓練系統。這一市場還有新的業者持續出現中。例如新創公司SambaNova Systems在獲得5,600萬美元的投資后首度在上周登場,其投資方包括Google的母公司Alphabet。
SambaNova Systems的共同創辦人Kunle Olukotun之前還成立了新創公司Afara Websystems,并打造了Niagara伺服器處理器,后來被升陽公司(Sun Microsystems)收購,而Oracle后來并購了升陽。
Nvidia DGX-2將自第三季開始銷售
聯手ARM加速深度學習推論計劃
Nvidia目前在資料中心的神經網路模型訓練方面占主導地位,但在網路邊緣的更廣泛推論領域仍是個新手。為了加強其市場地位,Nvidia和ARM展開合作,將Nvidia的開放來源硬件導入推論作業,成為ARM機器學習產品計劃的一部份。
Nvidia去年宣布將開放其Xavier推論加速器IP,至今已發布了多個RTL版本了。這些IP目前正面對來自益華(Cadence)、Ceva和新思科技(Synopsys)等公司的AI加速器競爭。
至于ARM將選擇哪一款Nvidia IP目前仍不清楚。ARM至今只是草擬了將AI芯片作為其廣泛Project Trillium的一部份。ARM目前僅透露計劃將其新興神經網路軟件移植到Nvidia IP上。
Nvidia負責Xavier的移動事業部門副總裁暨總經理Deepu Talla表示,他注意到業界開始使用免費的模組化IP設計多種芯片。然而,迄今為止還沒有人發布相關資訊。
Nvidia希望在推論方面的努力能夠擴展到使用其機器學習軟件,該軟件同時也用于訓練AI模型。為此,該公司發布了幾項更新其程式碼的計劃,并將其整合至第三方AI架構中。
此外,Nvidia最新的TensorRT 4 Runtime軟件也增強對于推論作業的支持,并整合于1.7版Google TensorFlow架構中。Nvidia還將該Runtime軟件與Kaldi語音架構、Windows ML和Matlab等整合在一起。
該公司并宣布,上周推出的RTX光影追蹤軟件采用V100 Quadro GV100芯片,支援32GB記憶體和兩組NVLink。
該軟件可為游戲、影片和設計模型提供更快速、更逼真的渲染,執行于Nvidia專有的API以及微軟(Microsoft)用于光線追蹤的DirectX,未來還將支援Vulkan。
Nvidia專業視覺化部門副總裁Bob Pette表示,相較于基于CPU的渲染,該軟件進一步提升了10倍到100倍;他并預計這一市場將在2020年達到超過20億美元的規模。
Nvidia執行長黃仁勛認為,GPU在AI效能方面已發展出超越摩爾定律以外的新方向(來源:Nvidia)
編譯:Susan Hong
(參考原文:Nvidia Taps Memory, Switch for AI,by Rick Merritt)
上一篇:英偉達在全球暫停無人駕駛汽車測試 股價大跌7.8%
下一篇:聯發科蔡力行與高通阿蒙雙雙赴大陸搶單
推薦閱讀
史海拾趣
在電子行業的快速發展中,ALD以其創新的CMOS技術嶄露頭角。1985年,公司創立之初,便致力于研發小功率線性集成電路,為線性工程師提供標準產品和定制方案。經過團隊的不懈努力,ALD成功開發出了一系列具有高精度和低功耗特點的CMOS線性集成電路,這些產品在工業控制、電子儀器等領域得到了廣泛應用,為公司的快速發展奠定了堅實基礎。
1962年,Futaba推出了無線電控制設備和沖壓金屬模用部件,旨在提升工業品質并縮短模具開發周期。這一舉措不僅解決了當時工業控制領域中的供應商問題,還引領了模具制造行業的標準。隨著技術的不斷進步,Futaba開始涉足無線電傳輸模組(R/C)的生產和銷售,并逐漸在無線遙控領域嶄露頭角。特別是高頻無線展頻通訊技術的實現,使Futaba的無線遙控技術在工業用機器人和工業控制設備上得到了廣泛應用,進一步鞏固了其在該領域的領先地位。
隨著全球環保意識的不斷提高,EVERLIGHT也積極響應環保號召,致力于研發和生產環保型LED產品。公司采用環保材料和節能技術,不斷降低產品的能耗和廢棄物排放。同時,公司還積極推廣綠色照明理念,為客戶提供環保、節能的照明解決方案。這種對環保的關注和實踐讓EVERLIGHT在電子行業中樹立了良好的形象。
經過多年的發展,Holy Stone成為國內少數涵蓋主、被動雙通路并擁有制造工廠的多元化公司。公司不僅代理多家國際知名半導體零組件,還通過自主研發和生產,為客戶提供完整的解決方案及多樣性零組件。這一雙通路戰略使得Holy Stone能夠在激烈的市場競爭中保持領先地位,并成功實現全球布局。公司的產品廣泛應用于消費電子、汽車電子等多個領域,滿足了全球客戶的多樣化需求。
隨著公司實力的不斷增強,恒連電子開始積極拓展國內外市場。在國內市場,公司通過與各大電商平臺合作,加大品牌宣傳力度,提高產品的知名度和美譽度。同時,公司還積極參與各類行業展會和論壇活動,與同行交流學習,提升公司的行業影響力。在國際市場方面,恒連電子通過與國外知名企業的合作,引進先進的技術和管理經驗,提升公司的國際化水平。此外,公司還積極開拓海外市場,將產品出口到多個國家和地區。
Clever Little Box公司成立于1964年,當時正值電子行業的蓬勃發展時期。創始人憑借對音頻和電子技術的深厚理解,以及對市場的敏銳洞察,決定成立這家公司,專注于音頻和電子組件的分銷。創業初期,公司面臨著資金短缺、市場競爭激烈等諸多挑戰,但創始人憑借堅定的信念和不懈的努力,逐漸在市場中站穩了腳跟。
PCB即印刷電路板,是電子電路的承載體。在現代電子產品中,幾乎都要使用PCB. PCB設計是電路設計的 最后一個環節,也是對原理電路的再設計。一些新的工程師往往低估PCB設計的重要性,將這一即煩瑣又 費事的工作完全交由技術員去完成。在這里我先講 ...… 查看全部問答∨ |
CORDIC 后仿過程中報的錯 我仿真的平臺是ISE10.1 器件 Virtex-5 SX50T speed-3 ISE10.1中,CORDIC IP核不支持Virtex-5。在網上搜索到說解決方案是在Virtex4器件中調用CORDIC ip核,然后把器件改成Virtex-5就可以了。 ...… 查看全部問答∨ |
非常全面的混合信號設計資料-Mixed Signal and DSP Design Techniques replyreload += \',\' + 281951;Timson,如果您要查看本帖隱藏內容請回復… 查看全部問答∨ |
|
X86模擬器的make OK 但是ARM平臺的不能編譯 ffmpeg中有關于C中嵌入asm的代碼,還有.S的匯編文件 EVC4 怎么編譯??… 查看全部問答∨ |
|
我畢業有三年了,電子專業的本科,以前工作也與電子有關,不過都在邊邊上打轉,做的也不開心。 做制造業,在生產大鏈條上重復一種動作,沒人關心你將來能做什么,將來還有什么用。 現在,怎么辦。知識基礎有,但掌握一般,這種 ...… 查看全部問答∨ |
1. 在低功耗模式下, 是哪幾個模式(LPM0,LPM1,LPM2,LPM3,LPM4) 下,還支持看門狗。LPM3,LPM4支持看門狗嗎。 2. 如果在以上的某種模式下把看門狗使能,那么功耗將增加多少? 3. 不管什么模式, 看門狗最長間隔時間能達到多少? 比如其它有的 ...… 查看全部問答∨ |