娇小w搡bbbb搡bbb,《第一次の人妻》,中国成熟妇女毛茸茸,边啃奶头边躁狠狠躁视频免费观看

Arm Ethos-U85 NPU:利用小語言模型在邊緣側實現生成式 AI

發布者:EE小廣播最新更新時間:2025-02-19 來源: EEWORLD關鍵字:Arm  NPU  模型  邊緣  AI 手機看文章 掃描二維碼
隨時隨地手機看文章

隨著人工智能 (AI) 的演進,利用小語言模型 (SLM) 在嵌入式設備上執行 AI 工作負載成為業界關注的焦點。Llama、Gemma 和 Phi3 等小語言模型,憑借其出色的成本效益、高效率以及在算力受限設備上的易部署性,贏得了廣泛認可。Arm 預計這類模型的數量將在 2025 年繼續增長。

 

Arm 技術以其高性能與低功耗的顯著優勢,為小語言模型提供了理想的運行環境,能夠有效提升運行效率,并進一步優化用戶體驗。為了直觀展示端點 AI 在物聯網和邊緣計算領域的巨大潛力,Arm技術團隊近期打造了一場技術演示。在演示中,當用戶輸入一個句子后,系統將基于該句擴展生成一個兒童故事。這項演示受到了微軟 “Tiny Stories” 論文和 Andrej Karpathy 的 TinyLlama2 項目的啟發,TinyLlama2 項目使用了 2,100 萬個故事來訓練小語言模型生成文本。

 

該演示搭載了 Arm Ethos-U85 NPU,并在嵌入式硬件上運行小語言模型。盡管大語言模型 (LLM) 更加廣為人知,但由于小語言模型能夠以更少的資源和較低的成本提供出色的性能,而且訓練起來也更為簡易且成本更低,因此越來越受到關注。

 

在嵌入式硬件上實現基于 Transformer 的小語言模型

 

Arm 的演示展示了 Ethos-U85 作為一個小型低功耗平臺,具備運行生成式 AI 的能力,并凸顯了小語言模型在特定領域中的出色表現。TinyLlama2 模型相較 Meta 等公司的大模型更為簡化,很適合用于展示 Ethos-U85 的 AI 性能,可作為端點 AI 工作負載的理想之選。

 

為開發此演示,Arm 進行了大量建模工作,包括創建一個全整數的 INT8(和 INT8x16)TinyLlama2 模型,并將其轉換為適合 Ethos-U85 限制的固定形狀 TensorFlow Lite 格式。

 

Arm 的量化方法表明,全整數語言模型在取得高準確度和輸出質量之間實現了良好平衡。通過量化激活、歸一化函數和矩陣乘法,Arm 無需進行浮點運算。由于浮點運算在芯片面積和能耗方面成本較高,這對于資源受限的嵌入式設備來說是一個關鍵考量。

 

Ethos-U85 在 FPGA 平臺上以 32 MHz 的頻率運行語言模型,其文本生成速度可達到每秒 7.5 到 8 個詞元 (token),與人類的閱讀速度相當,同時僅消耗四分之一的計算資源。在實際應用的系統級芯片 (SoC) 上,該性能最多可提高十倍,從而顯著提升了邊緣側 AI 的處理速度和能效。

 

兒童故事生成特性采用了 Llama2 的開源版本,并結合了 Ethos NPU 后端,在 TFLite Micro 上運行演示。大部分推理邏輯以 C++ 語言在應用層編寫,并通過優化上下文窗口內容,提高了故事的連貫性,確保 AI 能夠流暢地講述故事。

 

由于硬件限制,團隊需要對 Llama2 模型進行適配,以確保其在 Ethos-U85 NPU 上高效運行,這要求對性能和準確性進行仔細考量。INT8 和 INT16 混合量化技術展示了全整數模型的潛力,這有利于 AI 社區更積極地針對邊緣側設備優化生成式模型,并推動神經網絡在如 Ethos-U85 等高能效平臺上的廣泛應用。

 

Arm Ethos-U85 彰顯卓越性能

 

Ethos-U85 的乘法累加 (MAC) 單元可以從 128 個擴展至 2,048 個,與前一代產品 Ethos-U65 相比,其能效提高了 20%。另外相較上一代產品,Ethos-U85 的一個顯著特點是能夠原生支持 Transformer 網絡。

 

Ethos-U85 支持使用前代 Ethos-U NPU 的合作伙伴能夠實現無縫遷移,并充分利用其在基于 Arm 架構的機器學習 (ML) 工具上的既有投資。憑借其卓越能效和出色性能,Ethos-U85 正愈發受到開發者青睞。

 

如果在芯片上采用 2,048 個 MAC 配置,Ethos-U85 可以實現 4 TOPS 的性能。在演示中,Arm 使用了較小的配置,即在 FPGA 平臺上采用 512 個 MAC,并以 32 MHz 的頻率運行具有 1,500 萬個參數的 TinyLlama2 小語言模型。

 

這一能力凸顯了將 AI 直接嵌入設備的可能性。盡管內存有限(320 KB SRAM 用于緩存,32 MB 用于存儲),Ethos-U85 仍能高效處理此類工作負載,為小語言模型和其他 AI 應用在深度嵌入式系統中的廣泛應用奠定了基礎。

 

將生成式 AI 引入嵌入式設備

 

開發者需要更加先進的工具來應對邊緣側 AI 的復雜性。Arm 通過推出 Ethos-U85,并支持基于 Transformer 的模型,致力于滿足這一需求。隨著邊緣側 AI 在嵌入式應用中的重要性日益增加,Ethos-U85 正在推動從語言模型到高級視覺任務等各種新用例的實現。

 

Ethos-U85 NPU 提供了創新前沿解決方案所需的卓越性能和出色能效。Arm 的演示顯示了將生成式 AI 引入嵌入式設備的重要進展,并凸顯了在 Arm 平臺上部署小語言模型便捷可行。

 

Arm 正為邊緣側 AI 在廣泛應用領域帶來新機遇,Ethos-U85 也因此成為推動新一代智能、低功耗設備發展的關鍵動力。


關鍵字:Arm  NPU  模型  邊緣  AI 引用地址:Arm Ethos-U85 NPU:利用小語言模型在邊緣側實現生成式 AI

上一篇:歐盟對蘋果施壓:要求iOS開放核心功能
下一篇:最后一頁

推薦閱讀最新更新時間:2025-05-17 16:12

基于模型和產品代碼生成的汽車嵌入系統設計
由于有了基于模型的設計,使得開發大量的汽車嵌入式系統時,可以由模型自動生成最終編譯的軟件。不過,這項工作需要一個軟件工程框架的支持。本文使用線控駕駛系統(steer-by-wire system)作為實例,給出了設計汽車嵌入式系統的過程、方法和測試工具的一個框架。? 近來,有報道稱包括Denso、Motorola和Toyota在內的不同行業的多家公司都在產品代碼方面取得了成功。這項技術正日益成為軟件下一波演進發展中的一個重要組成部分。雖然總體而言,它對軟件工程化過程的影響已為業界所了解,但卻并沒有十分清楚地確立起來。對于早前類似演進發展(包括從機器代碼發展到匯編代碼,再發展到源代碼)的參與者而言,這一點尤為明顯。? 隨著抽象
[嵌入式]
AI生成智能座艙設計
AI為智能出行提供了新的可能性,在不斷發展的智能座艙設計中,AI已經觸及到了汽車行業的各個領域,以真正實現汽車行業的數字化進程。 AI界面設計 AI界面設計在汽車領域發揮著關鍵作用,它為我們提供了更直觀、智能和安全的用戶體驗。 智能推薦和個性化體驗:利用AI分析駕駛者的習慣和偏好,汽車界面可以提供個性化的建議和設置,如推薦路線、音樂和駕駛模式,有助于提高用戶滿意度和駕駛體驗。 軟件 更新和遠程控制:通過遠程連接和 云服務 ,車輛可以接受遠程的軟件更新,使汽車系統始終保持最新狀態,同時也能夠遠程控制一些功能,如預熱/預冷車內溫度、遠程啟動等。 數據可視化和駕駛分析:提供關于車輛性能、能源利用和駕駛行為的可視化數據
[汽車電子]
邊緣AI開發的挑戰及ST的解決方案
1 邊緣AI的優勢 今天,人工智能(AI)被廣泛應用,幾乎無所不在,AI有助于汽車、工業、個人電子等產品設備實現數字化和智能化,改變我們的日常生活和工作方式。在很多應用領域,尤其是工業應用,AI 將是一個“攪局者”,將會改變現有的游戲規則。 Matteo MARAVITA(意法半導體亞太區人工智能創新中心&智能手機創新中心高級經理) 雖然很多企業專注生成式AI 和大型數據中心驅動的AI,但意法半導體(ST)注意到,邊緣AI 現在正在成為熱門話題,并將成為工業數字化的關鍵推動者。邊緣AI 是一種不同尋常的AI,直接位于網絡邊緣節點的微型設備上,由一系列不同的芯片和軟件棧驅動。 邊緣AI 意味著原始數據不會發送到云
[網絡通信]
<font color='red'>邊緣</font><font color='red'>AI</font>開發的挑戰及ST的解決方案
Energous與Syntiant合作開發無線傳輸能量的邊緣人工智能
無線充電供應商Energous Corporation,日前宣布與深度學習解決方案提供商 Syntiant 合作,使邊緣人工智能成為現實,用于始終在線的語音、傳感器和圖像應用程序,使用 Syntiant 的 Neural Decision Processors? (NDP) 開發和實施 Energous 的 WattUp 無線電源網絡技術,以在廣泛的消費者和工業用例中部署邊緣人工智能 (AI)。 總部位于加利福尼亞的 Syntiant提供高效的芯片與數據平臺相結合,為客戶提供低成本的交鑰匙解決方案,將深度學習處理置于幾乎所有邊緣設備中,無需云連接,確保隱私和安全。該公司的超低功耗 NDP 被設計用于耳塞、可穿戴設備、醫療設備、
[嵌入式]
風河CTO:在5G和邊緣AI時代構建智能系統
本文作者:風河CTO Paul Miller 更多的計算和處理能力將部署在網絡邊緣,以提供積極、強大和安全的用戶體驗。這種計算和處理要求將增加網絡體系結構的復雜性,并要求更高,更細致的管理和維護水平才能有效地工作。隨著連接設備數量的成倍增長,企業將需要設計智能系統以確保有效地協調這些設備。 通信服務提供商和全球企業已經開始圍繞智能邊緣和5G建立和塑造其業務模型。5G支持的絕大多數企業用例位于網絡邊緣,這得益于超低延遲通信和提高的網絡速度,智能系統對于支持和協調5G的生態系統至關重要。 邊緣系統的引入意味著高度物理分布式架構部署,這帶來了極大的操作復雜性。毫不奇怪,人工智能將在智能邊緣設備的創建中扮演關鍵角色,在智能邊緣
[嵌入式]
AI模型“重塑”智能座艙,這些新機會已經顯現
在AI大模型的浪潮下,智能座艙進入了升級新周期。 根據《高工智能汽車研究院》數據顯示,2023年1-10月,中控大屏、語音交互、車聯網等的滲透率已經超過了70%。在這其中,中控娛樂系統的前裝標配滲透率已經超過90%。 過去幾年,智能座艙主要是單一功能的“堆棧”上車時代,伴隨著整車電子電氣架構往中央計算架構的升級,以及高算力芯片、AI算法的快速發展,打造更加差異化的智能座艙功能和極致的用戶體驗,已經成為各大高端品牌新車的競爭要點。 因此,在“移動出行第三空間”概念的指引下,智能座艙開始轉向視覺、聽覺、觸覺等多維感知信息融合的多模態人機交互,從而開創主動式、多模態的車載交互體驗。 總體來看,智能座艙已經步入了3.0時代
[汽車電子]
谷歌發布人工智能學習模型機器人轉換器使其機器人更智能
據悉,谷歌希望通過發布學習模型(Roboc Transfmer,RT-2)使其機器人更。 RT-2是該公司所稱的視覺語言動作(VLA)模型的新版本。該模型教導機器人更好地識別視覺和語言模式,以解釋指令并推斷哪些對象最適合請求。 研究人員在廚房辦公室的環境中用臂測試了RT-2。結合思維鏈推理,RT-2可以執行多階段語義推理。即便是一些抽象概念,RT-2也能理解并指揮機械臂做出正確的動作。比如讓它找一把臨時用的簡易錘子,它會抓起石頭;讓它給疲憊的人選一款飲料,它會選擇紅牛;讓它把可樂罐移到泰勒·斯威夫特的照片上,它也能順利完成。 該公司在一篇論文中表示,新模型基于和機器人數據進行訓練,利用谷歌自己的Bar
[機器人]
Arm 計算平臺加持,全新 Llama 3.2 LLM實現AI 推理的全面加速和擴展
在 Arm CPU 上運行 Meta 最新 Llama 3.2 版本,其云端到邊緣側的性能均得到顯著提升,這為未來 AI 工作負載提供了強大支持 Meta 與 Arm 的合作加快了用例的創新速度,例如個性化的端側推薦以及日常任務自動化等 Arm 十年來始終積極投資AI領域,并廣泛開展開源合作,為 1B 至 90B 的 LLM 實現在 Arm 計算平臺上無縫運行 人工智能 (AI) 的迅猛發展意味著大語言模型 (LLM) 的新版本不斷推陳出新。要充分發揮 AI 的潛力并抓住其帶來的機遇,需要實現 LLM 從云端到邊緣側的廣泛部署,而這也伴隨著對計算和能源需求的大幅增長。整個生態系統正攜手尋找應對這一挑戰的解決方
[嵌入式]
小廣播
最新嵌入式文章
何立民專欄 單片機及嵌入式寶典

北京航空航天大學教授,20余年來致力于單片機與嵌入式系統推廣工作。

 
EEWorld訂閱號

 
EEWorld服務號

 
汽車開發圈

 
機器人開發圈

電子工程世界版權所有 京ICP證060456號 京ICP備10001474號-1 電信業務審批[2006]字第258號函 京公網安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
主站蜘蛛池模板: 大庆市| 兴国县| 峨眉山市| 霸州市| 大邑县| 临朐县| 巨鹿县| 民县| 天气| 建宁县| 稻城县| 莎车县| 广河县| 佛教| 通化县| 弋阳县| 辰溪县| 祥云县| 行唐县| 宝坻区| 乌海市| 滨州市| 娄烦县| 浑源县| 色达县| 万安县| 蓬莱市| 胶南市| 五莲县| 青阳县| 白城市| 广安市| 崇阳县| 西华县| 含山县| 龙口市| 昭苏县| 会泽县| 张家界市| 常宁市| 永修县|