娇小w搡bbbb搡bbb,《第一次の人妻》,中国成熟妇女毛茸茸,边啃奶头边躁狠狠躁视频免费观看

Arm推出目前最小的Armv9-A架構CPU:面向邊緣AI領域出擊

發布者:EEWorld資訊最新更新時間:2025-02-27 來源: EEWorld作者: 付斌關鍵字:Arm  CPU  AI  大模型 手機看文章 掃描二維碼
隨時隨地手機看文章

“當下,我們正處于‘百模爭霸’的時代,雖說行業目前關注點主要在AI訓練端,但事實上,真正可以釋放AI價值的在推理端,AI推理會下沉到我們身邊無處不在。” Arm物聯網事業部業務拓展副總裁馬健(Chloe Ma)在Arm Cortex-A320 CPU的發布會上如是說。


她提出一個設想,假如我們生活在帶寬無限大,速率無限大的理想環境中,那么云端AI會帶給我們實時無縫的體驗。但海量數據都回傳到云端是不現實的,這種情況下,邊緣AI就勢在必行。邊緣側豐富的用例,能夠給我們帶來更多的機會。


Arm是邊緣AI生態構建的引領者,從去年4月推出Ethos-U85,到去年5月推出新的Arm Kleidi軟件和Cortex-X925/A725/A520,Arm一直關注著邊緣AI的軟件和硬件。隨著AI大模型以及蒸餾大模型的進一步發展,目前市場對邊緣AI芯片的需求不再只是算力層面,而是更高的整體能效。


2月27日,Arm正式發布Armv9 邊緣人工智能 (AI) 計算平臺,該平臺以全新CPU Cortex A320,以及對Transformer AI網絡具有原生支持的Ethos U85 AI加速器為核心,支持運行超10億參數的端側AI模型。值得注意的是,A320不僅是一款專門為物聯網優化的超高能效CPU,也是目前最小型的Armv9-A架構CPU。


Cortex-A320:能效比顯著提升


“Cortex-A320 CPU是Arm首款基于Armv9架構的超高能效CPU,針對物聯網應用進行了專門優化,我們認為它將徹底改變邊緣 AI,因此將其作為全新計算平臺的核心組件。”Chloe Ma表示,Cortex-A320是一款基于Armv9.2-A架構的AArch64 CPU,微架構源自Cortex-A520,并經過顯著優化,以改善面積和功耗。


具體而言,在ML性能方面,Cortex-A320相較上一代超高能效Cortex-A35性能提高了十倍。在能效比方面,比V9架構的Cortex-A520 提升了50%,進一步降低了邊緣設備的能耗。在標量計算性能方面,Cortex-A320相較Cortex-A35提高了30%,帶來了更強的通用計算能力。在系統擴展方面,Cortex-A320最高可支持四核的共享集群,能根據不同需求靈活擴展,滿足各種邊緣應用需求。


image.png


Cortex-A320 提供從單核到四核配置的集群內擴展。該CPU所采用的簡化DynamIQ Shared Unit (DSU) DSU-120T,可支持僅使用Cortex-A320的集群。DSU-120T是最小的DSU實現,能夠顯著降低復雜性、面積和功耗,進而大幅提升基于Cortex-A的入門系列產品的能效。


Cortex-A320 支持高64KB的L1緩存和高達512KB的L2緩存,并且具有可連接到外部存儲器的256位AMBA5 AXI接口。L2緩存和L2 TLB可以在Cortex-A320 CPU之間共享,而實現Neon和SVE2 SIMD 技術的向量處理單元既可在單核復合體中專用,也可在雙核或四核實現中由兩個核共享。



正因為Cortex-A320也是A系列的一員,所以無論是FreeRTOS、Zephyr這種實時操作系統(RTOS),還是Linux或安卓這樣的豐富操作系統,都能高效支持。


Cortex-A320不僅能運行豐富操作系統,還具備運行實時操作系統的能力,為未來 MCU工作負載提供了更靈活的升級路徑。開發者可將現在跑在MCU上的工作負載遷移到運行在A320上的操作系統,從而獲得更強的計算能力和更高的內存靈活性。


“我們相信,Cortex-A320為IoT和嵌入式開發者提供了終極靈活性,無論開發功能豐富的操作系統還是實時操作系統,都能高效運行,滿足未來需求。”Chloe Ma如是說。




Armv9更強大的計算能力,更多的安全功能


對于全新的Armv9邊緣AI平臺有兩個關鍵詞——一個是Armv9,一個是Cortex-A。


在Armv9方面,根據Chloe介紹,隨著邊緣AI在Arm平臺上持續鞏固發展,Arm為智能物聯網領域提供了最先進、全方位的Armv9 Cortex處理器家族。這一系列處理器應用廣泛,從提供極致性能的Cortex X925到適用于大規模低成本低功耗智能部署的全新A320,無論智能物聯網應用要求如何,都能找到適合的基于Armv9架構的處理器解決方案。這套解決方案為客戶和生態系統帶來了軟件兼容性優勢,Armv9軟件可在所有這些處理器上無縫運行,極大降低IoT服務部署和交付的總體擁有成本(TCO)。



Armv9架構一大突出特性是支持增強的NEON和SVE2。SVE2有助于提升DSP 任務性能,該特性使得處理復雜算法更加快速、高效。這對于AI和ML工作負載等需要高算力的應用特別有助益。借助SVE2,智能攝像頭可以更高效地處理視頻流,語音接口能夠以更低的延遲進行自然語言處理,而工業傳感器則可在保持長時間電池續航的同時,運行復雜的分析算法。


Armv9架構支持新的AI 數據類型BF16(Brain Floating Point 16-bit)。BF16格式是由Google Brain團隊提出的,旨在為人工智能(AI)和深度學習(DL)應用優化,它有時也被稱為BFloat16。BF16指數位比FP16更寬,而小數位fraction卻小。也就是說,BF16能表示的數據范圍更大,但精度變小了。


Armv9架構還新增了矩陣乘法(matrix multiplication instruction)指令,優化了 AI 和ML計算性能,加速神經網絡推理和訓練等任務。這些改進使A320成為IoT設備理想的AI計算平臺,能高效執行復雜邊緣AI任務,同時保證系統安全性和可靠性。


另外,一些開源操作系統和編譯器已支持Armv9特性,大大縮短了產品開發周期。并且,軟件應用開發版本在整個Armv9設備家族中保持兼容,例如在Cortex-A720上運行的應用,在內存允許情況下可直接搬到A320上使用,簡化了產品開發流程,減少了 IoT 生態系統伙伴在解決方案交付上的總體成本。


最后,Armv9具備先進的安全性。Cortex-A320采用了MTE、指針驗證 (PAC) 和分支目標識別 (BTI) 等先進的安全特性,并協同發揮作用,以防御各種網絡安全威脅;支持S-EL2虛擬化,增強了在同一硬件上運行的虛擬機之間的隔離性。



Cortex-A:用異構應對未來MCU工作負載


Cortex-A320作為一個將能耗比堆到極致的產品,會是這一平臺的主推產品之一,一定程度上取代一些想要做更高AI推理功能的Cortex-M產品。



在Cortex-A方面,按照以往的邏輯來看,追求低功耗一般會選擇Cortex-M系列處理器,追求高性能則會選擇Cortex-A。但在目前邊緣AI的一些特定應用,如智能眼鏡來說,就對AI性能和低功耗有著雙重要求。而且Cortex-M的上限會更低一些,比如無法實現Cortex-A的64位性能,內存性能存在上限。


根據Chloe Ma的介紹,全新Armv9邊緣AI平臺可覆蓋多個應用場景,實現包括視覺和自然語言在內的多模態環境感知和理解,未來甚至可以運行AI智能體,實現自主規劃,在邊緣執行復雜任務。其擁有強大的計算能力,比如,Cortex-A320和Ethos-U85的組合相比Cortex-M85,擁有8倍的ML計算性能。通過這種能力,賦能邊緣AI設備輕松運行超過10億參數的大模型,助力大模型和生成式AI在物聯網領域落地。


image.png


事實上,從底層MAC 操作速率來看,A320+U85相比M85+U85的上限也更高:


MAC/核心/時鐘周期數據類型INT8INT16INT32BF16FP16FP32
Cortex-M55 與 Cortex-M85842N/A42
Ethos-U85 (128 MACs)12864N/AN/AN/AN/A
Ethos-U85 (2048 MACs)20481024N/AN/AN/AN/A
Cortex-A3203284884


你我都知道,無論是邊緣AI還是云AI,內存性能往往決定著整個系統的上限。此外,隨著對支持更大規模多模態AI模型的硬件需求不斷增長,由于大模型參數占用空間大,且常存儲于內存中,系統對內存的需求迅速提升。因此,具備更高內存訪問性能的系統變得十分必要。


Cortex-A處理器正是為此設計,相較于Cortex-M,它支持更大的內存尋址空間,并能更靈活地管理多級內存訪問延時。同時,由于邊緣AI工作負載日益復雜,對更強大、靈活的操作系統進行系統管理的需求增加。傳統Cortex-M一般只能運行實時操作系統(RTOS)或裸跑,Cortex-A豐富的操作系統讓設備管理更靈活。


除此之外,去年發布的Cortex-M85加上Ethos-U85的Corestone物聯網參考設計平臺,已顯著提升了端側Transformer網絡的執行效率。如今,Ethos U85的驅動程序得到更新,使得Cortex-A320能夠直接驅動Ethos U85,無需額外搭載Cortex-M,這種配置被Arm稱為“直接驅動 (direct drive)”。這一更新降低了延時,讓合作伙伴可以去掉驅動U85 AI加速器的額外控制器,從而降低成本和系統復雜性。



綜上,Cortex-A320與Ethos U85 的組合,是運行大模型以及需要更靈活軟件管理的邊緣AI系統的理想選擇。



讓邊緣AI在千行百業“開花”


為了讓Cortex-A320更好地進入生態,軟件也必不可少。Chloe Ma對此也介紹了Arm去年推出的Arm KleidiAI開源AI庫。得益于關鍵的ML框架和運行時集成,其優化并加速了Cortex-A320上的AI工作負載,使開發者能夠利用Armv9架構的先進功能和靈活性。Kleidi優化了跨不同工作負載的軟件級性能,以充分發揮Arm CPU上的AI加速。其高度優化的內核提升了ExecuTorch、LiteRT(前身為Tensorflow Lite)等主流 AI框架性能,從而實現了更快速的邊緣AI執行,以及CPU和NP 間順暢的工作負載靈活性。


image.png


例如,在Llama.cpp上運行微軟的Tiny Stories小語言模型時,Cortex-A320的性能提升了近70%。這一強大的組合簡化了AI開發,并加速了數十億設備的性能,使開發者能夠更輕松地在恰當的時間和位置上執行合適的AI工作負載。


“令人高興和驕傲的是,全新的邊緣 AI 計算平臺已得到行業內多家領先企業認可。”Chloe Ma表示,AWS IoT Greengrass是開源的邊緣執行程序和云服務,用于構建、部署和管理設備端軟件,目前已可在諸多基于Arm的設備上運行,并支持遠程部署、管理和升級AI功能。例如在智能制造應用場景中,可在上千臺工廠設備上實現AI功能的遠程管理和升級。在云邊協同服務場景下,安全至關重要,Armv9增強的安全特性成為IoT服務成功部署并為終端客戶創造價值的關鍵創新。因此,很高興獲得 AWS IoT 部門的支持。



Chloe Ma舉了幾個Cortex-320典型的應用場景:對于消費電子領域,Cortex-A320可以引領智能手表、智能眼鏡等智能可穿戴設備繼續創新;對于云服務商,Cortex-A320是服務器中基板管理控制器(BMC)理想的CPU 升級選擇,因為目前BMC大規模采用Cortex-A53,而Cortex-A320可帶來更高能效和管理能力;對于醫療健康領域,Cortex-A320可以革新可穿戴設備和醫療AI助手。



目前,Arm在邊緣計算平臺占據領導地位,在工業自動化、智慧家居、智慧城市等領域,OEM軟件開發者都在積極與Arm合作,構建AI推理生態系統,以釋放AI更大價值。Chloe強調,自AI發展初期,Arm技術就推動著邊緣智能創新。其Helium技術和 Ethos U AI加速器在物聯網廣泛應用,賦予數十億邊緣設備AI和ML計算能力,提升的算力讓智能軟件與模型發揮更大效能。

關鍵字:Arm  CPU  AI  大模型 引用地址:Arm推出目前最小的Armv9-A架構CPU:面向邊緣AI領域出擊

上一篇:Arm 發布 Cortex-A320 CPU,推出全球首個 Armv9 邊緣 AI 運算平臺
下一篇:玄鐵首款服務器級RISC-V處理器C930下月起交付

推薦閱讀最新更新時間:2025-07-04 10:49

模型訓練更高效,奇異摩爾用互聯創新方案定義下一代AI計算
近一段時間以來, DeepSeek現象級爆火引發產業對大規模數據中心建設的思考和爭議。在訓練端,DeepSeek以開源模型通過算法優化(如稀疏計算、動態架構)降低了訓練成本,使得企業能夠以低成本實現高性能AI大模型的訓練;在推理端,DeepSeek加速了AI應用從訓練向推理階段的遷移 。因此,有觀點稱,DeepSeek之后算力需求將放緩。不過,更多的國內外機構和研報認為,DeepSeek降低了AI應用的門檻,將加速AI大模型應用落地,吸引更多的企業進入這個賽道,算力需求仍將繼續增長,不過需求重心從“單卡峰值性能”轉向“集群能效優化”。比如,SemiAnalysis預測,全球數據中心容量將從2023年的49GW增長至2026年的96
[網絡通信]
讓<font color='red'>大</font><font color='red'>模型</font>訓練更高效,奇異摩爾用互聯創新方案定義下一代<font color='red'>AI</font>計算
「卓視智通」完成數千萬Pre-B+融資,AI視覺模型突圍
我國智能交通產業發展迅猛,預計2025年規模將達萬億級。在 傳感器 、通信、云計算等多項關鍵技術加速迭代的背景下,計算機視覺技術正處于機遇與挑戰并存的關口。誰能夠突破算法技術瓶頸,實現交通場景的精確智能感知,就能搶占這個萬億級藍海。 近日,作為我國較早布局計算機視覺技術產業化應用的企業,卓視智通宣布完成數千萬元Pre-B+輪融資。據悉,本輪融資由中交資本、騰飛資本聯合投資,資金將主要用于市場拓展、AI打磨新等技術研發、AI訓練平臺建設,以及智能制造生產基地的升級擴容。 2012年成立的卓視智通,算得上中國計算機視覺領域的“老將軍”。十余年,公司經歷了從技術積累到商業化應用的蛻變,人工智能技術也完成了從傳統模式識別,到深度學習,再到
[機器人]
AI計算,CPU仍有一戰之力:英特爾第四代至強再現強大AI性能
近期,MLCommons公布了針對AI模型訓練的行業標準MLPerf訓練v3.1基準測試結果。其中,內置英特爾?高級矩陣擴展(英特爾?AMX)加速引擎的第四代英特爾?至強?可擴展處理器作為唯一提交MLPerf測試結果的CPU,在測試中展現出強大的性能,進一步印證了英特爾對加速在云、網、邊、端的工作負載中大規模部署AI的承諾。 本次,英特爾提交了ResNet50、RetinaNet、BERT和DLRM dcnv2的測試結果。值得注意的是,在DLRM dcnv2這一個新提交的測試模型中,第四代英特爾至強可擴展處理器僅使用四個節點就在227分鐘內完成了訓練。而對于ResNet50、RetinaNet和BERT,第四代英特爾至強可擴展
[焦點新聞]
<font color='red'>AI</font>計算,<font color='red'>CPU</font>仍有一戰之力:英特爾第四代至強再現強大<font color='red'>AI</font>性能
李曉華:多模態模型 打造下一代座艙大腦
由中國汽車技術研究中心有限公司、中國汽車工程學會、中國汽車工業協會、中國汽車報社共同主辦,天津經濟技術開發區管理委員會特別支持,日本汽車工業協會、德國汽車工業協會、中國汽車動力電池產業創新聯盟、 新能源汽車 國家大數據聯盟聯合協辦的第二十屆中國汽車產業發展(泰達)國際論壇(以下簡稱“泰達汽車論壇”)于2024年8月29日至9月1日在天津濱海新區舉辦。本屆論壇以“風雨同舟二十載 攜手并肩向未來”為年度主題,邀請重磅嘉賓展開深入研討。 在9月1日“科技生態方向圓桌論壇一:20年新引擎——深化人工智能技術的垂直化應用”中,商湯絕影創新中心高級總監李曉華發表題為“多模態大模型 打造下一代座艙大腦”的演講。 商湯絕影創新中心高
[汽車電子]
李曉華:多模態<font color='red'>大</font><font color='red'>模型</font> 打造下一代座艙大腦
揭秘聊天機器人的“大腦”-語言模型
如果說 正處于改變歷史的“ 時刻”,那么聊天就是其首批熱門應用之一。 聊天機器人的誕生離不開大語言模型,這是一種基于大規模數據集進行預訓練的,能夠識別、總結、翻譯、預測和生成文本及其他形式的內容。這類模型可以在由 NVIDIA GeFce 和 RTX 提供支持的 PC 和工作站上本地運行。 大語言模型擅長總結大量文本,通過數據分類和挖掘來獲取見解,以及按照用戶指定的風格、語氣或形式生成新文本。它們可以促進以各種語言進行的交流,甚至包括人類語言之外的非常規“語言”,例如計算機代碼或蛋白質和基因序列。 首代大語言模型只能處理文本,但后續迭代針對其他類型的數據進行了訓練。這些多模態大語言模型可以識別和生成圖像
[機器人]
機器人撞上多模態模型,是沖擊還是契機?
多模態大模型對現有的機器人產業意味著什么?是一場顛覆的巨浪,還是新時代的開啟契機? 這是無法斷言任何的階段,我們唯一能做的是不停推演、嘗試。過去幾個月,從機器人的感知、決策、控制等層面, 藍馳創投對于其中的變革可能性、技術突圍思路 做了許多思考,也與諸多機器人賽道的被投公司探討技術突破如何在強調落地能力的機器人產業中應用。 5月17日(下周三)19:00-21:00 , 藍馳創投將在線上開啟機器人系列沙龍的第二期 , 展望多模態大模型給機器人產業帶來的變革可能性 ,并與市場分享 藍馳創投的 思考。 本次活動將通過 「騰訊會議」 舉行,歡迎各位 創業者、行業人士、學術界專家與投資人朋友 掃描下方 二維碼
[機器人]
ARM CPU大小端
ARM CPU大小端: 大端模式:低位字節存在高地址上,高位字節存在低地址上 小端模式:高位字節存在高地址上,低位字節存在低地址上 STM32屬于小端模式,簡單的說,比如u32 temp=0X12345678; 假設temp地址在0X2000 0010. 那么在內存里面,存放就變成了: 地址 | HEX | 0X2000 0010 | 78 56 43 12 | CPU到底是大端還是小端,可以通過如下代碼測試: //CPU大小端 //0,小端模式;1,大端模式. static u8 cpu_endian; //獲取CPU大小端模式,結果保存在cpu_endian里面 void fi
[單片機]
<font color='red'>ARM</font> <font color='red'>CPU</font>大小端
AI計算時代,為什么Arm獨具優勢?
“預計到2025年底,全球將有超過1000億臺具備AI能力的Arm設備。”Arm 基礎設施事業部產品解決方案副總裁Dermot O’ Driscoll在Arm Tech Symposia 2024年度技術大會主題演講如是說。 隨著AI發展漸深,我們正身處AI爆發的新時代。對許多人而言,更多感知到的是ChatGPT,但實際上AI的潛力和顛覆性并不止如此。比如說,DeepMind最近使用AI預測蛋白質結構而榮獲諾貝爾化學獎。再比如,AI能將臨床試驗的時間縮短高達50%。AI不僅改變著我們與世界交互的方式,也在為美好的未來奠定著基礎。 Arm一直在AI領域中不斷投入。本次大會上,Dermot分享了Arm在AI方面的計劃,目標是快
[半導體設計/制造]
<font color='red'>AI</font>計算時代,為什么<font color='red'>Arm</font>獨具優勢?
小廣播
最新嵌入式文章
何立民專欄 單片機及嵌入式寶典

北京航空航天大學教授,20余年來致力于單片機與嵌入式系統推廣工作。

 
EEWorld訂閱號

 
EEWorld服務號

 
汽車開發圈

 
機器人開發圈

電子工程世界版權所有 京ICP證060456號 京ICP備10001474號-1 電信業務審批[2006]字第258號函 京公網安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
主站蜘蛛池模板: 加查县| 财经| 南昌市| 双牌县| 凤山县| 刚察县| 呼玛县| 阳春市| 石景山区| 祁门县| 长泰县| 溆浦县| 十堰市| 柯坪县| 赣榆县| 庐江县| 枣庄市| 长沙县| 紫金县| 京山县| 阜宁县| 临海市| 松江区| 友谊县| 额济纳旗| 宜兴市| 神木县| 赤水市| 汨罗市| 建昌县| 阳泉市| 哈巴河县| 两当县| 古蔺县| 广昌县| 松原市| 成安县| 道孚县| 繁昌县| 夏河县| 夏津县|