最近一段時間,有人提出:“未來3年,只有含AI量高的企業,才能活下來。”之所以有這樣的觀點,是因為這今年,AI真的不一樣了。
雖然行業一直在熱捧AI,但實際上,AI這個概念實際已經轉動了好幾輪,并且歷經了三次低潮。而這一次,當行業力大磚飛地用大參數量驅動模型“智能涌現”,使得生成式AI成為現實,AI也愈發具備生產力。
未來AI會無處不在,打個比方,比如進家門后,你順手就把背包掛在了門口的掛鉤上,但你平時從來察覺不到它的存在,有當包掉到地上你才知道有這么一個掛鉤。未來的AI,一定會潛移默化地影響你的生活,融入到你的生活和工作中。而這一切,都需要每個企業進行改變。
企業AI,是英特爾最新提出的概念。日前,英特爾對其企業AI進行了一次詳細解析,同時其合作伙伴也宣布了其與英特爾合作的最新進展。
企業AI,英特爾三步走
英特爾中國軟件技術合作事業部唐炯認為,讓AI無處不在,需要加速創新、價值最大化、靈活部署,英特爾企業AI的戰略也圍繞這三點進行。
首先,在加速創新方面,英特爾的關鍵詞是開放、多樣、可靠性和規模化。
開放指的是圍繞軟件、應用,面向個人和企業開發者提供更加開放的資源平臺,比如在工具層面提供PyTorch、TensorFlow、Python等可編程開放環境,幫助更多人實現應用創新。
多樣指的是在算力層面提供了oneAPI、OpenVINO等開源工具,支持一次編程,適配XPU異構平臺,無需重新編程。
可靠性指的是通過不同的軟件模塊提高推理的準確性和可靠性。目前AI推理還存在一定問題,對于企業級AI,90%或95%的準確率往往不可接受,尤其在醫療領域,因此這是英特爾重點關注的問題。
規模化指的是為客戶提供更多低門檻的POC機會,讓創新者能在可靠的平臺上進行測試、驗證和優化,因為在創新的過程中,測試和POC(概念驗證)成本較高,阻礙了很多開發者。
其次,在價值最大化方面,英特爾會將最合適的工作負載放到最合適的平臺上。
在AI時代,云計算的傳統邏輯被打破,無論是AI加速器還是GPU,都幾乎沒有空閑時間。因此,為了實現價值最大化,必須在云、邊、端等不同場景靈活部署AI解決方案。
例如,醫院的數據需要在邊緣設備上處理,PC的算力也可以用于分擔云端的AI成本,這有助于優化整體部署成本。
最后,在靈活部署與運行方面,英特爾會解構現有解決方案,以便讓每個合作伙伴專注于其最擅長的領域,并通過透明、靈活的部署減少手動編碼的需求。這種解構將幫助企業提供最合適的AI解決方案,實現真正的能力落地。
根據唐炯的解析,如今整個AI堆棧都非常復雜,涉及不同層次的算力基礎、操作系統、大數據和應用等,因此如何靈活部署AI解決方案成為關鍵。英特爾提出了 OPEA(Open Platform for Enterprise AI)的概念,即通過開放的平臺,匯聚各方代碼和模塊,形成完整的企業級AI應用。
OPEA在今年上半年正式推出,吸引了全球頭部ISV和國內廠商的參與。隨著未來更多異構計算、創新應用和數據管理解決方案通過開源社區共享與優化,這種開放、透明的配置方式能夠減少應用的風險,使其更加靈活和高效。“期待更多中國軟件行業合作伙伴加入,共同為開源社區貢獻力量。”唐炯如是說。
企業AI來到了云、邊、端
戰略不能只停留在概念階段,企業AI目前已經惠及到產業,東方國信、海鑫智圣、星環科技便分享了自己與英特爾的合作。
東方國信副總裁兼CTO查禮表示,AI時代會有三點變革,一是硬件環境的變革,從原來主要集中在通算密集型應用的硬件環境,切換到XPU密集型計算,也就是包含GPU、ASIC等的密集型計算;二是交互體驗的變革,從原來的圖形界面,點按鈕、點菜單,變成自然語言NLP交互;三是開發模式的變革,現在可以利用提示詞,讓大模型幫忙生成代碼,譬如一些代碼注釋、測試用例,或是相應文檔;四是應用構建的變革,就比如英特爾的OPEA項目便是一種應用構建的變革。
東方國信與英特爾的合作已經持續五年,在各種各樣前沿計算技術領域都與英特爾開展合作,包括數據庫、大數據、判別式AI和生成式AI。舉個典型的合作案例,在大數據方面,東方國信一個工作內容是Spark集成英特爾Gluten + Velox + 英特爾QAT/AVX512,即利用現有CPU上向量化的指令集來加速數據處理的性能,它能在不增加用戶投資的前提下,提升一倍以上的性能,換句話說,原來需要一個小時的數據加工,現在半小時就可以做完。
另外,目前東方國信和英特爾合作還包括幕僚產品體系的訓推一體機,這個一體機應用在企業級層面與OPEA不謀而合,企業級AI平臺就是希望有一個自有的、專有的、私有化部署的硬件平臺,和這樣的一個行業模型,把這些軟、硬件打包在一起,開箱即用端到端交付給企業級用戶,這是目前正在和英特爾合作的一個重要內容。
海鑫智圣總經理孟凡軍表示,與英特爾的合作中,會通過各種各樣的算法去處理器數據集,如果把云端的算法放到具體的場景中,其精度會發生很多變化。作為AI廠商不能把所有的理論停留在紙上,而是要給用戶解決問題,所以在AI推行過程當中,如何實現云邊端的精度統一非常難。解決方案是“向上管理與合作”,只有在云、邊、端都和芯片公司有了很好的合作,做了底層擬合,才能實現數據集、精度集云邊端的統一,所以這是一個很難的工程。
舉個典型案例來說,此前在第三代至強CPU推出時,海鑫智圣有一個課題是云廠商第一次擁抱AI,對云廠商來說,又要提高成本,也沒看到收入,所以當時云廠商對AI是猶豫的。所以當初與英特爾合作中,他們認為這其實是一個簡單的“二八法則”,即20%的典型場景是需要新的設備加速的方式去解決(如部署GPU),而傳統的80%的場景是通過新的軟件技術和CPU推出一些新的特性來橫向擴展,在原來的基礎把根本問題就解決掉。所以在大家都在采用各種各樣高大上的GPU去解決問題的時候,海鑫智圣在英特爾新推出的CPU上,用英特爾提供的OpenVINO和oneAPI軟件提高了CPU適用的寬度,并提高了AI推理性能。
星環科技生態合作部總經理張雷表示,從成立之初,就與英特爾結緣,這些年中隨著英特爾CPU不斷發布,其產品也在實時的同步更新。比如,去年推出的Hippo向量數據庫產品,對第五代英特爾至強可擴展處理器進行了性能調優,與第三代的產品性能相比有2.07倍的提升。
有了向量數據庫之后,也在行業應用場景上進行打磨,并且在去年年底推出了TKH(Transwarp Knowledge Hub),這個產品有兩款比較核心的應用,即無涯·問知和無涯·問數。無涯·問知分為云、邊、端三面,在端側,星環科技與英特爾聯合打造了無涯·問知AI PC版,它解決了云端算力不足的問題,能夠在端側提供充足的算力。
從云時代到AI時代
唐炯表示,進入AI時代,與云時代相比有了很大變化。云時代底層邏輯更多關注任務的調度,而AI時代不僅僅是調度的問題,更重要的是如何充分發揮有限算力的潛力。在異構環境中,如何協調不同的負載放在合適的平臺上至關重要。同時,從底層基礎軟件到應用軟件的匹配也變得更為復雜。
如何在數據安全和可靠性方面設計更高效的接口,實現“熱插拔”的靈活性是關鍵。例如,某些應用可能需要一個大模型,而其他應用則可能需要不同的模型,能否實現靈活插拔,減少部署過程中對代碼和應用的修改,是英特爾面臨的挑戰。在此方面,英特爾將繼續加大投入,貢獻更多資源來支持開源社區的發展。
當然,為了讓AI更好地在企業中有效運作,英特爾也考慮了很多。唐炯認為企業需要通過類似RAG向量數據庫等工具來優化,并通過前端應用進行調整。
就像一名新入職的員工,需要在新的工作環境中適應、調整,并使用前人的知識庫作為資源。通用大模型雖然強大,但要在企業中落地應用,需要進一步調整、培訓和優化,才能為特定行業服務。在應用AI時,企業往往低估了“培訓”和“實習”過程中的成本。
通過解構這個過程,可以清楚地識別出哪些環節的成本可以降低。在英特爾的OPEA框架下,可以通過優化不同環節,進一步減少總體擁有成本,這超出了技術成本下降的市場趨勢,并為企業提供了具體的成本控制措施。
上一篇:英特爾:最新節點上的產品設計和工藝準備進展順利,已具備更早地過渡到Intel 18A的能力
下一篇:Openharmony軟件評估指南-瑞芯微RK3568開發板
推薦閱讀最新更新時間:2025-07-04 09:08




- 適用于汽車應用的 LT3973HMSE-3.3 3.3V 降壓轉換器的典型應用
- R_08_V30基于IPS2電機換向傳感器的設計
- 使用 Microchip Technology 的 PIC16C782 的參考設計
- 使用 LT1054CSW 基本型電壓逆變器 / 穩壓器的典型應用
- 使用 LTC3637EDHC 4V 至 76V 輸入至 1.8V 超級電容器充電器的典型應用
- 儀表用 ADC 驅動器
- EN6310QA 1A PowerSoC 電壓模式同步 PWM 降壓與集成電感器的典型應用
- STEVAL-ISV012V1,使用 L6924D 高達 5 W 太陽能電池充電器的演示板,用于單節鋰離子和鋰聚合物電池
- 適用于汽車應用的 A5974D 正降壓-升壓穩壓器的典型應用電路
- 使用 NXP Semiconductors 的 TDA2582Q 的參考設計