從按下快門前就對(duì)照片進(jìn)行即時(shí)銳化,到通話過程中實(shí)時(shí)消除背景噪音,再到離線狀態(tài)下與人工智能 (AI) 助手互動(dòng),端側(cè) AI 正在重塑移動(dòng)體驗(yàn)。而 Arm 計(jì)算平臺(tái)正是實(shí)現(xiàn)這些無縫交互體驗(yàn)的強(qiáng)勁驅(qū)動(dòng)力。
隨著 AI 工作負(fù)載變得日益復(fù)雜且廣泛滲透至各個(gè)領(lǐng)域,移動(dòng)開發(fā)者面臨的需求也與日俱增:他們需要在內(nèi)存、電力和熱預(yù)算等嚴(yán)格且多樣化的限制下,實(shí)現(xiàn)實(shí)時(shí)且高效的性能表現(xiàn),同時(shí)確保不會(huì)給應(yīng)用及其工作負(fù)載增加額外的復(fù)雜性。
為了應(yīng)對(duì)這些挑戰(zhàn),Arm 推出了可伸縮矩陣擴(kuò)展2 (SME2) 技術(shù),以直接在移動(dòng) CPU 上加速高強(qiáng)度的矩陣計(jì)算工作負(fù)載——這些工作負(fù)載對(duì)計(jì)算機(jī)視覺和生成式 AI 應(yīng)用至關(guān)重要。SME2 是Armv9 架構(gòu)中的一組高級(jí) CPU 指令,它基于 SME 升級(jí)、能夠在 AI 異構(gòu)計(jì)算框架下,高效支持圖像處理、自然語言處理、語音生成等實(shí)時(shí)移動(dòng)端推理任務(wù)。
開發(fā)者如何獲取 SME2 的優(yōu)勢(shì)
移動(dòng)開發(fā)者無需改動(dòng)現(xiàn)有代碼、模型或應(yīng)用程序,即可直接獲取 SME2 帶來的性能提升。這得益于 Arm 的軟件加速層——Arm KleidiAI,它能夠無縫集成到主流運(yùn)行時(shí)庫(kù)和 AI 框架中,為開發(fā)者提供開箱即用的性能體驗(yàn)。
得益于 KleidiAI 深入且廣泛的集成,SME2 已在 Google 專為安卓系統(tǒng)優(yōu)化的神經(jīng)網(wǎng)絡(luò)推理庫(kù) XNNPACK 中實(shí)現(xiàn)支持。此外,SME2 也被集成至多個(gè)框架中,包括阿里巴巴 MNN、Google LiteRT 和 MediaPipe、微軟 ONNX Runtime,以及 llama.cpp。這些集成意味著 SME2 已深度嵌入到軟件棧中。當(dāng)設(shè)備支持并啟用 SME2 時(shí),XNNPACK 會(huì)自動(dòng)通過 KleidiAI 將矩陣計(jì)算密集型任務(wù)路由至 SME2,從而讓開發(fā)者在無需改動(dòng)任何應(yīng)用邏輯或基礎(chǔ)架構(gòu)的情況下,直接實(shí)現(xiàn)性能提升。
與此同時(shí),KleidiAI 不僅著眼于當(dāng)下的性能加速,更是為滿足未來需求而設(shè)計(jì)。隨著 Arm 不斷推出新特性與架構(gòu)升級(jí),KleidiAI 將持續(xù)為所支持的 AI 框架和運(yùn)行時(shí)庫(kù)帶來自動(dòng)的性能提升,而無需開發(fā)者投入額外精力。
大規(guī)模 AI 性能與能效優(yōu)化
搭載 SME2 增強(qiáng)硬件的安卓新機(jī)即將上市,開發(fā)者可率先通過硬件加速解鎖 AI 性能躍升。與此同時(shí),SME2 已支持最新的 iOS 設(shè)備,只要應(yīng)用中使用了集成 SME2 的 AI 框架,便可自動(dòng)享受這些性能提升。
在搭載 SME2 增強(qiáng)硬件的設(shè)備上運(yùn)行 Google Gemma 3 模型時(shí), 其聊天交互中的 AI 響應(yīng)速度比未啟用 SME2 的同款設(shè)備快六倍。此外,僅用單個(gè) CPU 核心,Gemma 3 便可在不到一秒的時(shí)間內(nèi)啟動(dòng)多達(dá) 800 字的文本摘要任務(wù)。目前,一家領(lǐng)先的獨(dú)立軟件供應(yīng)商 (ISV) 已承諾將其應(yīng)用中的大部分詞元 (token) 生成工作負(fù)載從云端遷移到移動(dòng)端,這在一定程度上得益于端側(cè) AI 能力的持續(xù)突破。
Google 安卓杰出軟件工程師 Iliyan Malchev 表示:“借助 SME2 增強(qiáng)的硬件,更先進(jìn)的 AI 模型(如 Gemma 3)能夠直接在各類設(shè)備上運(yùn)行。隨著 SME2 的持續(xù)擴(kuò)展,移動(dòng)開發(fā)者能夠在不同生態(tài)系統(tǒng)中無縫部署下一代 AI 功能,從而為終端用戶帶來低延遲、廣泛可用的智能手機(jī)體驗(yàn)?!?p>
除了性能的提升,SME2 還為 Arm 生態(tài)系統(tǒng)(如 iOS 與安卓)提供了可移植的解決方案。目前,已有 900 萬款應(yīng)用在 Arm 計(jì)算平臺(tái)上運(yùn)行,超過 2,200 萬名軟件開發(fā)者基于 Arm 平臺(tái)構(gòu)建他們的應(yīng)用和工作負(fù)載。
助力開發(fā)者構(gòu)建 AI 的未來
對(duì)安卓開發(fā)者而言,他們只要將應(yīng)用構(gòu)建在集成了 KleidiAI 的 AI 框架和運(yùn)行時(shí)庫(kù)之上,就能自動(dòng)獲得 SME2 帶來的性能提升,并可在各類設(shè)備上無縫部署下一代 AI 功能。
開發(fā)者若提前布局,即可確保其應(yīng)用在 SME2 增強(qiáng)硬件推向市場(chǎng)時(shí)實(shí)現(xiàn)優(yōu)化,無需改動(dòng)任何一行代碼,便可為用戶帶來更快的性能、更低的延遲以及更高的能效。
此外,Arm 還發(fā)布了開發(fā)者啟動(dòng)平臺(tái),幫助移動(dòng)開發(fā)者充分利用 SME2 的技術(shù)優(yōu)勢(shì),通過豐富案例展示如何針對(duì) KleidiAI 增強(qiáng)框架進(jìn)行開發(fā),從而默認(rèn)激活硬件層面的最新加速能力。
上一篇:晶心科技:只需提供兩個(gè)設(shè)計(jì)文件,就能輕松擴(kuò)展RISC-V指令集
下一篇:最后一頁
- RISC-V人才該怎么培養(yǎng)?專家這樣說
- Arm SME2 技術(shù)加速安卓 AI 升級(jí),驅(qū)動(dòng)移動(dòng)應(yīng)用下一代功能革新
- “東山RISC-V人才培養(yǎng)計(jì)劃”即將推出:2030年前1萬名學(xué)生實(shí)現(xiàn)10萬次代碼
- 上海交大孫亞男:已有30多家頂級(jí)芯片龍頭企業(yè)參與授課
- 日本半導(dǎo)體制造商 Rapidus 啟動(dòng) 2nm GAA 晶體管試制,首塊晶圓亮相
- 北京大學(xué)林金龍:教學(xué)是發(fā)展RISC-V生態(tài)的重要環(huán)節(jié)
- 上??萍即髮W(xué)劉思廷:引入RISC-V課程,應(yīng)對(duì)傳統(tǒng)教學(xué)挑戰(zhàn)
- 上海市經(jīng)信委半導(dǎo)體處調(diào)研員夏益飛:芯片強(qiáng)則產(chǎn)業(yè)強(qiáng),人才強(qiáng)則芯片強(qiáng)
- “一生一芯”計(jì)劃,如何幫助國(guó)內(nèi)解決芯片人才缺乏危機(jī)?
- LDK130PU30R 3V、300 mA 低靜態(tài)電流極低噪聲 LDO 的典型應(yīng)用可調(diào)版本電路
- DER-508 - 4.75W 雙輸出電源
- LTC2201IUK、16 位、20Msps ADC 的典型應(yīng)用電路
- 使用 Analog Devices 的 LTC1450CN 的參考設(shè)計(jì)
- AD8646ARMZ-REEL 24MHz 軌到軌運(yùn)算放大器的典型應(yīng)用電路
- SimplePnP:個(gè)人用開源的PCB貼裝機(jī)(含設(shè)計(jì)文件、原理圖、源碼、軟件等)
- LT3970EMS-3.3 5V 同步降壓轉(zhuǎn)換器的典型應(yīng)用
- LT3007ITS8-3.3 用于?;铍娫吹牡蛪翰罹€性穩(wěn)壓器的典型應(yīng)用電路
- LT1021BCN8-5 精密電壓基準(zhǔn)的典型應(yīng)用
- 具有 250:1 PWM 調(diào)光和 LED 開路保護(hù)的 LT3755IMSE 21W 降壓-升壓模式的典型應(yīng)用電路
- RISC-V人才該怎么培養(yǎng)?專家這樣說
- 割草機(jī)器人,四大流派的巔峰之戰(zhàn)
- 車載顯示迎來三大革命丨“形態(tài)”革命
- 什么是“CDC+空懸”?
- 汽車電子信息安全:如何有效保護(hù)硬件Debug口?
- 新能源汽車核心技術(shù)之“大三電”、“小三電”
- 芯原如何推動(dòng)RISC-V嵌入式軟件人才發(fā)展?
- Arm 技術(shù)助力《國(guó)家地理》探險(xiǎn)家繪制地球海洋圖景
- Arm SME2 技術(shù)加速安卓 AI 升級(jí),驅(qū)動(dòng)移動(dòng)應(yīng)用下一代功能革新
- VGA接口定義、功能用途和種類
- sockit定制內(nèi)核u盤無法識(shí)別
- 最后三天!沁恒CH579免費(fèi)測(cè)評(píng)!BLE,以太網(wǎng),LCD,全速USB,ADC,觸摸...玩起來~
- 最新DSP接口程序(VB版)
- WinCE 5.0 標(biāo)準(zhǔn)模擬器沒有 軟鍵盤模塊,請(qǐng)問模擬器是否可以加入這個(gè)模塊?
- zstack加入網(wǎng)絡(luò)的距離小于實(shí)際通訊距離的原因
- 中國(guó)嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟征集個(gè)人會(huì)員單位邀請(qǐng)函
- DS18B20中文資料
- PCB設(shè)計(jì)中的電源信號(hào)完整性的考慮
- 感謝自已
- H.264視頻編碼基本知識(shí)