网站首页 > 技术文章 正文
在AI phone成为智能手机行业的下一个主流方向后,端侧AI成为了从“通信工具”向“智能体”迭代的关键底座。
简单来说,端侧AI就是指将AI模型与算力集成到智能手机本地(如NPU、CPU+GPU异构计算单元),实现数据的本地采集、处理与决策,而非依赖云端服务器。
其核心特征可概括为四点:低延迟(本地处理无需网络传输,响应速度达毫秒级)、高隐私(数据存储与计算均在设备端,杜绝泄露风险)、离线可用(无网络环境下仍能执行智能任务)、个性化(通过本地学习适应用户习惯,提供定制化服务)。
而作为整个智能手机芯片的最上游供应商——Arm,也开始将Arm架构的升级方向聚焦到端侧AI。目前全球99%的智能手机都采用Arm架构,基于Arm架构的芯片出货量迄今已累计超过3100亿颗。
Arm Unlocked AI技术峰会上海站期间,Arm推出了全新的Arm Lumex计算子系统(Compute Subsystem,CSS)平台。Arm方面称,这是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能(AI)体验的计算平台。
搭载SME2技术的CPU,AI性能提升五倍
新的CPU架构中,Arm发布了搭载SME2(第二代可伸缩矩阵扩展技术)的Arm C1 CPU集群。
“SME2是SME的新一代版本。第一,它新增了更多指令集,可进一步提升性能和能效。第二,它支持更小的数据类型——具体而言是2 bit和4 bit。”
Arm终端事业部产品管理副总裁James McNiven表示,随着每年高度量化模型的不断增多,这类小数据类型在移动生态系统中的重要性正日益凸显。这也是我们重点将SME2整合到Arm Lumex平台中的原因所在。
Arm C1 CPU集群为实际场景中的AI驱动型任务带来了显著的AI性能提升,包括:AI性能提升高达五倍,语音类工作负载延迟降低4.7倍,音频生成速度提升2.8倍。
此外,通过Arm、支付宝与vivo的三方合作下,将大语言模型(LLM)的交互响应时间缩短了多达40%,证明了SME2可为终端设备带来更快速的实时生成式AI体验。
除了速度的提升,在搭载SME2的单个核心上运行神经摄像头降噪功能,可以在1080P分辨率下实现帧率超120帧/秒 (fps),或在4K分辨率下实现帧率达30fps。这使得智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像。
“我想强调的是,由于SME2直接集成到了CPU当中,在工作负载的支持上能起到高度可扩展性。这意味着,SME2 带来的AI功能不仅能应用于4000元以上的高端手机,还能下沉到2000元等不同价位段的手机中,最大幅度地推广AI技术落地。”Arm高级副总裁兼终端事业部总经理Chris Bergey表示。
Mali GPU,让AI推理性能提升最高20%
CPU之外,全新的Arm Mali G1-Ultra GPU则搭载了新一代光线追踪单元RTUv2。
与前一代Arm Immortalis-G925 GPU相比,Mali G1-Ultra的光线追踪性能提升高达两倍,并在主流图形基准测试中,性能表现提升20%。在AI方面,通过新的FP16矩阵计算路径,该GPU在AI与机器学习网络上的推理速度比 Immortalis-G925快20%。
在边缘计算方面,Mali G1-Ultra引入新的矩阵乘法单元(MMUL) FP16指令,可加速如语义分割、去噪、深度估计、物体检测、语音识别和图像增强等端侧关键AI工作负载。与上一代Immortalis-G925相比,其性能提升高达104%。
Arm提供的数据显示,目前搭载Arm GPU的芯片累计出货量突破120亿颗。
“AI已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托Arm Lumex平台,我们持续提升端侧AI体验,以满足用户日益增长的需求与期待。”
Arm高级副总裁兼终端事业部总经理Chris Bergey表示,从出货量角度来看,手机行业的增长已趋于平缓。但是,我们仍处于AI发展的初期阶段,尤其是在手机领域,AI正推动着更高的计算需求,并创造全新的价值。
此外,Chris Bergey还强调领先的手机厂商——无论是苹果还是三星——都已不同程度地朝着自研芯片的方向发展。这实际上是整个泛半导体行业所面临的趋势,Arm CSS平台正是顺应这一趋势而生。
“我们提供一个经过验证的计算基础,让客户能够以相对较低的成本实现自身所需的定制化。”
Chris Bergey称,Arm CSS平台真正的价值并非是“做出比Arm工程师设计的更优秀的Arm CPU”,而是客户通过在 Arm 平台基础上构建自己的SoC,额外创造更大的商业价值。(本文首发于钛媒体APP,作者 | 饶翔宇 编辑 | 钟毅)
猜你喜欢
- 2025-10-02 手机端XMind格式文件编辑软件推荐
- 2025-10-02 完美!我用AI做了两个工具,终于实现手机微信输入法在PC端的语音输入了!
- 2025-10-02 回答网友问题:手机导航凯立德、高德和百度哪个更好用?
- 2025-10-02 锐评|干什么都跳转?手机一晃进广告是典型的技术霸凌
- 2025-10-02 DeepSeek为何更易接入手机端?_deeplink
- 2025-10-02 iPhone手机端选择哪一款待办清单类工具比较好用?
- 2025-10-02 vivo亮手机端最大视觉生成模型,再发自研影像芯片,大秀空间视频
- 2025-10-02 手机端文件传输功能怎么用?1分钟简单三步轻松搞定
- 2025-10-02 OriginOS 6与PC/Mac互联升级,手机电脑跨端随手传文件
- 2025-10-02 让大模型“跑”在手机里:vivo蓝心端侧部署创新揭秘,性能功耗双优!
你 发表评论:
欢迎- 最近发表
-
- Three.js vs Unity:工业可视化为何选择Web方案?
- 一款全新Redis UI可视化管理工具,支持WebUI和桌面——P3X Redis UI
- 时间线可视化实战:三款AI工具实测,手把手教你制作人生轨迹图
- 【推荐】一款可视化在线 Web 定时任务管理平台,支持秒级任务设置
- 重磅更新!FastDatasets 推出可视化 Web 界面
- 模具设计之UG钣金实例教程(3)_ug钣金基础教程
- 前端基于 RBAC 模型的权限管理实现
- 别再把JWT存在localStorage里了!2025年前端鉴权新思路
- 模具设计之曲面造型中不圆润的曲面如何处理技巧
- 9个专业级别的CSS技巧区分了解和精通的鸿沟
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- oracle面试 (55)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)