2025年9月10日,Arm在Arm Unlocked 2025峰会上正式推出了全新Arm Lumex CSS计算平台。该平台是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能体验的先进计算平台。以下是其详细介绍: 平台特点集成SME2技术:Lumex CSS平台集成了搭载第二代可伸缩矩阵扩展(SME2)技术的高性能Arm CPU、GPU及系统IP。C1 CPU集群是首个基于Armv9.3架构并原生集成SME2技术的CPU系列,相比上一代CPU集群,其AI性能提速高达五倍,同时能效优化多达三倍。图形处理能力强:全新的Arm Mali G1-Ultra GPU进一步突破移动游戏的性能边界,采用第二代光线追踪技术,其光线追踪性能相较前代提升了两倍,在AI工作负载方面,可将推理性能提升最高20%,显著增强各类实时应用的响应速度。设计灵活性高:合作伙伴可选择直接采用Arm预集成的物理实现方案以缩短上市时间,也可基于寄存器传输级(RTL)设计进行自定义配置,以适应不同市场与功耗需求。该平台涵盖从旗舰级C1-Ultra、注重面积效率的C1-Premium,到高能效C1-Pro及超低功耗C1-Nano等多个CPU配置,覆盖智能手机、PC、可穿戴设备等多种产品形态。软件硬件协同:通过KleidiAI软件库,开发者可在主流AI框架,如PyTorch ExecuTorch、Google LiteRT、阿里巴巴MNN和微软ONNX Runtime中无缝调用SME2硬件加速能力,无需修改代码即可实现性能提升,大幅降低了AI应用开发与部署的门槛。 实际应用效果语音处理:在处理语音工作负载时(基于Whisper Base模型),延迟降低了4.7倍。聊天交互:在运行Google Gemma 3模型进行聊天交互时,AI性能可增长4.7倍。音频生成:在使用Stability AI Stable Audio模型生成音频时,速度提升了2.8倍。 合作企业SME2已经广受业界领先生态伙伴的采用,包括阿里巴巴、支付宝、三星System LSI、腾讯及vivo等,谷歌、MediaTek等企业也表示正在推进相关集成与优化工作。
|
|