铠侠UFS 5.0为端侧AI提供全新技术支撑

2026-03-31 18:29:44
关注

铠侠UFS 5.0为端侧AI提供全新技术支撑

随着铠侠开始向合作伙伴交付UFS 5.0评估样品,业界普遍预计移动端正式迈入UFS 5.0时代已为时不远。UFS 5.0相比前代UFS 4.0和UFS 4.1在性能方面实现了显著跃升,其读写速度最高可达10.8GB/s,几乎是UFS 4.1(4.64GB/s)的两倍,使得移动设备首次突破10GB/s的传输瓶颈,与PC端的PCIe 5.0固态硬盘速度趋于一致。

传输速度的提升不仅改善了整体使用体验,更为端侧AI(On-Device AI)的部署提供了关键支撑。UFS 5.0凭借其高性能与高带宽,为端侧AI在更广泛场景中的应用奠定了坚实的技术基础。

规格层面的重大升级

从技术规格来看,铠侠UFS 5.0实现了多项关键突破。该产品目前提供512GB和1TB两种容量版本,采用备受市场认可的第八代BiCS FLASH技术,并采用7.5x13mm的紧凑型封装设计,适用于智能手机、平板电脑,甚至可穿戴设备。

第八代BiCS FLASH是铠侠在3D NAND领域的代表技术,已广泛应用于消费级与企业级SSD产品中。其采用218层堆叠结构,存储密度达到18.3Gb/mm²,处于行业领先水平,并将I/O接口速度提升至3.6Gbps。

在制造工艺方面,铠侠采用了晶圆直接键合到存储阵列(CBA)技术,允许CMOS控制电路与存储单元分别在不同晶圆上制造,并通过高精度键合集成,从而实现更高的性能与能效比。

铠侠UFS 5.0在第八代BiCS FLASH的基础上,进一步集成MIPI M-PHY 6.0与UniPro 3.0协议。铠侠自标准制定初期便深度参与该接口的研发工作,并通过优化电源管理,使UFS 5.0在保持高性能的同时具备出色的低功耗特性。

在信号调制方面,铠侠UFS 5.0采用PAM4(脉冲幅度调制四电平)技术,通过在每个信号周期内传输更多信息,显著提升了数据传输效率,助力实现10.8GB/s的峰值传输速度。然而,PAM4对噪声更为敏感,因此需要更高性能的控制器和链路设计以充分发挥其潜力。

在数据完整性方面,铠侠UFS 5.0引入了多项增强机制,包括链路均衡(Link Equalization)、独立电源轨设计,以及通过预编码(Pre-coding)与格雷编码(Grey Encoding)优化信号传输。这些措施确保在高速传输过程中数据的准确性与稳定性。

端侧AI性能的跃升

凭借铠侠UFS 5.0的高性能与可靠性,端侧AI在计算能力与响应速度方面都获得了显著提升。以智能手机为例,运行生成式AI通常涉及两个关键步骤:首先,将大语言模型(LLM)从UFS加载至DRAM,其次由SoC从DRAM中读取模型参数并执行推理。

目前主流端侧LLM参数规模约在30至40亿之间,FP8量化精度下约占用3GB至4GB内存。随着模型规模扩大,加载时间延长,将对用户体验造成影响。

铠侠UFS 5.0凭借其大容量与高速度,将LLM的支持上限提升至10GB,对应约100亿个FP8量化参数。此外,得益于UFS 5.0的高带宽特性,用户首次获得AI响应的时间(Time to First Token)也大幅缩短,有效提升了交互体验。

此外,铠侠UFS 5.0还与铠侠AiSAQ固件协同工作,在UFS中内置RAG(检索增强生成)专用数据库,从而减轻DRAM负担,使AI任务的执行更加流畅。

当端侧AI不再依赖云端处理,用户数据隐私将得到更好保障,响应速度也将更加即时。铠侠UFS 5.0的推出,标志着智能手机在端侧AI能力方面迈入全新阶段。通过第八代BiCS FLASH、MIPI M-PHY 6.0与UniPro 3.0协议、10.8GB/s的传输速率,以及高性能控制器与AiSAQ固件设计,铠侠UFS 5.0在物理层、协议层、存储层与应用层实现了系统级优化,为AI在终端设备的进一步普及提供了坚实支撑。

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

广告
提取码
复制提取码
点击跳转至百度网盘