高通AI战略全面升级,从芯片到数据中心构建统一架构
在3月27日举行的CFMS MemoryS 2026峰会上,高通公司AI产品技术中国区负责人万卫星分享了其在AI领域的全面布局与技术洞察。随着个人智能体的发展进入新阶段,尤其是OpenClaw(小龙虾)等生成式AI应用的兴起,AI如何在终端设备中落地、发挥更大价值,成为行业关注的核心议题。
AI应用正经历四阶段演进,端侧部署仍面临关键挑战
万卫星表示,AI在产业中的应用正逐步从感知AI、生成式AI迈向智能体AI,并有望进入物理AI时代。当前业界主要聚焦在第二和第三阶段的演进。
感知AI主要应用于多媒体信号处理、语音识别、图像分类及噪声抑制等领域,而生成式AI则依托大规模数据进行预训练,通过监督学习解决特定任务,例如ChatGPT和文生图模型。相比之下,智能体AI能够在无监督环境下自主理解用户意图并执行任务,适用于更复杂的交互场景。
物理AI则代表了更前沿的发展方向,其核心在于AI可以基于对物理世界的理解进行反馈和决策。尽管目前该领域尚处于早期探索阶段,但其潜在价值不容忽视。
当前,端侧AI正快速成长,特别是在模型参数量方面取得显著进步。智能手机已可支持10亿至100亿参数的大模型,PC设备支持130亿至200亿参数量的模型,车载设备则可承载高达200亿至600亿参数量的AI模型。而在AR眼镜等轻量级设备上,支持10亿至40亿参数量的模型也已实现。
尽管端侧模型的参数规模仍小于云端模型,但随着内存带宽提升、模型量化技术优化等技术手段的成熟,端侧设备的模型承载能力正在持续增强。值得注意的是,高通已成功将具备推理能力的大模型部署至端侧,并不断扩展其上下文长度。
3年前,端侧模型的上下文长度普遍在1000到2000词之间;2年前,这一数值扩展至2000到4000词;而2025年,高通与合作伙伴共同探索的场景中,上下文长度已提升至4000至8000词,部分场景甚至达到了32000至128000词。
端侧部署大模型面临三大核心挑战:首先,受限于端侧内存规模,即便采用模型压缩技术,仍存在内存容量瓶颈;其次,受限的内存带宽影响推理速度,进而影响用户体验;第三,大模型在终端运行时的能效与散热问题尤为突出,需在保证AI性能的同时,有效控制功耗和温度。
智能体演进呈现三大趋势,AI芯片全面覆盖端侧与数据中心
据万卫星介绍,个人AI将逐步从单一设备扩展至多终端协同体验。未来的智能体不再局限于简单的语音助手,而是能深度理解用户意图、上下文和感知信息的高智能化助手。
当前,智能体的发展趋势主要包括:端侧智能体的普及、智能体的垂直领域专业化、以及高度个性化与多模态融合。随着AI与用户为中心的多终端体验逐渐成型,AI不再局限于某一个设备,而是通过统一架构在本地边缘、网络边缘与中央云之间协同运行。
为支撑这一趋势,高通已在2024年推出多款高性能AI芯片与平台,包括第五代骁龙8至尊版移动平台与X2 Elite计算平台等,为消费电子设备提供充足算力。此外,在数据中心领域,高通也发布了基于AI200和AI250芯片的加速卡和机架系统,以行业领先的总体拥有成本(TCO)支撑生成式AI推理任务。
万卫星总结道:“高通正通过统一的AI架构,为手机、耳机、可穿戴设备、PC、汽车、机器人乃至下一代数据中心提供高性能、高能效的软硬件技术支撑。这一战略将AI能力从单一产品、单一芯片扩展为跨终端、跨场景的平台级能力。”