国芯科技发布神经网络处理器DPNPU内部测试成果
1月5日,国芯科技在其官方渠道发布通告,宣布其最新研发的神经网络处理器IP核DPNPU(Dataflow Parallel NPU)已完成内部测试。此次测试成果以自愿性信息披露方式对外公布。
根据公告内容,DPNPU单核具备0.5至4.8TOPS之间的灵活算力配置能力,支持算力的线性扩展,能够根据不同应用场景需求,提供定制化的AI计算解决方案。该处理器基于RISC-V ISA标准架构进行创新设计,通过将RISC-V核心与高性能神经网络加速单元在系统架构层深度集成,提升了整体运行效率。
在核心控制方面,DPNPU引入了专有的TDS硬件调度引擎,负责将神经网络模型中的算子序列转化为节点化任务流,从而实现任务调度、数据流控制与AI计算之间的协同优化。这种架构设计有助于实现更高效的资源分配和运算流程。
此外,该IP产品还采用脉动阵列与动态融合技术,提升系统在长时间运行下的稳定性与能效比。内置超过90种神经网络算子,覆盖CNN与RNN等主流神经网络架构,支持LSTM和GRU等RNN变体。凭借RISC-V指令集的通用性与硬件设计的灵活性,DPNPU具备良好的模型适配能力,为未来AI模型的演进预留了扩展空间。
在量化技术方面,DPNPU支持PTQ(Post Training Quantization),提供对称量化、非对称量化、逐层量化和逐通道量化四种实现方式。同时支持INT8与FP16混合精度量化,在不牺牲模型精度的前提下,有效减少计算资源和存储需求,实现性能与精度之间的平衡。
为增强硬件系统的整体性能,DPNPU还集成了自主研发的PCD模块,具备参数压缩与硬件自动解压功能,有助于缓解数据传输中的带宽瓶颈,降低系统延迟,提升运行效率。
在软件生态方面,国芯科技同步推出了围绕DPNPU构建的C*Core NPU Studio平台,包含完整的开发工具链、驱动程序以及运行环境。该平台旨在降低AI应用的开发门槛,缩短从算法设计到部署上线的周期,提升AI解决方案的落地效率。