中星微发布最新AI芯片:可单芯片运行大模型
芯片发布信息
2025年4月30日,在福州举行的第八届数字中国建设峰会上,中星微技术股份有限公司宣布最新AI芯片“星光智能五号”已成功运行DeepSeek16B大模型3456。5月4日消息也进一步确认了该芯片发布的相关情况。
芯片架构优势
“星光智能五号”采用中星微自主研发的多核异构GP - XPU新架构,相比传统的CPU + GPU架构,在运行效率、实时响应、性价比和安全性等方面有显著提升123456。该架构集成了高性能的RISC - V CPU、GP - GPU、NPU,以及面向智能感知领域的图像信号处理器(ISP)、视频编解码器(VPU)、加解密处理器(ECU)等多核心模块,通过专用的HCP(异构计算池)任务调度单元和安全内存管理系统,实现多异构内核之间的算力与存储资源的实时调度与动态共享,大幅提升了算力利用效率和数据吞吐率。
运行能力表现
单芯片运行:该芯片能够单芯片同时驱动通用语言大模型和“万物识别”多模态大模型,首次实现了在单芯片上部署运行DeepSeek1.5B、7B、8B、16B等通用大模型及视觉大模型的能力。在仅约一张名片大小的处理板中,单颗星光智能五号既满足复杂场景下的视频实时检测、识别与跟踪需求,又能实现自然语言处理、任务规划、知识管理、自动控制等智能体功能
多芯片协同:通过8颗芯片的协同工作,可以完整支持671B参数的DeepSeek大模型和视觉大模型的运行,彻底打破边缘端算力瓶颈。
芯片特性亮点
作为AI芯片领域的全能型选手,“星光智能五号”以六大核心优势树立行业标杆:
特性 具体表现
高效率 通过算子级MoE架构与HCP实时调度机制,算力利用效率提升约40%,数据吞吐率提升约50%
低能耗 通过异构计算资源按需分配,该芯片能耗降低至少30%5
低成本 通过端 - 边闭环架构减少云端资源依赖,综合部署成本约为服务器架构同性能部署的1/3
体积小 嵌入该芯片的处理板最小仅需要约一张名片大小,可满足多种小型化智能设备的空间需求
强安全性 采用存储器分区安全隔离技术,支持高性能国密算法计算,实现信源级密码保护,具备原生数据安全特性
高适应性 支持开放生态与主流AI框架,无缝对接千行百业的各种应用场景;在工作环境适应性方面,摆脱了云端大算力设备对机房恒温恒湿环境的依赖,可以在各种生产生活现实环境中完成高性能智能化工作
应用领域及意义
应用领域:这款基于国产工艺制程、完全自主可控的AI芯片,将广泛应用于智慧城市、智能制造、智慧农业和智能交通等领域,还可应用于国家战略重要领域以及城市感知等方面。
重要意义:中星微技术CEO张韵东表示,“星光智能五号”将推动端侧、边缘侧智能化升级,大幅减少对云端算力资源的依赖,节省系统建设成本,探索出一条符合中国国情的人工智能技术路线。传统依赖云端的AI推理流程常面临响应延迟大、成本高、受制于网络环境等问题,而该芯片通过本地化算力与内生安全机制,使大模型推理可直接在边端侧内完成闭环,既节省了云端传输与存储成本,同时极大提升了响应速度,可实现毫秒级响应,同时以信源级密码机制保障数据全生命周期安全