切换到宽版
  • 12阅读
  • 2回复

[数码讨论]华为发布AI推理创新技术UCM,计划于9月开源 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
176883
金币
344012
道行
2004
原创
2412
奖券
2855
斑龄
36
道券
1038
获奖
0
座驾
设备
摄影级
在线时间: 39818(小时)
注册时间: 2008-10-01
最后登录: 2025-08-13
只看楼主 倒序阅读 使用道具 楼主  发表于: 昨天 08:42
— 本帖被 兵马大元帅 执行加亮操作(2025-08-13) —

IT之家 8 月 12 日消息,今日,华为正式发布 AI 推理创新技术 UCM(推理记忆数据管理器)。

据IT之家了解,作为一款以 KV Cache 为中心的推理加速套件,UCM 融合了多类型缓存加速算法工具,分级管理推理过程中产生的 KV Cache 记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每 Token 推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融 AI 推理加速应用试点,并已取得成果。

华为计划于 2025 年 9 月正式开源 UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有 Share Everything (共享架构) 存储厂商和生态伙伴。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
176883
金币
344012
道行
2004
原创
2412
奖券
2855
斑龄
36
道券
1038
获奖
0
座驾
设备
摄影级
在线时间: 39818(小时)
注册时间: 2008-10-01
最后登录: 2025-08-13
只看该作者 沙发  发表于: 昨天 08:43
华为发布 AI 推理创新技术 UCM:推动智慧金融发展

华为在8月12日正式发布了AI推理创新技术UCM(推理记忆数据管理器)。这一技术的发布标志着华为在AI领域的又一重大突破,特别是在智慧金融领域的应用。

UCM 技术概述

UCM是一款以KV Cache为中心的推理加速套件,融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据。通过这种方式,UCM能够扩大推理上下文窗口,实现高吞吐、低时延的推理体验,从而降低每Token的推理成本。

应用场景

该技术已率先在中国银联的“客户之声”、“营销策划”和“办公助手”三大业务场景中开展智慧金融AI推理加速应用试点,并已取得显著成果。这些应用场景的共同特点是需要处理大量的数据和复杂的推理任务,UCM技术的应用显著提升了这些任务的效率和准确性。

开源计划

华为计划于2025年9月正式开源UCM技术,届时将在魔擎社区首发。后续,华为将逐步将这一技术贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。这一开源计划将进一步推动AI技术的普及和发展,为更多企业和开发者提供强大的技术支持。

技术优势

1. 高吞吐、低时延:通过分级管理KV Cache记忆数据,UCM能够显著提升推理过程的效率,降低时延。
2. 成本降低:扩大推理上下文窗口,减少重复计算,从而降低每Token的推理成本。
3. 灵活性:UCM融合了多类型缓存加速算法工具,能够适应不同的业务场景和需求。

未来展望

随着AI技术的不断发展,UCM技术的应用前景广阔。特别是在智慧金融领域,UCM技术将为金融机构提供更高效、更准确的AI推理服务,提升客户体验和服务质量。同时,华为的开源计划也将促进整个AI生态的发展,推动更多创新应用的出现。

总之,华为发布的UCM技术不仅在技术上实现了重大突破,还在应用上展现了巨大的潜力。我们期待这一技术在未来能够为更多行业和领域带来积极的影响。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
149971
金币
320213
道行
20030
原创
757
奖券
224
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 17679(小时)
注册时间: 2012-06-21
最后登录: 2025-08-13
只看该作者 板凳  发表于: 昨天 13:27
华为UCM技术发布:AI推理领域的突破性创新与开源规划
2025年8月12日,华为在2025金融AI推理应用落地与发展论坛上正式发布AI推理创新技术UCM(推理记忆数据管理器),并宣布计划于同年9月开源该技术125。这一技术的推出旨在解决当前AI推理过程中的效率、成本及资源依赖问题,尤其在缓解HBM(高带宽内存)短缺压力方面具有重要意义。

UCM技术核心架构与优势解析
技术定位与核心机制
UCM是一款以KV Cache为中心的推理加速套件,通过融合多类型缓存加速算法工具和分级管理策略,高效处理推理过程中产生的记忆数据126。其核心架构包含三大组件:

推理引擎插件(Connector):对接不同引擎与算力平台;

功能库(Accelerator):支持多级KV Cache管理及加速算法;
存取适配器(Adapter):实现高性能KV Cache数据交互5。
关键技术优势
扩大上下文窗口:通过精细化数据管理提升模型处理长文本的能力14;
高吞吐与低时延:优化推理流程,确保快速响应与批量处理效率26;
降低推理成本:减少每Token的计算开销,提升AI应用性价比37;
缓解HBM依赖:通过缓存优化技术减少对高带宽内存的需求,缓解行业资源短缺问题210。
开源计划与生态合作布局
开源时间表与平台
华为计划于2025年9月在魔擎社区首发开源UCM技术,后续逐步贡献至业界主流推理引擎社区,并向所有ShareEverything(共享架构)存储厂商及生态伙伴开放3689。这一举措将加速技术普惠,推动AI推理生态的协同发展。

行业合作与应用案例
金融领域试点:与中国银联联合发布智慧金融AI推理加速方案,在“客户之声”等场景中实现推理速度提升125倍,客户高频问题识别时间从数小时压缩至10秒
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个