8月12日消息,今日,华为正式发布AI推理创新技术UCM(推理记忆数据管理器)。
据了解,作为一款以KVCache为中心的推理加速套件,UCM融合了多类型缓存加速算法工具,分级管理推理过程中产生的KVCache记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每Token推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融AI推理加速应用试点,并已取得成果。
华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有ShareEverything(共享架构)存储厂商和生态伙伴。
VideoWorld:无需依赖语言模型,只通过视觉就可实现复杂任务
2025-03-24
DeepSeek使用教程指南,内含指令基础操作、进阶技巧和实战案例
2025-04-11
2025-04-26
一小时翻译整部《甄嬛传》,AI面试官发offer……在杭州看AI落地的1000种玩法
2025-07-18
Anthropic联合创始人:团队成员极具使命感,Meta天价薪酬也挖不动
2025-07-28
2025-02-19
被老板追着夸的PPT,全靠这4个DeepSeek隐藏指令模板!
2025-03-14
OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念
2025-04-01
2025-04-17
2025-07-15