华为正式开源UCM技术:最大提升22倍 AI推理性能跃升

业界 来源:快科技 2025-11-05 17:46:07

近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。

UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。

UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。

它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。

目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。


UCM产品架构

延伸阅读
  • TikTok将在美国成立合资公司维持运营!我国商务部回应

    据央视新闻报道,在今日商务部举行的例行新闻发布会上,有记者问:据报道,TikTok已与三家投资者签署协议,并将成立新的TikTok美国合资公司,确保其继续在美运营。请问发言人对此有何评论?商务部新闻发

  • 小红书官方辟谣:陈震账号依旧处于禁言状态

    有网友今日发现,车评人陈震的部分帐号已经恢复正常,没有了封禁标识,已可正常关注。且陈震的小红书、B站、今日头条账号显示已经解禁,但还没发布最新内容。但在今日下午,小红书官方账号“薯管家”发布了“关于账

  • 微软PowerPoint喜提全新功能:更好理解PPT晦涩内容

    近日,微软为其办公神器PowerPoint推出了名为“Explainer(解释器)”的全新功能。该工具由Copilot AI驱动,可帮助用户快速拆解和理解演示文稿中那些晦涩难懂的专业术语、缩写或复杂的

关注公众号:拾黑(shiheibook)了解更多

赞助链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接