华为正式开源UCM技术:最大提升22倍 AI推理性能跃升
近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。
UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。
UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。
它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。
目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

UCM产品架构
-
微信“学会”潮汕话了 网友实测好用:毕竟马化腾是汕头人
据媒体报道,近日,有广东网友发现,微信的语音转文字功能悄然启动了对潮汕话的支持。值得注意的是,这是继粤语之后微信开放的第二种汉语方言。据悉,用户更新至最新版本后,可通过长按语音消息或上滑发送实现潮汕话
-
高德地图:正积极推进车载导航鹰眼守护 预计年底全覆盖
高德地图宣布,车机端也是“鹰眼守护”重点覆盖的场景之一。目前正积极推进该功能向车载导航系统延伸。已经完成部分场景的落地,预计年底可以实现全场景的覆盖。据了解,今年9月,高德地图与中国安全生产科学研究院
-
阿里通义App重大品牌升级!正式更名为“千问”
今天,阿里巴巴旗下的人工智能应用“通义”App迎来了重大的品牌升级,正式更名为 “千问”。伴随着此次更名,软件版本号从3.60.0直接升级至5.0.0,目前“千问”App已正式登陆苹果App Stor
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩



微信扫码关注公众号