华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本
[百科] 时间:2025-08-24 06:51:57 来源:椰林海韵碧浪白沙 作者:百科 点击:197次
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

责任编辑:郭栩彤
(责任编辑:休闲)
相关内容
- 《流放之路2》国服98元起 9月11日开启不删档测试
- 2025年农心杯中国队选拔赛将于8月5日在新疆开赛
- 大乐透1现象上市18年仅20次 周六1特征90%开出
- IPG主赛8人决赛桌产生 潘宇文保持大幅度优势领跑
- 《异形:夺命舰》主演或将加盟《艾尔登法环》电影
- 双色球开17注633万落3地 云南1站爆6973万大奖
- 云南东盟智运会报名名单公示:320人参赛 通幽组赛程微调
- 女子排名:沃德夺冠升至24位 渡边彩香攀升到158
- 英语议论文的写作方法
- 男子15元机选擒大乐透1800万 平时期期都买
- [新浪彩票]足彩25106期盈亏指数:库普斯捍卫主场
- 中国排名:李昊桐82位 袁也淳出战光巡升到332位
- 西汉姆联 vs切尔西:蓝军有望客场奏凯
- 中国排名:李昊桐82位 袁也淳出战光巡升到332位
精彩推荐
- FOSSIL携手NICK JONAS推出独家新作
- 精选大乐透专家:阿旺、李晓天各擒一等揽1147万!
- 少年棋手Tianyuan对于围棋和生活的解构
- 8月2日锁定新浪棋牌直播间 乐弈场周赛带来精彩围棋对决
- 初中英语简单句的九大基本句型
- 精选大乐透专家:潘冠宇、胜九天同中头奖769万
热门点击
- 黄山市:“微改造”增添“小确幸” views+
- 关于教师节的作文:九月十日——一个美丽的日子 views+
- 公司工会财务工作报告 views+
- 微盟集团2025半年报:营收7.75亿元,AI商业化收入3400万元 views+
- 《湮灭之潮》制作人称赞《古剑》:烛龙的同学们真棒! views+
- Comedian Nate Jackson says cancel culture is finally winding down views+
- 百度Q2财报:AI新业务收入超100亿元,智能云增长27% views+
- 做菜的很大乐趣在于“多变”:黑椒干锅虾 views+
- 在县委理论中心学习会议上的发言 views+
- 俄罗斯公布涉731部队解密文件 views+