华为发布AI推理创新技术UCM:实现高吞吐、低时延推理体验,降低每Token推理成本
新浪科技讯 8月12日下午消息,发布在2025金融AI推理应用落地与发展论坛上,推理吞吐n推华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),创新实现高吞吐、技术低时延的现高推理体验。
在当今数字化时代,低时低AI发展日新月异。延推验降大模型训练的理体理成热潮尚未消退,AI推理体验却已悄然成为AI应用的发布关键。中信建投在2025WAIC期间发布的推理吞吐n推白皮书指出,AI正从训练向推理的创新结构性转变而快速增长。在这样的技术大背景下,AI推理体验的现高重要性愈发凸显。
推理体验直接关系到用户与AI交互时的低时低感受,包括回答问题的延推验降时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。
据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

责任编辑:郭栩彤
- ·2025精英童模超级联赛表演嘉宾邹逸辰 荣获主题赛冠军
- ·国家德比预演对攻战 皇马神锋或率队复仇巴萨
- ·哈兰德:瓜帅对我要求非常多 但这正是我想要的
- ·iphone不可用怎么解除
- ·2023年全国各省高考英语作文真题汇总
- ·舞剧《海的一半》在泉州大剧院召开首演前新闻发布会(视频)
- ·尤文虽不败刷1尴尬数据 德比望小胜迎魔鬼赛程
- ·最高法首次发布意见服务和保障西部陆海新通道建设
- ·2025精英童模超级联赛表演嘉宾邵宣瑜 荣获主题赛冠军
- ·《假面迷情》今日收官 战损美学开启网剧新赛道
- ·多特爆冷不敌倒数第二 沙欣若下课继任者是滕哈赫
- ·尤文虽不败刷1尴尬数据 德比望小胜迎魔鬼赛程
- ·六年级英语作文:Englishteacher
- ·伊萨克12月以来英超打进11球 同期英超进球最多
- ·石狮市委一季度工作会议召开
- ·转转app可以用微信支付吗
- ·茅台酱香酒官宣合作美团闪购:首批上线门店超千家,将共建正品联盟
- ·法国多地气温突破40摄氏度 气象部门警告高温仍将持续
- ·奥运马术故事之6位中国骑手首次站上奥运赛场
- ·火箭不太会顶薪续约杜兰特 新合同可能降至2年1亿
- ·2021玉树藏族自治州成立70周年赛马会开幕在即,各大交通路线实施管制
- ·松潘县川主寺镇牧场村举行为期一周的“夏顿 嘉年华”赛马节
- ·夫妻摆“急救地摊”8年 教会10余万人“救命术”
- ·第35次登上腾讯财报!《王者荣耀》已连续三年霸榜全球手游收入TOP1
- ·2021第三届中国年青马西坞大赛“最具种公马潜质”获奖马匹揭晓
- ·日本乒协被曝赛前偷换器材,引发热议,张本夺冠发言更是引起众怒