华为提出全新压缩算法:节省70%内存占用

广众网1月24日消息,华为AI算法团队在人工智能领域取得了显著突破,他们研究并发表了一种创新的大模型KV Cache压缩算法,名为“RazorAttention”。

这一算法具有卓越的性能,能够有效节省高达70%的大模型推理内存占用,为AI大模型的高效运行提供了有力支持。

其论文《RazorAttention: Efficient KV Cache Compression Through Retrieval Heads》已被深度学习领域国际顶级会议ICLR 2025收录。

华为表示,此算法为业界首个基于Attention可解释性的离线静态KV Cache压缩算法,打破了过去AI大模型长序列KV Cache压缩不理想的现状。

该算法通过检索头的设置,确保上下文中重要且主要的信息不丢失,在保持高精度(误差小于1%)的情况下,静态有效压缩了最大到70%的KV Cache内存占用,可以为用户大大节约AI大模型推理的成本。

目前RazorAttention算法已产品化集成在昇腾MindIE/MindStudio,支持主流8K~1M长序列KV Cache压缩,32K以上场景增量吞吐提升20%+。

华为提出全新压缩算法:节省70%内存占用

【本文结束】如需转载请务必注明出处:广众网

责任编辑:随心

文章来源于网络。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/6558.html

(0)
广众网的头像广众网
上一篇 2025年1月24日 下午9:45
下一篇 2025年1月24日 下午10:17

相关推荐

  • 轿车司机边开车边喝啤酒 交警拦下后实现职业生涯首次乌龙

    广众网1月24日消息,据网红交警博主“晓辉在路上”透露,他拦下了一位边开边喝酒的轿车司机后,实现了个人职业生涯中首次乌龙事件。 1月23日,河南郑州,晓辉在路上正常行驶时,发现隔壁车道的轿车司机正在喝酒。 从灌装“啤酒”的包装样式来看,司机喝的是“夺命大乌苏”,看到司机这么嚣张,晓辉立即和同事将轿车司机叫停,并进行检查。 结果轿车司机下车后,说他喝的不是酒,…

    2025年1月24日
    9000
  • 人人羡慕NVIDIA的暴富 却不知道黄仁勋的疯魔

    要论这两年资本市场谁最火,NVIDIA称第二,就没有公司敢称第一。 由ChatGPT引爆的人工智能热潮让NVIDIA成为了一个“造富机器”,一块块GPU就像一块块金砖,构成了NVIDIA员工通往财富自由之路的阶梯。 要说不羡慕嫉妒,那肯定不符合人性。就在昨天,还有NVIDIA中国区的前员工网上吐槽,因目光短浅,在2023年之前跳槽,损失了3亿多元的股票收入。…

    2025年1月19日
    7800
  • 国补扩容拉涨消费热情!3C产品销量翻倍 消费电子产业链迎来新机遇

    “平常销量也就两三台,国补出来后日卖二三十台。”广州某手机品牌门店工作人员向财联社记者透露。 “以旧换新”国家补贴范围从家电、汽车,扩展至消费电子领域。近日,全国多地陆续启动手机等数码产品购新补贴政策,最高立减500元。自1月20日起,各地新政陆续开始实施,至今已有数日,拉动3C产品销量明显增长。不少消费者表示,“购机立省几百,真香。” ST易购(00202…

    2025年1月25日
    10900
  • 中国短剧风靡美国市场:收入占比超六成

    广众网1月22日消息,据央视财经报道,截至2024年8月,头部短剧应用在美国的收入达1.51亿美元,占全球总收入的64.8%,美国成为中国短剧最重要的海外市场,多家中国企业积极布局短剧出海。 中文在线的ReelShort曾登顶美国iOS娱乐类免费榜,超六成收入来自美国市场;北京点众科技开发的DramaBox预计2024年全球收入约1.47亿美元;九州文化的S…

    2025年1月22日
    10800
  • 微信更新后 不用解锁手机 也能接听语音了

    虽然现在就是年底,但这两天微信一个更新,还是让关注微信的网友直呼——过年了 因为 “ CallKit 回归了 ” 。 不过和往常一样,微信的功能都是逐步覆盖到所有用户的。这不,有的人体验上了,有的人却迟迟体验不上。 于是网友们开始整了一堆玄学,各种疯狂调试,就想早一秒用上 CallKit 。 有人说升级到微信最新版后,重登一下账号就有了;也有人把说语言先切成…

    2025年1月24日
    11400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信