华为SINQ量化技术发布：大语言模型显存需求直降60%至70% - 微信群发布与分享平台

华为SINQ量化技术发布：大语言模型显存需求直降60%至70%

长按识别二维码

微信号: 次

联系方式:

简介:

0个赞

赞
0个踩

踩
分享

华为苏黎世计算系统实验室近日宣布推出一项革命性的开源量化技术——SINQ（Sinkhorn归一化量化），该技术专为优化大语言模型（LLM）的硬件资源利用而设计。通过创新性的压缩算法，SINQ显著降低了模型运行所需的显存空间和计算成本，为人工智能领域的高效部署提供了新方案。

实验室测试数据显示，SINQ技术对不同规模的大语言模型均展现出强大的压缩能力。在保持模型性能的前提下，显存占用可减少60%至70%。例如，原本需要超过60GB显存才能运行的复杂模型，经SINQ优化后仅需约20GB显存即可部署，大幅降低了硬件门槛。

这项技术的突破性在于其归一化量化机制，通过Sinkhorn算法对模型权重进行高效重构，在压缩过程中最大程度保留了原始模型的信息密度。与传统的量化方法相比，SINQ不仅减少了资源消耗，还维持了模型的推理精度，为大规模语言模型的商业化应用开辟了新路径。

目前，SINQ已作为开源项目对外发布，研究人员和开发者可自由获取相关代码并应用于实际场景。随着人工智能模型规模持续扩大，这项技术有望缓解高算力需求带来的硬件压力，推动更高效的AI系统落地。

更多>同类资讯

日本“妻子”机器人引关注：拟真设计融合情感需求，“生育模拟”成新焦点
科技赋能娱乐新体验：自助KTV如何以创新技术重塑未来场景
汉王科技：从技术先锋到“风口”追逐者，持续亏损下如何寻回初心？
科技赋能自助KTV：创新解决方案与未来娱乐新体验探索
华为SINQ量化技术发布：大语言模型显存需求直降60%至70%
苹果高层人事变动在即硬件主管特纳斯或成CEO热门继任者

PK10赛车微信群2862345 赛车飞艇pk加81288339 赛车飞艇微信群81288339 168赛车飞艇微信81288339 赛车pk飞艇微信群97495882 赛车飞艇群2862345 2024极速pk10赛车群公众号2862345 塞车微信群97495882 衰退忧虑主导市场美股走势不容乐观美国“独立日”变“哀悼日” 团结口号难掩分裂欧洲股市、石油、欧元接连大跌经济衰退恐慌加剧民调：超八成美国人认为美国正朝错误的方向发展《星空》连锁效应为错开档期《博德之门3》《迷失神祇》接连宣布延期 23年情怀不老属于80后的《石器时代：觉醒》首测来袭天涯明月刀手游清爽外观【晨夕·小海螺】来临，数字天刀与黄山论剑爆料邀你先睹为快！枪火重生手游即将更新：小玖携机甲现身，新武器、新玩法登场《生死狙击2》周年庆典开幕，携手星瞳闪耀舞台！《大唐无双》暑期资料片“虎啸神都”今日热血上线！《守望先锋2》发布最新动画短片「纯洁无邪」智械危机开始 MMO《黑色沙漠》回归玩家暴涨335% 新DLC引热度韩服《命运方舟》公开新职业“噬魂师”实机预告国服已开启抢先登陆魔兽故事：泰坦才是最后大BOSS？魔兽新大陆即将开放，世界树又双叒被烧了！发布更多