A Comprehensive Evaluation of Quantization Strategies for Large Language Models-369IT编程

admin管理员组
文章数量:1130349

本文是LLM系列文章，针对《A Comprehensive Evaluation of Quantization Strategies for Large Language Models》的翻译。

大型语言模型量化策略的综合评价

摘要
1 引言
2 相关工作
3 评估协议
4 评估设置
5 实验结果和讨论
6 结论
局限性

摘要

增加大型语言模型（LLM）中的参数数量通常会提高下游任务的性能，但会增加计算和内存成本，使部署在资源有限的环境中变得困难。由于LLM的兴起，量化技术已经变得流行起来，该技术以最小的性能损失来减少模型权重或激活所需的比特。然而，大多数量化研究使用预训练的LLM，量化对指令调整LLM的影响以及量化LLM的困惑与基准性能之间的关系还没有得到很好的理解。量化LLM的评估通常仅限于语言建模和一些分类任务，使其在其他基准上的性能不明确。为了解决这些差距，我们提出了一个由三个关键维度组成的结构化评估框架：（1）知识和能力，（2）一致性和（3）效率，并在十个不同的基准上进行了广泛的实验。我们的实验结果表明，具有4位量化的LLM可以保持与非量化LLM相当的性能，并且困惑可以作为大多数基准上量化LLM的代理度量。此外，具有较大参数尺度的量化LLM可以优于较小LLM。尽管通过量化节省了内存，但它也会减慢LLM的推理速度。因此，为了在量化LLM的背景下实现解码速度和存储器消耗的平衡优化，大量的工程工作和硬件支持是必不可少的。

1 引言

2 相关工作

3 评估协议

4 评估设置

5 实验结果和讨论

本文是LLM系列文章，针对《A Comprehensive Evaluation of Quantization Strategies for Large Language Models》的翻译。

大型语言模型量化策略的综合评价

摘要
1 引言
2 相关工作
3 评估协议
4 评估设置
5 实验结果和讨论
6 结论
局限性

摘要

1 引言

2 相关工作

3 评估协议

4 评估设置

5 实验结果和讨论

本文标签： Quantization evaluation Comprehensive strategies Models

版权声明：本文标题：A Comprehensive Evaluation of Quantization Strategies for Large Language Models 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1758739818a2783564.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

A Comprehensive Evaluation of Quantization Strategies for Large Language Models

大型语言模型量化策略的综合评价

摘要

1 引言

2 相关工作

3 评估协议

4 评估设置

5 实验结果和讨论

大型语言模型量化策略的综合评价

摘要

1 引言

2 相关工作

3 评估协议

4 评估设置

5 实验结果和讨论

更多相关文章

A Comprehensive Overhaul of Feature Distillation

latex 分布符号_（LaTex全部符号表示）The Comprehensive LATEX Symbol List

暑期文献阅读一：A Comprehensive Study of Jailbreak Attack versus Defense for Large Language Models

【图神经网络综述】A Comprehensive Survey on Graph Neural Networks（V4）

单细胞论文记录(part19)--A comprehensive comparison on cell-type composition inference for ST data

英语写作中“广泛、深入、详细地（的）”extensively、in-depth、at length （comprehensive ）的用法

《A Comprehensive Survey on Community Detection with Deep Learning》简要笔记

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

Through the comprehensive test of the Miwu

Understanding LLMs: A Comprehensive Overview from Training to Inference

Deciphering Testing Techniques: A Comprehensive Exploration of Black-Box, White-Box, and Grey-Box Te

MVTec AD—A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection 2019 CVPR

Linux MongoDB: A Comprehensive Guide

【论文笔记】 图神经网络综述 A Comprehensive Survey on Graph Neural Networks

Analysis and comprehensive comparison of PacBio and nanopore-based RNA sequencing of the Arabidopsis

Java Object: A Comprehensive Guide

RAG综述：《A Comprehensive Survey of Retrieval-Augmented Generation (RAG)》

A Comprehensive Study of Knowledge Editing for Large Language Models

（四十三）：Comprehensive Linguistic-Visual Composition Network for Image Retrieval

【综述】A Comprehensive Survey on Community Detection with Deep Learning

发表评论

推荐文章

下载腾讯视频里的视频_手机腾讯视频如何升级新版本

小米手机android9换字体,教你免费修改小米手机字体

app抓包工具charles安装使用教程

z17刷miui_努比亚Z17刷机包

下载 | Win11 官方精简版，系统占用空间极少！(6月更新、Win 11 IoT物联网 LTSC版、适合老电脑安装使用)

热门文章

android 接电话 返回后黑屏,安卓手机打电话黑屏原因和解决方法

Vigorously promote the brand strategy of wheel loader

conda安装GPU版pytorch，却是cpu版本的原因

anaconda powershell prompt打开jupyter notebook

为什么微信输入法是比搜狗输入法更好的选择？

Ubuntu 安装sougoupinyin搜狗输入法

程序员电脑必备的几款云笔记

Bash Shell：从入门到精通

你应该懂得的关于电脑配置冷知识

绘图工具Draw.io开源免费供下载-draw.io-12.6.5-windows-installer.exe

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

【论文笔记】图神经网络综述 A Comprehensive Survey on Graph Neural Networks

android 接电话返回后黑屏,安卓手机打电话黑屏原因和解决方法

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程