大模型领域的GGML是什么？

最新推荐文章于 2025-06-03 09:04:16 发布

镰刀韭菜

最新推荐文章于 2025-06-03 09:04:16 发布

阅读量877

点赞数 3

CC 4.0 BY-SA版权

文章标签： GGML 大模型 llama.cpp 量化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ARPOSPF/article/details/141461619

大模型领域的GGML是什么？

什么是GGML

GGML是一个用于机器学习的张量库，它只是一个c++库，允许你在CPU或CPU + GPU上运行llm。它定义了用于分发大型语言模型(llm)的二进制格式。GGML使用了一种称为量化的技术，该技术允许大型语言模型在消费者硬件上运行。

GGML全称是Georgi Gerganov Machine Learning，是由Georgi Gerganov开发的一个张量库（tensor library），Georgi Gerganov是著名的开源项目llama.cpp的创建者。最早在2023年2月份在GitHub上提交更新。

GGML是用C编写的，为大型语言模型提供了基础设施。它定义了一个用于分发LLMs的二进制格式，并提供了Rust语言绑定，以及一系列原生Rust助手函数，以便安全、符合习惯地访问这些绑定。

简单总结就是GGML本身是一个C写的库，用它转换的大模型文件结果就是GGML格式的大模型文件，通常是原有的模型名+GGML。它的目标是让大模型在消费级硬件上产生高性能的工具。GGML起作用的原因有2个：一个是采用量化技术，将原有大模型预训练结果量化（即将原有大模型FP16精度压缩成INT8、INT6精度）；另一个是二进制文件编码，即将量化后的预训练结果通过一种指定的格式变成一个二进制文件。凡是遵从这种二进制格式文件和量化方式的库都可以直接载入这个模型使用。

这里说一下，GGML定义的二进制文件格式包括GGML版本号、模型的超参数、词汇表和模型预训练结果，是按照这个顺序排列的二进制编码数据。很固定的格式。

由于量化和二进制文件格式后，原有的与训练结果文件将大大减少其物理文件大小和显存大小，所以可以用更低的硬件资源运行。

GGML库的特点

Georgi Gerganov在开发完这个库之后还成立了一家公司

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

镰刀韭菜 看在我不断努力的份上，支持我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。