LLM大模型_ChatGLM3-6B使用_transformer

最新推荐文章于 2025-08-13 23:25:51 发布

本是少年

最新推荐文章于 2025-08-13 23:25:51 发布

阅读量585

点赞数 4

CC 4.0 BY-SA版权

分类专栏： LLM大模型文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43055565/article/details/142419460

1 前言

ChatGLM3是智谱AI和清华大学KEG实验室联合发布的新一代对话预训练模型，chatglm3-6b采用了全新设计的Prompt格式，除正常的多轮对话外。同时原生支持工具调用（Function Call）、代码执行（Code Interpreter）和Agent任务等复杂场景。

更强大的基础模型：ChatGLM3-6B的基础模型ChatGLM3-6B-Base采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，ChatGLM3-6B-Base具有在10B以下的预训练模型中最强的性能。
更完整的功能支持：ChatGLM3-6B采用了全新设计的Prompt格式，除正常的多轮对话外。同时原生支持工具调用（Function Call）、代码执行（Code Interpreter）和Agent任务等复杂场景。
更全面的开源序列：除了对话模型ChatGLM3-6B外，还开源了基础模型ChatGLM3-6B-Base、长文本对话模型ChatGLM3-6B-32K

2 环境检查

2.1 操作系统

对于操作系统而言，Windows、Mac OS、Linux都是支持的，而对于架构而言，x86是肯定支持的，arm64则要看情况，有些库或者包，有编译aarch64版本的，则也可以使用，没有则需要自己去编译。可玩性完全看个人能力。

2.2 硬件环境

前提条件：未使用其他量化方式，使用了其他量化方式可以以更小资源进行推理

最低要求：

内存：>=8gb
显存：>=6gb

2.3 软件环境

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄7年

17
原创

86
点赞

138
收藏

38
粉丝

关注

私信

热门文章

分类专栏

LLM大模型 3篇
ROS2 1篇
嵌入式开发 1篇
服务 1篇
工具安装 2篇
Linux 1篇
web服务 1篇
计算机基础 1篇
python 5篇

展开全部收起

上一篇：: # 玩转树莓派4B-部署LLM大模型-1

下一篇：: mobile agent学习笔记-1

最新评论

mobile agent学习笔记-1
安静的镜子: 大佬，有改过，模型下载位置吗？
adb连接夜神模拟器
CSDN-Ada助手: 恭喜你写了第13篇博客！看到你能够持续创作，真是让人钦佩。对于这篇关于adb连接夜神模拟器的博客，我觉得你可以在下一步的创作中，加入一些实际操作的步骤和注意事项，这样可以帮助更多的读者更好地理解和应用这项技术。希望你能不断进步，继续分享更多有价值的内容！
Ubuntu22.04 LTS 安装ROS2-Humble
CSDN-Ada助手: 恭喜您在第12篇博客中分享了Ubuntu22.04 LTS安装ROS2的经验！您的持续创作让我们受益良多。希望您能继续分享更多关于ROS2的实践经验，或者可以考虑分享一些ROS2的应用案例和实际项目经验，这样可以让更多读者受益。谢谢您的分享，期待您的下一篇博客！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。