sprusr的个人频道
蒸馏或许可以节省训练资源,但理论上蒸馏出的产品能力不可能超过被蒸馏产品。而deepseek在推理数学和代码能力上碾压chapgpt o1. 6park.comdeepseek模型训练的截至日期是2024年7月份。
所有跟帖: ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )
用户名:密码:[--注册ID--]
插入图片 插入Flash
楼主本栏目热帖推荐:
>>>>查看更多楼主社区动态...