一:使用pickle保存和调用模型
pickle是Python中比较标准的一个保存和调用模型的库,可以使用pickle和open函数的连用,来将模型保存到本地(注意:使用open进行保存的这个文件是一个可以进行读取或者调用的模型)
import pickle
# 保存模型
pickle.dump(xxx, open("xxx.xxx","wb"))
# open中往往使用w或者r作为读取的模式,但其实w和r只能用于文本文件
# 当希望导入的不是文本文件,而是模型本身的时候,使用wb和rb作为读取的模式,其中wb表示以二进制写入,rb表示以二进制读入
# 模型被保存到了哪里?
import sys
sys.path
# 能够看到Python的运行目录,第一行为模型保存的现有目录,下面为添加到环境变量的目录
导入模型也很简单:
loaded_model = pickle.load(open("xxx.xxx", "rb"))
二:使用joblib保存和调用模型
joblib是scipy生态系统中的一部分,它为Python提供了保存和调用管道和对象的功能,处理numpy结构的数据尤其高效,对于很大的数据集和巨大的模型非常有用,与pickle API非常相似
import joblib
joblib.dump(xxx, "xxx.xxx")
loaded_model = joblib.load("xxx.xxx")
在以上两种保存方法下,都可以找到保存下来的文件,将这些文件移动到任意计算机上的Python下的环境变量路径中(使用sys.path进行查看),则可以使用import来对模型进行调用