1. 引言
前面欺诈文本分类微调(四):构造训练/测试数据集已经构造出了数据集,更之前的欺诈文本分类微调(一):基座模型选型选好了基座模型,这篇文章将基于构造出的数据集和选定的模型进行欺诈文本分类的微调训练。
关于微调方法,我们将使用比较普遍的Lora:在模型中注入低秩矩阵的方式。
关于训练器,使用transformers库中提供的Trainer类。
2. 数据准备
2.1 加载数据
导入要使用的基础包。
import os
import json
import torch
from datasets import Dataset
impor