一、背景
由于项目需要训练大量数据集,所以将数据集提前分类保存在不同文件夹,此时作者需要将这些文件夹一次性生成训练集与测试集。
二、需求与思路
前期工作获取到:
(1)文件夹名称.txt文件
(2)对应文件夹中所含图片数量.txt文件
处理要求:
(1)获取到符合数量要求(100<图片数量<=1000)的文件夹名称
(2)提取100张图片按8:2将图片分成训练集(train文件夹)和测试集(test文件夹)
(3)将其以原文件夹名称、原图片名称保存到新的总文件夹下
具体思路如下:
(1)打开两个.txt文件并获取其中的信息分别赋值到两个列表;
(2)同时遍历两个列表的信息;
(3)当读取到的count数据中符合筛选要求,则输出对应的文件夹名称,形成新的遍历路径
(4)通过(3)中获取到的文件夹路径遍历其中的图片
(5)计数100,前80次保存到train文件夹,后20次保存到test文件夹
三、C++代码
C++代码实现如下:
#include <iostream>
#include <fstream>
#include <filesystem>
#include <experimental/filesystem>
#include <opencv4/opencv2/opencv.hpp>
#include <opencv4/opencv2/highgui.hpp>
#include <opencv4/opencv2/imgproc.hpp>
#include <vector>
#include <sys/stat.h>
namespace fs = std::experimental::filesystem;
std::vector<std::string&