[极简]nanodet训练自己的数据集

庸人自赏

已于 2022-04-14 23:23:01 修改

阅读量1.7k

点赞数

CC 4.0 BY-SA版权

文章标签：深度学习计算机视觉人工智能

于 2022-04-14 23:22:25 首次发布

本文链接：https://blog.csdn.net/Hurt_Town/article/details/124184520

一、准备数据集

cd nanodet
mkdir demo
cd demo
mkdir train
cd train
mkdir img
mkdir ann
cd ..
mkdir val
cd val
mkdir img
mkdir ann
cd ..

把原图片和xml标注文件放到train和val下面

二、修改配置文件

cp ./config/nanodet_custom_xml_dataset.yml ./demo

1、修改save_dir
2、修改num_classes
3、修改class_names
4、修改4个path

三、开始训练

python tools/train

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

庸人自赏

关注关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

史上最详细！nanodet及nanodet-plus训练自己的数据集（自定义数据集）（更新时间2025.4.10）

Cat

04-10

1083

nanodet是众多目标检测算法中轻量化、精度高、速度快的典型代表，在YOLO为王的当下也备受推崇，之前给大家分享过如何搭建naonodet的环境以及搭建环境时会遇到哪些BUG，今天给大家分享一下nanodet如何训练自己收集标注的数据集，也就是自定义数据集。

[极简]pytorch版yolov5训练自己的数据集

Hurt_Town的博客

04-11

1136

一、准备数据集 git clone -b v5.0 https://github.com/ultralytics/yolov5.git cd yolov5-v5.0 mkdir VOCdevkit cd VOCdevkit mkdir images cd images mkdir train mkdir val cd .. mkdir labels cd labels mkdir train mkdir val cd .. mkdir VOC2007 cd VOC2007 mkdir Annotations

1 条评论您还未登录，请先登录后发表或查看评论

nanodet训练自己的数据集、NCNN部署到Android

weixin_45977690的博客

11-07

1648

nanodet目标检测训练自己的数据以及在安卓终端的部署

NanoDet-训练自己的数据集

左手coding，右手cooking

03-23

6784

NanoDet简介 nanodet网址：https://github.com/RangiLyu/nanodet NanoDet 是一个速度超快和轻量级的移动端 Anchor-free 目标检测模型。该模型具备以下优势：超轻量级：模型文件大小仅 1.8m；速度超快：在移动 ARM CPU 上的速度达到 97fps（10.23ms）；训练友好：GPU 内存成本比其他模型低得多。GTX1060 6G 上的 Batch-size 为 80 即可运行；方便部署：提供了基于 ncnn 推理框架的 C++

目标检测——使用nanodet训练自己制作的数据集并测试模型，通俗易懂（详细图文教程）

qq_40280673的博客

08-02

1万+

关于目标检测的模型有很多，**nanodet**模型小且轻量化，适合移植部署到硬件设备上，非常推荐学习这个模型。经过我自己踩了无数坑后总结了此教程，助学刚接触nanodet，想要快速上手的学者，教程很详细，学者耐心看。...

nanodet-plus训练自己数据集

小菜的博客

12-29

9696

序言前两天nanodet-plus隆重发布，又赚了一波热度，趁着年底有空，避免被卷死，赶紧学习一波；因为之前有过nanodet的训练实践经历，但是有好长一段时间没用了，代码看的都生疏了，还好作者将新版本合并到老仓库中，代码结构基本上没变，旧的配置文件修改依旧适用，重新上手起来也比较容易，这次打算拿之前的筷子数据集来试试效果，本文记录训练过程。与上一代NanoDet相比，在仅增加1毫秒多的延时的情况下，精度提升了30%。与YOLOv5-n, YOLOX-Nano等其他轻量级模型相比，在精度和速度上也都高了

Nanodet训练自己的数据集并转为onnx和mnn

zfjBIT的专栏

09-29

1793

Nanodet训练自己的数据集

图像去噪IRCNN的Pytorch极简复现代码，包含计算PSNR/SSIM以及训练好的模型文件，可以直接使用，训练自己的数据集

08-30

datasets：数据集所在文件夹 Plt：训练过程指标曲线可视化位置（Loss、PSNR、SSIM与Epoch关系曲线） weights：训练模型保存位置 dataset.py：封装数据集 draw_evaluation.py：绘制指标曲线 model.py：IRCNN模型实现 ...

训练营99页！秋叶极简DeepSeek 7大热点+全套提示词零基础入门

最新发布

02-25

秋叶极简DeepSeek 7大热点+全套提示词零基础入门.pdf》深入介绍了DeepSeek这款AI模型的发展历程、技术突破以及其在中国乃至全球AI领域的影响。文章详细探讨了DeepSeek的成本优势、技术路径、开源策略和应用现状。...

5套PPT模板：毕业答辩、极简设计、中国风、数据分析、艺术展示

12-03

这种模板中通常包含了大量的图表和数据展示空间，可以容纳复杂的数据集和统计图表，如柱状图、饼图、折线图等。它们能帮助观众快速理解数据背后的信息和趋势，非常适合进行科学研究、市场分析、财务报告等领域的展示...

口罩训练数据集及标注文件（适用于 YOLOV5 及NANODET）.zip

03-17

nanodet：:high_voltage:超级快速，轻巧的无锚物体检测模型。 1.8仅1.8mb并在手机上运行97FPS:fire:

02-05

NanoDet 超快速，轻量的无锚物体检测模型。在移动设备上实时。 :high_voltage: 超轻量级：模型文件仅1.8 mb。 :high_voltage: 超快速：移动ARM CPU上97 fps（10.23ms）。 :smiling_face_with_sunglasses: 易于培训：GPU内存成本比其他型号低得多。 GTX1060 6G上可使用批处理大小= 80。 :smiling_face_with_sunglasses: 易于部署：基于ncnn推理框架提供C ++实现和Android演示。新闻！！！ [2021.02.03]支持和主干。请检查。 [2021.01.10]专为边缘NPU或GPU设计的具有较低内存访问成本的NanoDet-g现已上市！检查并下载： | 代码：otcd [2020.12.19]提供了。 [

C++ OpenCV调用onnx格式的NanoDet-plus

04-07

- OpenCV 4.5.1，基于CUDA 11 - NanoDet-plus - 模式.onnx格式 - 以类的形式封装调用

NanoDet-PyTorch:基于NanoDet项目进行小裁剪，专门用来实现PyTorch 版本的代码，下载直接能使用，支持图片、视频文件、摄像头实时目标检测

05-11

NanoDet-PyTorch 说明：NanoDet作者开源代码地址：（致敬）该代码基于NanoDet项目进行小裁剪，专门用来实现Python语言、PyTorch 版本的代码，下载直接能使用，支持图片、视频文件、摄像头实时目标检测。 YOLO、SSD、Fast R-CNN等模型在目标检测方面速度较快和精度较高，但是这些模型比较大，不太适合移植到移动端或嵌入式设备；轻量级模型 NanoDet-m，对单阶段检测模型三大模块（Head、Neck、Backbone）进行轻量化，目标加检测速度很快；模型文件大小仅几兆（小于4M）。 NanoDet 是一种 FCOS 式的单阶段 anchor-free 目标检测模型，它使用 ATSS 进行目标采样，使用 Generalized Focal Loss 损失函数执行分类和边框回归（box regression）模型性能 Model Resolut

目标检测-CPU训练NanoDet-plus自己的数据集

2301_80977231的博客

11-23

1663

NanoDet是一种轻量化模型，速度快并且适合部署在端侧，不过因为模型对于新版本torch和CUDA不太适配（torch>=1.10,

nanodet训练voc数据集

人工智能

02-17

2578

class_names: &class_names ['aeroplane','bicycle','bird','boat','bottle','bus','car','cat','chair','cow','diningtable', 'dog','horse','motorbike','person','pottedplant','sheep','sofa','train','tvmonitor'] num_classes: 20

Nanodet训练自己的轻量级目标检测模型实践

ssunshining的博客

04-06

5169

官方地址:https://github.com/RangiLyu/nanodet 一准备训练的数据: 数据文件目录为如下,分别存放训练集和验证集的图片和xml文件(注意图片和标签一一对应) 二、建立自己yaml文件在config文件夹下建立自己的yaml文件,VOC格式标签参照官方的 https://github.com/RangiLyu/nanodet/blob/main/config/nanodet_custom_xml_dataset.yml 文件进行修改: 注意修改的地方有以下

超轻量目标检测模型NanoDet

热门推荐

行云

11-24

1万+

华为P30上用NCNN移植跑benchmark，每帧仅需10.23毫秒，比yolov4-tiny快3倍，参数量小6倍，COCO mAP(0.5:0.95)能够达到20.6 。而且模型权重文件只有1.8mb，对比动辄数十兆的模型，可以说是相当友好了~ Android Demo 项目地址（提供训练代码到安卓部署一站式解决方案）： RangiLyu/nanodet: ⚡Super fast and lightweight anchor-free object detection model. Onl..

我尝试过yolo，但是使用cpu检测速度为200ms，太慢了，有没有速度更快的检测方法

02-19

<think>好的，用户之前问过目标检测算法，现在提到他们试过YOLO，但CPU上的检测速度是200ms，觉得太慢，想要更快的检测方法。首先，我需要理解他们的使用场景和需求。他们可能在资源受限的环境下工作，比如使用边缘设备或者没有GPU的机器，所以只能依赖CPU。这时候，速度是关键，可能需要轻量级模型或者优化策略。用户可能已经尝试了YOLO的某个版本，比如YOLOv5或v8，但即使在CPU上，速度还不够。我需要考虑不同的YOLO变种是否更适合CPU，比如YOLOv5n或者YOLOv8n，这些是专门设计的纳米版本，参数量更少，可能更快。另外，用户可能没有进行模型转换，比如转成ONNX或者使用OpenVINO优化，这些都能提升CPU上的推理速度。另外，是否有其他轻量级模型比YOLO更适合CPU？比如NanoDet、MobileNet-SSD、Tiny-YOLO，或者EfficientDet-Lite。这些模型设计时考虑了计算效率，可能在CPU上表现更好。还有基于Transformer的RT-DETR，虽然通常需要更多资源，但RT-DETR可能针对实时性做了优化，特别是在使用ONNX或OpenVINO的情况下。用户还可能没有进行后处理优化，比如减少检测的类别数量，调整置信度阈值，或者缩小输入图像的尺寸，这些都能减少计算量。此外，多线程或批处理可能也是提升速度的方法，但在实时检测中可能不适用。需要确认用户是否已经尝试了这些优化步骤，如果没有，提供这些建议可能会帮助他们提升速度。同时，要考虑到用户的技术水平，可能需要给出具体的实现步骤或代码示例，比如如何将YOLO模型转换为ONNX，或者如何使用OpenVINO优化。此外，推荐一些库或工具，比如ONNXRuntime、OpenVINO，以及如何安装和使用它们。还要注意用户可能对准确率有一定要求，但当前主要问题是速度，所以需要在速度和准确率之间找到平衡。比如，YOLO的纳米版本虽然快，但准确率可能有所下降，需要用户根据实际场景权衡。总结下来，回答应该包括优化现有YOLO模型的建议，推荐其他轻量级模型，以及后处理和工程优化方法，同时提供具体的实现步骤和工具，帮助用户在CPU上达到更快的检测速度。在</think>CPU上运行目标检测模型时，速度受限主要受算力和模型复杂度影响。以下是针对**CPU环境优化检测速度**的几种方案，涵盖模型选择、优化技巧和轻量化替代方案： --- ### **一、优化现有YOLO模型** #### 1. **切换更轻量的YOLO变体** - **YOLOv5n / YOLOv8n**：官方提供的“纳米级”（Nano）版本，参数量极小（如YOLOv8n仅2.5M参数），适合CPU部署。 - **Tiny-YOLO系列**：如YOLOv4-tiny、YOLOv3-tiny，牺牲少量精度换取更快的速度（CPU上可达50-100ms/帧）。 #### 2. **模型压缩与格式转换** - **转换为ONNX**：使用PyTorch导出ONNX格式模型（减少框架依赖），并通过ONNX Runtime加速推理。 - **量化（Quantization）**：将模型权重从FP32转为INT8（精度损失可控），速度可提升2-4倍。 ```python # 示例：PyTorch模型动态量化 model = torch.quantization.quantize_dynamic(model, {torch.nn.Linear}, dtype=torch.qint8) ``` - **OpenVINO优化**：将模型转换为Intel OpenVINO格式，利用CPU指令集（如AVX-512）加速。 ```bash mo --input_model yolov8n.onnx --output_dir ov_model ``` #### 3. **调整推理参数** - **缩小输入分辨率**：如从640x640降为320x320，计算量减少约75%。 - **减少检测类别**：限定检测目标种类（如仅检测“人”或“车”），降低后处理复杂度。 - **置信度阈值调优**：适当提高`conf`阈值（如从0.25→0.5），减少冗余计算。 --- ### **二、替代YOLO的轻量级模型** 以下模型在CPU上可能比YOLO更快（部分需量化/优化后）： | 模型 | 特点 | CPU速度参考（ms/帧） | |---------------------|-----------------------------------------|---------------------| | **NanoDet** | 无锚框设计，仅1.8M参数，支持INT8量化 | 30-50ms | | **MobileNet-SSD** | 经典轻量模型，适合低算力设备 | 40-70ms | | **EfficientDet-Lite**| Google官方优化版，平衡速度与精度 | 50-80ms | | **TFLite模型** | 使用TensorFlow Lite转换并量化，适配移动端 | 20-60ms | | **FastestDet** | 专为CPU设计的极简模型（<1M参数） | 10-30ms | --- ### **三、工程优化技巧** 1. **多线程/异步处理**： - 使用Python的`ThreadPoolExecutor`或C++多线程拆分预处理、推理、后处理步骤。 2. **模型预热**： - 首次推理前加载模型并运行空数据，避免首次调用延迟。 3. **批处理（Batch Inference）**： - 合并多帧输入一次性推理（适合视频流处理），减少单帧平均耗时。 --- ### **四、推荐工具链** 1. **推理框架**： - **ONNX Runtime**：支持多平台，启用`execution_provider=CPU`优化。 - **OpenVINO**：Intel CPU专用，支持INT8量化与指令集加速。 - **TensorFlow Lite**：适合移动端部署，支持GPU/NNAPI加速。 2. **代码库参考**： - NanoDet官方实现：https://github.com/RangiLyu/nanodet - OpenVINO+YOLO示例：https://github.com/openvinotoolkit/open_model_zoo --- ### **五、实测对比建议** 1. **测试步骤**： - 下载预训练轻量模型（如YOLOv8n、NanoDet）。 - 转换为ONNX/OpenVINO格式并量化。 - 使用优化后的框架（如ONNX Runtime）运行测试。 2. **示例代码（ONNX Runtime）**： ```python import onnxruntime as ort sess = ort.InferenceSession("yolov8n_quantized.onnx", providers=['CPUExecutionProvider']) outputs = sess.run(None, {"input": preprocessed_image}) ``` --- ### **六、总结** - **最快方案**：`FastestDet`或量化后的`NanoDet`（10-50ms/帧）。 - **平衡方案**：量化后的`YOLOv8n` + OpenVINO优化（约50-80ms/帧）。 - **注意事项**：速度提升可能伴随精度下降，需根据场景权衡。若允许，尝试结合GPU（如Intel核显OpenCL）进一步加速。