快速训练自己的目标检测数据集

标注自己的数据集

准备工作

首先创建一个文件夹datasets；
在其中创建一个子文件夹 images，将需要标注的图片（≥100张）放入images文件夹中；
在“images”同路径下新建一个名字为labels的文件夹，用来存放标注过程中生成的标签文件；
在“images”同路径下新建一个名字为xxx.yaml的空文件（如该数据集为口罩检测，则命名为mask.yaml）；
准备好的数据集文件夹如下图所示：

标注数据

双击并运行label_object.exe；
启动之后，这就是软件的界面：
打开需要标注的数据集文件夹datasets，选择“当前文件夹”；
同样的选择并加载yaml文件，加载后如下图所示：
修改图片和标签相对路径为如下图所示：
点击“载入”，可以看到图片区域已经加载好了待标注图片；

请注意：如果该图片没有感兴趣的目标，不需要将该图片放到该数据集中
右边一栏“所有类型”当前什么也没有，可以自己编辑，但ID必须从0开始，逐个加1，标签名字必须是英文（如口罩检测共两个标签，mask和nomask），添加所有要标记的标签；
添加完毕一定要如下图所示点击保存，然后点击OK，否则无法保存标签名字；

注意：后续如果新增了标签类型，即所有类型中新增了ID和名字，也请记得一定要点击保存。
开始标注，将鼠标滑动到图片区域会出现十字框，从左上向右下拖动即可进行画框标注；

图片缩放：移动鼠标至图片区域，滑动鼠标滚轮可以实现图片的缩放；

图片移动：按ctrl+鼠标左键可以上下左右移动图片；
框好口罩区域以后，会弹出标签框，可在下拉框中选择对应标签，点击OK；
此时对象列表里面就有这个对象了；
如果图片中还有其他待标注物体，那么重复9，10两步。这个图标注好以后，点“保存一张图片”，就把标注信息存起来了，只要点击了“保存一张图片”了，关掉软件下次再继续标注也没问题。
点击左边“图片索引”向上箭头，点击OK标注下一张图片。
若有框框错或者框对应的标签选错，则可在对象列表中选中该行，点击“删除标签”；
全部图片标注完成后，关闭label_object.exe；
此时打开labels文件夹，里面是多个txt格式的标签文件，文件名称与图片名称一一对应；
打开txt标签文件，里面的每一行代表图片中的一个矩形框。每一行从左到右依次是：种类序号、矩形中心点x 、矩形中心点y 、矩形宽w、矩形高h，用空格隔开。其中x、y、w、h都是相对于图片总宽、总高的比例；
打开xxx.yaml，可看到格式如下：

训练数据集

设置参数

双击运行ObjectDetection Training.exe界面如下图所示：

训练文件路径：即预训练模型文件和训练之后生成的模型文件存放路径，默认为：C:\ProgramData\VIRobotics\Train\yolov8，大家可以根据需要自己选择，需要注意：路径不要包含中文或空格；
yaml data: 数据文件的路径。该参数指定了数据集文件的位置，例如 coco128.yaml。数据集文件包含了训练和验证所需的图像、标签。演示中选择的是标注生成的xxx.yaml；
epoch：训练轮数。默认为20；这个参数确定了模型将会被训练多少次，每一轮都遍历整个训练数据集。设置数值越大，训练时间越久，模型精度越高，我们可以设置大一些比如100来找到模型的更佳性能；
workers：默认为0，如果电脑显存较大，可以试试将workers设置为1；
model: 预训练模型：默认为yolov8n.pt，也可以选择其他预训练模型例如yolov8s、yolov8m、yolov8l、yolov8x、redetr-l、rtdetr-x。n、s、m、l、x预训练权重越来越大。预训练模型权重越大，训练出来的模型精度相对来说越高，但训练和检测的速度也会越慢。此外，同样型号的模型，rtdetr检测精度和速度比yolov8会更好。各位用户可以根据实际需求来选择预训练模型。
img：输入图像的尺寸，默认为640。这个参数确定了输入图像的大小。可以指定一个整数值表示图像的边长，建议为32的整数倍。（设置策略：如果数据集中存在大量小对象，增大输入图像的尺寸imgsz可以使得这些小对象从高分辨率中受益，更好的被检测出）
batch: 每个批次中的图像数量。在训练过程中，数据被分成多个批次进行处理，每个批次包含一定数量的图像。这个参数确定了每个批次中包含的图像数量，默认为8。一般认为batch越大越好。batch越大选择的这个batch中的图片更有可能代表整个数据集的分布，从而帮助模型学习。但batch越大占用的显卡显存空间越多，如果训练过程中出现GPU显存溢出的报错或者内存不足，可将该值设置的小一点，GPU对2的幂次的batch可以发挥更佳的性能；
若希望训练之后直接生成onnx模型，勾选“训练后生成onnx”，训练结束后会自动弹出生成的onnx模型，该格式的模型可以直接用于仪酷AI系列工具包的推理部署；

开始训练

所有参数配置好了之后，点击Train；
弹出的框中点击“是的”开始进行训练；
训练过程会弹出cmd黑框，请不要关闭，训练完毕会自动关闭，首次训练会自动下载一些必要的文件以及预训练模型，这将会耗费一点时间；
如下图所示训练了20个epoch，黄色进度条满格，则表示整个数据集已经训练完毕，训练生成的pt模型输出在C:\ProgramData\VIRobotics\Train\yolov8\runs\detect\train\weights文件夹中；

【注：多次训练时，输出路径的train会自动变为train2、train3 … 以此类推。】
如果对本次训练的结果不满意，可以用上述的best.pt 或last.pt 作为预训练模型再次训练，而不必用yolov8s.pt 从头开始训练，操作方法如下：将best.pt复制到C:\ProgramData\VIRobotics\Train\yolov8文件夹下，修改model控件中的yolov8s.pt为best.pt，点击Train再次开始训练。

导出为onnx模型

若在训练之前，勾选了训练后生成onnx，则在训练完成后会弹出生成的onnx及所在路径提示框；
点击OK，完成本次训练，可根据实际检测效果来判断是否要继续进行训练；
导出的onnx可以直接用于仪酷AI系列工具包的推理和部署；

常见问题

如在标注或训练过程遇到问题，可查看故障排除

如果您遇到了无法解决的问题，请联系我们的支持团队寻求帮助。联系邮箱： support@virobotics.net