半自动图像标注(官方自带YOLOv5的半自动标注方法)
这篇博文介绍一下YOLOv5自带的一个生成标签的方式 ,前提是有一个已经训练好的权重!! 1 、权重可以来自官方提供的 ,比如v5的权重包含80类别 ,如果包含了你要训练的类别 ,就可以用官方权重去打标签;2 、或者你的数据集打好一部分标签 ,自己先训练出一个权重 ,用训练出的权重去检测剩下的图片 ,生成标签文件等等 。
目录
1 、利用现有的权重去检测图片 ,得到标签文件
1.1修改相应参数
2 、对生成的标签文件使用IableImg进行微调
3 、将所有标签微调好了后 ,下面是对数据进行划分 。
1 、利用现有的权重去检测图片 ,得到标签文件
找到YOLOv5的detect.py文件 ,以我下面检测行人为例 ,可以去官网下载YOLOv5X.pt,因为官方权重包括行人类 ,所有可以直接使用 ,这里建议下载最大的,因为检测精度高 。
1.1修改相应参数
1 、参数save-txt的末尾添加default = True ,这个参数就是保存检测的标签文件 。
parser.add_argument(--save-txt, action=store_true, help=save results to *.txt,default=True)2 、参数nosave的的末尾添加default = True ,这个参数是是否保存检测后图片 ,设置不保存 。
parser.add_argument(--nosave, action=store_true, help=do not save images/videos,default=True)3 、然后官网权重是80类别 ,我现在只想检测行人 ,可以在pycharm的Termina运行该detect.py
时加上--classes 0,就是只检测行人这个类 。
python detect.py --classes 04 、接下来去找刚才的运行结果 ,一般默认保存在run/detect/文件夹下 ,存在一个labels文件 ,就是我们需要的标签文件 。
2 、对生成的标签文件使用IableImg进行微调
1 、因为用初始权重得到的标签的坐标框信息可能存在一些误差 ,所以还需要进行手动微调 ,哈哈 ,是不是又回到了最开始的打标签的时候 ,这样其实已经能节约很多时间了 。
2、将最开始测试图片和得到的labels文件夹放在一起,使用labelImg打开该文件夹 。
打开labelImg之前 ,先在labels文件夹下手动创建一个classes.txt文件 ,里面写上你的类别名称,防止labelImg的闪退 。
3 、设置打开的图片文件夹 ,设置保存标签的文件夹 ,如下图
完成图片中1,2步后 ,第3步双击右侧图片 ,即可对框进行修改 。
4 、打开自动保存功能 ,如下图
3、将所有标签微调好了后 ,下面是对数据进行划分 。
1 、这里提供一个将数据划分为如下格式的脚本 ,也能用于v5的训练。图片如下
2 、脚本如下:只需要改main函数中 ,文件路径 、rate比列(训练集 ,验证集比列) 。
import os import random import re import shutil def creat_files(): try: shutil.rmtree(./data//images) shutil.rmtree(./data/labels) except: pass try: os.makedirs(./data/images/train) os.makedirs(./data/images/val) os.makedirs(./data/labels/train) os.makedirs(./data/labels/val) except: pass def read_files(path): dir_list = os.listdir(path) for i in dir_list: #利用正则表达 ,切割出图片ID image_id = re.match(r(.*)?.(jpg|png),i).group(1)#图片后缀为jpg ,png,可自行添加后缀格式 labels_name = image_id+.txt #由图片ID找到对应标签名 prob = random.randint(1, 100)#随机数prob if (prob < rate): # train dataset old_images_path = path_images + / + i new_images_path = ./data/images/train + / + i old_labels_path = path_labels + /+ labels_name new_labels_path = ./data/labels/train + / + labels_name shutil.copy(old_images_path, new_images_path) shutil.copy(old_labels_path, new_labels_path) else: # val dataset old_images_path = path_images + / + i new_images_path = ./data/images/val + / + i old_labels_path = path_labels + / + labels_name new_labels_path = ./data/labels/val + / + labels_name shutil.copy(old_images_path, new_images_path) shutil.copy(old_labels_path, new_labels_path) if __name__ == __main__: path_images = ./images #图片的路径 path_labels = ./labels #标签路径 rate = 90 # (1-100)之间 ,90即练集与验证集比例9:1,可以改成自己喜欢的比例 creat_files() read_files(path_images)3 、运行脚本会在代码根目录生成一个data文件 ,里面划分好数据 ,如下:
4 、可以直接把这个data文件夹剪切到YOLOv5中进行训练了 。
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!