每月见闻202207

Label Studio

在研究目标检测任务时,必定需要了解如何对自定义的数据集做标注,网络上提到最多的就是labelme,然而我觉得labelme并没有那么好用,这是由于标注这块目前还是挺乱的,一方面目标检测数据集的格式各不相同,例如VOC数据集使用的是xml格式的标注images+annotations,标注坐标为xmin、ymin、xmax、ymax,而YOLO又有自己的标注格式images+labels,标注文件是txt格式,很多开源的目标检测源码支持的格式也各不相同,有些是直接将xml、yolo格式的数据集读进来做训练,有些又是转换成AI框架的数据集格式例如tfrecord,再读取进行训练。在了解标注工具时,我了解到Label Studio这个好用的工具,能够对语音识别、目标检测、实例分割等多种任务的数据进行标注

在目标检测的标注任务中,Label Studio能够方便添加label,而且可以对不同类别的Bounding Box自由选择颜色

将标注好的数据支持YOLO、VOC、COCO等格式的导出,非常方便

可以直接在pip中安装label studio,注意不要安装最新版本,访问有些问题

1
pip install -U label-studio==1.4