为方便广大人工智能领域科研工作者与应用开发者更高效地进行数据集管理、数据标注以及模型训练等工作,鹏城实验室近期在鹏城汇智代码托管平台(www.ihub.org.cn)上向全球免费正式开源基于BS架构的高效半自动标注平台系统——PLabel。
PLabel系统采用纯Web页面操作,数据存储在服务端,操作便捷且能有效避免标注过程中的数据泄露。系统支持多人协同标注与任务管理,用户可根据自身需求接入相关资源,搭建包含数据集管理、自动标注、人工校验、工作分配、模型重训等功能的一体化数据标注与应用系统。
PLabel系统架构
PLabel系统集成了大量数据标注相关功能,包括数据管理、自动标注、人工标注、ReID标注、车流统计、视频标注、医疗CT标注、超大图像标注等。目前还集成视频抽帧、目标检测、视频跟踪、ReID分类、人脸检测等系列算法,支持用户自行增加目标检测算法,实现对图像、视频的自动标注,并可以对自动算法的结果进行人工标注修订,标注结果支持COCO及VOC格式。
PLabel系统由鹏城实验室叶齐翔、曾炜、田永鸿教授团队自主研发,由工程师邹安平维护,目前已在鹏城实验室人工智能研究中心部分课题组内部署应用。该系统的源代码下载地址和配置文件请访问:
https://code.ihub.org.cn/projects/4420
欢迎从事人工智能数据标注、处理及模型训练相关的研发人员关注和使用PLabel系统,欢迎提出宝贵的意见和建议,帮助我们继续做好系统开发与维护工作。
PLabel系统主要功能
PLabel系统五大方面主要功能。
● 数据集管理
数据集管理提供统一的数据集管理平台,支持如下功能:
1、支持视频(ffmpeg支持的格式)数据集创建。支持视频抽帧及抽帧后文件名定制,支持视频合并,支持MP4格式视频预览。
2、支持图片(常见格式均能支持)数据集创建。
3、支持CT影像数据(.dcm、.ima)集创建。
4、支持超大图像(.tiff,.svs)格式数据集。
5、支持数据集任务指派,即指派的人有权限看到分享的数据集。
6、支持数据集导出。
7、支持数据集带标注导入。
数据集管理界面
● 自动标注
用户可以选择集成好的算法对图片进行目标检测,支持对视频、图片进行自动标注,标注结果可在线查看。目前系统使用的自动标注算法基于mmdetection框架,当前自带了人、车检测,在各种场景下都能支持,且性能较高。自动标注算法模型支持扩展功能,用户可以根据需求集成自己定制的算法模型。
新建自动标注
自动标注结果在线查看
● 人工标注
系统支持对视频、图片、CT数据影像进行人工标注,支持单个图片进行自动标注,支持单目标及多目标跟踪。
1、标注形状可为矩形、多边形或点。
2、标注属性可以按照任务进行自定义。
3、标注数据格式为COCO、VOC,可导出。
4、标注图形可以放大、缩小、拖动、复制、粘贴等。
5、标注任务进度可视化及流程化,标注完成后,可转审核人员进行审核。
人工标注界面
● ReID标注
1、支持多镜头的ReID标注,并可以在下方显示最近ReID标注,方便用户参考。
2、支持结果在线实时查看及修改、删除。
3、支持ReID人的自动分类。
4、支持ReID的抠图导出及原图、标注导出。
5、支持ReID标注对象属性自定义。
ReID标注界面
● 超大图像标注
1、支持20--10000M的大图片标注,目前支持tiff及svs格式。
2、支持标注结果导出。
超大图像标注界面
撰稿/人工智能研究中心 邓清