2023年7月10日发(作者:)
coco数据集_Tensorflow对COCO⽬标检测数据预处理COCO数据集是微软发布的⼀个⼤型图像数据集, 专为对象检测、分割、⼈体关键点检测、语义分割和字幕⽣成⽽设计。这个数据集还提供了Matlab, Python 和 Lua 的 API 接⼝. 该 API 接⼝可以提供完整的图像标签数据的加载, parsing 和可视化。下⾯记录⼀下我是如何利⽤COCO的数据集来制作⽬标检测的数据,以及对数据进⾏增⼴处理的。COCOAPI安装好后,在PythonAPI的⽬录下,有⼀个的⽂件,⽤Jupyter Notebook运⾏这个⽂件,可以看到cocoapi的⽤法,我根据这个⽂件的⽰例来进⾏改造,把COCO的图像数据和⽬标检测⽤到的标注框的数据打包制作为Tensorflow的tfrecord格式的数据,⽅便之后⽤Tensorflow来进⾏训练。代码如下:#-*- encoding: utf-8 -*-TFRECORD数据⽣成后,我们可以进⾏很多的数据增⼴(Data augmentation)的处理了。具体的数据增⼴包括了以下⼏个⽅⾯:1. 对图像⼤⼩调整到固定的⼤⼩(例如416*416),并相应调整Bounding Box的坐标2. 把图像⼤⼩调整到固定的⼤⼩的120%(例如500*500),然后再随机裁剪图⽚到固定的⼤⼩(416*416),并相应调整BoundingBox的坐标3. 对图像进⾏Expand操作,例如随机⽣成⼀个是图像1-3倍⼤⼩的⼀个图像(像素值都为0),然后随机放置这个图像进去。然后再把扩展后的图像调整⼤⼩到固定的⼤⼩(416*416),并相应调整Bounding Box的坐标。相当于缩⼩Bounding Box4. 随机对图像进⾏Patch的操作,Patch的⼤⼩是图像的0.1-1.0,Patch和Bounding Box的IOU值需要在[0.1,0.3,0.5,0.7,0.9]这⼏个随机值中。相当于对Bounding Box进⾏扩⼤5. 随机调整图像的颜⾊,对⽐度,明亮度,并对图像的数值进⾏标准化的操作。具体的代码如下:import
运⾏结果如下:
发布者:admin,转转请注明出处:http://www.yc00.com/web/1688932926a185016.html
评论列表(0条)