数据集下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz
总说:
详解:
Annotations为注解,主要就是每帧图bndbox的标注,所有会有train和val两个文件夹

所有的train类文件夹都被分为了0000,0001,0002,0003四个类别

每个类别中会以每单个视频为细分依据,命名前五位代表同一细分类别,后三位为具体个例

每个文件夹中存放的是每一帧的对应信息,以.xml文件格式存储

用浏览器打开后可看到具体存储信息,每张图长宽像素值固定,都是1280 x 720,bndbox为对应目标的标注(xmin, ymin)(xmax, ymax)分别为左上角与右下角坐标
Data文件夹中存放的是对应视频和每帧图片
视频存放于snippets文件夹,每帧图片分为test,train,val三个文件夹存放

snippets文件夹也分为test,train,val三个文件夹存放对应视频(.mp4)格式
ImageSets文件夹存放主要是帧数文件的记录
部分借鉴于:https://blog.csdn.net/shenziheng1/article/details/ 在此表示感谢
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/178778.html原文链接:https://javaforall.net
