mask rcnn实现教程「建议收藏」

mask rcnn实现教程「建议收藏」一,首先去github上下载mask-rcnn源码,这里提供一个百度网盘地址链接:https://pan.baidu.com/s/1htJYyNy密码:0r2b含可运行DEMO更新链接:https://pan.baidu.com/s/1HBPtIPz0xpZsCprl7rc6hw密码:bvm5二,下载对应的mask_rcnn_coco.h5模型,这里给出百度网盘下载地址链接:h……

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

一,首先去github上下载mask-rcnn源码,这里提供一个百度网盘地址

链接:https://pan.baidu.com/s/1htJYyNy 密码:0r2b

含可运行DEMO更新链接:百度网盘 请输入提取码 密码:bvm5

二,下载对应的mask_rcnn_coco.h5模型,这里给出百度网盘下载地址

链接:https://pan.baidu.com/s/1drKvfg 密码:yer9

三,运行如下代码,根据提示安装相应的库

import os
import sys
import random
import math
import numpy as np
import skimage.io
import matplotlib
import matplotlib.pyplot as plt

import coco
import utils
import model as modellib
import visualize

对于pycocotools库安装方法如下

git clone https://github.com/pdollar/coco

cd coco/PythonAPI

将makefile中的python 改为python3

然后先运行安装python3-dev

然后命令行输入

make -j8

然后将pycocotools文件夹复制到mask-rcnn下

最 后再

sudo pip3 install h5py

四,当编译器不再报错时运行如下程序

import os
import sys
import random
import math
import numpy as np
import skimage.io
import matplotlib
import matplotlib.pyplot as plt

import coco
import utils
import model as modellib
import visualize

#%matplotlib inline 

# Root directory of the project
ROOT_DIR = os.getcwd()

# Directory to save logs and trained model
MODEL_DIR = os.path.join(ROOT_DIR, "logs")

# Local path to trained weights file
COCO_MODEL_PATH =  "mask_rcnn_coco.h5"


# Directory of images to run detection on
IMAGE_DIR = os.path.join(ROOT_DIR, "images")





class InferenceConfig(coco.CocoConfig):
    # Set batch size to 1 since we'll be running inference on
    # one image at a time. Batch size = GPU_COUNT * IMAGES_PER_GPU
    GPU_COUNT = 1
    IMAGES_PER_GPU = 1

config = InferenceConfig()
config.display()





# Create model object in inference mode.
model = modellib.MaskRCNN(mode="inference", model_dir=MODEL_DIR, config=config)

# Load weights trained on MS-COCO
model.load_weights(COCO_MODEL_PATH, by_name=True)





# COCO Class names
# Index of the class in the list is its ID. For example, to get ID of
# the teddy bear class, use: class_names.index('teddy bear')
class_names = ['BG', 'person', 'bicycle', 'car', 'motorcycle', 'airplane',
               'bus', 'train', 'truck', 'boat', 'traffic light',
               'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird',
               'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant', 'bear',
               'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie',
               'suitcase', 'frisbee', 'skis', 'snowboard', 'sports ball',
               'kite', 'baseball bat', 'baseball glove', 'skateboard',
               'surfboard', 'tennis racket', 'bottle', 'wine glass', 'cup',
               'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
               'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
               'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed',
               'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote',
               'keyboard', 'cell phone', 'microwave', 'oven', 'toaster',
               'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors',
               'teddy bear', 'hair drier', 'toothbrush']



# Load a random image from the images folder
file_names = next(os.walk(IMAGE_DIR))[2]
image = skimage.io.imread(os.path.join(IMAGE_DIR, random.choice(file_names)))

# Run detection
results = model.detect([image], verbose=1)

# Visualize results
r = results[0]
visualize.display_instances(image, r['rois'], r['masks'], r['class_ids'], 
                            class_names, r['scores'])
print('OK')

至此mask-rcnn完成

五,用mask-rcnn训练自己数据

这里提供一个最新源码(没积分的留言联系我,我发给你的邮箱)

点击打开链接

这里我们主要用到源码提供的coco.py

首先我们去如下两个网址下载coco数据集

http://images.cocodataset.org/zips/train2014.zip

http://images.cocodataset.org/zips/val2014.zip

接着我们下载对应的json文件

https://dl.dropboxusercontent.com/s/o43o90bna78omob/instances_minival2014.json.zip?dl=0

https://dl.dropboxusercontent.com/s/s3tw5zcg7395368/instances_valminusminival2014.json.zip?dl=0

可能上面链接失效,这里提供instances_minival2014.json和instances_valminusminival2014.json一个csdn的下载地址json下载

instances_train2014.json和instances_val2014.json百度云下载链接为:

链接:https://pan.baidu.com/s/1qHoeAOULbsAFiPnBr4a8JA 密码:fk62

将上面下载的源码解压,将sample中coco/coco.py复制到Mask_RCNN-master 根目录下,新建一个文件夹coco用来存放我们上面下载的数据图片及json文件

进入coco文件夹中解压train2014.zip和val2014.zip 到当前目录下

解压上面的包含json文件的zip,这里我们只需要

instances_minival2014.json  instances_train2014.json  instances_val2014.json  instances_valminusminival2014.json

这四个json ,在coco目录下新建一个文件夹annotations用来存放上面的四个json,

最终目录如下:

mask rcnn实现教程「建议收藏」

在home目录存放预训练模型mask_rcnn_coco.h5

此时我们可以回到Mask_RCNN-master目录下,运行命令

python3 coco.py train --dataset=coco/ --model=coco

然后我们会看到如下界面

mask rcnn实现教程「建议收藏」

mask rcnn实现教程「建议收藏」

Logs处就是我们保存训练后的模型所在目录

到此,我们成功开始训练coco数据集

六,分析coco数据集

1,为了更好地分析coco数据集,这里我们准备一个工具labelme,这是一个打标的工具

安装方法如下:

pip3 install labelme

安装完成之后打开

labelme

mask rcnn实现教程「建议收藏」

mask rcnn实现教程「建议收藏」

第二幅图就是我们自己给图片打标注后,我们进行保存会生成一个json文件,打开生成的json文件我们可以看到标注的所有点的x,y坐标

mask rcnn实现教程「建议收藏」                                      mask rcnn实现教程「建议收藏」

这个工具可以用来标注我们自己的数据集,然后进行训练。

2,获取coco标注文件内容

coco标注文件比较大,一个json有500M多,我们用普通的记事本是打不开的,这里我们要用到coco官网提供的一个python API包,该api是抽象的,封装了各装函数用来获取json的数据,我们分析后发现该json相当于一个字典文件,键值对形式呈现。

# The following API functions are defined:
#  COCO       - COCO api class that loads COCO annotation file and prepare data structures.
#  decodeMask - Decode binary mask M encoded via run-length encoding.
#  encodeMask - Encode binary mask M using run-length encoding.
#  getAnnIds  - Get ann ids that satisfy given filter conditions.
#  getCatIds  - Get cat ids that satisfy given filter conditions.
#  getImgIds  - Get img ids that satisfy given filter conditions.
#  loadAnns   - Load anns with the specified ids.
#  loadCats   - Load cats with the specified ids.
#  loadImgs   - Load imgs with the specified ids.
#  annToMask  - Convert segmentation in an annotation to binary mask.
#  showAnns   - Display the specified annotations.
#  loadRes    - Load algorithm results and create API for accessing them.
#  download   - Download COCO images from mscoco.org server.
# Throughout the API "ann"=annotation, "cat"=category, and "img"=image.
# Help on each functions can be accessed by: "help COCO>function".

# See also COCO>decodeMask,
# COCO>encodeMask, COCO>getAnnIds, COCO>getCatIds,
# COCO>getImgIds, COCO>loadAnns, COCO>loadCats,
# COCO>loadImgs, COCO>annToMask, COCO>showAnns

from pycocotools.coco import COCO
from pycocotools.cocoeval import COCOeval
from pycocotools import mask as maskUtils
coco=COCO("pycocotools/instances_train2014.json")

mask rcnn实现教程「建议收藏」

mask rcnn实现教程「建议收藏」

mask rcnn实现教程「建议收藏」

3,分析coco中的segemention

我们提取其中一幅图片的segemention用如下代码将其按labelme要求的json格式写入test.txt文件中

l = [345.28, 220.68, 348.17, 269.8, 355.4, 307.36, 377.07, 318.92, 395.85, 370.93, 444.97, 565.96, 473.86, 616.52, 478.19, 628.08, 431.96, 628.08, 401.63, 581.85, 377.07, 477.83, 375.62, 529.84, 387.18, 600.63, 397.29, 628.08, 325.06, 623.75, 216.7, 622.3, 216.7, 606.41, 251.38, 529.84, 223.93, 529.84, 209.48, 528.4, 202.26, 505.28, 193.59, 485.06, 167.58, 375.26, 179.14, 334.81, 203.7, 324.7, 229.71, 313.14, 209.48, 278.47, 193.59, 248.13, 208.04, 188.89, 223.93, 175.89, 236.93, 168.67, 258.6, 162.89, 294.72, 168.67, 310.61, 174.45, 326.5, 197.56]
l0 = []
l1 = []
l3 = []
l4 = []
for i in range(len(l)):
	if i%2==0:
		l0.append(l[i])
	else:
		l1.append(l[i])
for i in range(len(l)):
	if i%2==0:
		l3.append(l[i])
	else:
		l3.append(l[i])
		l4.append(l3)
		l3 = []
print(l0)
print(l1)
print(l4)
f = open("test.txt","w")
for e in l4:
	f.write('\n        [\n          ')
	f.write(str(e[0]))
	f.write(',\n          ')
	f.write(str(e[1]))
	f.write('\n        ],')
f.close()
a = input()

然后我们将之前labelme保存的json文件中的位置坐标进行替换,我们得到如下图片:

mask rcnn实现教程「建议收藏」

最新源码和相关json文件的下载地址见下:

GitHub – wjd1994/mask-rcnn

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/185883.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月4日 下午10:00
下一篇 2022年10月4日 下午10:16


相关推荐

  • JAVA语法基础 标识符 关键字 注释 变量 数据类型与类型转换

    JAVA语法基础 标识符 关键字 注释 变量 数据类型与类型转换1JAVA 语法基础 1 1 标识符标识符可以简单的理解成一个名字 在 Java 中 我们需要标识代码的很多元素 包括类名 方法 字段 变量 包名等等 我们选择的那个名称就称为标识符 一个正确的标识符需要遵循以下规则 1 标识符可以由字母 数字 下划线 美元符 组成 但不能包含 空格等其它特殊字符 2 不能以数字开头 如 123name 就是不合法 3 标识符严格区分大小写 如 tmooc 和 tMooc 是两个不同的标识符 4 标识符的命名最好能反映出其作用 做到见名知意

    2026年3月19日
    1
  • CompareTo Semantics[通俗易懂]

    CompareTo Semantics[通俗易懂]ForthepropertytypesotherthanBOOLEAN,NAME,PATHandBINARY,comparisonrelationsaredefinedintermsoftheresultofthecompareTomethodoninstancesV1andV2oftheJavaclasscorrespondingto

    2022年7月15日
    19
  • Java 是值传递还是引用传递

    Java 是值传递还是引用传递最近整理面试题 整理到值传递 引用传递 到网上搜了一圈 争议很大 带着一脸蒙圈 线上线下查了好多资料 最终有所收获 所以分享给大家 希望能对你有所帮助 首先说下我的感受 这个题目出的很好 但是在 Java 中这个题目是有问题的 在下面我会解释 并且 有很多结论是 Java 中只有值传递 我认为这样说不够严谨 当然如果针对 Java 语言本身来讲 Java 中只有值传递 没有

    2026年3月19日
    3
  • 钩子函数介绍(vue11个钩子函数)

    钩子(hook)又称钩子函数,是在一个有序的周期中的某些特殊时刻,系统内部预先设置好的函数,当系统周期到达指定时刻会自动执行该’钩子’。钩子函数的函数体内容由开发者编写,这绐了幵发者在不同阶段做某些处理的机会。钩子是很多开发语言,前后端都会涉及的概念,是一种形象的说法,源于Windows的消息处理机制。通过设置钩子,应用程序在消息过去前将其钩住,阻止其传递,然后优先处理开发者的自定义内容,俗称’下个钩子’。系统:初始化..钩子ready()运行..钩子beforeEnd(…

    2022年4月12日
    75
  • Tomcat安装及配置教程[通俗易懂]

    Tomcat安装及配置教程[通俗易懂]步骤一:下载Tomcat链接如下:https://tomcat.apache.org/注意:要根据自己的JDK版本选择Tomcat的版本。因本人java版本为10.0.2,故选择Tomcat9.0.31版本(Windows请自行选择64位或32位)步骤二:配置环境变量新建系统环境变量:修改系统Path(变量值末尾添加%CATALINA_HOME%\bin…

    2022年6月4日
    34
  • JAVA设计模式初探之组合模式

    先看看组合模式的定义吧:“将对象组合成树形结构以表示‘部分-整体’的层次结构。组合模式使得用户对单个对象和组合对象的使用具有一致性。”   就拿剪发办卡的事情来分析一下吧。   首先,一张卡可以在总部,分店,加盟店使用,那么总部可以刷卡,分店也可以刷卡,加盟店也可以刷卡,这个属性结构的店面层级关系就明确啦。   那么,总店刷卡消费与分店刷卡消费是一样的道理,那么总店与分店对会员卡的使用

    2022年3月11日
    39

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号