深度图转换成点云[通俗易懂]

深度图转换成点云[通俗易懂]一、概述最近由于课题需要数据源,但是没有直接获取的方法,所以只能在周老师http://www.qianyi.info/的网站上自己下载深度图转换成点云数据,大概花了三点的时间,终于弄得差不多了,这里做个记录。二、数据准备和环境配置1、数据下载在http://redwood-data.org/indoor/dataset.html上下载CleanDepthSequence和Groun…

大家好,又见面了,我是你们的朋友全栈君。

一、概述

最近由于课题需要数据源,但是没有直接获取的方法,所以只能在周老师http://www.qianyi.info/的网站上自己下载深度图转换成点云数据,大概花了三天的时间,终于弄得差不多了,这里做个记录。

二、数据准备和环境配置

1、数据下载
在 http://redwood-data.org/indoor/dataset.html 上下载Clean Depth Sequence和Ground-truth Trajectory下的文件,如图:
在这里插入图片描述
本文以Living Room 1作为示例。

2、环境配置
开发工具为QT。根据网站介绍,在进行空间坐标计算的时候需要使用到一个转换矩阵Tk,而这个Tk则是需要在相机的轨迹文件中提取的,而相机的轨迹文件需要使用第1步中的txt文件进行解析得到。解析代码在http://redwood-data.org/indoor/fileformat.html中,提供了C++、Python和MATLAB的版本。

因为使用工具是QT,所以首选了C++版本的解析代码(C++版本需要配置PCL环境,具体配置方案见QT+PCL配置过程),但是在编译时发生错误,经过摸索后发现可能是Eigen与C++版本的问题,暂时没有找到好的解决办法,所以就改成了Python代码,这就涉及到了如何在QT中调用Python的问题,具体方法见QT调用Python模块

3、轨迹文件解析
直接利用Python代码进行解析。
.py文件:

import numpy as np
import numpy.linalg
#import cv2
#import math
#from numpy import array as matrix, arange

class CameraPose:
    def __init__(self, meta, mat):
        self.metadata = meta
        self.pose = mat

    def __str__(self):
        return 'Metadata : ' + ' '.join(map(str, self.metadata)) + '\n' + \
            "Pose : " + "\n" + np.array_str(self.pose)

def read_trajectory(filename):
    traj = []
    with open(filename, 'r') as f:
        metastr = f.readline();
        while metastr:
            metadata = map(int, metastr.split())
            mat = np.zeros(shape = (4, 4))
            for i in range(4):
                matstr = f.readline();
                mat[i, :] = np.fromstring(matstr, dtype = float, sep=' \t')
            traj.append(CameraPose(metadata, mat))
            metastr = f.readline()
    return traj

def write_trajectory(traj, filename):
    with open(filename, 'w') as f:
        for x in traj:
            p = x.pose.tolist()
            f.write(' '.join(map(str, x.metadata)) + '\n')
            f.write('\n'.join(' '.join(map('{0:.12f}'.format, p[i])) for i in range(4)))
            f.write('\n')


def ext():
    write_trajectory(read_trajectory("livingroom1-traj.txt"), "extraction_file.txt")
    print('extraction file successfully')

main.cpp文件:

#include <stdio.h>
#include <stdlib.h>
#include <iostream>

#include <vector>
#include <fstream>
#include <Eigen/Core>
#include <Eigen/StdVector>
#include <Python.h>
using namespace std;

int main()
{ 
   
    Py_Initialize();
    if(!Py_IsInitialized())
    { 
   
        return -1;
    }
    PyObject* pModule = PyImport_ImportModule("transformMatrixExt");
    if(!pModule)
    { 
   
        cout<<"open fail"<<endl;
        return -1;
    }
    PyObject* pFunhello = PyObject_GetAttrString(pModule,"ext");
    if(!pFunhello)
    { 
   
// cout<<"get function ext failed"<<endl;
        return -1;
    }
    PyObject_CallFunction(pFunhello, NULL);
    Py_Finalize();

}

这样就会得到轨迹txt文件了。

三、深度图转换

第二步已经将轨迹文件提取,但是里面的数据非常多,而用C++进行字符串操作远不如使用Python简单,所以这里继续使用Python进行相关文件操作。另外,在http://qianyi.info/scenedata.html中已经给出深度图转换方法,
在这里插入图片描述
所以这里直接上代码。
.py文件:

import numpy as np
import numpy.linalg
import cv2
import math
from numpy import array as matrix, arange
def generate_XYZ(depthBuffer, res, u, v, T):
    fx = 525.0
    fy = 525.0
    cx = 319.5
    cy = 239.5
    z = depthBuffer[res[1]*u+v]/1000
    x = (v-cx)*z/fx
    y = (u-cy)*z/fy
    w = np.array([x, y, z, 1], dtype='f')

    x = T[0,0]*w[0]+T[0,1]*w[1]+T[0,2]*w[2]+T[0,3]*w[3]
    y = T[1,0]*w[0]+T[1,1]*w[1]+T[1,2]*w[2]+T[1,3]*w[3]
    z = T[2,0]*w[0]+T[2,1]*w[1]+T[2,2]*w[2]+T[2,3]*w[3]

    return x, y, z

def readimg():
# img = cv2.imread('00000.png', -1)
# img = cv2.imread('01500.png', -1)
    img = cv2.imread('02869.png', -1)
    res = img.shape
    print(img[1,1])

# print(img[0])
# img = cv2.flip(img, 0)
# cv2.imshow('hh',img)
# cv2.waitKey(0)
    depth_buffer = np.array(np.array(img,dtype=np.float32).flatten())#img.flatten().astype(float32)/255

    T1 = arange(16, dtype='f').reshape(4,4)
    i = 0

    with open("extraction_file.txt", 'r') as f:
        content = f.read().splitlines()
# for stringline in content[7496:7500]:
# for stringline in content[1:5]:
        for stringline in content[14346:14350]:
            j = 0
            for number in stringline.split(' '):
                T1[i,j] = float(number)
                j = j+1
            i = i+1
    print(T1)
    flag = []
    print(res[1])
    for u in range(res[0]):
        for v in range(res[1]):
            x, y, z = generate_XYZ(depth_buffer, res, u, v, T1)
            flag.append([x, y, z])

    with open('02869.ply', 'w') as f:
        f.write('ply\nformat ascii 1.0\nelement vertex '+str(len(flag))+'\nproperty float x\nproperty float y\nproperty float z\nend_header\n')
        for loc in flag:
            f.write(str(loc[0])+' '+str(loc[1])+' '+str(loc[2])+'\n')

    print('finish')

这里需要注意的是,在读取深度图时,需要使用imread( , -1)方法,这样才是读取深度图,而在转换时,网站提到的深度图(u, v, d)坐标分别就是横坐标,纵坐标和深度值(像素值)。另外,在需要用到OpenCV时,发现在python中直接安装cv2库即可,比C++环境下的配置简单很多,暂时还没有发现在功能上太大的区别。

main.cpp文件:

#include <stdio.h>
#include <stdlib.h>
#include <iostream>

#include <vector>
#include <fstream>
#include <Eigen/Core>
#include <Eigen/StdVector>
#include <Python.h>
using namespace std;

int main()
{ 
   
    Py_Initialize();
    if(!Py_IsInitialized())
    { 
   
        return -1;
    }
    PyObject* pModule = PyImport_ImportModule("transformMatrixExt");
    if(!pModule)
    { 
   
        cout<<"open fail"<<endl;
        return -1;
    }
    PyObject* pFunhello = PyObject_GetAttrString(pModule,"readimg");
    if(!pFunhello)
    { 
   
// cout<<"get function ext failed"<<endl;
        return -1;
    }
    PyObject_CallFunction(pFunhello, NULL);
    Py_Finalize();

}

转换结果截图:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这三个分别是http://qianyi.info上面的livingroom1-depth-clean里面的00000.png,01500.png和02869.png三张深度序列图转换成点云的场景截图,如果要还原成一个完整的场景,好像需要把一共2870序列图都要转换。但是这里有个疑问,每张深度图转换出的点云数量是307200个,在网站上可以看到一个完整的点云数量是200多万个,而完整的序列是2870张,所以这个数量最终无法对上,需要继续探索。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/138949.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Origin2018安装教程「建议收藏」

    Origin2018安装教程「建议收藏」Origin是由OriginLab公司开发的一个科学绘图、数据分析软件,支持在MicrosoftWindows下运行,它能支持各种各样的2D/3D图形,其数据分析功能很强大,包括统计,信号处理,曲线拟合以及峰值分析。Origin中的曲线拟合是采用基于Levernberg-Marquardt算法(LMA)的非线性最小二乘法拟合,它强大的数据导入功能,支持多种格式的数据,包括ASCII、Excel、NITDM、DIADem、NetCDF、SPC等等。不仅如此,它的图形输出格式也多种多样,例如JPEG,

    2022年6月14日
    72
  • 【JavaScript——牛客网算法No.HJ2】计算一个字符串中含有某个字符的个数[通俗易懂]

    【JavaScript——牛客网算法No.HJ2】计算一个字符串中含有某个字符的个数[通俗易懂]@No.HJ2@problemdescription:写出一个程序,接受一个由字母和数字组成的字符串,和一个字符,然后输出输入字符串中含有该字符的个数。不区分大小写。@inputdescription:第一行输入一个有字母和数字以及空格组成的字符串,第二行输入一个字符。@outputdescription:输出输入字符串中含有该字符的个数。示例@input:ABCDEFA@output:1varstr1=readline();varstr2=…

    2022年9月28日
    0
  • ubuntu 局域网传输文件

    ubuntu 局域网传输文件scp[可选参数]file_sourcefile_target参数说明:-1:强制scp命令使用协议ssh1 -2:强制scp命令使用协议ssh2 -4:强制scp命令只使用IPv4寻址 -6:强制scp命令只使用IPv6寻址 -B:使用批处理模式(传输过程中不询问传输口令或短语) -C:允许压缩。(将-C标志传递给ssh,从而打开压缩功能) -p:保留原文件的修改时间,访问时间和访问权限。 -q:不显示传输进度条。 -r:递归复制整个目录。 -v:详细方.

    2022年5月24日
    38
  • 单射、双射、满射

    单射、双射、满射映射就是说对于集合X里的每一个元素x,按法则f,在集合Y里都有唯一的y与之对应,那么称f为从集合X到集合Y的映射。记作f:X->Y。映射基本要求是1.对于X中的每一个x,都有对应的y,还有2.一个x,只能有一个唯一的y与之对应。按照其他限制条件不同,可分为以下3种:单射:满足,对于不同的x,经过映射后的y不同。即当x1!=x2,f(x1)!==f(x2)。满足单射的映射可以不满足满射,例如,我们将一个满足单射的映射f的值域放大,此时有y没有x与之对应。满射:满足,Y集

    2022年6月10日
    106
  • 我的第一次WebService接口开发

    我的第一次WebService接口开发前言最近项目上需要对接WebService接口,之前从来没有用过,这次都遇见了。记录下基础的使用和我遇见的问题。正文概述WebService接口百度一搜,各个介绍的都非常详细,由于刚开始没接触,看的也不是很懂。首先记住一句话:WebService是一种跨编程语言和跨操作系统平台的远程调用技术。跨编程语言和跨操作系统平台:也就是说Asp.net开发的WebService我用java代码调用…

    2022年6月12日
    53
  • DLL注入

    DLL注入DLL注入DLL注入原理dll注入实现过程功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML图表FLowchart流程图导出与导入导出导入DLL注入原理在Windows操作系统中,运行的每一个进程都生活在自己的程序空间中(保护模式),每一个进程都认为自己拥有整个机器的控制权,

    2022年5月17日
    59

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号