Linux - 使用V4L2（总结） - 全栈程序员必看

一、什么是V4L2

概述： Video for linux 2（简称V4L2），是linux中关于视频设备的内核驱动。
它也是 linux操作系统下用于采集图片、视频和音频数据的 API接口，配合适当的视频采集设备和相应的驱动程序；

作用： 支持许多USB 网络摄像头，电视调谐器和相关设备，使它们的输出标准化，因此程序员可以轻松地向其应用程序添加视频支持。MythTV，tvtime和Tvheadend是使用V4L框架的典型应用程序；
可以实现图片、视频、音频等的采集。在远程会议、可视电话、视频监控系统和嵌入式多媒体终端中都有广泛的应用。

存放位置： Linux中，一切皆文件，视频设备为设备文件，可以像普通文件一样进行读写操作，而采用 V4L2驱动的摄像头设备文件是 /dev/v4l/video0，为了通用，可以建立到一个和普通摄像头一样的 /dev/video0的链接。

V4L2 架构图如下：

在这里插入图片描述

二、什么是ioctl

概述： ioctl是设备驱动程序中对设备的 I/O通道进行管理的接口函数。
所谓对 I/O通道进行管理，就是对设备的一些特性进行控制，例如串口的传输波特率、马达的转速等等。

作用： 一个字符设备驱动通常会实现设备打开、关闭、读、写等功能，在一些需要细分的情境下，如果需要扩展新的功能，通常以增设 ioctl() 命令的方式实现。例：当你用 read，write不能完成某一功能时，就用 ioctl来操作。
配合一些头文件（v4l2-controls.h / videodev2.h），根据命令，实现对摄像头的操作，如：白平衡、聚焦、曝光、饱和度、亮度…

函数：

#include <sys/ioctl.h> //需要引用的头文件 //参数一：文件描述符 //参数二：设备驱动命令，执行对应操作 //参数三：根据参数二变化 int ioctl(int fd, int cmd, ...) ;

在这里插入图片描述

三、操作流程

打开设备文件。（int fd=open(“/dev/video0”,O_RDWR);）

查询设备属性：取得设备的capability，看看设备具有什么功能，比如是否具有视频输入,或者音频输入输出等。（ioctl(fd_v4l, VIDIOC_QUERYCAP, &cap);）

选择视频输入，一个视频设备可以有多个视频输入。（VIDIOC_S_INPUT, struct v4l2_input）

设置视频采集的参数。 —设置视频的制式，制式包括PAL/NTSC，使用 ioctl(fd_v4l, VIDIOC_S_STD, &std_id)
—设置视频图像的采集窗口的大小，使用 ioctl(fd_v4l, VIDIOC_S_CROP, &crop)
—设置视频帧格式，包括帧的点阵格式，宽度和高度等，使用 ioctl(fd_v4l, VIDIOC_S_FMT, &fmt)
—设置视频的帧率，使用 ioctl(fd_v4l, VIDIOC_S_PARM, &parm)
—设置视频的旋转方式，使用 ioctl(fd_v4l, VIDIOC_S_CTRL, &ctrl)

向驱动申请帧缓冲，一般不超过5个。（ioctl(fd_v4l, VIDIOC_REQBUFS, &req);）
查询帧缓冲区在内核空间中的长度和偏移量（ioctl(fd_v4l, VIDIOC_QUERYBUF, &buf);）
将申请到的帧缓冲映射到用户空间 mmap，这样就可以直接操作采集到的帧了，而不必去复制。（buffers[i].start = mmap (NULL, buffers[i].length, PROT_READ | PROT_WRITE, MAP_SHARED,fd_v4l, buffers[i].offset); ）
将申请到的帧缓冲全部入队列，以便存放采集到的数据。（ioctl (fd_v4l, VIDIOC_QBUF, &buf) ）
开始视频的采集。（ioctl (fd_v4l, VIDIOC_STREAMON, &type) ）
出队列以取得已采集数据的帧缓冲，取得原始采集数据。（ioctl (fd_v4l, VIDIOC_DQBUF, &buf) ）
处理完后，将该帧缓冲重新入队列尾，这样可以循环采集（循环步骤8-10），直到停止采集。
停止视频的采集。（ioctl (fd_v4l, VIDIOC_STREAMOFF, &type) ;）
释放申请的视频帧缓冲区 unmap，关闭视频设备。（close(fd_v4l);）

在这里插入图片描述

1. 打开设备文件

阻塞模式 / 非阻塞模式

—应用程序能够使用阻塞模式或非阻塞模式，打开视频设备。

阻塞操作： 是指在执行设备操作时，若不能获得资源，则挂起进程直到满足操作条件后再进行操作。被挂起的进程进入休眠（不占用cpu资源），被从调度器移走，直到条件满足。在设备驱动中，阻塞的实现通常是通过等待队列。

非阻塞操作： 如果使用非阻塞模式调用视频设备，在不能进行设备操作时，并不挂起或者放弃，或者不停地查询，直到可以进行操作（一直占用CPU资源）。即使尚未捕获到信息，驱动依旧会把缓存（DQBUFF）里的东西返回给应用程序。
非阻塞应用程序通常使用 select系统调用查询是否可以对设备进行无阻塞的访问，最终会引发设备驱动中 poll函数执行。

（建议 V4L2编程中使用阻塞方式打开一个设备文件，除非你能保重开始采集数据时队列里的n块缓存已有数据存在。）

用非阻塞模式打开摄像头设备

int cameraFd = open(“/dev/video0″, O_RDWR| O_NONBLOCK, 0);

用阻塞模式打开摄像头设备

int cameraFd = open(”/dev/video0″, O_RDWR, 0);

若出现错误：error: VIDIOC_DQBUF: Resource temporarily unavailable

在这里插入图片描述

2. 查询设备属性（VIDIOC_QUERYCAP）

函数使用：int ioctl(int fd, int request, struct v4l2_capability *argp);

v4l2相关结构体定义：

struct v4l2_capability { 
     u8 driver[16]; // 驱动名字 u8 card[32]; // 设备名字 u8 bus_info[32]; // 设备在系统中的位置 u32 version;// 驱动版本号 u32 capabilities;// 设备支持的操作 u32 reserved[4]; // 保留字段 };

capabilities 常用值：

V4L2_CAP_VIDEO_CAPTURE （是否支持图像获取）

struct v4l2_capability cap; ioctl(fd,VIDIOC_QUERYCAP,&cap); printf(“Driver Name:%s\nCard Name:%s\nBus info:%s\nDriver Version:%u.%u.%u\n”,cap.driver,cap.card,cap.bus_info,cap.capabilities);

V4L2_BUF_TYPE_VIDEO_CAPTURE （获取设备支持的分辨率）

例一：

 enum v4l2_buf_type type = V4L2_BUF_TYPE_VIDEO_CAPTURE;//初始化 struct v4l2_fmtdesc fmt_1; struct v4l2_frmsizeenum frmsize; struct v4l2_frmivalenum frmival; fmt_1.index = 0; //索引 fmt_1.type = type; while (ioctl(fd, VIDIOC_ENUM_FMT, &fmt_1) >= 0) { 
     frmsize.pixel_format = fmt_1.pixelformat; frmsize.index = 0; while (ioctl(fd, VIDIOC_ENUM_FRAMESIZES, &frmsize) >= 0){ 
     if(frmsize.type == V4L2_FRMSIZE_TYPE_DISCRETE){ 
     printf("line:%d %dx%d\n",__LINE__, frmsize.discrete.width, frmsize.discrete.height); }else if(frmsize.type == V4L2_FRMSIZE_TYPE_STEPWISE){ 
     printf("line:%d %dx%d\n",__LINE__, frmsize.discrete.width, frmsize.discrete.height); } frmsize.index++; } fmt_1.index++; } }

例二：

struct v4l2_capability cap; memset(&cap, 0, sizeof(cap)); /* 获取设备支持的操作 */ if(ioctl(dev->fd, VIDIOC_QUERYCAP, &cap) < 0){ 
     if(EINVAL == errno){ 
     /*EINVAL为返回的错误值*/ printf(stderr,"%s is no V4L2 device\n", dev->dev); return TFAIL; } else { 
     printf(stderr,"%s is not V4L2 device,unknow error\n", dev->dev); return TFAIL; } } //获取成功，检查是否有视频捕获功能 if(!(cap.capabilities & V4L2_CAP_VIDEO_CAPTURE)){ 
     printf(stderr, "%s is no video capture device\n",dev->dev); return TFAIL; } /* streaming I/O ioctls */ if(!(cap.capabilities & V4L2_CAP_STREAMING)){ 
     printf(stderr, "%s does not support streaming i/o\n",dev->dev); return TFAIL; }

在这里插入图片描述

3. 选择视频输入

作用： 一个 video设备节点可能对应多个视频源，比如 saf7113可以最多支持四路cvbs输入，如果上层想在四个 cvbs视频输入间切换，那么就要调用 S_INPUT ioctl来切换。

因此saf7113驱动需要实现一个选择和查询 input的接口，当上层应用调用 v4l2的 G_INPUT S_INPUT时，会调用 saf7113的这个接口。（没用过这玩意儿）

input / output

ID	描述
VIDIOC_ENUMINPUT	枚举所有 input端口
VIDIOC_G_INPUT	获取当前正在使用的 input端口
VIDIOC_S_INPUT	设置将要使用的 input端口
VIDIOC_ENUMOUTPUT	枚举所有 output端口
VIDIOC_G_OUTPUT	获取当前正在使用的 output端口
VIDIOC_S_OUTPUT	设置将要使用的 output端口
VIDIOC_ENUMAUDIO	枚举所有 audio input端口
VIDIOC_G_AUDIO	获取当前正在使用的 audio input端口
VIDIOC_S_AUDIO	设置将要使用的 audio input端口
VIDIOC_ENUMAUDOUT	枚举所有 audio output端口
VIDIOC_G_AUDOUT	获取当前正在使用的 audio output端口
VIDIOC_S_AUDOUT	设置将要使用的 audio output端口

在这里插入图片描述

4. 设置视频属性及采集的参数

常用命令：

命令	作用
VIDIOC_REQBUFS	分配内存
VIDIOC_QUERYBUF	把VIDIOC_REQBUFS中分配的数据缓存转换成物理地址
VIDIOC_QUERYCAP	查询驱动功能
VIDIOC_ENUM_FMT	获取当前驱动支持的视频格式
VIDIOC_S_FMT	设置当前驱动的频捕获格式
VIDIOC_G_FMT	读取当前驱动的频捕获格式
VIDIOC_TRY_FMT	验证当前驱动的显示格式
VIDIOC_CROPCAP	查询驱动的修剪能力
VIDIOC_S_CROP	设置视频信号的边框
VIDIOC_G_CROP	读取视频信号的边框
VIDIOC_QBUF	把数据从缓存中读取出来
VIDIOC_DQBUF	把数据放回缓存队列
VIDIOC_STREAMON	开始视频显示函数
VIDIOC_STREAMOFF	结束视频显示函数
VIDIOC_QUERYSTD	检查当前视频设备支持的标准，例如PAL或NTSC

v4l2_format结构如下：

struct v4l2_format { 
      enum v4l2_buf_type type; // 数据流类型，必须永远是V4L2_BUF_TYPE_VIDEO_CAPTURE union { 
      struct v4l2_pix_format pix; struct v4l2_window win; struct v4l2_vbi_format vbi; __u8 raw_data[200]; } fmt; }; struct v4l2_pix_format { 
      __u32 width; // 宽，必须是16的倍数 __u32 height; // 高，必须是16的倍数 __u32 pixelformat; // 视频数据存储类型，例如是YUV4：2：2还是RGB enum v4l2_field field; __u32 bytesperline; __u32 sizeimage; enum v4l2_colorspace colorspace; __u32 priv; };

检查当前视频设备支持的标准（VIDIOC_QUERYSTD）

v4l2_std_id std; do { 
      ret = ioctl(fd, VIDIOC_QUERYSTD, &std); } while (ret == -1 && errno == EAGAIN);

设置视频捕获格式

struct v4l2_format fmt; javamemset (&fmt, 0, sizeof(fmt)); fmt.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; fmt.fmt.pix.width = 720; fmt.fmt.pix.height = 576; fmt.fmt.pix.pixelformat = V4L2_PIX_FMT_YUYV; fmt.fmt.pix.field = V4L2_FIELD_INTERLACED; if (ioctl(fd, VIDIOC_S_FMT, &fmt) == -1) { 
      return -1; }

设置帧数

struct v4l2_streamparm Stream_Parm; memset(&Stream_Parm, 0, sizeof(struct v4l2_streamparm)); Stream_Parm.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; Stream_Parm.parm.capture.timeperframe.denominator =Denominator;; Stream_Parm.parm.capture.timeperframe.numerator = Numerator; io_rel = ioctl(Handle, VIDIOC_S_PARM, &Stream_Parm);

设置缩放（VIDIOC_G_CROP,VIDIOC_S_CROP）

int ioctl(int fd, int request, struct v4l2_crop *argp); int ioctl(int fd, int request, const struct v4l2_crop *argp); struct v4l2_crop { 
      enum v4l2_buf_type type;// 应用程序设置 struct v4l2_rect c; }

在这里插入图片描述

5. 向驱动申请帧缓冲（CAP_BUF_NUM）

功能： 请求V4L2驱动分配视频缓冲区（申请V4L2视频驱动分配内存）
V4L2是视频设备的驱动层，位于内核空间，所以通过 VIDIOC_REQBUFS控制命令字申请的内存位于内核空间，应用程序不能直接访问，需要通过调用mmap内存映射函数，把内核空间内存映射到用户空间后，应用程序通过访问用户空间地址来访问内核空间。

参数说明： 参数类型为 V4L2的申请缓冲区数据结构体类型 struct v4l2_requestbuffers；v4l2_requestbuffers 结构中定义了缓存的数量，驱动会据此申请对应数量的视频缓存。多个缓存可以用于建立FIFO，来提高视频采集的效率。
一般不超过5个，CAP_BUF_NUM = 4

返回值说明： 执行成功时，函数返回值为 0；V4L2驱动层分配好了视频缓冲区；

struct v4l2_requestbuffers req; /* 申请设备的缓存区 */ memset(&req, 0, sizeof(req)); req.count = CAP_BUF_NUM; //申请一个拥有四个缓冲帧的缓冲区 req.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; req.memory = V4L2_MEMORY_MMAP; if (ioctl(dev->fd, VIDIOC_REQBUFS, &req) < 0) { 
       if (EINVAL == errno) { 
       printf(stderr, "%s does not support " "memory mapping\n", dev->dev); return TFAIL; } else { 
       printf(stderr, "%s does not support " "memory mapping, unknow error\n", dev->dev); return TFAIL; } } if (req.count < 2) { 
       printf(stderr, "Insufficient buffer memory on %s\n", dev->dev); return TFAIL; }

在这里插入图片描述

6. 查询帧缓冲区在内核空间中的长度和偏移量（VIDIOC_QUERYBUF）

在这里插入图片描述

获取缓冲帧的地址，长度：

int ioctl(int fd, int request, struct v4l2_buffer *argp);

struct v4l2_buffer结构体：

struct v4l2_buffer { 
       __u32 index; //buffer 序号 enum v4l2_buf_type type; //buffer 类型 __u32 byteused; //buffer 中已使用的字节数 __u32 flags; // 区分是MMAP 还是USERPTR enum v4l2_field field; struct timeval timestamp;// 获取第一个字节时的系统时间 struct v4l2_timecode timecode; __u32 sequence; // 队列中的序号 enum v4l2_memory memory;//IO 方式，被应用程序设置 union m { 
       __u32 offset;// 缓冲帧地址，只对MMAP 有效 unsigned long userptr; }; __u32 length;// 缓冲帧长度 __u32 input; __u32 reserved; };

在这里插入图片描述

7. 将申请到的帧缓冲映射到用户空间 mmap

函数：

void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);

参数说明：
addr：映射起始地址，一般为 NULL ，让内核自动选择
length：被映射内存块的长度
prot：标志映射后能否被读写，其值为 PROT_EXEC,PROT_READ,PROT_WRITE, PROT_NONE
flags：确定此内存映射能否被其他进程共享，MAP_SHARED,MAP_PRIVATE
fd,offset：确定被映射的内存地址

返回成功映射后的地址，不成功返回MAP_FAILED ((void*)-1);

断开映射

// addr为映射后的地址，length为映射后的内存长度 int munmap(void *addr, size_t length);

例：将四个已申请到的缓冲帧映射到应用程序，用buffers 指针记录

buffers = (buffer*)calloc (req.count, sizeof (*buffers)); if (!buffers) { 
        fprintf (stderr, "Out of memory/n"); exit (EXIT_FAILURE); } // 映射 for (unsigned int n_buffers = 0; n_buffers < req.count; ++n_buffers) { 
        struct v4l2_buffer buf; memset(&buf,0,sizeof(buf)); buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; buf.memory = V4L2_MEMORY_MMAP; buf.index = n_buffers; // 查询序号为 n_buffers的缓冲区，得到其起始物理地址和大小 if (-1 == ioctl (fd, VIDIOC_QUERYBUF, &buf)) exit(-1); buffers[n_buffers].length = buf.length; // 映射内存 buffers[n_buffers].start =mmap (NULL,buf.length,PROT_READ | PROT_WRITE ,MAP_SHARED,fd, buf.m.offset); if (MAP_FAILED == buffers[n_buffers].start) exit(-1); }

在这里插入图片描述

8、9、10、11. 将申请到的帧缓冲全部入队列，开始采集视频并处理

概述： 操作系统一般把系统使用的内存划分成用户空间和内核空间，分别由应用程序管理和操作系统管理。
应用程序可以直接访问内存的地址，而内核空间存放的是供内核访问的代码和数据，用户不能直接访问。
v4l2捕获的数据，最初是存放在内核空间的，这意味着用户不能直接访问该段内存，必须通过某些手段来转换地址。

一共有三种视频采集方式： 使用read、write方式、内存映射方式和用户指针模式。

read、write方式：在用户空间和内核空间不断拷贝数据，占用了大量用户内存空间，效率不高。

内存映射方式：把设备里的内存映射到应用程序中的内存控件，直接处理设备内存，这是一种有效的方式。上面的mmap函数就是使用这种方式。

用户指针模式：内存片段由应用程序自己分配。这点需要在v4l2_requestbuffers里将memory字段设置成V4L2_MEMORY_USERPTR。

在这里插入图片描述

//把四个缓冲帧放入队列 for (i = 0; i < CAPBUFNUM; i++) { 
         memset(&buf, 0, sizeof(buf)); buf.type = V4L2BUFTYPE_VIDEO_CAPTURE; buf.memory = V4L2_MEMORY_MMAP; buf.index = i; buf.m.offset = dev->buffer[i].offset; // 将空闲的内存加入可捕获视频的队列  if(ioctl(dev->fd, VIDIOC_QBUF, &buf) < 0) { 
         printf(“ERROR: VIDIOC_QBUF[%s], FUNC[%s], LINE[%d]\n”, dev->dev, __FUNCTION, __LINE); return TFAIL; } } type = V4L2BUFTYPEVIDEOCAPTURE; //打开设备视频流 if(ioctl(dev->fd, VIDIOC_STREAMON, &type) < 0) { 
         printf(“ERROR: VIDIOC_STREAMON[%s], FUNC[%s], LINE[%d]\n”, dev->dev, __FUNCTION, __LINE); return TFAIL; }

获取一帧数据并处理

struct v4l2_buffer buf; CLEAR(buf); buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; buf.memory = V4L2_MEMORY_MMAP; // 从缓冲区取出一个缓冲帧 ioctl (fd, VIDIOC_DQBUF, &buf); // 图像处理 process_image (buffers[buf.index].start); // 将取出的缓冲帧放回缓冲区 ioctl (fd, VIDIOC_QBUF, &buf);

在这里插入图片描述

12、13. 停止视频采集，解除映射，关闭设备

// 停止视频采集，解除映射 int ret = ioctl(fd, VIDIOC_STREAMOFF, &buf_type); munmap(buffer[j].start, buffer[j].length); // 关闭视频设备 close(fd);

在这里插入图片描述

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/221121.html原文链接：https://javaforall.net

Linux – 使用V4L2（总结）

一、什么是V4L2

二、什么是ioctl

三、操作流程

1. 打开设备文件

2. 查询设备属性（VIDIOC_QUERYCAP）

3. 选择视频输入

4. 设置视频属性及采集的参数

5. 向驱动申请帧缓冲（CAP_BUF_NUM）

6. 查询帧缓冲区在内核空间中的长度和偏移量（VIDIOC_QUERYBUF）

7. 将申请到的帧缓冲映射到用户空间 mmap

8、9、10、11. 将申请到的帧缓冲全部入队列，开始采集视频并处理

12、13. 停止视频采集，解除映射，关闭设备

关于作者

全栈程序员-站长

发表回复

Linux – 使用V4L2（总结）

一、 什么是V4L2

二、 什么是ioctl

三、 操作流程

1. 打开设备文件

2. 查询设备属性（VIDIOC_QUERYCAP）

3. 选择视频输入

4. 设置视频属性及采集的参数

5. 向驱动申请帧缓冲（CAP_BUF_NUM）

6. 查询帧缓冲区在内核空间中的长度和偏移量 （VIDIOC_QUERYBUF）

7. 将申请到的帧缓冲映射到用户空间 mmap

8、9、10、11. 将申请到的帧缓冲全部入队列，开始采集视频并处理

12、13. 停止视频采集，解除映射，关闭设备

关于作者

全栈程序员-站长

相关推荐

Gemini、ChatGPT、Qwen、豆包、Claude五大主流AI模型深度对比：技巧、生态与应用全景解析

AI智能体｜扣子(Coze)搭建【爆款泡泡玛特Labubu打工图文】工作流

Python之Pycharm2019安装教程

networkx画有向图和无向图

历年计算机二级Java考试试题及答案（完整版）

pyqt5安装配置_离线安装pyqt5

发表回复

一、什么是V4L2

二、什么是ioctl

三、操作流程

6. 查询帧缓冲区在内核空间中的长度和偏移量（VIDIOC_QUERYBUF）