【编解码】从零开始写H264解码器(1) 总纲

【编解码】从零开始写H264解码器(1) 总纲关于编解码的原理的书和文章自己一直在看,从入门到略懂,但是感觉有些零零碎碎,或不完整,似乎串不成体系。有些小功能,知道是知道,并不知道它的意义和作用,时间一长也会慢慢忘记。反思了一下,或许很多东西,还是需要自己动手做一遍,会理解的更深更透彻一些,就像费曼学习法,你能讲出来,才说明懂了,这个也一样,你能把功能实现出来,才说明你真的明白了里面的流程和逻辑。

大家好,又见面了,我是你们的朋友全栈君。

1. 背景

因为工作原因,接触编解码也有一段时间了。AVC,HEVC,大大小小的功能都也接触了一些,关于编解码的原理的书和文章自己一直在看。从入门到略懂,感觉有些零零碎碎,或不完整,似乎串不成体系。有些小功能,知道是知道,并不知道它的意义和作用,时间一长也会慢慢忘记。
反思了一下,或许很多东西,还是需要自己动手做一遍,会理解的更深更透彻一些,就像费曼学习法,你能讲出来,才说明懂了,这个也一样,你能把功能实现出来,才说明你真的明白了里面的流程和逻辑。于是乎,在今年过年期间,突然萌生出了写一个解码器的想法,而且一萌生就一直压不住了,一直想赶快动键盘写起来。
其实目前市面上开源好用的解码器有不少,像ffmpeg,x264等等。自己这个工程,应该就是单纯的一个学习工程吧,估计最后再怎么优化也达不到这些大名鼎鼎的工程的效果和功能,但是那又怎么样呢,过程和经历也很棒,不是吗?
刚开始的时候是想写过一个编码器的,思考了一下之后很快就放弃了,我目前的想法只是想熟悉协议,并不是侧重于编码算法,相比之下,编写一个解码器所需要的的知识正是我所需要的。
这就成了这一系列文章的的起因了,算是自己一边写代码,一边写总结吧。
虽说是从“零”开始,但是编解码的基础知识还是要有一些储备的,我会在每一章里对解码所涉及到的知识点做一个介绍和讲解,但是太零碎的,就不会一一说明了。如果知识点太大,可能会单独写一篇来总结。

2. 计划

2.1 写作计划

按照一个解码器的步骤,准备暂时先分成这么几个部分来写

  • NALU:格式,起始码, EBSP RBSP SODB
  • 熵编码之哥伦布熵编码
  • SPS:解析协议里每个成员的意义
  • PPS: 解析协议里每个成员的意义
  • SEI:解析协议里每个成员的意义
  • SLICE Header:解析Header
  • SLICE data:解析slice数据
  • MarcoBlock:怎么还原出一个宏块完整的YUV数据
  • macroblock_layer
  • mb_pred
  • 帧内预测的part的预测模式获取
  • CAVLC
  • residual 残差数据获取
  • 帧内预测的part的预测数据 和 图像数据恢复
  • deblocking
  • ……待定

2.2 项目计划

  • 开发环境
    C语言

  • 包含功能:
    H264是分7个profile的,每个profile便是不同功能的集合。具体区别见wiki百科
    计划 :
    第一阶段做最基础的一个baseline的解码器(无B帧,只有CAVLC,只支持逐行 Progressive)
    第二阶段做mainExtend的解码器(有B帧,有CABAC,支持Progressive和interlace)
    在这里插入图片描述

    后续的就不做支持了。
    解码不做显示,从h264文件解到YUV文件即可。

  • 时间安排:
    预计6个月写完baseline (8月30),
    后续再安排第二阶段。

3. 参考

3.1 参考资料

3.2 参考工程

3.3 参考博客

  1. 从零实现一个H.264码流解析器
    配套工程
  2. 自己动手写 H.264 解码器-ZigZagSin
    配套工程
  3. H264视频解码器C++工程说明
    配套工程

4. 工具准备

4.1 码流分析工具

  • vega: 我用过最专业,分析最好的软件。不过只能蹭单位的使用哈哈,目测应该很贵。
    在这里插入图片描述

  • H264 Visa : 我用的1.15版本,不能用vega的时候使用的。参数解析的比较全面,用于前期判断自己的解析对不对很有帮助。
    在这里插入图片描述
    后面据说有升级版 H.264 CodecVisa,暂时没用。

  • elecard
    试用了一下,感觉使用不是很顺手,论美观好用不如vega,轮参数完整不如H264 Visa。就没太多使用。
    这里记录一下,elecard的软件种类很多,elecard stream analyzer, elecard stream eye,Elecard StreamEye Studio等等。其实 Elecard StreamEye Studio 就包含了stream analyzer,不要被一堆名字搞混了。其中 streamEye算是功能比较全面的。

在这里插入图片描述
在这里插入图片描述

4.2 YUV查看工具

  • 7yuv

4.3 播放器

  • potplayer: 查看h264码流

4.4 一些YUV数据源

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/150705.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 程序连接mysql失败

    程序连接mysql失败

    2021年8月22日
    59
  • 模拟信号采样与AD转换

    模拟信号采样与AD转换1 著名的 Nyquist 采样定理尽管大家都知道 但还是提一提 大牛奥本海姆的 信号与系统 中是这样描述的 Letx t beaband limitedsigna jw 0for w wM Thenx t isuniquelyde nT n 1 1 2 if

    2025年11月10日
    4
  • excel 堆积折线图_什么叫堆积折线图

    excel 堆积折线图_什么叫堆积折线图excel中关于折线图和堆积折现图的解释:“堆积折线图和带数据标记的堆积折线图堆积折线图用于显示每一数值所占大小随时间或有序类别而变化的趋势,可能显示数据点以表示单个数据值,也可能不显示这些数据点。如果有很多类别或者数值是近似的,则应该使用无数据点堆积折线图。提示为更好地显示此类型的数据,您可能要考虑改用堆积面积图。更通俗的解释为: 如果有两个数据系列,折线图中两个数据系列是独立…

    2022年4月20日
    149
  • php 递归[通俗易懂]

    php 递归[通俗易懂]php 递归

    2022年4月20日
    32
  • axure实现点击按钮显示界面_axure哪些可点击怎么区分

    axure实现点击按钮显示界面_axure哪些可点击怎么区分由于公司产品离职,只能自己做了,汗~~整体过程挺好理解的,拖拽一个图片,双击能设置背景图片。然后选中按钮,并双击OnClick2.在弹出的视图中可以修改点击事件的名字3.由于我这个是在当前页面弹出二级页面,所以点击CurrentWindow,并点击要跳转的页面,然后点击ok4、点击ok后,回到工作区发现原来的按钮上有一个数字,表示添加上了点击事件,

    2025年6月12日
    3
  • k8s支持的存储_k8s安装与配置与优化

    k8s支持的存储_k8s安装与配置与优化k8sPV和PVC概述PVPVC生命周期配置存储ConfigMapSecretPV和PVC概述前面我们已经学习了使用NFS提供存储,此时就要求用户会搭建NFS系统,并且会在yaml配置nfs。由于kubernetes支持的存储系统有很多,要求客户全部掌握,显然不现实。为了能够屏蔽底层存储实现的细节,方便用户使用,kubernetes引入了PV和PVC两种资源对象。PV(Persistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PV由kubernetes管理员进行创

    2022年8月11日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号