【编解码】从零开始写H264解码器(1) 总纲

【编解码】从零开始写H264解码器(1) 总纲关于编解码的原理的书和文章自己一直在看,从入门到略懂,但是感觉有些零零碎碎,或不完整,似乎串不成体系。有些小功能,知道是知道,并不知道它的意义和作用,时间一长也会慢慢忘记。反思了一下,或许很多东西,还是需要自己动手做一遍,会理解的更深更透彻一些,就像费曼学习法,你能讲出来,才说明懂了,这个也一样,你能把功能实现出来,才说明你真的明白了里面的流程和逻辑。

大家好,又见面了,我是你们的朋友全栈君。

1. 背景

因为工作原因,接触编解码也有一段时间了。AVC,HEVC,大大小小的功能都也接触了一些,关于编解码的原理的书和文章自己一直在看。从入门到略懂,感觉有些零零碎碎,或不完整,似乎串不成体系。有些小功能,知道是知道,并不知道它的意义和作用,时间一长也会慢慢忘记。
反思了一下,或许很多东西,还是需要自己动手做一遍,会理解的更深更透彻一些,就像费曼学习法,你能讲出来,才说明懂了,这个也一样,你能把功能实现出来,才说明你真的明白了里面的流程和逻辑。于是乎,在今年过年期间,突然萌生出了写一个解码器的想法,而且一萌生就一直压不住了,一直想赶快动键盘写起来。
其实目前市面上开源好用的解码器有不少,像ffmpeg,x264等等。自己这个工程,应该就是单纯的一个学习工程吧,估计最后再怎么优化也达不到这些大名鼎鼎的工程的效果和功能,但是那又怎么样呢,过程和经历也很棒,不是吗?
刚开始的时候是想写过一个编码器的,思考了一下之后很快就放弃了,我目前的想法只是想熟悉协议,并不是侧重于编码算法,相比之下,编写一个解码器所需要的的知识正是我所需要的。
这就成了这一系列文章的的起因了,算是自己一边写代码,一边写总结吧。
虽说是从“零”开始,但是编解码的基础知识还是要有一些储备的,我会在每一章里对解码所涉及到的知识点做一个介绍和讲解,但是太零碎的,就不会一一说明了。如果知识点太大,可能会单独写一篇来总结。

2. 计划

2.1 写作计划

按照一个解码器的步骤,准备暂时先分成这么几个部分来写

  • NALU:格式,起始码, EBSP RBSP SODB
  • 熵编码之哥伦布熵编码
  • SPS:解析协议里每个成员的意义
  • PPS: 解析协议里每个成员的意义
  • SEI:解析协议里每个成员的意义
  • SLICE Header:解析Header
  • SLICE data:解析slice数据
  • MarcoBlock:怎么还原出一个宏块完整的YUV数据
  • macroblock_layer
  • mb_pred
  • 帧内预测的part的预测模式获取
  • CAVLC
  • residual 残差数据获取
  • 帧内预测的part的预测数据 和 图像数据恢复
  • deblocking
  • ……待定

2.2 项目计划

  • 开发环境
    C语言

  • 包含功能:
    H264是分7个profile的,每个profile便是不同功能的集合。具体区别见wiki百科
    计划 :
    第一阶段做最基础的一个baseline的解码器(无B帧,只有CAVLC,只支持逐行 Progressive)
    第二阶段做mainExtend的解码器(有B帧,有CABAC,支持Progressive和interlace)
    在这里插入图片描述

    后续的就不做支持了。
    解码不做显示,从h264文件解到YUV文件即可。

  • 时间安排:
    预计6个月写完baseline (8月30),
    后续再安排第二阶段。

3. 参考

3.1 参考资料

3.2 参考工程

3.3 参考博客

  1. 从零实现一个H.264码流解析器
    配套工程
  2. 自己动手写 H.264 解码器-ZigZagSin
    配套工程
  3. H264视频解码器C++工程说明
    配套工程

4. 工具准备

4.1 码流分析工具

  • vega: 我用过最专业,分析最好的软件。不过只能蹭单位的使用哈哈,目测应该很贵。
    在这里插入图片描述

  • H264 Visa : 我用的1.15版本,不能用vega的时候使用的。参数解析的比较全面,用于前期判断自己的解析对不对很有帮助。
    在这里插入图片描述
    后面据说有升级版 H.264 CodecVisa,暂时没用。

  • elecard
    试用了一下,感觉使用不是很顺手,论美观好用不如vega,轮参数完整不如H264 Visa。就没太多使用。
    这里记录一下,elecard的软件种类很多,elecard stream analyzer, elecard stream eye,Elecard StreamEye Studio等等。其实 Elecard StreamEye Studio 就包含了stream analyzer,不要被一堆名字搞混了。其中 streamEye算是功能比较全面的。

在这里插入图片描述
在这里插入图片描述

4.2 YUV查看工具

  • 7yuv

4.3 播放器

  • potplayer: 查看h264码流

4.4 一些YUV数据源

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/150705.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月22日 下午5:46
下一篇 2022年6月22日 下午5:46


相关推荐

  • SQL Server 触发器[通俗易懂]

    SQL Server 触发器[通俗易懂]SQLServer触发器

    2022年6月20日
    36
  • ODS浅析_ods分析

    ODS浅析_ods分析1,ODS和DW*根据Bill.Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统”  ;*ODS(OperationalDataStore)操作型数据存储,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“集成的、当前或接近当前的、不断变化的”数据,一般不保留数据的变动轨迹,是数据仓库体系结构中的一个可选部分;ODSDW主要是…

    2026年4月13日
    4
  • java编写文本编辑器_基于java实现文本编辑器.doc

    java编写文本编辑器_基于java实现文本编辑器.doc基于 java 实现文本编辑器 Java 语言程序设计课程设计报告 PAGE14 封面 Java 语言程序设计 课程设计报告设计题目 制作一个文本编辑器分院 电信分院班级 姓名 学号 指导教师 黄建华实验地点 三教机六课设时间 2009 12 20 2009 12 25 二 OO 九年十二月二十五

    2026年3月17日
    1
  • CBIR–Survey.C/GPU优化.Sys搭建「建议收藏」

    CBIR–Survey.C/GPU优化.Sys搭建「建议收藏」基于内容的图像检索(英语:Content-basedimageretrieval,CBIR;或content-basedvisualinformationretrieval),属于图像分析的一个研究领域。基于内容的图像检索目的是在给定查询图像的前提下,依据内容信息或指定查询标准,在图像数据库中搜索并查找出符合查询条件的相应图片。

    2025年10月19日
    4
  • pta 列车调度_数据结构/PTA-列车调度/栈/数组

    pta 列车调度_数据结构/PTA-列车调度/栈/数组火车站的列车调度铁轨的结构如下图所示。两端分别是一条入口(Entrance)轨道和一条出口(Exit)轨道,它们之间有N条平行的轨道。每趟列车从入口可以选择任意一条轨道进入,最后从出口离开。在图中有9趟列车,在入口处按照{8,4,2,5,3,9,1,6,7}的顺序排队等待进入。如果要求它们必须按序号递减的顺序从出口离开,则至少需要多少条平行铁轨用于调度?输入格式:输入第一行给出一个整数N(2≤…

    2022年7月26日
    11
  • main方法的各种书写样式

    main方法的各种书写样式以下是一些正确的和一个错误的:publicstaticvoidmain(String[]args)publicstaticfinalvoidmain(String[]args)staticpublicvoidmain(String[]args)staticpublicsynchronizedvoidmain(String[]args)staticpublicabstractvoidmain(String[]args)//错误,abstract要求没

    2022年5月31日
    41

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号