音视频技术的高光时刻: LiveVideoStackCon 2019上海 音视频技术大会

Mux流媒体专家PhilCluff在4月19、20日举办的LiveVideoStackCon2019上海音视频技术大会中发表了主题演讲,并根据自己在大会中的所见所闻…

大家好,又见面了,我是你们的朋友全栈君。

640?wx_fmt=jpeg

Mux 流媒体专家Phil Cluff在4月19、20日举办的LiveVideoStackCon 2019上海音视频技术大会中发表了主题演讲,并根据自己在大会中的所见所闻,对其它部分精彩内容进行了详细的分析与总结。


文 / Phil Cluff

译 / John

原文 

https://mux.com/blog/highlights-livevideostackcon-shanghai-2019/

上个月,我很荣幸地被邀请参加在上海举办的LiveVideoStackCon 2019 音视频技术大会并就如何设计出色的视频API进行了主题演讲。不得不说,这是一场由LiveVideoStack组织的专注于在线流媒体等音视频技术、服务与解决方案的饕餮盛宴。

LiveVideoStackCon 2019对我们——Mux与Demuxed会议的运营者来说是一个不错的能与音视频行业的优秀同仁沟通交流机会,因此我决定跨越大半个地球来到令人惊叹的上海参加这场技术大会。

为期两天的LiveVideoStackCon 2019 上海吸引了400-500名中国最优秀、最具创新力的音视频工程师。在这场大会中我不仅发表了主题演讲,还参与了多场讲座与圆桌会议,内容包括但不限于AI+多媒体、视频编解码、开源技术栈与多媒体传输网络。虽然我的中文不算出色,但凭借在音视频领域的多年耕耘与谷歌翻译的良好协助,我完全体会到了与会嘉宾和观众的热情以及音视频技术不断发展的澎湃动力。

 

640?wx_fmt=jpeg


中国正在成为机器学习的领导者

尽管在Mux,我们认为自己是将机器学习应用在音视频领域的行业领导者——例如我们的基于机器学习的Per-Title编码解决方案与和自适应编码相关的产品等;但让我们感到震惊的是,我们在LiveVideoStackCon上看到的大量基于机器学习的解决方案与商业应用,从TCP的选择到图像识别优化,都是借助神经网络得以实现。我们十分期待能在Demuxed 2019看到这样机器学习的行业应用百花齐放的局面。

来自中兴微电子的人工智能首席科学家徐科借主题演讲,深入浅出地分享了如何将机器学习运用于视频传输与分析当中;除此之外徐科还谈到了机器学习在计算机视觉领域的一些挑战并提供了一系列应用实例,让我倍感惊讶的是在这场演讲上,徐科对去年十月在“自然”杂志上发表的一篇题为《基于伦理学的机器学习实验(“The Moral Machine experiment” )》的论文进行了可视化分析。此实验旨在分析危险发生时人们的主观选择对于机器学习算法的影响,并揭露了不同国家与地区文化和社会的差异——例如当危机发生时,英国人相对于美国人更愿意把更多生存的机会留给年轻人。

 

640?wx_fmt=jpeg


我最喜欢的基于机器学习的解决方案之一是用于选择由智能手机拍摄的照片,其最佳曝光后处理设置参数的机器学习训练算法,该算法由同济大学开发并逐渐落地。除了执行所有我们已知的传统方法,此解决方案还执行了Google的“Auto Awesome”特性。

为什么中国会成为机器学习领域的领导者?从一些研究机构给出的结果我们不难找到答案——首先,中国拥有全球规模最大的消费电子市场,这不仅仅是因为中国拥有全世界最多的人口数量,还因为中国拥有一个以技术为导向的社会与市场。与西方相比,中国的移动支付技术正经历着爆炸式增长。据观察,中国政府对人工智能研究的投入大大高于其他任何西方国家,尤其对于图像分析和面部识别的研究更是颇为重视,西方国家需要花费很大资源与时间才能赶上中国现在取得的技术水平。

中国仍在继续推进自己的视频编解码器

在之前的很长一段时间内,我并没有在维基百科等渠道听说过AVS(Audio Video Standard)——一个几乎只在中国开发与使用的音视频多媒体编解码器。AVS的第一个版本实现了足以比肩MPEG 2与H.264的压缩比,其中编解码器的更新版本AVS +压缩效果大致与H.264相当。AVS解码器通常位于机顶盒中以接收有线和卫星广播,在一些Android电视或机顶盒中我们可以发现AVS系编解码器的存在。而自亚马逊宣布推出Alexa语音服务以来,依赖Google Android的AVS发展面临重重阻力,特别是因为Alexa现在开始越来越多地出现在家庭智能影音设备之中。

但出乎我意料的是AVS协议仍处于积极的开发状态中且最新的标准版本AVS2声称其压缩性能已优于HEVC。令人遗憾的是,由于未能实现桌面浏览器或iOS设备的支持,AVS2似乎不太可能在中国以外的其他地区取得商业成功,尽管与HEVC相比,AVS2具有更明智的专利池结构。

基于AV1的商用编码器不断涌现

 

640?wx_fmt=png


虽然诸多中国公司继续对AVS2等本土编解码器追加投资,但开源编解码器特别是AV1仍为大家关注的重点。来自腾讯的刘杉借主题演讲对当前编解码器的总体发展进行了精彩的阐述,而Zoe Liu则以AV1的更新为主题,详细介绍了rav1e与dav1d的最新改进;除此之外,Zoe Liu的公司Visionular构建了一套基于机器学习的增强型视频编码器,她展示了这套全新开发的AV1编码器Aurora的一些参数与数据。从质量和性能的角度来看,目前Aurora的综合性能优于libaom;而某些测试序列的VMAF得分则提高了30%以上,在质量和编码性能方面Aurora也优于lib-x265。值得注意的是,libaom并未针对性能进行特别优化,而是被设计成参考级编码器。

尽管Zoe并没有比较Aurora与rav1e或SVT-AV1,尽管两者都可在许可证下免费获得,但我们相信,为了与免费产品竞争,Aurora必须表现出足够的速度或质量改进。然而Visionular宣称即将推出一款软件实时编码器,这在商业市场上还属首例。

在Mux,我们将继续研究、开发和测试AV1生态系统中的商业与免费软件。我们坚信开放的编解码器生态系统适合每一个参与音视频行业建设的开发者,我们希望为此生态系统的良性发展作出贡献。

备用TCP堆栈逐渐普及

TCP的举足轻重有目共睹。尽管在大多数互联网设备与服务中被使用,但TCP并非为互联网而生。现代网络架构与CDN并不一定需要TCP中存在的积极拥塞与流量控制机制。

很长一段时间以来,企业为了提高数据吞吐量,减少延迟并增强数据链路的可靠性,一直在尝试实现兼容TCP的网络堆栈。其中尝试的一些方法依赖于在已经接收到先前有效载荷的TCP ACK之前抢先发送的后续数据序列,其目的是有效调整拥塞控制算法。但此类型技术需要被微调以减少阻碍正常带宽的风险, TCP应当与同一网络上更传统的TCP实现共存。

来自Akamai的Will Law在LiveVideoStackCon上借主题演讲详细阐述了Akamai如何通过兼容各种不同的TCP以提供最佳性能的TCP协议加速技术,包括FastTCP(2012年被Akamai收购)、BBR(Google的TCP替代方案,被Fastly与Spotify使用)、RENO与CUBIC等。与此同时,Akamai正致力于训练神经网络,该网络可以识别出在每个HTTP请求中使用何种拥塞控制算法以达到最佳效果。不得不说这真的很新颖!

在中国的这段时间我也有幸与Cascade Range Networks的Sean进行了交谈,并了解一些他们正尝试使用兼容性TCP替代Linux网络堆栈的探索。让我印象深刻的是,他们借软件部署设备之间的差异,实现从10美元的闭路电视摄像机到10,000美元的核心网络服务器都显示出性能的显着提升。

我们将密切关注这一领域的发展。我们对Cascade Range Network的产品以及即将推出的谷歌BBR V2感到非常期待。

摘要

如果你有机会来到中国,那么LiveVideoStackCon将是一场不容错过的绝佳技术盛宴。我非常享受在上海的时光,更多是因为这里有着与欧美等国家截然不同的技术发展理念,让我们学会了掌握核心技术的特别奥义。


LiveVideoStack  招募

LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒及技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。

640?wx_fmt=jpeg

LiveVideoStackCon 2019北京正在招募讲师,无论你是技术派还是学术派,亦或是行业专家,无论你的团队有多小、有多新,都可以来申请成为LiveVideoStackCon的讲师。点击【阅读原文】了解更多大会相关信息。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/129445.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • KindEditor配置ctrl+enter提交

    KindEditor配置ctrl+enter提交今天花费了一些时间去想怎么配置,网上也没有直接找到这方面的资料。后面突然看到一个网页,提交也是用了相同的编辑器。就学习了一下。//创建编辑器functioncreateEditor(){KindEditor.ready(function(K){ChatEditor=K.create(‘textarea.win_chat_textarea’,{width:’100%’,

    2022年10月10日
    4
  • 就业更看重本科学历还是研究生学历(大厂面试的员工什么水平)

    前言我是一个普通本科出身的Android程序员,我的学校也不过就是一个普通二本。嗯,我的学弟学妹们也是一样的,都是普通二本。但是和我不同的是,现在的社会越来越浮躁了,浮躁的让人沉不下心认真做事,让人忍不住去想各种有的没的。比如我的这些学弟学妹们。我已经不止一次收到来自他们的私信了,他们问的内容,无一不是表达对自己学历的自卑和对即将离开学校的自己的不自信,还有对面试被拒的伤心。千篇一律的问题,基本内容如下:面试挂了,大厂面试到底更看重学历还是技术?我这样的学历在求职中有什么需要注意点的点吗?

    2022年4月11日
    85
  • java actioncontext_关于struts2中ActionContext的实现原理

    java actioncontext_关于struts2中ActionContext的实现原理北京,雾霾天气阻止了今天的马拉松之行,蜗居一天。为一个问题“struts2如何保证ActionContext每次取的都是本次请求所对应的实例?”,给一个网友解释了半天。首先,我们知道,struts2和struts1的一个重要区别就是它进行了Action类和Servlet的解耦。而又提供了获取ServletAPI的其它通道,就是ActionContext(别跟我说还有个ServletActionC…

    2025年10月14日
    6
  • 什么是移动端开发【重点学习系列—干货十足–一万字详解】

    什么是移动端开发【重点学习系列—干货十足–一万字详解】引言这一篇文章主要对移动端开发相关的基础知识点,进行总结。从移动端开发的一些概念、专有名词、缩放、viewport移动端事件、适配问题以及一些工作中沟通经常会用到这些方面来说一下移动端1-移动端开发相关概念移动端特点移动端与PC端网页有所不同,有以下几个特点小屏幕触摸交互屏幕尺寸繁多屏幕大小​屏幕大小指屏幕的对角线的长度,单位一般是英寸。常见的手机屏幕大小3.5、4…

    2022年6月24日
    39
  • linux mysql 修改表名_Linux下mysql怎么设置表名?「建议收藏」

    linux mysql 修改表名_Linux下mysql怎么设置表名?「建议收藏」Linux下mysql可以通过“ALTERTABLE旧表名RENAME[TO]新表名;”语句来修改表名;还可以通过配置my.cnf文件,修改“lower_case_table_names”选项的值为“1”来设置表名不区分大小写。Linux下mysql设置表名在MySQL中,可以使用ALTERTABLE语句来实现表名的修改。在MySQL中可以使用ALTERTABLE语句…

    2022年5月31日
    34
  • 深入理解Java类型信息(Class对象)与反射机制

    深入理解Java类型信息(Class对象)与反射机制【版权申明】未经博主同意,谢绝转载!(请尊重原创,博主保留追究权)http://blog.csdn.net/javazejian/article/details/70768369出自【zejian的博客】关联文章:深入理解Java类型信息(Class对象)与反射机制深入理解Java枚举类型(enum)深入理解Java注解类型(@Annotation)深入理解

    2022年6月9日
    30

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号