提取视频中的音频——python三行程序搞定「建议收藏」

提取视频中的音频——python三行程序搞定「建议收藏」写在开头提取音频安装python包提取音频分析音频安装python包读取音频matplotlib画信号强度图librosa画信号强度图写在开头  身处数据爆炸增长的时代,各种各样的数据都飞速增长,视频数据也不例外。我们可以使用python来提取视频中的音频,而这仅仅需要安装一个体量很小的python包,然后执行三行程序!  语音数据在数据分析领域极为重要。比如可以分析语义、口音、根据人的情绪等等。可以应用于偏好分析、谎话检测等等。提取音频  需要..

大家好,又见面了,我是你们的朋友全栈君。

写在开头

  身处数据爆炸增长的时代,各种各样的数据都飞速增长,视频数据也不例外。我们可以使用 python 来提取视频中的音频,而这仅仅需要安装一个体量很小的python包,然后执行三行程序!
  语音数据在数据分析领域极为重要。比如可以分析语义、口音、根据人的情绪等等。可以应用于偏好分析、谎话检测等等。

提取音频

  需要用到 python 包 moviepy,这里是moviepy 的 github 地址

安装 python 包

安装 moviepy,cmd 或 bash 输入

pip install moviepy

提取音频

假设有一个 mp4 文件路径为”e:/chrome/my_video.mp4″,我们想提取其音频保存到”“e:/chrome/my_audio.wav””,那么三行程序为:

from moviepy.editor import AudioFileClip
my_audio_clip = AudioFileClip("e:/chrome/my_video.mp4")
my_audio_clip.write_audiofile("e:/chrome/my_audio.wav")

  执行上面的三行程序,就会发现音频文件已经成功提取到指定文件夹了~ 这里的视频格式和音频格式都支持其他格式,比如读取 m4v 格式视频,保存 MP3 格式音频,下面是我电脑的示例
示例

分析音频

  可以使用 librosa 包来分析音频,这里是librosa 的 github 地址

安装 python 包

安装 librosa,cmd 或 bash 输入

pip install librosa

需要说明,librosa 包本身不支持 MP3 格式,需要一些相关包的支持。官网上说使用 conda 安装则自动安装 MP3 支持的相关包。具体请去librosa 的 github 地址了解。

读取音频

假设有一个 wav 文件路径为”e:/chrome/my_audio.wav”。科普一下音频数据的内容,可以认为记录采样频率每个采样点的信号强度两个部分即可构成一个音频文件。数据流可理解为一个数组,按照字节存储。
下面我们读取音频

import librosa
audio, freq = librosa.load('e:/chrome/my_audio.wav')
time = np.arange(0, len(audio)) / freq
print(len(audio), type(audio), freq, sep="\t")

下图是我电脑的示例,可以看到读取到了采样频率每个采样点的信号强度,采样点共 2121210,频率为 22050,音频长度约 96 秒示例图

matplotlib 画信号强度图

bash 输入

import matplotlib.pyplot as plt
fig, ax = plt.subplots()
ax.plot(time, audio)
ax.set(xlabel='Time(s)', ylabel='Sound Amplitude')
plt.show()

下图是本人电脑示例:示例图

librosa 画信号强度图

当然我们可以使用 librosa 库的工具来分析,可以修掉音频首尾的其他信息,画信号强度图的方式如下:

import  librosa.display
audio, _ = librosa.effects.trim(audio)#Trim leading and trailing #silence from an audio signal.
librosa.display.waveplot(audio, sr=freq)
plt.show()

下图是我电脑的示例:示例图

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144149.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • nginx最全教程_nginx使用教程

    nginx最全教程_nginx使用教程location[=|~|~*|^~]patt{}中括号可以不写任何参数,此时称为一般匹配也可以写参数因此,大类型可以分为3种location=patt{}[精准匹配]locationpatt{}[一般匹配]location~patt{}[正则匹配]——————————————–如何发挥作用?:首先看有没有精准匹配…

    2025年5月23日
    3
  • mysql字符串转数字解决办法

    mysql字符串转数字解决办法1.直接用加法  字符串字段+02.使用函数,这里的type可以为:浮点数:DECIMAL、整数:SIGNED、无符号整数:UNSIGNEDCAST(valueastype);CONVERT(value,type);

    2022年5月30日
    48
  • 基本开关电路

    一、晶体管开关电路:是一种计数地接通-断开晶体管的集电极-发射极间的电流作为开关使用的电路,此时的晶体管工作在截止区和饱和区。当需要输出大的负载电流时,由于集电极电流(负载电流)是放大基极电流而来的,所以必须能够从输入端提供大于1/Hfe的基极电流,这对于输出端的大负载电流情况下的基极驱动电路就无能为力。因此可以采用达林顿管来解决这个问题,达林顿管是一种复合管,它的直流放大倍数Hfe非常大…

    2022年4月5日
    63
  • mac idea2021永久激活码【中文破解版】

    (mac idea2021永久激活码)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月25日
    161
  • SqlServer 函数Declare通过传变量查询超慢解决办法

    SqlServer 函数Declare通过传变量查询超慢解决办法from参考:1,Declare传参查询速度慢,直接放入参数执行sql却快,求大牛给原因2,OPTION(RECOMPILE)提高带参数执行SQL语句的索引效率 遇到的问题:通过参数执行sql函数查询速度超慢示例示例代码:class=”lang:tsqldecode:true”>declare@prefixnvarchar(10)=’095-0021-‘;…

    2022年8月22日
    9
  • Javadeque_deque接口

    Javadeque_deque接口Queue也是Java集合框架中定义的一种接口,直接继承自Collection接口。除了基本的Collection接口规定测操作外,Queue接口还定义一组针对队列的特殊操作。通常来说,Queue是按照先进先出(FIFO)的方式来管理其中的元素的,但是优先队列是一个例外。Deque接口继承自Queue接口,但Deque支持同时从两端添加或移除元素,因此又被成为双端队列。鉴…

    2022年9月20日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号