语音信号处理知识点

语音信号处理知识点语音信号处理过程的总体结构:语音输入–>预处理–>数字化–>特征提取预处理:对信号适当放大和增益控制,并进行反混叠滤波来消除工频信号干扰数字化:进行A/D转换特征提取:用反映语音信号特点的若干参数来代表语言 共振峰:当把声道看成一个发音的腔体的时候,激励的频率达到他的固有频率,则声道会以最大的振幅来振荡,即产生共鸣,这个频率称为共振频率(forman…

大家好,又见面了,我是你们的朋友全栈君。

语音信号处理过程的总体结构:

语音输入–>预处理–>数字化–>特征提取

预处理:对信号适当放大和增益控制,并进行反混叠滤波来消除工频信号干扰

数字化:进行A/D转换

特征提取:用反映语音信号特点的若干参数来代表语言

 

共振峰:当把声道看成一个发音的腔体的时候,激励的频率达到他的固有频率,则声道会以最大的振幅来振荡,即产生共鸣,这个频率称为共振频率(formant frequency),简称共振峰(formant)

 

语音信号分析分为时域、频域、倒谱域

时域分析优点:简单直观、清晰易懂、运算量小、物理意义明确

常用的频域分析方法有带通滤波器组方法、傅里叶变换方法和线性预测分析法

频谱分析方法优点:频谱对外界环境变化具有一定的顽健性。利用频域分析获得语音特征具有实际的物理意义。如:共振峰参数、基音周期等参数

倒谱域是将对数功率谱进行反傅里叶变换后得到的

语音信号分析分为模型分析法和非模型分析法。

模型分析法:依据语音信号产生的数学模型,来分析和提取表征这些模型的特征参数:共振峰模型分析和线性预测分析

 

语音信号数字化

数字化之前,必须进行防混叠滤波防工频干扰滤波。防混叠滤波指滤除高于1/2采样频率的信号成分或噪声,是信号带宽限制在某个范围内,否则产生频率混叠;工频干扰指50Hz的电源干扰。

 

语音信号的采样与量化:将语音信号变成时间和幅度都离散的数字信号。

采样:把模拟信号在时间域上进行等间隔取样,两个取样点之间的间隔成为采样周期,倒数称为采样频率。当采样频率大于信号最高频率的两倍的时候,在采样过程中就不会丢失信息,且可以用采样后的信号重构原始信号。

量化:将整个信号的幅度值分成若干个有限的区间,并把落入同一区间的样本点用同一个幅度表示,这个幅度值称为量化值。 零记忆量化、分组量化、序列量化

预加重:提升高频部分,使信号的频谱变得平坦,便于进行频谱分析或升到参数的分析。

                                                                            语音信号处理知识点

u值接近于1,典型取值在0.94~0.97之间,预加重后的信号在分析处理之后需要进行去加重处理。

 

短时加窗处理

为了得到短时的语音信号(10ms~30ms短时间内是平稳的),窗函数平滑地在语音信号上滑动,将语音信号分成帧。分针可以连续,也可以采用交叠分段的方法,交叠部分称为帧移,一般为窗长的一半。

 

 

矩形窗

                                                                     语音信号处理知识点

汉明窗:

                                                       语音信号处理知识点

汉宁窗

                                                        语音信号处理知识点

N为窗口长度,不同的窗函数形状将影响分帧后短时特征的特性。

矩形窗的谱平滑性较好,但波形细节丢失,并且矩形窗会产生泄露现象;而汉明窗可以有效地克服泄露现象,应用范围也最为广泛。

时域分析

短时能量分析:

                                         语音信号处理知识点

语音信号处理知识点表示x(n)经过加窗处理

hn=w2n, En语音信号处理知识点表示信号的第n个点开始加窗函数时的短时能量。

短时能量可以区分清音和浊音,浊音能量比清音大;其次可以用短时能量对有声段和无声段进行判定、对声母韵母分解以及对连字分界等;作为特征中的一维参数来表示语音信号能量的大小和超音段信息。

由于短时能量是对信号进行平方运算,因而人为增加了高低信号之间的差距,可以用短时平均幅值来表示能量变化

                                                           语音信号处理知识点

短时平均过零率:

每帧内信号通过零值的次数。对于连续信号,考察时域波形通过时间轴的情况;对于离散信号,信号采样点符号变化的次数

                                                       语音信号处理知识点

                                                                    语音信号处理知识点

一般,浊音段有较低的过零率,清音段有较高的过零率

将短时平均过零率和短时能量结合起来判断语音起止点的位置,即进行端点检测。

上面定义中计算短时平均过零率容易受到低频的干扰,可以设立一个门限T,将过零率的含义修改为跨过正负门限的次数:

                                                        语音信号处理知识点

待续… …

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/141179.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • WebGPU 初探 – Windows10上Chorme运行WebGPU程序

    WebGPU 初探 – Windows10上Chorme运行WebGPU程序WebGPU 是最新的 Web3D 图形 API 浏览器封装了现代图形 API Dx12 Vulkan Metal 这才是未来的标准 不像 WebGL2 0 苹果直接不支持 好 开始今天的分享 点击链接查看是否支持 WebGPU 首先分享链接 W3CWebGPU 组织 WebGPU 目前的进展可以查看 WebGPU 最新的进展和平台支持情况 WebGPU 文档 WebGPU 的官方介绍 说明比较详细 Web

    2025年7月2日
    2
  • linux的vim显示行号(vim添加行号)

    打开vim的配置文件/etc/vim/vimrcsudovim/etc/vim/vimrc然后找到#setnumber,把注释取消就行了如果没有,就自己加一行转载于:https://www.cnblogs.com/zdj8023/p/10837480.html…

    2022年4月11日
    131
  • 在 vscode 中使用 Git :拉取、提交、克隆

    在 vscode 中使用 Git :拉取、提交、克隆PS:转载此文后,网友在评论中提到还有其它方法,不过目前个人尚在研究中,有兴趣的朋友们也可自行一探究竟…————————————————————————-1、将代码放到码云到码云里新建一个仓库,完成后码云会有一个命令教程按上面的来就行了 码云中的使用教程:Git全局设置:…

    2022年6月29日
    502
  • pycharm的运行环境_pycharm新环境怎么选

    pycharm的运行环境_pycharm新环境怎么选一直用pycharm写代码一直用anaconda管理python环境但是今天我居然发现我不会更改pycharm当前的运行环境到我新建的anacondaenvironment中!配置:系统:win10;GPU:NVIDIAGeForceGTX1050Ti管理平台:anaconda3IDE:Pycharm问题我的anaconda里面有三个环境,第一个是自…

    2022年8月26日
    5
  • hotumoyi吉他_木棒能做什么

    hotumoyi吉他_木棒能做什么乔治拿来一组等长的木棒,将它们随机地砍断,使得每一节木棍的长度都不超过 50 个长度单位。然后他又想把这些木棍恢复到为裁截前的状态,但忘记了初始时有多少木棒以及木棒的初始长度。请你设计一个程序,帮助乔治计算木棒的可能最小长度。每一节木棍的长度都用大于零的整数表示。输入格式输入包含多组数据,每组数据包括两行。第一行是一个不超过 64 的整数,表示砍断之后共有多少节木棍。第二行是截断以后,所得到的各节木棍的长度。在最后一组数据之后,是一个零。输出格式为每组数据,分别输出原始木棒的可能最小长度

    2022年8月9日
    9
  • verilog 移位寄存器与流水灯「建议收藏」

    verilog 移位寄存器与流水灯「建议收藏」用Verilog写一个简单的多功能移位寄存器,并在移位寄存器的基础上进行修改,利用移位功能形成流水灯的效果基本的功能如下:寄存器示意图见下方虚拟面板图有两种改进方式:第一种是把最后一个功能改成循环右移,即此功能模式下,按一下时钟按键(代表时钟信号到来),高三位往右移一位,最低位移动到最高位。按一次移位一次,形成流水灯效果第二种在第一种的基础上把按键时钟改成接入内部时钟,每隔一段时间时钟…

    2022年7月16日
    16

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号