scratch文字朗读没有声音怎么办_pocketfiles怎样解密

scratch文字朗读没有声音怎么办_pocketfiles怎样解密问题说明今天在使用pocketsphinx_continuous识别中文wav文件是,报如下错误:>pocketsphinx_continuous-hmmzh_broadcastnews_ptm256_8000-lmzh_broadcastnews_64000_utf8.DMP-dictzh_broadcastnews_utf8.dic-infilemyfile…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

问题说明

今天在使用 pocketsphinx_continuous 识别中文 wav 文件是,报如下错误:

> pocketsphinx_continuous -hmm zh_broadcastnews_ptm256_8000 -lm zh_broadcastnews_64000_utf8.DMP -dict zh_broadcastnews_utf8.dic -infile myfile.wav
ERROR: "continuous.c", line 136: Input audio file has sample rate [44100], but decoder expects [16000]

问题原因

这个 myfile.wav 是我从一个 mp3 文件转换过来的,其中是采样率是 44100HZ,而 pocketsphinx_continuous 需要使用 16000HZ 的音频文件。

具体文件是什么采样率,在 linux 上可以使用 soxi 命令查看,比如:

$ soxi myfile.wav
Input File     : 'myfile.wav'
Channels       : 1
Sample Rate    : 44100
Precision      : 16-bit
Duration       : 00:01:26.45 = 3812421 samples = 6483.71 CDDA sectors
File Size      : 7.62M
Bit Rate       : 706k
Sample Encoding: 16-bit Signed Integer PCM

解决办法

解决办法就是使用 sox 命令将音频文件采样率转换成 16000HZ,比如:

$ sox myfile.wav -r 16000 myfile-16000.wav
$ soxi myfile-16000.wav

Input File     : 'myfile-16000.wav'
Channels       : 1
Sample Rate    : 16000
Precision      : 16-bit
Duration       : 00:01:26.45 = 1383191 samples ~ 6483.71 CDDA sectors
File Size      : 2.77M
Bit Rate       : 256k
Sample Encoding: 16-bit Signed Integer PCM

转换后,重新运行语音识别程序。

> pocketsphinx_continuous -hmm zh_broadcastnews_ptm256_8000 -lm zh_broadcastnews_64000_utf8.DMP -dict zh_broadcastnews_utf8.dic -infile myfile-16000.wav
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183449.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 数仓分层ods_跨境电商国内中转仓

    数仓分层ods_跨境电商国内中转仓一、ods层介绍1、保持数据原貌不做任何修改,起到备份数据的作用。2、数据采用LZO压缩,减少磁盘存储空间。100G数据可以压缩到10G以内。3、创建分区表,防止后续的全表扫描,在企业开发中大量使用分区表。4、创建外部表,在企业开发中,除了自己用的临时表,创建内部表外,绝大多数场景都是创建外部表。二、用户行为数据1、启动日志表ods_start_log//创建启动日志…

    2022年10月6日
    0
  • SpringBoot调用.asmx后缀的webservice接口

    SpringBoot调用.asmx后缀的webservice接口目录一、简介二、示例一、简介最近在项目中,在与其他公司做对接中需要回调一个对方的接口,根据对方提供的接口地址,发现是webservice的接口,而且接口后缀名为.asmx,因为现在webservice接口基本上都是wsdl这种形式,所以使用wsdl调用方式不能用,得使用其他方法。WebService是一个SOA(面向服务的编程)的架构,它是不依赖于语言,不依赖于平台,可以实现不同的语言间的相互调用,通过Internet进行基于Http协议的网络应用间的交互。其实WebService.

    2022年6月6日
    28
  • FastCGI介绍

    FastCGI介绍本文主要介绍FastCGI的相关知识。有关CGI的知识,点击此处查看。1.概述FastCGI实际上是增加了一些扩展功能的CGI、是CGI的改进,描述了客户端和Web服务器程序之间传输数据的一种标准。FastCGI致力于减少Web服务器与CGI程序之间进行互动的开销,从而使Web服务器可以同时处理更多的Web请求。与CGI为每个Web请求创建一个新的进程不同,…

    2022年7月11日
    25
  • 什么是bs模型_cs模型人物看不见

    什么是bs模型_cs模型人物看不见C/S结构,即Client/Server(客户机/服务器)结构,是大家熟知的软件系统体系结构,通过将任务合理分配到Client端和Server端,降低了系统的通讯开销,可以充分利用两端硬件环境的优势。早期的软件系统多以此作为首选设计标准。(用的是ip,tcp/udp通信协议)B/S结构,即Browser/Server(浏览器/服务器)结构,是随着Internet技术的兴起,对C/S结构的一种…

    2022年9月17日
    0
  • Linux文本编辑器——vim编译器的全面讲解[通俗易懂]

    Linux文本编辑器——vim编译器的全面讲解[通俗易懂]vim编译器一概述二vim编译器常用的操作命令2.1vim编辑器的启动和退出2.2文件的打开和读取2.3文件保存与另存为2.4vim编辑器的删除与撤销2.5vim编辑器的复制与粘贴2.6vim编辑器的查找与替换三vim输入模式常见操作3.1快速进入输入模式3.2快速移动编辑四vim命令模式常见操作4.1行内快速跳转4.2行间快速跳转

    2022年7月26日
    4
  • sqlserver 属性 TextHeader 不可用于 StoredProcedure“[dbo].[x]”该对象可能没有此属性,也可能是访问权限不足而无法检索。 该文本已加密。

    sqlserver 属性 TextHeader 不可用于 StoredProcedure“[dbo].[x]”该对象可能没有此属性,也可能是访问权限不足而无法检索。 该文本已加密。打开sqlserverproc存储过程错误:属性TextHeader不可用于StoredProcedure“[dbo].[x]”。该对象可能没有此属性,也可能是访问权限不足而无法检索。 该文本已加密。(Microsoft.SqlServer.Smo),提示如下图错误:注:本文基于SQLserver2008R2,其他版本没有测试过解决方法:1、使用原有数据库从新导出非加密脚本重新建立…

    2022年7月26日
    21

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号