搭建一个属于自己的语音对话机器人

搭建一个属于自己的语音对话机器人

“零基础– 搭建一个属于自己的机器人

 

首先请想象一下,当你回到家,只有一个人在家,但却没有人聊天,然后你发出了一个命令,电脑便开始自动与你对话,而你不需要打字,不需要看屏幕,因为她会自己发出声音,回应你的问题,以及问候。

01—编程思路很重要

有一个好的想法,并把它用代码实现出来,怎么实现,这就比较重要了。

首先,想一下,假如没有看这篇文章,你们会怎么去实现自动回复的机器人,然后再来看我的解决方式,因为我这个也不是最优的解决方式。

 

思路:

1、首先想到的是宏观的,我想要说话,然后让机器立马做出响应,并通过喇叭回答我们,这是我们的需求。

2、我们把他拆分,变成一些小的需求。

(1)我要说话,会产生声音,系统不能翻译声音,那我们要记录下我们发出的声音。

(2)将声音转化为文字。

(3)将文字发送给自己训练的机器人,但自己训练机器人比较难,这时候使用第三方接口,自动回复,就像公众后台的小灵机器人一样。

3、那我们具体的流程就出来了。

声音—->音频文件—–>调用第三方接口(语音识别)——->文字——->发送给图灵机器人——->机器人做出回复——->返回文字——->文字转语音—->输出并发出声音。

突然感觉一阵头晕搭建一个属于自己的语音对话机器人,怎么调来调去的。

 

02—语音生成音频文件

语音生成文件,我们需要录音,并保存到文件中,那python要怎么实现启动录音并保存文件呢?

好好想一想!

这里需要导入一个模块,正所谓,那里不会导哪里!嘿嘿,python就是这么强。

导入模块,这里需要安装一个pip install pyaudio

import wave
from pyaudio import PyAudio,paInt16

有兴趣的可以去了解一下,继续来看实现代码

def save_wave_file(filename,data):#保存音频文件
    wf=wave.open(filename,'wb')
    wf.setnchannels(1)
    wf.setsampwidth(2)
    wf.setframerate(8000)
    wf.writeframes(b"".join(data))
    wf.close()

def my_record():#实现录音
    pa=PyAudio()
    stream=pa.open(format = paInt16,channels=1,
                   rate=8000,input=True,
                   frames_per_buffer=2000)
    my_buf=[]
    count=0
    print("正在录音")
    while count<2*15:#控制录音时间,15秒
        audio= stream.read(2000)
        my_buf.append(audio)
        count+=1
        # print('.')
    save_wave_file('01.wav',my_buf)#调用保存音频文件函数
    stream.close()
    print("录音完成!")

语音生成音频文件搞定

 

03—音频文件转文字

 

我们已经在上面获取到了音频文件,那要怎么把音频文件转化为文字呢?

我们继续:

这里可以使用第三方的语音识别接口,这里我使用的事百度的接口,因为比较简单,相关的api大家可以自己去研究一下。

导入模块:pip install baidu_aip

from aip import AipSpeech

导入我们需要的模块名,然后将音频文件发送给出去,返回文字。

这里的三个参数就交给大家去获取了。

def audio_word():
    APP_ID = ''
    API_KEY = ''
    SECRET_KEY = ''
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    ret = client.asr(get_file_content('01.wav'), 'wav', 16000, {'dev_pid': 1537, })
    print(ret)#获取识别到的文字

这里我没有做异常处理,来考验一下大家的能力,给大家链接让大家自己动手试一下,

这是百度的文档,和开放平台,需要使用的可以申请一个自己的应用试一下:

相关文档    http://ai.baidu.com/docs#/ASR-Online-Python-SDK/top

开放平台   https://console.bce.baidu.com/ai/#/ai/speech/app/detail~appId=608501

 

04—与机器人对话

好了,到这里了,我们的声音成功转化为文字,然后呢?

这次再调用第三方接口,做自动应答。

这里我调用的是图灵机器人,大家也可以去了解一下。

因为某些原因,这里我直接使用了平台对话框的聊天机器人,

如下(这里需要导入requests模块):

def tu_ling(text):

    url = "http://www.tuling123.com/robot-chat/robot/chat/227960/jwt7"
    data = {"perception": {"inputText": {"text": text}}, "userInfo": {"userId": "demo123"}}
    header = {
        "Referer": "http://www.tuling123.com/member/robot/1140264/center/frame.jhtml?page=0&child=0",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.4094.1 Safari/537.36"}
    tuling = requests.post(url, json=data, headers=header)
    conent = tuling.json()

我是不会告诉你,这里我使用的是爬虫的方式的搭建一个属于自己的语音对话机器人

 

05—文字转换为语音

好了,(敲黑板)重点,前年没有考,去年没有考,今年一定考

我们要把文字转换为语音,使用输出设备输出,怎么弄?

怎么办?再导入一个模块呀!

pip install Pywin32

导入成功之后,我安装的时候,pywin32好像是python2的代码,需要修改几个地方,让它支持python3

然后就是调用

import win32com.client
speaker = win32com.client.Dispatch("SAPI.SpVoice")
speaker.Speak("我是语音助手,小灵!")

好了我们的语音伙伴就这么搞定了。

分解开来看,感觉是不是非常简单呢!还等什么,自己也制造一个吧!

 

相关推荐:

自动操作浏览器之–无界面selenium爬虫

自动打开浏览器,自动进行操作

python实现祝福弹框

微信自动添加好友

python爬虫教程

 

 

在公众号后台回复  :    “语音机器人”   获取完整代码,以及有关的插件。

 

欢迎关注我们哟!

 

搭建一个属于自己的语音对话机器人

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/111420.html原文链接:https://javaforall.net

(0)
上一篇 2021年9月17日 下午9:00
下一篇 2021年9月17日 下午9:00


相关推荐

  • 静态路由介绍_静态路由下一跳地址类型

    静态路由介绍_静态路由下一跳地址类型网络上通过各种设备传递数据,最常见的就是路由器和交换机。本篇介绍路由器的静态路由协议。先简要说一下路由条目和路由表(熟悉的可略过):一个数据包从源IP地址到目标IP地址间可能穿过多个路由器,也可能有多条路径通往目标IP地址。那路由器收到数据后,如何知道哪个端口能通往目标地址呢?如果多个端口都可通往目标地址,选择用哪个端口才是最优路径呢?依据的就是路由表。路由表就是路由器的灵魂,是多个路由条目的…

    2026年3月8日
    6
  • 详解最大熵模型

    详解最大熵模型熵的概念在统计学习与机器学习中真是很重要 熵的介绍在这里 信息熵 nbsp 今天的主题是最大熵模型 MaximumEntro 以下简称 MaxEnt MaxEnt 是概率模型学习中一个准则 其思想为 在学习概率模型时 所有可能的模型中熵最大的模型是最好的模型 若概率模型需要满足一些约束 则最大熵原理就是在满足已知约束的条件集合中选择熵最大模型 最大熵原理指出 对一个随机事件的概率分布进行

    2026年3月26日
    2
  • 重构区块链

    前言撰写这篇手册,并不简单的因为区块链是一个热门话题,更因为随着研究的深入,你会发现这是一个相当复杂的领域。关于这一话题的信息来源无外乎三个方面:技术文档和代码,商业机构的宣传,研究机构或个人的整理。但是每一种媒体都因其形式、渠道或作者而带有某种偏见。技术文档固然详细精确,但是不够通俗,视野也不够广阔;商业宣传必定带有一定的偏向性;而看似中立的研究机构和媒体也因其背后资助方或者受众市场的差异而…

    2022年4月8日
    38
  • maven中的GroupID和ArtifactID怎么写

    maven中的GroupID和ArtifactID怎么写原文地址 http www cnblogs com panxuejun p 6184072 html 由于本人年纪大了 每次创建 maven 项目的时候总是纠结很久不知道怎么写 id 网上看了一篇文章还不错 推荐一下 groupId theuniqueide nbsp artifact

    2026年3月17日
    3
  • 权限系统与RBAC模型概述[绝对经典]

    0.前言一年前,我负责的一个项目中需要权限管理。当时凭着自己的逻辑设计出了一套权限管理模型,基本原理与RBAC非常相似,只是过于简陋。当时google了一些权限管理的资料,从中了解到早就有了RBAC这个东西。可惜一直没狠下心来学习。更详细的RBAC模型非常复杂。本文只做了一些基础的理论性概述。本文资料完全来自互联网。  1.权限系统与RBAC模型概述

    2022年4月7日
    49
  • Zigbee协议栈中文说明

    Zigbee协议栈中文说明1.概述 1.1解析ZigBee堆栈架构ZigBee堆栈是在IEEE802.15.4标准基础上建立的,定义了协议的MAC和PHY层。ZigBee设备应该包括IEEE802.15.4(该标准定义了RF射频以及与相邻设备之间的通信)的PHY和MAC层,以及ZigBee堆栈层:网络层(NWK)、应用层和安全服务提供层。图1-1给出了这些组件的概况。1.1.1ZigBee堆栈层每个Z

    2022年5月8日
    42

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号