您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ROS语音交互图像识别包(python脚本)

  2. ROS包,python代码,主要三个文件 1、ROS_baidu_voice.py:用百度语音云服务实现语音识别,并将识别结果简单分类发送到 话题/cmd_vel_mux/input/teleop或话题camera_op或话题camera_reply,分别用于控制小车速度、打卡摄像头进行图像识别和进行语音交互; 2、ROS_baidu_reply.py:用于进行语音交互,使用图灵机器人云服务和百度语音合成云服务实现与人交互的功能,订阅camera_reply话题(其内容是图像识别结果或语音识别
  3. 所属分类:Python

  1. python百度语音识别 语音合成demo

  2. 在使用本代码前请自行安装pip install baidu-aip库,然后自己注册百度语音的账号以及ID、key等,语音识别时要求录音质量与官方要求一致方可,否则可能出现错误。其中atow.py表示语音识别的代码,wtoa.py表示语音合成的代码
  3. 所属分类:机器学习

    • 发布日期:2018-04-20
    • 文件大小:1024
    • 提供者:qianlixiaomage
  1. 人工智障语音聊天机器人.zip

  2. 项目构想: 录制一段音频并识别成字符,将字符传入图灵机器人并获得回复,将回复合成音频文件并播放。 项目感想: 讯飞语音识别率还行,但是项目容错率低,并且项目基本调用API,没进一步研究语音识别技术的过程与实现,不过还是颇有收获,学习到了完成项目期间出现各种各样的问题的解决办法,所以只要你敢想,敢动手去做就一定会有收获。 项目API调用:讯飞语音识别,百度语音合成,图灵机器人。 项目语言以及库:Python+playsound+pyaudio+wave+os+百度API+讯飞API+图灵
  3. 所属分类:Python

    • 发布日期:2020-01-02
    • 文件大小:181248
    • 提供者:Cxk___
  1. python语音识别

  2. 一个python编写的将文字转换成语音的程序,可以当广播用。所需要的外接库:baidu-api
  3. 所属分类:Python

    • 发布日期:2020-06-05
    • 文件大小:3072
    • 提供者:xiaohetao_
  1. python之语音识别speech模块

  2. 主要介绍了python之语音识别speech模块,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-16
    • 文件大小:273408
    • 提供者:weixin_38657376
  1. python语音识别指南终极版(有这一篇足矣)

  2. 【导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到: •语音识别的工作原理; •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。 语言识别工作原理概述 语音识别源于 20
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:131072
    • 提供者:weixin_38499553
  1. Python实现简单的语音识别系统

  2. 最近认识了一个做Python语音识别的朋友,聊天时候说到,未来五到十年,Python人工智能会在国内掀起一股狂潮,对各种应用的冲击,不下于淘宝对实体经济的冲击。在本地(江苏某三线城市)做这一行,短期可能显不出效果,但从长远来看,绝对是一个高明的选择。朋友老家山东的,毕业来这里创业,也是十分有想法啊。 将AI课上学习的知识进行简单的整理,可以识别简单的0-9的单个语音。基本方法就是利用库函数提取mfcc,然后计算误差矩阵,再利用动态规划计算累积矩阵。并且限制了匹配路径的范围。具体的技术网上很多,不
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:116736
    • 提供者:weixin_38645865
  1. Python 利用pydub库操作音频文件的方法

  2. 最近使用Python调用百度的REST API实现语音识别,但是百度要求音频文件的压缩方式只能是pcm(不压缩)、wav、opus、speex、amr,这里面也就wav还常见一点,但是一般设备录音得到的文件都是mp3,这就要把mp3转换为wav,由于python的效率并不高,很多实现都是使用C++或者Java,不过GitHub上有一个项目pydub(https://github.com/jiaaro/pydub/tree/master/pydub)可以暂时解决问题。 安装pydub 直接执行以下
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:36864
    • 提供者:weixin_38655780
  1. 基于python实现语音录入识别代码实例

  2. 这篇文章主要介绍了如何通过python实现语音录入识别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 一、介绍 1.第一步录音存入本地 2.调用百度语音识别sdk 注意点:百度语音识别对声音源有要求,比特率必须是256kbps 二、代码 #安装必要库 pip install baidu-aip #百度sdk pip install pyaudio import wave import pyaudio from aip import Ai
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:56320
    • 提供者:weixin_38673924
  1. python实现语音识别前期准备(调用科大讯飞平台)

  2. 本demo测试时运行的环境为:Windows + Python3.7 本demo测试成功运行时所安装的第三方库及其版本如下,您可自行逐一或者复制到一个新的txt文件利用pip一次性安装: cffi1.12.3 gevent1.4.0 greenlet0.4.15 pycparser2.19 six1.12.0 websocket0.2.1 websocket-client==0.56.0 语音听写流式 WebAPI 接口调用示例 接口文档(必看):https://doc.xfyun.cn/res
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:215040
    • 提供者:weixin_38552871
  1. python调用pyaudio使用麦克风录制wav声音文件的教程

  2. python的pyaudio可以进行录音,播放,生成wav文件等等,WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为WAV,数据本身的格式为PCM或压缩型,属于无损音乐格式的一种。在我们研究语音识别,自然语言处理的过程中,常常会使用到它,比如我们调用百度语音识别所以我们首先研究一下pyaudio库的安装与使用。 安装: pip install pyaudio 调用pyaudio使用麦克风录制声音: python中的pyaudio库可以直接通过麦克风录制声音,我们可以通过调用该库,
  3. 所属分类:其它

    • 发布日期:2020-12-26
    • 文件大小:53248
    • 提供者:weixin_38712092
  1. RobinASR:ROBIN项目中的罗马尼亚语自动语音识别-源码

  2. 罗宾·阿斯 该存储库包含基于架构的罗马尼亚语言的罗宾自动语音识别(RobinASR),以及用于转录的语言模型。 预训练的文本-语音模型可被下载和预训练KenLM能下载。 另外,请确保访问: RELATE平台中可用的ASR系统演示: ://relate.racai.ro/index.php path robin/asr 允许断字和基本大小写还原的后处理Web服务: : 安装 您必须在系统中安装Python 3.6+和PyTorch 1.5.1+。 还。 如果要使用(推荐)GPU版
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:60416
    • 提供者:weixin_42107561
  1. espresso:Espresso:快速的端到端神经语音识别工具包-源码

  2. 浓咖啡 Espresso是基于深度学习库和流行的神经机器翻译工具的开源,模块化,可扩展的端到端神经自动语音识别(ASR)工具包。 Espresso支持在GPU和计算节点之间进行分布式训练,并具有ASR中常用的各种解码方法,包括基于超前单词的语言模型融合,为此实现了快速,并行的解码器。 我们为以下语音数据集提供最新的培训食谱: 什么是新的: 2020年6月:发布了变压器配方。 2020年4月:现已支持 (使用 )和混合ASR的交叉熵训练。 和分别提供WSJ配方作为示例。 2020年3月:支
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:3145728
    • 提供者:weixin_42116585
  1. 蜻蜓:已存档! -语音识别框架,允许基于Python的强大脚本编写以及Dragon NaturallySpeaking(DNS)和Windows语音识别(WSR)的扩展-源码

  2. 这个仓库已经存档! 蜻蜓的原始存储库已存档。 请参阅以了解当前积极维护的Dragonfly分支。 蜻蜓 蜻蜓是一种语音识别框架。 它是一个Python软件包,提供了高级对象模型,并允许其用户轻松编写使用语音识别的脚本,宏和程序。 当前,它支持以下语音识别引擎: Dragon NaturallySpeaking (DNS), Nuance的产品 Windows语音识别(WSR),包含在Microsoft Windows Vista,Windows 7中,可免费用于Windows XP 蜻蜓
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:287744
    • 提供者:weixin_42130889
  1. speech_recognition:中文语音识别-源码

  2. 中文语音识别 1.环境 巨蟒:3.5 Tensorflow:1.5.0 2.训练数据下载 清华大学中文语料库(thchs30) 3.训练 配置conf目录下的conf.ini文件中的设定 在python train.py运行python train.py开始训练 在终端运行python test.py测试 也可以使用PyCharm打开 4.测试效果
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:415744
    • 提供者:weixin_42132352
  1. tensorflow_end2end_speech_recognition:基于TensorFlow的端到端语音识别实现(CTC,Attention和MTL培训)-源码

  2. 端到端语音识别的TensorFlow实现 要求 TensorFlow> = 1.3.0 tqdm> = 4.14.0 python-Levenshtein> = 0.12.0 setproctitle> = 1.1.10 海上> = 0.7.1 语料库 电话(39,48,61电话) 字符 电话(实施中) 字符 字 电话(实施中) 日语假名字符(约150个班级) 日语汉字字符(约3000类) 这些语料库将在将来添加。 总机 华尔街日报 该存储库
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:828416
    • 提供者:weixin_42169971
  1. TF-Speech-Recognition-Challenge-Solution:Tensorflow语音识别挑战(https:www.kaggle.comctensorflow-speech-recognition-challenge)中

  2. TF语音识别挑战 Tensorflow语音识别挑战赛是Google Brain组织的Kaggle竞赛,目的是使用“语音命令数据集”来构建可理解简单语音命令的算法。 该解决方案在私人排行榜上排名63(排名前5%)。 项目结构 数据 生的 训练(训练音频文件) 测试(测试用于评估的音频文件 库分类(用于培训和评估的所有脚本) 笔记本 脚本(可执行脚本) 模型(预训练模型) 要求 Tensorflow 1.4 解放军 scikit学习 Python 3.x 跑步 下载语音命令数据集,然后将
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:121634816
    • 提供者:weixin_42134097
  1. libfaceid:libfaceid是用于人脸识别解决方案原型的研究框架。 它通过语音合成和语音识别功能无缝集成了多种检测,识别和动态模型-源码

  2. libfaceid,适合所有人的人脸识别库 人脸识别变得容易。 libfaceid是用于面部识别的Python库,它无缝集成了多个面部检测和面部识别模型。 从零到英雄。 学习面部识别的基础知识,并尝试不同的模型。 libfaceid通过提供全面的模型列表供初学者学习各种模型,并简化面部识别解决方案的原型。 从基本模型(Haar Cascades + LBPH)到更高级的模型(MTCNN + FaceNet),支持多种检测和编码/嵌入模型,包括分类模型。 这些模型无缝集成,因此用户可以混合和匹配
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:467664896
    • 提供者:weixin_42178688
  1. Python的框架/库总结(深度学习向)

  2. 下面总结了一些我平时常用的库,并配有解释,不多废话,直接上! 1深度学习库 Tensflower(用过) 先说我对tensflower的理解,入门特别推荐,安装方便,代码一堆,通俗是真的通俗,易懂也是真的易懂,不过支持前期入门,并不支持深入使用。谷歌公司开发的神经网络开源库,主要优点是可进行分布式计算,API稳定,兼容性比较好。张量(Tensor)是他的基本数据单位,可在各种设备上运行,在图形处理和语音识别方面有不俗实力 pytorch(用过) 作为torch的Python版本,由Faceboo
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:81920
    • 提供者:weixin_38689113
  1. 使用Python和百度语音识别生成视频字幕的实现

  2. 从视频中提取音频 安装 moviepy pip install moviepy 相关代码: audio_file = work_path + '\\out.wav' video = VideoFileClip(video_file) video.audio.write_audiofile(audio_file,ffmpeg_params=['-ar','16000','-ac','1']) 根据静音对音频分段 使用音频库 pydub,安装: pip install pydub 第一种方法:
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:98304
    • 提供者:weixin_38616139
« 12 3 »