您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. C#版中英文文本阅读器源码

  2. c#语言实现, 实现中英文阅读; 复读,暂停,继续等功能; 文本合成音频文件; 好像是xp下运行,vista需该参数; Interop.SpeechLib.dll文件需考到system 32文件夹下 其他可问我,具体忘了,一年前写的
  3. 所属分类:C#

    • 发布日期:2009-07-06
    • 文件大小:212992
    • 提供者:sunxinhere
  1. 新东方英语背诵美文30篇 文本 doc格式

  2. 新东方英语背诵美文30篇 的文本部分。 音频mp3可以在沪江论坛搜索到。
  3. 所属分类:专业指导

    • 发布日期:2008-03-07
    • 文件大小:138240
    • 提供者:HappyTown
  1. Visual C++音频/视频处理技术及工程实践 (分卷1)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频/视频处理技术及工程实践(分卷2)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++ 音频/视频 处理技术及工程实践(分卷3)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频/视频处理技术及工程实践(分卷4)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频视频处理技术及工程实践(分卷5)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频视频处理技术及工程实践(分卷6)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频视频处理技术及工程实践(分卷7)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频视频处理技术及工程实践(分卷8)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. Visual C++音频视频处理技术及工程实践(分卷9)

  2. 本书共16章,分为4篇,详细讲解了使用各种软件和平台进行音、视频多媒体编程的技术,以案例为对象展示实现过程、分析技术难点。主要内容包括软件Visual C++2005的开发技术、DirectSound开发音频、DirectShow/VFW开发视频、MMX/SSE进行多媒体汇编编程、DM642 DSP进行音视频算法优化和主流视频算法MPEG-4/H.264的编码原理及工程实践。本书系统地介绍Visual C++ 2005进行流媒体编程的基本思路和方法,采用案例为主的叙述方式,将大量的技术理论融入
  3. 所属分类:C++

    • 发布日期:2011-03-08
    • 文件大小:25165824
    • 提供者:a7952113
  1. jsp 视频音频图片文本文件等各种文件的上传源码(最新技术)

  2. jsp完美实现视频音频图片文本文件等各种文件的上传,支持各种现今流行的浏览器,代码简洁易懂,并能方便的部署到自己的项目中。在此热情献出供酷爱学习酷爱计算机的朋友学习参考!
  3. 所属分类:Java

    • 发布日期:2013-09-15
    • 文件大小:1048576
    • 提供者:fanaticism1
  1. 音频转文本软件SitMan

  2. ◇ 复读功能 ※ 支持RM、MP3、WAV等多种常见语音文件格式; ※ 设定重复区域反复播放; ※ 按语句分段后逐段复读,或随机选段复读; ※ 禁止某些不想听(如空白、音乐等)的段落; ◇ 录音跟读对比功能 ※ 同步跟读录音并对比播放,找出您的发音与原音的区别; ◇ 听写文本与语音的完美结合 ※ 可边听边写,并自动保存和调入与语音文件对应的文本内容; ※ “即点即到”功能 ---- 在文本的相应位置记录下语音文件中的位置, 或某个复读区域,鼠标一点即可跳到该位置播放,或选中该区域反复播放; ※
  3. 所属分类:编解码

    • 发布日期:2018-05-10
    • 文件大小:1048576
    • 提供者:protoss_bu
  1. 语音转换文字 Speechnotes

  2. 该软件使用谷歌开放的api语音识别文字到记事本保存文本。支持世界上众多语言识别。需要有墙外网络,需要安装google.apk主引擎
  3. 所属分类:Android

    • 发布日期:2018-08-01
    • 文件大小:4194304
    • 提供者:llq520
  1. speech-to-text-nodejs, IBM Watson语音到文本服务的样例 node.js 应用程序.zip

  2. speech-to-text-nodejs, IBM Watson语音到文本服务的样例 node.js 应用程序 向文本浏览器应用程序添加语音 在文本转换中使用了ibm的语音识别功能来将多种语言中的语音转换成文本,从而实现文本的转换。 传入音频的转录连续发送回客户端,并且在听到更多语音时更正。 通过 web socket接口访问服务;还可以使用
  3. 所属分类:其它

    • 发布日期:2019-09-18
    • 文件大小:29360128
    • 提供者:weixin_38744435
  1. DiTTo_SpeechToText:IBM Watson语音到文本实现-源码

  2. DiTTo_SpeechToText IBM Watson语音到文本实现 准备:在cloud.ibm.com上注册一个IBM Cloud帐户。 然后,在资源列表中创建“语音转文本”资源。 测试:在sttTinker_Constants类中,添加API密钥,Ibm Cloud上Speech-To_text资源的端点URL以及测试音频文件的绝对路径。 在SttTinker_testRunner中运行main方法
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:19922944
    • 提供者:weixin_42176612
  1. 普通话:机器学习的音频分类-源码

  2. 共同的声音 实时部署: 数据 该项目的数据来自 ,这是Mozilla发起的一项众包项目,旨在为语音识别软件创建免费的数据库。 该项目得到了志愿者的支持,他们用麦克风录制了例句,并查看了其他用户的录音。 转录的句子将被收集到语音数据库中,该数据库可在公共领域许可CC0下获得。 该许可证确保开发人员可以将数据库用于语音到文本应用程序而不受限制或花费。 Common Voice的出现是对诸如Amazon Echo,Siri或Google Assistant等大公司的语言助手的回应 总览 该项目的目
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:1048576
    • 提供者:weixin_42150745
  1. 语音到文本代码模式:使用Watson语音到文本服务的React应用程序将语音音频转换为书面文本-源码

  2. 语音转文字码型 示例React应用程序可用于使用Watson Speech to Text服务。 :sparkles: 演示: : :sparkles: 流 用户向应用程序提供音频输入(在IBM Cloud或IBM Cloud Pak for Data中本地运行)。 该应用程序通过将音频数据发送到Watson Speech to Text服务。 处理数据时,语音转文本服务将有关提取的文本和其他元数据的信息返回给应用程序以显示。 脚步 1.提供Watson语音转文字 注:如果要使用下面
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:32505856
    • 提供者:weixin_42138376
  1. AnkiExtraction:从anki抽认卡中提取音频和文本并将其存储到SQL Server数据库中的程序-源码

  2. AnkiExtraction:从anki抽认卡中提取音频和文本并将其存储到SQL Server数据库中的程序
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:7168
    • 提供者:weixin_42139302
  1. Dataset-Generation-for-DeepSpeech-Speech-To-Text-Engine:该工具可以使用Google Translate的文本到语音API功能为DeepSpeech语音到文本引擎生成干净的和嘈杂的(加性

  2. 基于Google Translate API的DeepSpeech STT引擎的干净且嘈杂的数据集生成工具 描述 该工具可以使用Google Translate的文本到语音API功能为DeepSpeech语音到文本引擎生成干净的和嘈杂的(加性高斯白噪声(AWGN)和真实世界的噪声(RWN))数据集。和缓慢的讲话。 是基于的语音到文本引擎。 DeepSpeech项目使用Mozilla另一个名为Common Voice的项目提供的数据集。 音频片段规格: 音频文件格式为.wav。 频道数为1(
  3. 所属分类:其它

    • 发布日期:2021-03-27
    • 文件大小:7340032
    • 提供者:weixin_42131276
« 12 3 4 5 6 7 8 9 10 ... 28 »