您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Qt下微软语音识别接口MS Speech SDK调用 和 微软认知服务语音识别API demo

  2. t下微软语音识别接口MS Speech SDK调用 和 微软认知服务语音识别API
  3. 所属分类:C++

    • 发布日期:2016-12-16
    • 文件大小:26624
    • 提供者:stafniejay
  1. BiYingSpeech

  2. Bing Speech微软必应语音认知,文字语音互转 ,Unity工程,亲测可用!!! 配置教程:http://blog.csdn.net/shanguuncle/article/details/77867424
  3. 所属分类:Unity3D

    • 发布日期:2017-09-06
    • 文件大小:286720
    • 提供者:shanguuncle
  1. 通过真人语音提示的少儿趣味辨色软件

  2. 【基本介绍】 “少儿趣味辨色”是一款极富趣味性指导少儿辨认色彩的软件,它通过真人语音提示的方式将原本枯燥的色彩认识变得趣味盎然,使孩子们在轻松活泼的氛围中得到认知,可谓寓教于乐。
  3. 所属分类:其它

    • 发布日期:2019-08-06
    • 文件大小:2097152
    • 提供者:weixin_39841882
  1. 情感语音数据库优化及PAD情感模型量化标注

  2. 情感语音数据库是情感语音识别研究的基础,建立包含认知心理因素在内的维度情感语音数据库对提高识别率、改善人机交互能力具有重要意义。笔者首先对前期建立的摘引型TYUT2.0数据库进行语音听辨筛选,根据认同率阈值进行数据库优化,得到的情感语音数据库包含四种情感的语句237句,其中"悲伤"62句,"愤怒"58句,"高兴"57句,"惊奇"60句。然后利用PAD三维情感模型对该数据库语音进行标注,得到维度情感语音数据库。该数据库中的每句语音都有对应的听辨认同率以及PAD值。对每句语音的PAD值进行统计分析,
  3. 所属分类:其它

    • 发布日期:2020-05-10
    • 文件大小:295936
    • 提供者:weixin_38513565
  1. 云视频会议背后的语音核心技术揭秘:如何进行语音质量评估?

  2. 音频和语音是电声学下面两个不同的学科分支,属于两个不同的应用,两者在应用目的、使用场景、行业和用户认知统一度三方面存在差异,所以对于语音质量测试来说,首先要界定一下评估对象是音频还是语音。
  3. 所属分类:编解码

    • 发布日期:2020-03-29
    • 文件大小:1048576
    • 提供者:karamos
  1. 语音情感识别的关键技术

  2. 语音信号中的情感信息是一种很重要的信息资源,仅靠单纯的数学模型搭建和计算来进行语音情感识别就显现出不足。情感是由外部刺激引发人的生理、心理变化,从而表现出来的一种对人或事物的感知状态,因此,将认知心理学与语音信号处理相结合有益于更好地处理情感语音。首先介绍了语音情感与人类认知的关联性,总结了该领域的最新进展和研究成果,主要包括情感数据库的建立、情感特征的提取以及情感识别网络等。其次介绍了基于认知心理学构建的模糊认知图网络在情感语音识别中的应用。接着,探讨了人脑对情感语音的认知机理,并试图把事件相
  3. 所属分类:其它

    • 发布日期:2020-06-20
    • 文件大小:342016
    • 提供者:weixin_38722721
  1. 语音数据集下载地址,永久有效

  2. 语音数据集下载地址,永久有效。近几年来语音识别技术得到了迅速发展,从手机中的Siri语音智能助手、微软的小娜以及各种平台的智能音箱等等,各种语音识别的项目得到了广泛应用。语音识别属于感知智能,而让机器从简单的识别语音到理解语音,则上升到了认知智能层面,机器的自然语言理解能力如何,也成为了其是否有智慧的标志,而自然语言理解正是目前难点。
  3. 所属分类:网络安全

    • 发布日期:2020-10-10
    • 文件大小:90
    • 提供者:qq_42279468
  1. BabyBERTa:针对儿童的语音训练和评估BERT-源码

  2. 关于 该存储库包含研究代码,用于测试在以儿童为导向的小型语料库中训练的RoBERTA小模型(来自美国英语儿童的5M个单词)。我们的模型是使用transformers Python包实现的,该包由huggingface维护。 历史 2020年(Spring):BabyBERTa项目源于Cynthia Fisher,Dan Roth,Michael Connor和Yael Gertner领导的BabySRL项目,可找到其发表的作品。对于定制(较小尺寸)版本的BERT的SRL和MLM联合培训没有多大益
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:774144
    • 提供者:weixin_42110469
  1. bootcamp-ai-luis-speech-search:类别分类的电信和外部信息服务使用Azure的服务-源码

  2. IA训练营 人工造物 费韦罗(Fevereiro)2021 Kong蒂多 Objetivo 解决方案类别的电信和外部信息处理服务。 Arquitetura Proposta ServiçosUtilizados 塞尔维索 Documentação Azure存储-Blob 认知服务-语音 认知服务-LUIS 认知搜寻 电源应用 环境配置 内萨·埃塔帕(Nessa etapa),作为一种环境植入物,被配置为一个自然保护区。 Tarefa 1:Criaçãodo Grupo de R
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:103809024
    • 提供者:weixin_42117082
  1. 认知服务工作室-源码

  2. 借助Signal R进行认知服务和实时无服务器 让我们从研讨会概述开始。 主要思想是使用Microsoft的“翻译”和“语音至文本”认知服务构建一个实时的无服务器应用程序。 目标是使用本教程来构建原型并将其用于您自己的想法。 本教程提供了指向认知服务文档,方案等的链接。 本教程的要求是Visual Studio 2019社区或VS Code。 C#基础知识 以下是构建SignalR实时应用,将其连接到翻译服务然后使用语音转文本的三个步骤。 步骤1.基础架构 第一步是创建一个演示Azure订阅在
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:5120
    • 提供者:weixin_42115003
  1. TwitchCaptioner:一个使用Azure认知服务语音API的python应用程序,提供您所说内容的实时覆盖-源码

  2. 抽搐字幕机 一个简单的Python应用程序,可以从麦克风获取音频流,并将语音转换为文本,然后在窗口中输出。 要配置它: 在此处注册Azure语音 将密钥和区域添加到config.py文件。 如果要使用与默认麦克风不同的麦克风,请获取设备uid并将其设置在config.py文件中。 运行该应用程序,将出现一个窗口,显示实时字幕。
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:5120
    • 提供者:weixin_42105169
  1. ognitive-services-speech-sdk:Microsoft Cognitive Services语音SDK的示例代码-源码

  2. page_type 语言 名称 描述 产品展示 样品 cpp 尖锐的 Java javascr ipt 节点js 对象 Python Swift Microsoft认知服务语音SDK示例 了解如何使用Microsoft Cognitive Services语音SDK向您的应用添加启用语音功能。 天蓝色 天蓝色认知服务 Microsoft认知服务语音SDK的示例存储库 该项目托管Microsoft Cognitive Services Speech SDK的示例。 要了解有关Micros
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:106954752
    • 提供者:weixin_42150341
  1. Xamarin.Cognitive.Speech:一个客户端库,可轻松在Xamarin.iOS,Xamarin.Android,UWP和Xamarin.Forms.NET标准库上使用Microsoft Cognitive Services语

  2. Xamarin认知语音 Xamarin.Cognitive.Speech是一个托管客户端库,可轻松在Xamarin.iOS,Xamarin.Android,Xamarin.Forms,UWP和其他.NET Standard 2.0+项目上使用 。 。 包括带有iOS,Android和UWP应用程序的Xamarin.Forms示例。 有关语音服务/语音到文本API的资源及其含义: 为什么? 为什么要使用此客户端库与“语音转换为文本” API对话,而不是[在此处插入其他库或示例代码]? 官
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:551936
    • 提供者:weixin_42143161
  1. OpenSesame:糟糕的假期实验。 MyQ车库门开启器,带有语音命令支持和一些动画-源码

  2. 2017年假期实验 我打破了我们20多年的车库门开启器...碎片在光荣的灭亡中飞到了任何地方。 新的“车库机器人”已启用wifi,所以我当然必须修补一下。 这虽然没什么大不了的,但是花一些时间来使用我一直想探索的各种东西是一个很好的借口: React性扩展和 Azure认知服务和Bing语音识别 芝麻车库开门器 与MyQ API交谈。 支持的动作: 登录 获取设备 GetDeviceState SetDeviceState(打开和关闭) 如果要使用MyQ API,并且(显然)有兼容的车库
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:838656
    • 提供者:weixin_42122432
  1. 三态模式:由Three.js,Vue和LUIS(认知服务)构成的生物反馈可视化,由Brian Holt构成-源码

  2. 三个Vue模式 该项目汇集了一些概念,概述如下: Three.js,Vue和LUIS 我希望不久前能够使用Vue动态更新three.js可视化。 该应用程序从概述的基本概念入手,并对其进行重构/扩展,以使您可以根据语音情感来操纵它们。 您可以使用分析语音来更新可视化(通过Vuex中的状态)。 是一项基于机器学习的服务,通过使用可以不断改进的自定义模型来构建自然语言。 我们可以将其用于应用程序,机器人甚至物联网设备。 在这里,我们正在引导可视化,首先通过告诉我们我们的心情,然后我们可以用声音控
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:829440
    • 提供者:weixin_42102634
  1. Unity-Text-to-Speech:示例应用程序,用于演示从Unity内部使用Microsoft认知服务Text-to-Speech API(又称语音合成)-源码

  2. 文本到语音转换 示例应用程序用于演示如何从Unity游戏引擎中使用 。 这些基于云的API提供对更高质量语音的访问,从而在所有客户端平台之间提供了一致性。 请查看“以尝试并听到这些声音的样本。 该示例提供了一个独立的SpeechManager组件,该组件易于在您自己的Unity项目中重用。 鉴于认知服务是云API,因此离线时它们不可用。 建议离线时回退特定于本地平台的“文本到语音” API。 此示例中的代码演示了两种调用语音合成服务的方法。 第一个利用了。 运行示例时,请确保未选中“使用SD
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:13631488
    • 提供者:weixin_42132325
  1. Unity-MS-SpeechSDK:示例Unity项目,用于通过WebSockets使用新的Microsoft语音服务(预览版)演示语音识别-源码

  2. Unity-MS-语音SDK 示例Unity项目用于通过WebSockets使用新的(当前在Preview中)演示语音识别(aka语音到文本)。 Microsoft语音服务是。 这是一项正在进行的工作。 Unity版本: 2018.2.5f1 语音服务版本: 0.6.0(预览版) 测试的目标平台: Unity Editor / Mono,Windows Desktop x64,Android,UWP(待测试:iOS) 实施说明 此示例使用与语音服务进行交互,并实时生成语音识别假设。 该
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:787456
    • 提供者:weixin_42131633
  1. web-speech-cognitive-services:Polyfill Web Speech API与Cognitive Services Bing Speech一起用于语音到文本和文本到语音服务-源码

  2. 网络语音认知服务 Web语音API适配器,可将Cognitive Services语音服务用于语音到文本服务和文本到语音服务。 描述 语音技术支持许多有趣的场景,包括智能个人助理,并为辅助技术提供替代输入。 尽管W3C在浏览器中对语音技术进行了标准化,但是语音对文本和文本对语音的支持仍然很匮乏。 但是,基于云的语音技术非常成熟。 该polyfill通过使用在浏览器中提供W3C和API。 这将语音技术带入PC和移动平台上所有可用的现代第一方浏览器。 演示版 在开始之前,请从您的Azure订阅中
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:55574528
    • 提供者:weixin_42137723
  1. 基于DTW的语音情感识别系统

  2. 语音识别一直是人工智能的重点研究领域,也是未来人工智能技术产业应用的主要方向之一。语音识别不仅带来一种全新的、变革式的人机交互方式,还会催生出一种人类和机器的情感交流。 语音识别技术不仅带来更多功能和应用,更重要的是,语音作为人类富含情感的交流方式也会把这种情感投射到人机关系上。我们对于人工智能的狂热和追逐不仅仅在于它可以把我们从某些工作中解放出来,还有对认知计算、情感智能的敬畏,对于语音来说同样如此。语音情感AI正在改变我们与用户的沟通。 人有四种基本的情绪:快乐、愤怒、恐惧和悲伤。快乐是
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:82944
    • 提供者:weixin_38703955
  1. 基于语音技术的听觉认知功能评估方法

  2. 基于语音技术的听觉认知功能评估方法
  3. 所属分类:其它

    • 发布日期:2021-03-28
    • 文件大小:41984
    • 提供者:weixin_38733885
« 12 3 »