您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 语料库sougou 的最新

  2. 非常好的语料库,他是sougou 的一部分,如果各位有心情,可以自己去找一些
  3. 所属分类:Java

    • 发布日期:2010-01-24
    • 文件大小:337920
    • 提供者:lw19881130
  1. 自然语言处理 汉语定界

  2. 自然语言处理中需要对汉语句子进行分词和断开,本资源中(代码在文档当中)使用的是前向判别的方法,压缩包内附带文档说明以及试验用语料库。
  3. 所属分类:专业指导

    • 发布日期:2010-03-17
    • 文件大小:1048576
    • 提供者:lhy137910144
  1. LJCorpus中文语料库分析软件

  2. LJCorpus试用版本下载地址 下载地址:http://www.lingjoin.com/download/LJCorpus.rar 介绍: LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统,应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术,目前,东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析,极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括: 1. 新词发现:
  3. 所属分类:专业指导

    • 发布日期:2010-04-17
    • 文件大小:12582912
    • 提供者:lingjoin
  1. 汉语基本短语的自动识别

  2. 汉语基本短语的自动识别 自然语言理解,语料库建设
  3. 所属分类:专业指导

    • 发布日期:2011-03-19
    • 文件大小:268288
    • 提供者:jxg55555
  1. 基于php+mysql的小型语料库程序(英语汉语通用)

  2. 改程序是我本人做的项目,这里提供给大家作参考。具体来说是一个简单的语料库搜索引擎程序,基于PHP和Mysql平台。
  3. 所属分类:教育

    • 发布日期:2011-05-16
    • 文件大小:464896
    • 提供者:sunshukui
  1. TIMIT语音库

  2. This corpus contains a selection from the TIMIT Acoustic-Phonetic Continuous Speech Corpus, consisting of speech files, annotations,and associated materials: * 16 speakers from 8 dialect regions * 1 male and 1 female from each dialect region * total
  3. 所属分类:电信

    • 发布日期:2012-11-06
    • 文件大小:22020096
    • 提供者:mctyro
  1. 基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究_赵小兵.caj

  2. 基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究_赵小兵.caj
  3. 所属分类:其它

    • 发布日期:2014-01-09
    • 文件大小:16777216
    • 提供者:king_0281
  1. 基频包络的音节聚类分析

  2. 对汉语TTS 系统的大规模语料库做了基本的韵律参数统计, 分析了音节的韵律特征与其所在的韵律结构位 置以及韵律结构边界的关系. 进一步, 对有调音节样本集基于基频包络采进行聚类, 通过听辨实验检验了聚类结果, 并分析了音节聚类与其所在韵律结构之间的对应关系
  3. 所属分类:专业指导

    • 发布日期:2008-12-30
    • 文件大小:261120
    • 提供者:aouming
  1. CASIA汉语情感语料库

  2. 资源名称 CASIA汉语情感语料库 共包括四个专业发音人,六种情绪,共9,600句不同发音,包括300句相同文本和100句不同文本,可供各种分析实验使用 本数据集包含部分数据 用途 为研究情感语音所设计的语料
  3. 所属分类:机器学习

    • 发布日期:2018-04-06
    • 文件大小:61127254
    • 提供者:u012337562
  1. 兰卡斯特汉语语料库LCMC语料库

  2. LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库。起先建立时,它是作为英国经社研究委员会资助项目Contrasting Tense and Aspect in English and Chinese的部分成果。肖忠华最初的设想是要将其建成同FLOB和FROWN对应的现代汉语语料库。筹建这样的一个语料库的另一个动因是:尽管已经有很多汉语语料库存在,但却没有一个完全免费对公众开放的平衡的汉语语料库
  3. 所属分类:Informix

    • 发布日期:2018-07-02
    • 文件大小:6291456
    • 提供者:weixin_42593834
  1. 基于HMM与深度学习的唇读识别研究_宋文明(好).caj

  2. 尽管国内的唇语识别研究工作已经开展了一段时间,但统一的、标准的用于汉语唇 语识别的语料库还没有建立起来,也没有权威机构提出该方面的建议。因此,本文提出了自己的一套汉语识别的语料架构用于本文涉及到的实验,并在此基础上提出改进方案 以使其适用范围更广。 隐马尔可夫模型的双随机过程与人类语言表达相吻合,这一特点使得该方法成为最 适合唇语识别的方法。本文将对 HMM 方法做深入研究,探究其在唇语识当中的具体适用形式,包括参数设置、模型的类型选择以及训练方法等。
  3. 所属分类:深度学习

    • 发布日期:2020-04-27
    • 文件大小:2097152
    • 提供者:zhr_the_great
  1. 现代汉语语料库

  2. 语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
  3. 所属分类:算法与数据结构

    • 发布日期:2019-04-20
    • 文件大小:26214400
    • 提供者:archeng
  1. 现代汉语语料库加工规范(pku)

  2. 北大计算语言学研究所从1992年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范V1.0》。几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范V2.0》(征求意见稿)。因这次加工的任务超出词语
  3. 所属分类:专业指导

    • 发布日期:2010-10-20
    • 文件大小:302080
    • 提供者:yjsmzq
  1. 汉语语料库分词类词频表-高频词汇.xls

  2. 分类词频是文本分析中非常重要的内容。本资源把常用的分类词收集起来,方便大家在做文本分析时使用。有了本资源,大家可以提高文本分析的效率
  3. 所属分类:机器学习

    • 发布日期:2020-07-20
    • 文件大小:2097152
    • 提供者:weixin_42128570
  1. 基于跨语言语料库的汉语和老挝语单词分布

  2. 单词表示是自然语言处理的基础研究内容。目前,单语言单词的分布式表示在一些神经概率语言(NPL)研究中显示出令人满意的应用效果,而对于跨语言单词的分布式表示,研究很少。在国内外。 针对这两种语言中名词和动词的分布相似性的问题,我们通过弱监督学习扩展法等方法将互译的单词,同义词,上位词嵌入中文语料库中,从而在跨语言环境中实现了老挝单词分布。学中文和老挝。 我们利用之前学习的跨语言单词的分布式表示来计算双语文本的相似度,并对汉语和老挝的混合文本语料库进行分类,实验结果表明该建议对这两个任务具有令人满意
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:442368
    • 提供者:weixin_38719643
  1. 汉维医疗平行语料库构建及特征分析

  2. 面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_38746574
  1. 基于文本聚类的中文量化风格特征及不同风格之间的关系研究

  2. 本研究的语料来自新闻联播,日常对话和文涛的头条新闻,它们分别代表正式的书面风格,口语风格和对话风格。 从预处理的语料库中选择句子长度,单词长度,词性(POS)和句子首字母词POS作为特征来生成文本向量,然后将其与PAM(围绕medoids进行划分)和Ward算法进行聚类。 聚类结果表明:(1)合理选择句子长度,词长,词性和词首词词性作为汉语定量文体特征。 (2)风格是一个两极分化的连续体,因为正式的书面风格和口语风格表现出双极性分布,而对话风格则介于口语风格之间和附近。
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:1048576
    • 提供者:weixin_38675506
  1. 基于本体的汉语语料库坐标关系提取

  2. 基于本体的汉语语料库坐标关系提取
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:550912
    • 提供者:weixin_38545517
  1. ChineseGLUE:中文语言理解评估基准:数据集,基线,预训练模型,语料库和页首横幅-源码

  2. 中国胶 汉语语言理解评估基准:数据集,基线,预训练模型,语料库和排行榜 中文语言理解测评基准,包括预期的数据集,基准(预训练)模型,语料库,排行榜。 「更新,2019年11月22日」 1)【推荐】新版,更加系统全面,更好的技术支持,迁移新地址: : 2)初始经典版,以实用任务如分类或句子对任务为主,将继续保留并在此项目更新 我们会选择一系列有一定预期的任务对应的数据集,做为我们测试基准的数据集。这些数据集会覆盖不同的任务,数据量,任务缺陷。 中文任务基准测评(ChineseGLUE)-
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:2097152
    • 提供者:weixin_42097189
  1. 基于ABC优化MVDR的语音情感识别研究

  2. 语音情感特征的提取和选择是语音情感识别的关键问题,针对线性预测(LP)模型在语音情感谱包络方面存在的不足。本论文提出了最小方差无失真响应(MVDR)谱方法来进行语音情感特征的提取;并通过人工蜂群(ABC)算法找到最优语音情感特征子集,消除特征冗余信息;利用径向基函数(RBF)神经网络对CASIA汉语情感语料库中的4种情感语音即生气、平静、高兴、害怕进行实验识别。实验结果表明,该方法比线性预测法有更高的识别率和更好的鲁棒性。
  3. 所属分类:其它

    • 发布日期:2021-01-28
    • 文件大小:668672
    • 提供者:weixin_38556822
« 12 3 4 »