您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. PowerGrep文本批量抽取工具

  2. 很好用的语料库工具,或者说是批量文本抽取工具。
  3. 所属分类:专业指导

    • 发布日期:2011-03-30
    • 文件大小:11534336
    • 提供者:zhangbc1
  1. 自然语言工具包(nltk),python

  2. 这本书提供自然语言处理领域非常方便的入门指南。它可以用来自学,也可以作为自然语言处理或计算语言学课程的教科书,或是人工智能、文本挖掘、语料库语言学课程的补充读物。本书的实践性很强,包括几百个实际可用的例子和分级练习。
  3. 所属分类:专业指导

    • 发布日期:2012-12-03
    • 文件大小:4194304
    • 提供者:cfx337
  1. 基于HTK的连续语音识别技术研究

  2. 基于HTK的连续语音识别技术研究 语音识别是让机器能够“听懂”人类的语言、并把人类的语音信号转化为相应的文本 或命令的技术⋯。语音识别可以认为是模式识别的一个分支,它与声学、语言学、心理学、 数字信号处理、计算机学科等有密切的联系,是--I"1跨学科的技术。 本文以HTK为工具,以HMM为模型,实现了母语为英语的非特定人、大词汇量连 续语音识别系统。非特定人、连续、大词汇量这三个特点是语音识别走向应用必须要实现 的目标。本文中训练和测试的语音库来自NIST的TIMIT,该数据库是一个平衡语料库
  3. 所属分类:C

    • 发布日期:2013-01-30
    • 文件大小:3145728
    • 提供者:lilyliu307307
  1. 语料库wordsmith6.0软件(最新英文版)

  2. WordSmith Tools 是一个在Window下运行的用来观测文字在文本中的表现的功能强大的综合软件包。它共包含Concord (语境共现检索工具)、WordList (词频列表检索工具) 、KeyWords(关键词检索工具)、Splitter(文本分割工具)、Text Converter (文本替换工具)、Viewer(文本浏览工具)等六个程序,其中前面三个程序是主要的文本检索工具,后面三个程序属于辅助性工具。这六个程序的各项设置由一个叫WordSmith Tools Controll
  3. 所属分类:教育

    • 发布日期:2015-01-22
    • 文件大小:61865984
    • 提供者:wufuhehe
  1. Java 词海分析 自然语言分析 人名地名机构名提取自定义词典

  2. 中文分词 最短路分词 N-最短路分词 CRF分词 索引分词 极速词典分词 用户自定义词典 词性标注 命名实体识别 中国人名识别 音译人名识别 日本人名识别 地名识别 实体机构名识别 关键词提取 TextRank关键词提取 自动摘要 TextRank自动摘要 短语提取 基于互信息和左右信息熵的短语提取 拼音转换 多音字 声母 韵母 声调 简繁转换 繁体中文分词 简繁分歧词(简体、繁体、臺灣正體、香港繁體) 文本推荐 语义推荐 拼音推荐 字词推荐 依存句法分析 基于神经网络的高性能依存句法分析器
  3. 所属分类:Java

    • 发布日期:2017-10-11
    • 文件大小:22020096
    • 提供者:vip923803855
  1. Python 自然语言处理

  2.   自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。   《Python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。《Python自然语言处理》基于Python编程语言以及一个名为NLTK的自然语言工具包的开源库,但并不要求读者有Python编程的经验。全书共1
  3. 所属分类:Python

    • 发布日期:2018-05-12
    • 文件大小:3145728
    • 提供者:jisuran
  1. 英语词汇分析工具V6.4中文免费安装版

  2. 英语词汇分析工具是一款对英文文本进行单词分割提取、原型转化,是一款简易的语料库构建平台,生僻词、新词汇收录,快来下载学习吧。 功能介绍 1. 英语词汇数据采集  本软件可以直接对英文文本文件进行单词的分割提取、原型转化,提供词汇表、词频数据、词汇分级数据、总词量、容词率、单词覆盖率、常用词占率… 2 简易语料库构建平台 平台不提供内容!用户可以自己编写相关资料,使其成为教学、研究的
  3. 所属分类:其它

    • 发布日期:2019-08-07
    • 文件大小:17825792
    • 提供者:weixin_39840387
  1. 配置好的傻瓜化小狼毫全拼+多种双拼+五笔86-98+笔画输入法v200312 - 17种方案

  2. 简介 这是一套按照绝大多数人习惯配置优化好的小狼毫。 小狼毫是一款优秀的开源免费输入法平台,可定制性极强,无任何广告骚扰和隐私泄露的风险,但要配置好它,对于不少人是比较困难的。为此,我们把它进行了全方位配置,以做到各种需求都可拿来即用,不需折腾。 对于喜欢折腾的朋友,本套小狼毫的所有方案和码表都是开放的,同时附带了丰富的功能导向的修改指南,非常方便二次修改。 主要特色 1.包含86版五笔、98版五笔;全拼、双拼(几乎囊括当前所有主流双拼方案);五笔画、手写(方便输入疑难生僻字);快
  3. 所属分类:桌面系统

    • 发布日期:2020-03-12
    • 文件大小:26043084
    • 提供者:emca
  1. 正则表达式在语料库研究中的应用

  2. 语料库技术的关键在于通过对大规模真实文本的自动化分析处理,探索自然语言的内在规律。计算机程序编辑中广泛使用的正则表达式技术,因其强大的文本批处理能力,被逐渐应用于语料库开发和复杂检索等相关技术中。本文的研究目的在于厘清正则表达式的起源、概念和构造,并以任务驱动的方法,以几款常用的语料库工具为例,探讨正则表达式在文本清理、语料标注和检索等技术环节中的具体应用,从而进一步推动正则表达式在语料库研究中的普及和应用。
  3. 所属分类:其它

    • 发布日期:2020-07-09
    • 文件大小:719872
    • 提供者:weixin_38626943
  1. pyhanlp安装介绍和简单应用

  2. 1. 前言 中文分词≠自然语言处理! Hanlp HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁 中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。 不同于一些简陋的分词类库,HanLP精心
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:146432
    • 提供者:weixin_38652636
  1. Python自然语言处理-从文本提取信息

  2. 回答下列问题:  (1)如何能构建一个系统,以至从非结构化文本中提取结构化数据?  (2)有哪些稳健的方法识别一个文本描述的实体和关系?  (3)哪些语料库适合这项工作,如何使用它们来训练和评估模型?信息有很多种”形状“和”大小“,一个重要的形式是结构化数据:实体和关系的规范和可预测的组织。例如:我们可能对公司和地点之间的关系,可用关系数据库存储。但如果我们尝试从文本中获得相似的信息,事情就比较麻烦了。如何从一段文字中发现一个实体和关系的表呢?然后,利用强大的查询工具,如SQL,这种从文本获取意
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:220160
    • 提供者:weixin_38733597
  1. 面向语音合成的维吾尔语音素自动切分算法研究

  2. 结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:1048576
    • 提供者:weixin_38635979