点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 语料库工具、文本工具
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
PowerGrep文本批量抽取工具
很好用的语料库工具,或者说是批量文本抽取工具。
所属分类:
专业指导
发布日期:2011-03-30
文件大小:11534336
提供者:
zhangbc1
自然语言工具包(nltk),python
这本书提供自然语言处理领域非常方便的入门指南。它可以用来自学,也可以作为自然语言处理或计算语言学课程的教科书,或是人工智能、文本挖掘、语料库语言学课程的补充读物。本书的实践性很强,包括几百个实际可用的例子和分级练习。
所属分类:
专业指导
发布日期:2012-12-03
文件大小:4194304
提供者:
cfx337
基于HTK的连续语音识别技术研究
基于HTK的连续语音识别技术研究 语音识别是让机器能够“听懂”人类的语言、并把人类的语音信号转化为相应的文本 或命令的技术⋯。语音识别可以认为是模式识别的一个分支,它与声学、语言学、心理学、 数字信号处理、计算机学科等有密切的联系,是--I"1跨学科的技术。 本文以HTK为工具,以HMM为模型,实现了母语为英语的非特定人、大词汇量连 续语音识别系统。非特定人、连续、大词汇量这三个特点是语音识别走向应用必须要实现 的目标。本文中训练和测试的语音库来自NIST的TIMIT,该数据库是一个平衡语料库
所属分类:
C
发布日期:2013-01-30
文件大小:3145728
提供者:
lilyliu307307
语料库wordsmith6.0软件(最新英文版)
WordSmith Tools 是一个在Window下运行的用来观测文字在文本中的表现的功能强大的综合软件包。它共包含Concord (语境共现检索工具)、WordList (词频列表检索工具) 、KeyWords(关键词检索工具)、Splitter(文本分割工具)、Text Converter (文本替换工具)、Viewer(文本浏览工具)等六个程序,其中前面三个程序是主要的文本检索工具,后面三个程序属于辅助性工具。这六个程序的各项设置由一个叫WordSmith Tools Controll
所属分类:
教育
发布日期:2015-01-22
文件大小:61865984
提供者:
wufuhehe
Java 词海分析 自然语言分析 人名地名机构名提取自定义词典
中文分词 最短路分词 N-最短路分词 CRF分词 索引分词 极速词典分词 用户自定义词典 词性标注 命名实体识别 中国人名识别 音译人名识别 日本人名识别 地名识别 实体机构名识别 关键词提取 TextRank关键词提取 自动摘要 TextRank自动摘要 短语提取 基于互信息和左右信息熵的短语提取 拼音转换 多音字 声母 韵母 声调 简繁转换 繁体中文分词 简繁分歧词(简体、繁体、臺灣正體、香港繁體) 文本推荐 语义推荐 拼音推荐 字词推荐 依存句法分析 基于神经网络的高性能依存句法分析器
所属分类:
Java
发布日期:2017-10-11
文件大小:22020096
提供者:
vip923803855
Python 自然语言处理
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。 《Python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。《Python自然语言处理》基于Python编程语言以及一个名为NLTK的自然语言工具包的开源库,但并不要求读者有Python编程的经验。全书共1
所属分类:
Python
发布日期:2018-05-12
文件大小:3145728
提供者:
jisuran
英语词汇分析工具V6.4中文免费安装版
英语词汇分析工具是一款对英文文本进行单词分割提取、原型转化,是一款简易的语料库构建平台,生僻词、新词汇收录,快来下载学习吧。 功能介绍 1. 英语词汇数据采集 本软件可以直接对英文文本文件进行单词的分割提取、原型转化,提供词汇表、词频数据、词汇分级数据、总词量、容词率、单词覆盖率、常用词占率… 2 简易语料库构建平台 平台不提供内容!用户可以自己编写相关资料,使其成为教学、研究的
所属分类:
其它
发布日期:2019-08-07
文件大小:17825792
提供者:
weixin_39840387
配置好的傻瓜化小狼毫全拼+多种双拼+五笔86-98+笔画输入法v200312 - 17种方案
简介 这是一套按照绝大多数人习惯配置优化好的小狼毫。 小狼毫是一款优秀的开源免费输入法平台,可定制性极强,无任何广告骚扰和隐私泄露的风险,但要配置好它,对于不少人是比较困难的。为此,我们把它进行了全方位配置,以做到各种需求都可拿来即用,不需折腾。 对于喜欢折腾的朋友,本套小狼毫的所有方案和码表都是开放的,同时附带了丰富的功能导向的修改指南,非常方便二次修改。 主要特色 1.包含86版五笔、98版五笔;全拼、双拼(几乎囊括当前所有主流双拼方案);五笔画、手写(方便输入疑难生僻字);快
所属分类:
桌面系统
发布日期:2020-03-12
文件大小:26043084
提供者:
emca
正则表达式在语料库研究中的应用
语料库技术的关键在于通过对大规模真实文本的自动化分析处理,探索自然语言的内在规律。计算机程序编辑中广泛使用的正则表达式技术,因其强大的文本批处理能力,被逐渐应用于语料库开发和复杂检索等相关技术中。本文的研究目的在于厘清正则表达式的起源、概念和构造,并以任务驱动的方法,以几款常用的语料库工具为例,探讨正则表达式在文本清理、语料标注和检索等技术环节中的具体应用,从而进一步推动正则表达式在语料库研究中的普及和应用。
所属分类:
其它
发布日期:2020-07-09
文件大小:719872
提供者:
weixin_38626943
pyhanlp安装介绍和简单应用
1. 前言 中文分词≠自然语言处理! Hanlp HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁 中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。 不同于一些简陋的分词类库,HanLP精心
所属分类:
其它
发布日期:2020-12-31
文件大小:146432
提供者:
weixin_38652636
Python自然语言处理-从文本提取信息
回答下列问题: (1)如何能构建一个系统,以至从非结构化文本中提取结构化数据? (2)有哪些稳健的方法识别一个文本描述的实体和关系? (3)哪些语料库适合这项工作,如何使用它们来训练和评估模型?信息有很多种”形状“和”大小“,一个重要的形式是结构化数据:实体和关系的规范和可预测的组织。例如:我们可能对公司和地点之间的关系,可用关系数据库存储。但如果我们尝试从文本中获得相似的信息,事情就比较麻烦了。如何从一段文字中发现一个实体和关系的表呢?然后,利用强大的查询工具,如SQL,这种从文本获取意
所属分类:
其它
发布日期:2021-02-24
文件大小:220160
提供者:
weixin_38733597
面向语音合成的维吾尔语音素自动切分算法研究
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。
所属分类:
其它
发布日期:2021-02-21
文件大小:1048576
提供者:
weixin_38635979