搜索资源 - 中文分词、词性标注 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 中文分词、词性标注

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

csw5.0中文分词组件
一、CSW中分词组件简介 CSW中文分词组件，是一套可自动将一段文本按常规汉语词组进行拆分，并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法，具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要，本组件同时提供词性及词频标注功能，可根据用户要求，对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、自动摘要、自动分类及信息加工处理等各个领域。二、本组件特点： 1．适应性强本组全部件采用
所属分类：C#
- 发布日期：2009-09-01
- 文件大小：3145728
- 提供者：madl_lxj_163

中科院中文分词ictclaszyfc-v2009.zip
一、ICTCLAS简介　　中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级6次，目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s，分词精
所属分类：嵌入式
- 发布日期：2010-07-19
- 文件大小：11534336
- 提供者：hanmeiaoxue123456

有关词性标注及中文人名、机构名识别的源代码
一个集分词、词性标注和依存句法分析的强大的工具包，能够帮助你识别中文人名、机构名。
所属分类：C++
- 发布日期：2011-09-03
- 文件大小：14680064
- 提供者：haobufei

ICTCLAS2009版中文分词系统
中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级7次，目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典中的词，调节分词的效果。提高了用户词典使用的灵活性。分词粒度可调可以
所属分类：C++
- 发布日期：2012-01-02
- 文件大小：9437184
- 提供者：yahawami

汉语文本聚类
程序利用中科院的软件，分词、词性标注以后聚类，利用tf-idf值求出30个特征性，生成特征向量，可放在weka中聚类！
所属分类：C++
- 发布日期：2012-03-05
- 文件大小：5242880
- 提供者：bengyu

NLPIR(ICTCLAS2013)中文分词
张华平博士正式发布ICTCLAS2013 版本，为了与以前工作进行大的区隔，并推广NLPIR自然语言处理与信息检索共享平台，从本版本开始，系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年，内核升级10次，全球用户突破20万，先后获得了2010年钱伟长中文信息处理科学技术奖一等奖，2003年国际SIGHAN分词大赛综合第一名，2002年国内973评测综合第一名。 NLPIR汉语分词系统（又名ICTCLAS2013），主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持G
所属分类：其它
- 发布日期：2013-03-17
- 文件大小：7340032
- 提供者：lankelan

中文分词器nlpir Java32位开发接口
需配合完整开发包使用，NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取；张华平博士先后倾力打造十余年，内核升级10次。全球用户突破20万，先后获得了2010年钱伟长中文信息处理科学技术奖一等奖，2003年国际SIGHAN分词大赛综合第一名，2002年国内973评测综合第一名。
所属分类：Java
- 发布日期：2013-04-15
- 文件大小：788480
- 提供者：wskings

中文分词与关键词提取（NLPIR java版）
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取；这个是java版本
所属分类：其它
- 发布日期：2013-04-24
- 文件大小：3145728
- 提供者：tiancaiywt

分词器NLPIR
目前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取；张华平博士先后倾力打造十余年，内核升级10次。国内国际排名均为第一。项目已经配置好环境，导入Eclipse即可使用，文件内src下的TestUTF8.java可以直接运行，提供了分词接口
所属分类：Java
- 发布日期：2014-01-21
- 文件大小：4194304
- 提供者：reacherxu

分词系统NLPIR2013
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取；张华平博士先后倾力打造十余年，内核升级10次。全球用户突破20万，先后获得了2010年钱伟长中文信息处理科学技术奖一等奖，2003年国际SIGHAN分词大赛综合第一名，2002年国内973评测综合第一名。
所属分类：Java
- 发布日期：2014-07-13
- 文件大小：7340032
- 提供者：qq_15192337

NLPIR分词例子
中文分词、词性标注、词频统计、关键词提取、文本分类、情感分析、摘要提取
所属分类：Java
- 发布日期：2016-10-20
- 文件大小：27262976
- 提供者：yulongkuke

word-1.3.1.jar中文分词
word 分词是一个Java实现的分布式的中文分词组件，提供了多种基于词典的分词算法，并利用ngram模型来消除歧义。能准确识别英文、数字，以及日期、时间等数量词，能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为，能自定义用户词库、自动检测词库变化、支持大规模分布式环境，能灵活指定多种分词算法，能使用refine功能灵活控制分词结果，还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、Solr、ElasticSearch、Luke集成。
所属分类：Hadoop
- 发布日期：2017-09-26
- 文件大小：25165824
- 提供者：shuaigexiaobo

中文分词及词性标注语料
中文分词及词性标注语料，包含微软亚研院、搜狗、北京大学等的语料库
所属分类：机器学习
- 发布日期：2017-12-18
- 文件大小：41943040
- 提供者：jklhj123

ICTCLAS2009版中文分词系统
中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级7次，目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典中的词，调节分词的效果。提高了用户词典使用的灵活性。分词粒度可调可以
所属分类：嵌入式
- 发布日期：2009-02-23
- 文件大小：9437184
- 提供者：zhangshibin8500

汉语分词系统
主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。
所属分类：Java
- 发布日期：2018-03-14
- 文件大小：11534336
- 提供者：u012088070

中文分词学习版
此为学习版，请勿用于商业用途或扩散。以下描述转至互联网。 ============== 一、CSW中分词组件简介 CSW中文分词组件，是一套可自动将一段文本按常规汉语词组进行拆分，并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法，具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要，本组件同时提供词性及词频标注功能，可根据用户要求，对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、自
所属分类：机器学习
- 发布日期：2018-10-11
- 文件大小：1048576
- 提供者：weixin_43387663

微软亚研的中文分词、词性标注和命名实体识别语料
微软亚研的中文分词、词性标注和命名实体识别语料，包括训练和验证集，xml格式，方便使用，机器学习、信息检索以及NLP领域的研究人员使用来训练模型
所属分类：机器学习
- 发布日期：2018-10-17
- 文件大小：4194304
- 提供者：u010732327

自然语言处理中英文分词、词性标注与命名实体识别——文本和代码
中英文分词工具有很多，今天我们来使用Jieba、SnowNlp、nltk、thunlp、NLPIR、Stanford等六种工具来对给定中英文文本进行分词、词性标注与命名实体识别。
所属分类：Python
- 发布日期：2019-05-24
- 文件大小：7168
- 提供者：godsolve

基于字符的中文分词、词性标注和依存句法分析联合模型
基于字符的中文分词、词性标注和依存句法分析联合模型
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：131072
- 提供者：weixin_38526823

Python结巴中文分词工具使用过程中遇到的问题及解决方法
本文实例讲述了Python结巴中文分词工具使用过程中遇到的问题及解决方法。分享给大家供大家参考，具体如下：结巴分词是Python语言中效果最好的分词工具，其功能包括：分词、词性标注、关键词抽取、支持用户词表等。这几天一直在研究这个工具，在安装与使用过程中遇到一些问题，现在把自己的一些方法帖出来分享一下。官网地址：https://github.com/fxsjy/jieba 1、安装。按照官网上的说法，有三种安装方式，第一种是全自动安装：easy_install jieba 或者 pip
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：99328
- 提供者：weixin_38632046

« 12 3 4 »