搜索资源 - 汉语自然语言分词词典 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 汉语自然语言分词词典

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

计算所汉语词法分析系统ICTCLAS
词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位，词语之间没有明显的区分标记，因此，中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上，耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97.58%(最近的973专家组评测结
所属分类：嵌入式
- 发布日期：2007-11-25
- 文件大小：2097152
- 提供者：yanghuan6215

LJParser文本搜索与挖掘开发平台
一、简介 LJParser文本搜索与挖掘开发平台包括：全文精准搜索，新词发现，汉语分词标注，词语统计与术语翻译，自动聚类与热点发现，分类过滤，自动摘要，关键词提取，文档去重，正文提取等十余项功能。针对互联网内容处理的需要，融合了自然语言理解、网络搜索和文本挖掘的技术，提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成，各个中间件API可以无缝地融合到客户的各类复杂应用系统之中，可兼容Windows，Linux， Android，Maemo5, FreeBSD等不同操作系统平台，可以供
所属分类：Web开发
- 发布日期：2010-05-11
- 文件大小：17825792
- 提供者：lingjoin

自然语言处理论文集(别下载了，文件毁坏的, 对CSDN无语)
包括：汉语自动分词中的上下文相关歧义字段(CSAS)研究,面向Internet的中文新词语检测,一种中文分词词典新机制——双字哈希机制,统计语言模型及汉语音字转换的一些新结果,基于EM算法的汉语自动分词方法等
所属分类：其它
- 发布日期：2008-04-20
- 文件大小：2097152
- 提供者：yeetoo

北大汉语语法信息词典
用于自然语言处理，作为语料库使用，可用于分词，词性标注
所属分类：教育
- 发布日期：2012-11-02
- 文件大小：446464
- 提供者：linxuantoo

ICTCLAS2013
简介：应各位ICTCLAS用户的要求，张华平博士提前发布ICTCLAS2013 版本，为了与以前工作进行大的区隔，并推广NLPIR自然语言处理与信息检索共享平台，从本版本开始，系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年，内核升级10次，全球用户突破20万，先后获得了2010年钱伟长中文信息处理科学技术奖一等奖，2003年国际SIGHAN分词大赛综合第一名，2002年国内973评测综合第一名。 NLPIR汉语分词系统（又名ICTCLAS2013），主要功能包括中文分词；词性
所属分类：企业管理
- 发布日期：2013-01-15
- 文件大小：7340032
- 提供者：nickpeng

NLPIR(ICTCLAS2013)中文分词
张华平博士正式发布ICTCLAS2013 版本，为了与以前工作进行大的区隔，并推广NLPIR自然语言处理与信息检索共享平台，从本版本开始，系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年，内核升级10次，全球用户突破20万，先后获得了2010年钱伟长中文信息处理科学技术奖一等奖，2003年国际SIGHAN分词大赛综合第一名，2002年国内973评测综合第一名。 NLPIR汉语分词系统（又名ICTCLAS2013），主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持G
所属分类：其它
- 发布日期：2013-03-17
- 文件大小：7340032
- 提供者：lankelan

自然语言处理全集
自然语言处理(汉语)算法实现，Java语言实现，经过优化，效率很高。主要包括： 1）汉语分词，采用ICTCLAS系统和Lucene+庖丁解牛系统 2）情感倾向性分析，包括基于统计学习的SVM算法，基于情感词典的词语权重算法，给出文档的情感权重和情感倾向 3）文本聚类，包括KMeas算法实现，文档向量建模，以及采用Weka API 库效率比较 4）词语关系网络，包括词语距离计算，构建词语的近似程度，并刻画词语网络图 5）抽象摘要，采用TFIDF计算文档关键词进行摘要和关键字提取经过部分优化，对
所属分类：Java
- 发布日期：2014-11-29
- 文件大小：6291456
- 提供者：lixufeng1992

自然语言处理全集_代码结构说明.doc
自然语言处理(汉语)算法实现，Java语言实现，经过优化，效率很高。主要包括： 1）汉语分词，采用ICTCLAS系统和Lucene+庖丁解牛系统 2）情感倾向性分析，包括基于统计学习的SVM算法，基于情感词典的词语权重算法，给出文档的情感权重和情感倾向 3）文本聚类，包括KMeas算法实现，文档向量建模，以及采用Weka API 库效率比较 4）词语关系网络，包括词语距离计算，构建词语的近似程度，并刻画词语网络图 5）抽象摘要，采用TFIDF计算文档关键词进行摘要和关键字提取经过部分优化，对
所属分类：Java
- 发布日期：2014-11-29
- 文件大小：25600
- 提供者：lixufeng1992

HanLP：汉语语言处理-源码
HanLP是一系列模型与算法组成的NLP工具包，由大快搜索主导并完全开源，目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善，性能高效，架构清晰，语料时新，可自定义的特点。 HanLP提供下列功能：中文分词 HMM-两字组（速度与精度最佳平衡;一百兆内存）最短路分词，N-最短路分词由字构词（侧重精度，全世界最大语料库，可识别新词;适合NLP任务）感知机分词，CRF分词词典分词（侧重速度，每秒数千万字符;省内存）极速词典分词所有分词器都支持：索引全切分模式用户自定
所属分类：机器学习
- 发布日期：2019-03-07
- 文件大小：98566144
- 提供者：iskugs

统计自然语言处理
统计自然语言处理是一本很好的书籍，是一本很基础的书籍目录序二第2版前宣第1版前言第1章绪论 11基本概念 1.1.1语言学与语音学 2自然语言处理 11.3关于“理解”的标准 1,2自然语言处理研究的内容和面临的困难 1,2,1自然语言处理研宄的内容 1,22自然语言处理涉及的几个层次 1.2.3自然语言处理面临的困难 13自然语言处理的基本方法及其发展 13,1自然语言处理的基本方汏 3,2自然语言处理的发展 14自然语言处理的研究现状本书的内容安挂第2章顸备知识 2,1概率论基本
所属分类：Python
- 发布日期：2019-03-04
- 文件大小：25165824
- 提供者：weixin_34749051

汉语自然语言分词词典
分词词典同义词词典汉语有18万分词词典和5000个同义词词典
所属分类：其它
- 发布日期：2011-10-18
- 文件大小：1048576
- 提供者：chen552

相似度：相似度：相似度计算工具包，java编写。用于词，短语，句子，词法分析，情感分析，语义分析等相关的相似度计算-源码
相似适用词，语法，句子，词法分析，情感分析，语义分析等相关的相似度计算。相似度是由一系列算法组成的Java版相似度计算工具包，目标是传播自然语言处理中相似度计算方法。相似度是工具实用，性能高效，架构清晰，语料时新，可自定义的特点。相似性提供下列功能：词相似度计算词林编码法相似度汉语语义法相似度知网词相似度字面编辑距离法初步相似度计算简单而言相似度句子相似度计算词性和词序结合法编辑距离算法 Gregor编辑距离法优化编辑距离法文本相似度计算余弦相似度编辑距离算
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：23068672
- 提供者：weixin_42139357