搜索资源 - 汉语标注 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 汉语标注

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

基于模型的汉语词性标注研究
基于模型的汉语词性标注研究的论文，欢迎参考，caj格式的，需要caj阅读器哦。
所属分类：专业指导
- 发布日期：2009-12-16
- 文件大小：2097152
- 提供者：dachun032

计算所汉语词法分析系统ICTCLAS
词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位，词语之间没有明显的区分标记，因此，中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上，耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，该系统的功能有：中文分词；词性标注；未登录词识别。分词正确率高达97.58%(最近的973专家组评测结
所属分类：嵌入式
- 发布日期：2007-11-25
- 文件大小：2097152
- 提供者：yanghuan6215

ACWPS（爱博汉语分词系统）分词组件 asp分词组件
爱博汉语分词系统Web服务器支持标准的HTTP协议，可以跨平台调用，支持分布式运算；爱博汉语分词系统COM组件提供COM和DLL接口（Windows环境）以及共享库.so（Linux）形式，可支持所有支持COM接口调用的编程语言及脚本语言。如：PHP、JSP、ASP、ASP.net、C/C++ 、VC6.0 、VC.net、BC、C#、VB6.0 、VB.net、Delphi、Java等。爱博汉语分词系统支持自定义词语的功能，用户可根据自己需要定义添加汉语词组。可根据需要自行定义影响
所属分类：C#
- 发布日期：2010-02-28
- 文件大小：2097152
- 提供者：selectersky

汉语词法分析系统windows_C_64.rar
中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统
所属分类：嵌入式
- 发布日期：2010-05-03
- 文件大小：8388608
- 提供者：sklzwmw

灵柩软件可用于汉语分词处理
LJParser文本搜索与挖掘开发平台的十大功能： 1. 全文精准检索支持文本、数字、日期、字符串等各种数据类型，多字段的高效搜索，支持AND/OR/NOT以及NEAR邻近等查询语法，支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现：从文件集合中挖掘出内涵的新词语列表，可以用于用户专业词典的编撰；还可以进一步编辑标注，导入分词词典中，从而提高分词系统的准确度，并适应新的语言变化。 3. 分词标注：对原始语料进行分词
所属分类：Web开发
- 发布日期：2010-11-05
- 文件大小：688128
- 提供者：zhangguoqiang52

汉语词法分析系统ICTCLAS2011
汉语词法分析系统ICTCLAS，主要功能包括中文分词；词性标注；命名实体识别；新词识别；用户词典功能，同时支持GBK编码、UTF8编码、BIG5编码。包括java，c，c#，linux 32位等各种接口
所属分类：其它
- 发布日期：2011-12-23
- 文件大小：5242880
- 提供者：greatspider

汉语文本聚类
程序利用中科院的软件，分词、词性标注以后聚类，利用tf-idf值求出30个特征性，生成特征向量，可放在weka中聚类！
所属分类：C++
- 发布日期：2012-03-05
- 文件大小：5242880
- 提供者：bengyu

基于层叠隐马模型的汉语词法分析
提出了一种基于层叠隐马模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中1在分词方面,采取的是基于类的隐马模型,在这层隐马模型中,未登录词和词典中收录的普通词一样处理1未登录词识别引入了角色HMM:Viterbi算法标注出全局最优的角色序列,然后在角色序列的基础上,识别出未登录词,并计算出真实的可信度1在切分排歧方面,提出了一种基于N2最短路径的策略,即:在早期阶段召回N 个最佳结果作为候选集,目的是覆盖尽可能多的歧义字段,最终的结果会在未
所属分类：其它
- 发布日期：2012-09-23
- 文件大小：202752
- 提供者：qq7489451

cmu_seg.pl
用于汉语标注,可以在notetab下运行。陶红印开发。
所属分类：Perl
- 发布日期：2012-10-21
- 文件大小：8192
- 提供者：qinhongwu

词性标注包(acopost-1.8.6)源代码阅读笔记
acopost是Ingo Schroder于02年在德国汉堡大学完成的一个词性标注工具包。主要实现了基于实例、最大熵、2元隐马、基于转换规则等4种词性标注算法，以及评价和算法融合等。采用的语言是perl和c，代码比较短小，非常适于学习。本笔记记录内容： o 对acopost所实现的每个算法的训练和标注的基本流程、函数调用关系、相关文献等做了记录和阐述； o 对每个算法相关的源文件进行了详细注释； o 以汉语分词为实例，记录了4个标注算法的训练和标注结果。 [acopost] http://a
所属分类：专业指导
- 发布日期：2014-01-15
- 文件大小：17825792
- 提供者：yqzhao

基于改进的隐马尔科夫模型的汉语词性标注
基于传统隐马尔科夫(HMM)模型的基础上, 对词语的词汇发射概率做出了新的假设, 从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑, 并且给出了未登录词词汇发射概率估计模型。实验结果证明, 改进后的模型明显优于传统HMM词性标注模型的效果。
所属分类：其它
- 发布日期：2014-02-27
- 文件大小：125952
- 提供者：u013800655

有关词性标注的一点意见
如果翻阅整个词典,肯定会发现不少问题。但是正如吕叔湘先生生前所指出的,“做总比不做好。万事开头难,只要开了头,随着科学的发展和研究的深入,总有一天会完备起来的”。因此在汉语中型词典里给词标注词性,应当充分肯定。
所属分类：讲义
- 发布日期：2016-02-18
- 文件大小：18432
- 提供者：u014677900

汉语词法分析系统ICTCLAS2011
汉语词法分析系统ICTCLAS，主要功能包括中文分词；词性标注；命名实体识别；新词识别；用户词典功能，同时支持GBK编码、UTF8编码、BIG5编码。包括java，c，c#，linux 32位等各种接口
所属分类：Java
- 发布日期：2016-08-28
- 文件大小：5242880
- 提供者：mcyandy_zxb

汉语分词系统
主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。
所属分类：Java
- 发布日期：2018-03-14
- 文件大小：11534336
- 提供者：u012088070

中文文本自动分词和标注
本书介绍了信息处理用现代汉语分词词表的收词原则和方法，《信息处理用现代汉语分词规范》设计原则及规范内容，中文文本歧义切分技术等内容。
所属分类：机器学习
- 发布日期：2018-04-22
- 文件大小：3145728
- 提供者：lengxuedezongzi

汉语词频标注语料
汉语词频标注语料汉语词频标注语料汉语词频标注语料
所属分类：机器学习
- 发布日期：2018-07-20
- 文件大小：175
- 提供者：u013378306

汉语语料库加工规范
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
所属分类：搜索引擎
- 发布日期：2018-01-12
- 文件大小：171008
- 提供者：johnson219

自然语言词性标注程序
汉语的分词与词性标注程序，基于C++开发，可成功运行，其中的input文件是输入文件，output为输出，有一个自己编写的头文件和一个运行文件，语料库是人民日报语料库
所属分类：C++
- 发布日期：2018-02-04
- 文件大小：950272
- 提供者：sh2245237188

老夫子汉语拼音批量标注工具 v1.0.1.rar
老夫子汉语拼音批量标注工具重要功能：软件实现对汉语批量标注，支持各种声调格式，批量标注，每标注 10000 个汉字仅需要约25秒的时间，处理非常迅速。内置GB2312 7800个汉字字库，包括多音字。支持自定义拼音字库。支持自动换行。使用方法： 1，将需要标注拼音的中文拷贝到文本文件（.txt），作为源文件； 2，选择拼音格式，然后执行；
所属分类：其它
- 发布日期：2019-07-13
- 文件大小：615424
- 提供者：weixin_39841882

现代汉语语料库
语言所公开的现代汉语语料库，通过分别查询3500个常用汉字，将所有数据进行清洗去重后的集合。共554026行，解压后约93.8M，带分词和词性标注。
所属分类：算法与数据结构
- 发布日期：2019-04-20
- 文件大小：26214400
- 提供者：archeng

« 12 3 4 5 6 »