搜索资源 - 词语切分 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 词语切分

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

perl语言实现词语切分
一个用perl语言编写的文章切分程序，利用所给词库对语料进行切分……
所属分类：Perl
- 发布日期：2010-04-16
- 文件大小：1048576
- 提供者：buptlian

LJCorpus中文语料库分析软件
LJCorpus试用版本下载地址下载地址：http://www.lingjoin.com/download/LJCorpus.rar 介绍： LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统，应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术，目前，东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析，极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括： 1. 新词发现：
所属分类：专业指导
- 发布日期：2010-04-17
- 文件大小：12582912
- 提供者：lingjoin

中文词语分析一体化系统
当前主要的中文词语分析系统哈工大统计分词系统自动化所三元统计模型清华大学SEGTAG系统词典中的每一个重要的词都加上了切分标志无条件切出qk类词；完全切分ck类词；其他无交叉歧义的切之，否则全切分。 "动态规划"和"全切分搜索+叶子评价"
所属分类：专业指导
- 发布日期：2010-04-20
- 文件大小：381952
- 提供者：hovany

LJParser文本搜索与挖掘开发平台
一、简介 LJParser文本搜索与挖掘开发平台包括：全文精准搜索，新词发现，汉语分词标注，词语统计与术语翻译，自动聚类与热点发现，分类过滤，自动摘要，关键词提取，文档去重，正文提取等十余项功能。针对互联网内容处理的需要，融合了自然语言理解、网络搜索和文本挖掘的技术，提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成，各个中间件API可以无缝地融合到客户的各类复杂应用系统之中，可兼容Windows，Linux， Android，Maemo5, FreeBSD等不同操作系统平台，可以供
所属分类：Web开发
- 发布日期：2010-05-11
- 文件大小：17825792
- 提供者：lingjoin

灵柩软件可用于汉语分词处理
LJParser文本搜索与挖掘开发平台的十大功能： 1. 全文精准检索支持文本、数字、日期、字符串等各种数据类型，多字段的高效搜索，支持AND/OR/NOT以及NEAR邻近等查询语法，支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现：从文件集合中挖掘出内涵的新词语列表，可以用于用户专业词典的编撰；还可以进一步编辑标注，导入分词词典中，从而提高分词系统的准确度，并适应新的语言变化。 3. 分词标注：对原始语料进行分词
所属分类：Web开发
- 发布日期：2010-11-05
- 文件大小：688128
- 提供者：zhangguoqiang52

freeICTCLAS中科院中文分词(拼音中文输入法设计和源代码).zip
freeICTCLAS中科院中文分词(拼音中文输入法设计和源代码).zip ICTCLAS源码结构 Codes │ ICTCLAS_WIN.cpp Windows界面的程序 │ ICTCLAS_Win.dsp │ ICTCLAS_WIN.dsw │ ICTCLAS_WIN.h │ ICTCLAS_Win.exe 可执行程序 │ ICTCLAS_WinDlg.cpp │ ICTCLAS_WinDlg.h │ resource.h │ StdAfx.cpp │ StdAfx.h │ log.txt
所属分类：C++
- 发布日期：2011-05-21
- 文件大小：2097152
- 提供者：duizhong

基于N最短路径方法与中国人名识别的中文分词系统
采取基于N-最短路径方法的中文词语粗分模型对中文文本进行粗切分，采取Viterbi算法对切分结果进行角色标注，在角色序列的基础上，进行模式最大匹配，最终实现中国人名的识别
所属分类：专业指导
- 发布日期：2012-09-25
- 文件大小：353280
- 提供者：danisein

pscws23-20081221.tar.bz2【中文分词】
php中文分词 ===== PSCWS23 - 说明文档 ===== $Id: readme.txt,v 1.3 2008/12/21 04:37:59 hightman Exp $ [ 关于 PSCWS23 ] PSCWS23 是由 hightman 于 2006 年开发的纯 PHP 代码实现的简易中文分词系统第二和第三版的简称。 PSCWS 是英文 PHP Simple Chinese Words Segmentation 的头字母缩写，它是 SCWS 项目的前身。现 SCWS 已作为
所属分类：PHP
- 发布日期：2013-09-08
- 文件大小：2097152
- 提供者：yao__shun__yu

《计算语言学》讲义-中科院刘群教授
中国科学院研究生院信息学院硕士生课程刘群教授主讲。本课程为计算机软件与理论专业研究生的专业基础课。通过本课程的学习，使同学掌握计算语言学的基本理论，了解自然语言处理的常用模型和算法，初步具备从事相关领域研究工作的能力。内容提要：第一章概论介绍计算语言学的研究对象，研究手段，学科特点，历史趋势等。第二章词典词典编纂，组织，检索等。第三章语料库语料库收集，整理，对齐，检索，基于语料库的知识获取。第四章词法分析正则语法与有限状态自动机，HMM与词性标注，汉语词语切分，
所属分类：专业指导
- 发布日期：2013-11-21
- 文件大小：9437184
- 提供者：yuhentian

Lucene中文分词组件 JE-Analysis 1.5.1
发布于：http://www.jesoft.cn/posts/list/5.page 1.5.1 —— 2006-01-22 修正细粒度分词错误的问题 1.5.0 —— 2007-01-18 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配增加了Mail地址的匹配实现了词尾消歧算法第二层的过滤整理优化了词库 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 200
所属分类：其它
- 发布日期：2007-01-22
- 文件大小：891904
- 提供者：diystar

自然语言处理工具----切词程序源代码
自然语言处理的好工具中科院最新切词程序分析内含所有源代码 Java语言编写的
所属分类：Java
- 发布日期：2008-12-29
- 文件大小：2097152
- 提供者：hit2007

汉语语料库加工规范
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
所属分类：搜索引擎
- 发布日期：2018-01-12
- 文件大小：171008
- 提供者：johnson219

北京大学常宝宝老师-计算机语言学
北京大学常宝宝老师-计算机语言学讲义词语切分数据平滑语言模型词类自动标注句法分析
所属分类：讲义
- 发布日期：2018-01-30
- 文件大小：4194304
- 提供者：win817

复旦nlp中文分词
复旦nlp中文分词，可以对中文文本词语切分，自然语言处理
所属分类：Python
- 发布日期：2018-09-05
- 文件大小：1048576
- 提供者：qq_24074771

现代汉语语料库加工规范(pku)
北大计算语言学研究所从1992年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范Ｖ1.0》。几年来已完成了约60万字语料的切分与标注，并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后，最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行，北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范Ｖ2.0》（征求意见稿）。因这次加工的任务超出词语
所属分类：专业指导
- 发布日期：2010-10-20
- 文件大小：302080
- 提供者：yjsmzq

python实现根据文件关键字进行切分为多个文件的示例
今天小编就为大家分享一篇python实现根据文件关键字进行切分为多个文件的示例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
所属分类：其它
- 发布日期：2020-09-19
- 文件大小：33792
- 提供者：weixin_38722891

汉语分词标准汇总
文章目录《PFR人民日报标注语料库》词性编码表《现代汉语语料库加工规范——词语切分与词性标注》词性标记计算所 ICTCLAS 3.0汉语词性标记集形容词(1个一类，4个二类)区别词(1个一类，2个二类)连词(1个一类，1个二类)副词(1个一类)叹词(1个一类)方位词(1个一类)前缀(1个一类)后缀(1个一类)数词(1个一类，1个二类)名词 (1个一类，7个二类，5个三类)拟声词(1个一类)介词(1个一类，2个二类)量词(1个一类，2个二类)代词(1个一类，4个二类，6个三类)处所词(1个一类)时
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：288768
- 提供者：weixin_38530202

freeICTCLAS中科院中文分词(拼音中文输入法设计和源代码)
ICTCLAS源码主要模块 │ ICTCLAS_WIN.cpp Windows界面的程序│ log.txt 日志├─Utility 共用函数模块├─Unknown 未登录词识别模块├─Tag HMM标注模块├─Segment 词语切分模块├─Result 结果生成模块├─Data 概率数据文件
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：2097152
- 提供者：weixin_38722588

基于规则的哈萨克语句法分析算法研究
哈萨克语的理解一般分为以下步骤: 原文输入词语切分及词语属性特征标注语法及句法分析语义及语用和语境分析生成目标形式表示句群及篇章理解等句子分析上接篇章理解，下联词汇分析，起着承上启下的作用由于哈萨克语句法分析结果的准确度将对后续机器翻译的研究产生影响，在掌握哈萨克语词法分析技术的基础上，结合现代哈萨克语句法结构特点，首先介绍了厄尔利算法算法和线图算法三种基于规则的句法分析算法通过实验对比发现，线图分析算法在哈萨克语简单句的分析中具有运算速度快和占用空间小的综合优势针对传统线图分析算法
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：917504
- 提供者：weixin_38747025

文本切分
您好！我是“筋斗云上”，请多关照！第一篇文本切分文本切分包含两个步骤：句子切分、词语切分一、句子切分句子切分是将文本语料库分解成句子的过程，句子切分基本技术是在句子之间寻找特定的分隔符，例如句号（.）换行符（\n）或者分号（；）等。 NLTK框架常用的句子切分器有： sent_tokenize PunkSentenceTokenizer RegexpTokenizer 预先训练的句子切分模型关于sent_tokenize，以NLTK中的古腾堡（gutenberg）语料库为
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：34816
- 提供者：weixin_38545485

« 12 3 »