搜索资源 - 文本分词 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 文本分词

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

中科院汉语分词工具
中科院汉语分词工具ICTCLAS，中文分词，文本分词，基于C++开发
所属分类：C/C++
- 发布日期：2011-12-20
- 文件大小：3145728
- 提供者：xu_haiwen

lucene-core-2.9.2
用于文本分词，特征词TFIDF计算时的需要的开发包
所属分类：Java
- 发布日期：2012-05-11
- 文件大小：1048576
- 提供者：huashengmier

基于K-means的文本聚类
基于K-means的文本聚类，实现了文本分词，去除停用词，聚类等，直接运行
所属分类：Java
- 发布日期：2012-07-03
- 文件大小：9216
- 提供者：abclinlin2011

je-analysis-1.5.1.jar+lucene-core-3.5.0.jar+IKAnalyzer2012.zip
文本分词时需要导入这些包，我是在做垃圾短信的检测时用到的，希望可以帮助有些人
所属分类：Java
- 发布日期：2013-04-08
- 文件大小：4194304
- 提供者：jinse199019

基于向量空间模型的中文文本分类技术研究
0引言伴随着文本挖掘技术的发展,文本分词技术作为文本挖掘技术的一个重要研究分支,也得到了迅速的发展.文本分词技术为大多数文本挖掘技术(如文本分类技术,文本聚类技术等)提供文本预处理工作,分词效果的好坏会直接影响到后续的处理过程,因此文本分词技术是文本挖掘过程中的
所属分类：Java
- 发布日期：2013-07-02
- 文件大小：494592
- 提供者：u011272837

python代码
python进行文本分词过滤处理，代码简单，支持中文文本
所属分类：Python
- 发布日期：2015-03-14
- 文件大小：2048
- 提供者：muziqingqing

英文文本分词java
基于java 的英文文本分词技术，对于初学的同学应该有用.doc
所属分类：Java
- 发布日期：2016-01-12
- 文件大小：44032
- 提供者：ljw123429

stanford-parser
这是一个斯坦福的文本分词系统，可以生成语法树。这是一个斯坦福的文本分词系统，可以生成语法树
所属分类：Java
- 发布日期：2016-03-07
- 文件大小：55574528
- 提供者：scott0704

去分词java版
文本分来，文中进行了分词，去停用词，用TFIDF来实现
所属分类：Java
- 发布日期：2016-04-12
- 文件大小：10240
- 提供者：u013194880

朴素贝叶斯分类算法
朴素贝叶斯算法的实现，从文本分词，预料的训练，到最后实现
所属分类：Java
- 发布日期：2016-07-12
- 文件大小：102400
- 提供者：yuyanyanyanyanyu

英文文本分词jar包与代码
文本分词
所属分类：Java
- 发布日期：2017-04-13
- 文件大小：2097152
- 提供者：alt_lb

大数据处理
互联网信息自动抓取，最常见且有效的方式是使用网络爬虫。文本分词是将字符串文本划分为有意义的单位的过程，如词语、句子或主题。。。。
所属分类：算法与数据结构
- 发布日期：2018-07-18
- 文件大小：6291456
- 提供者：weixin_39629642

马航失踪评论文本分词
据美国媒体 13 日报道，自 8 日以来， MH370 搜索人员就再未探测到新的脉冲信号，黑匣子的电池可能已经耗尽电量。一旦确信再也发现不了电子脉冲信号，水下机器人就有可能被投入进行工作。 http : / / t . cn / 8spSuZS
所属分类：其它
- 发布日期：2018-07-30
- 文件大小：14336
- 提供者：qq_39190865

BSBI倒排索引算法
python3.6实现中文语料文本的BSBI算法（倒排索引）索引程序实现。包括中文文本分词，停用词表。
所属分类：专业指导
- 发布日期：2018-10-29
- 文件大小：86016
- 提供者：kingle123

文本分析软件ROST CM6+使用说明
文本分析软件ROST CM6，支持文本分词，词频分析，社会网络和语义网络分析，情感分析与标签云等。
所属分类：机器学习
- 发布日期：2018-11-29
- 文件大小：9437184
- 提供者：esthermabel

python文本分词，去停用词，包含基础停用词词典
用于中文文本分词，去停用词，包含基本的停用词词典，可根据需要进行扩充。
所属分类：Python
- 发布日期：2019-03-06
- 文件大小：7168
- 提供者：u013293771

主题模型Python工具包Gensim.zip
Gensim是一个相当专业的主题模型Python工具包。在文本处理中，比如商品评论挖掘，有时需要了解每个评论分别和商品的描述之间的相似度，以此衡量评论的客观性。评论和商品描述的相似度越高，说明评论的用语比较官方，不带太多感情色彩，比较注重描述商品的属性和特性，角度更客观。gensim就是 Python 里面计算文本相似度的程序包。示例代码：针对商品评论和商品描述之间的相似度，怎么使用gensim来计算？原理1、文本相似度计算的需求始于搜索引擎。搜索引擎需要计算“用户查询”和爬下来的众多”网页
所属分类：其它
- 发布日期：2019-07-18
- 文件大小：42991616
- 提供者：weixin_39841848

中文分词算法.docx
1、颗粒度越大越好：用于进行语义分析的文本分词，要求分词结果的颗粒度越大，即单词的字数越多，所能表示的含义越确切，如：“公安局长”可以分为“公安局长”、“公安局长”、“公安局长”都算对，但是要用于语义分析，则“公安局长”的分词结果最好（当然前提是所使用的词典中有这个词）
所属分类：Java
- 发布日期：2020-04-17
- 文件大小：18432
- 提供者：qq_41936098

中文文本分词PPT（详细讲解HMM）
PPT中包含基于词典分词算法以及HMM（隐马尔可夫模型）算法，结巴分词（具体实现算法）等内容，PPT中包含基于词典分词算法以及HMM（隐马尔可夫模型）算法，结巴分词（具体实现算法）等内容
所属分类：深度学习
- 发布日期：2020-12-12
- 文件大小：3145728
- 提供者：weixin_40732165

基于条件随机场的中文短文本分词方法
中文分词是信息检索工作的一项先决任务。随着大数据时代的到来,信息检索工作对于中文分词准确率和召回率的要求也不断提高。该文提出了一种针对中文短文本的分词方法。该方法首先利用机器学习中的条件随机场模型对待处理的中文短文本进行初步分词,然后再利用传统词典分词方法对初步分词结果进行修正,从而完成分词工作。针对中文短文本的特点,该方法在条件随机场的标记选择和特征模板编写上做了相应优化。测试结果表明,该方法改善了传统的基于词典的分词法因为未登录词和交叠歧义而产生的准确率和召回率下降的问题,并在Sighan
所属分类：其它
- 发布日期：2021-03-17
- 文件大小：354304
- 提供者：weixin_38689736

« 12 »