点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 停止词
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
搜索引擎的分词列表Lucene-stopwords.rar
在开发apache的lucene框架的时候,如果你要编写自己的分析器的话,就要考虑到停止词的处理。
所属分类:
Java
发布日期:2009-10-10
文件大小:3072
提供者:
xuchengfeifei
使用IK Analyzer实现中文分词之Java实现(包含所有工具包)
1、lucene-core-3.6.0.jar 2、IKAnalyzer2012.jar(主jar包) 3、IKAnalyzer.cfg.xml(分词器扩展配置文件) 4、stopword.dic(停止词典) 5、IkSegmentation.java(样例类)
所属分类:
Java
发布日期:2015-03-30
文件大小:3145728
提供者:
luozhipeng2011
使用IK Analyzer实现中文分词之Java实现
1、lucene-core-3.6.0.jar 2、IKAnalyzer2012.jar(主jar包) 3、IKAnalyzer.cfg.xml(分词器扩展配置文件) 4、stopword.dic(停止词典) 5.IkSegmentation.java(示例代码)
所属分类:
Java
发布日期:2015-03-30
文件大小:3145728
提供者:
luozhipeng2011
tfidf特征提取
代码对10个txt文件进行分词、去除停止词,并提取每个词的tfidf特征值输出
所属分类:
Java
发布日期:2015-10-22
文件大小:1048576
提供者:
u014675586
Lucene.Net+盘古分词Demo
Lucene.Net+盘古分词是一个常见的中文信息检索组合。但是随着盘古分词停止更新,与Lucene.Net3.0无法兼容。为了使得大家少走弯路,本人利用Lucene.Net2.9+盘古分词2.3搭建了一个Demo
所属分类:
C#
发布日期:2016-11-13
文件大小:18874368
提供者:
fps189
IKAnalyzer分词器jar包,支持同义词、扩展词和停止词
自己打包并经过测试的,IKAnalyzerSolrFactory这个类是jdk1.6编辑的,需要高版本的可自己改。同义词可在core的conf里面单独配置,扩展词和停止词在应用的WEB-INF下classes里面配置。
所属分类:
Java
发布日期:2017-04-14
文件大小:1048576
提供者:
redshose
常用中文停用词
常用的中文停用词,停止词,stopword
所属分类:
Python
发布日期:2017-05-08
文件大小:20480
提供者:
suibianshen2012
chineseStopWords.txt
在中文网站里面其实也存在大量的stop word。比如,我们前面这句话,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停止词。这些词因为使用频率过高,几乎每个网页上都存在,所以搜索引擎开发人员都将这一类词语全部忽略掉。
所属分类:
Python
发布日期:2017-08-20
文件大小:3072
提供者:
longai1567
屏幕取词 win98 xp
屏幕取词 使用 nhw32.dll 主要引出两个函数: 1. DWORD WINAPI BL_SetFlag32(UINT nFlag, HWND hNotifyWnd, int MouseX, int MouseY) 功能: 启动或停止取词。 参数: nFlag [输入] 指定下列值之一: GETWORD_ENABLE: 开始取词。在重画被取单词区域前设置此标志。nhw32.dll是通过 重画单词区域,截取TextOutA, TextOutW, ExtTextOutA, ExtTextOut
所属分类:
其它
发布日期:2008-12-12
文件大小:137216
提供者:
fengkuangfj
IKanalyzer约2000个常用停止词库
近期整理的IKAnalyzer中文停用词列表,大约有2000多个词,希望可以帮到大家,下载希望给个好评,谢谢
所属分类:
Java
发布日期:2018-07-25
文件大小:6144
提供者:
tomakemyself
停止词 stopwords
写豆瓣评论爬虫用的停止词,基本上与网上大部分资源相近。
所属分类:
Python
发布日期:2018-01-28
文件大小:20480
提供者:
qq_38597315
中文分词器工具包下载(配置+Jar包)
IK配置+两个Jar包,实现与Solr 7.2.1版本的对接,对中文语句进行分词处理,可自行扩展词库字段ext.dict以及停止词字典dict
所属分类:
Web开发
发布日期:2018-02-06
文件大小:1048576
提供者:
appleyk
sphinx coreseek停止词
sphinx coreseek 停止词 常用一些的停用词,避免大数据索引
所属分类:
其它
发布日期:2018-02-13
文件大小:16384
提供者:
zhy38191
分词中文停止词词典
分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典
所属分类:
机器学习
发布日期:2018-02-25
文件大小:13312
提供者:
q97012791
中文 停止词 stopwords
中文 停止词 stopwords 中文 停止词 stopwords 中文 停止词 stopwords
所属分类:
其它
发布日期:2018-02-28
文件大小:15360
提供者:
anyao112233
中文停止词库
特整理中文停止词如下,方便开发。中文文本分词中先参考了官方给出的示例,官方给出的示例主要是对一条文本进行全分词和精确分词。
所属分类:
Python
发布日期:2018-12-25
文件大小:15360
提供者:
qq_22821275
自然语言处理常用的停止词
自然语言处理常用的停止词
所属分类:
深度学习
发布日期:2019-04-12
文件大小:21504
提供者:
lizibaopeng
搜索引擎无用词 停用词 stopWord.xlsx
搜索引擎开发中有一类词叫停止词,是由英文单词:stopword翻译过来的,原来在英语里面会遇到很多a,the,or等使用频率很多的字或词,常为冠词、介词、副词或连词等。如果搜索引擎要将这些词都索引的话,那么几乎每个网站都会被索引,也就是说工作量巨大。可以毫不夸张的说句,只要是个英文网站都会用到a或者是the。那么这些英文的词跟我们中文有什么关系呢? 在中文网站里面其实也存在大量的stopword,我们称它为停止词。比如,我们前面这句话,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停
所属分类:
其它
发布日期:2020-02-13
文件大小:25600
提供者:
qq_16454809
中文停止词列表
中文停止词列表,包含常用的停止词。编码为UTF-8
所属分类:
教育
发布日期:2013-07-01
文件大小:10240
提供者:
jameshaper
C#分词公共类完整版
C#分词技术公共的api类,C#分词公共类完整版:数据缓存函数,读取文本,写入文本,载入词典,判断字符串是否在制定字符数组中,检测中文字符,格式化字符串,得到分词结果,移除停止词等等方法
所属分类:
C#
发布日期:2020-10-09
文件大小:16384
提供者:
oPinBoFenDou
«
1
2
3
4
5
6
7
»