点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - Jieba分词
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
jieba 分词
组件只提供jieba.cut 方法用于分词 cut方法接受两个输入参数: 第一个参数为需要分词的字符串 cut_all参数用来控制分词模式 待分词的字符串可以是gbk字符串、utf-8字符串或者unicode jieba.cut返回的结构是一个可迭代的generator,可以使用for循环来获得分词后得到的每一个词语(unicode),也可以用list(jieba.cut(...))转化为list
所属分类:
Python
发布日期:2016-08-16
文件大小:7340032
提供者:
siolioy
jieba分词资源包
结巴分词用到的资源文件,使用方式见博客
所属分类:
Java
发布日期:2016-11-16
文件大小:1048576
提供者:
wbcg111
jieba分词支持关键词带空格和特殊字符
jieba分词支持关键词带空格和特殊字符
所属分类:
Python
发布日期:2017-02-21
文件大小:19456
提供者:
wangpei1949
运用Jieba分词对红楼婪进行词云分析
运用Jieba分词对红楼婪进行词云分析,可以分析红楼梦中词频及人物关系。
所属分类:
教育
发布日期:2018-05-09
文件大小:109568
提供者:
bowen2006
java版jieba分词统计,含1.02版本jar
结巴分词,jieba分词,统计分词出现的频率,按频率统计分词出现的频率。
所属分类:
Java
发布日期:2018-06-14
文件大小:6291456
提供者:
qq_26408545
jieba分词器字典
jieba分词器所用的字典,包含词频以及词性,可自行调整频次等属性。(仅做学习交流用,禁止商用)
所属分类:
机器学习
发布日期:2018-07-13
文件大小:4194304
提供者:
rex_gallon
jieba分词java版项目
jieba分词java版项目,解压文件后,用eclipse导入项目后,执行run包下的test程序即可。
所属分类:
Java
发布日期:2018-02-08
文件大小:4194304
提供者:
u012483103
结巴分词中一部分自定义字典
本人在使用jieba分词做项目时,锁整理出来的一部分被切分的词
所属分类:
机器学习
发布日期:2018-09-25
文件大小:1024
提供者:
weixin_43173880
jieba分词资源包
结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客
所属分类:
Java
发布日期:2019-07-08
文件大小:1048576
提供者:
etmessi
jieba分词资源包
结巴分词用到的资源文件,使用方式见博客
所属分类:
Java
发布日期:2020-06-09
文件大小:1048576
提供者:
yzucyj
python同义词替换的实现(jieba分词)
主要介绍了python同义词替换的实现(jieba分词),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
所属分类:
其它
发布日期:2020-09-18
文件大小:48128
提供者:
weixin_38641764
Django实现whoosh搜索引擎使用jieba分词
主要介绍了Django实现whoosh搜索引擎使用jieba分词,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
所属分类:
其它
发布日期:2020-09-17
文件大小:241664
提供者:
weixin_38692707
浅谈python jieba分词模块的基本用法
本篇文章主要介绍了浅谈python jieba分词模块的基本用法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
所属分类:
其它
发布日期:2020-09-21
文件大小:96256
提供者:
weixin_38659622
jieba分词器 java版
本人最近在用lucene做一些东西,需要用到jieba分词器。但csdn上的资源都是需要积分的,一个开源软件竟然还要积分。。。从github找的,分享给大家吧
所属分类:
Java
发布日期:2020-10-10
文件大小:2097152
提供者:
weixin_43820378
Jieba分词.rar
针对jieba的各种分词模式进行测试,并且给出了对三国演义的关键词提取,以及数据集,同时包括其他常用分词数据集
所属分类:
Python
发布日期:2020-11-21
文件大小:5242880
提供者:
qq_44465615
《中文jieba分词》总结
针对jieba分词作业做一个总结,方便以后查看。 中文分词 分词,即切词,在NLP文本预处理中经常使用一些方法来对文本进行分词,从而使文本从“字序列”升级到“词序列”。 为什么要进行分词?在中文中,一个个汉字有其自身的含义,但是组成词语时,其含义可能会发生很大的变化,使得之后进行文本处理任务时不能很好的理解句子的含义。(比如“和”,“平”,“和平”,三者的含义有很大的不同。)另外,从字序列升级成词序列,可以使模型能够得到更高级的特征。 分词算法有很多,比如正向最大匹配算法,逆向最大匹配算法,双向
所属分类:
其它
发布日期:2020-12-22
文件大小:61440
提供者:
weixin_38591291
jieba分词资源包
结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客 结巴分词用到的资源文件,使用方式见博客
所属分类:
Java
发布日期:2021-02-09
文件大小:1048576
提供者:
magicnono
jieba分词关键字含英文和特殊字符的处理方法
1.默认情况 语句中关键字在含有英文和特殊字符时(machine-1234),使用jieba往往将我们的关键词分割的非常零碎,比如: # 默认情况 import jieba str1 = 查找machine-1234的产品说明书 for w in jieba.cut(str1): print(w) # 运行结果 >>>查找 >>>machine >>>- >>>1234 >>>的 >>&
所属分类:
其它
发布日期:2021-01-21
文件大小:32768
提供者:
weixin_38545243
jieba分词详解和实践
jieba分词是目前最好的 python中文分词组件。在讲解jieba分词之前,我们先了解一下中文分词的一些概念: 最常用的TF-IDF 什么是TF-IDF呢?要分成2个部分来理解。 TF,词频——一个词在文章中出现的次数 IDF,在词频的基础上,赋予每个词一个权重,体现该词的重要性。 这是什么意思呢?我们来看个例子。 这是一条财经类新闻 上周 / 沉寂 / 一段 / 时间 / 的 / 白酒股 / 卷土重来 / ;/ 其中 / 古井贡酒 / 的 / 股价 / 创出 / 了 / 历史新高 / ,
所属分类:
其它
发布日期:2021-01-20
文件大小:39936
提供者:
weixin_38534352
Django实现whoosh搜索引擎使用jieba分词
本文介绍了Django实现whoosh搜索引擎使用jieba分词,分享给大家,具体如下: Django版本:3.0.4 python包准备: pip install django-haystack pip install jieba 使用jieba分词 1.cd到site-packages内的haystack包,创建并编辑ChineseAnalyzer.py文件 # (注意:pip安装的是django-haystack,但是实际包的文件夹名字为haystack) cd /usr/local/
所属分类:
其它
发布日期:2021-01-20
文件大小:235520
提供者:
weixin_38628920
«
1
2
3
4
5
6
7
8
9
10
»