点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 人民日报词库
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
人民日报(北大)语料库
分词训练语料库,仅供学习和研究使用,禁止用于商业行为
所属分类:
专业指导
发布日期:2009-10-31
文件大小:8388608
提供者:
xufengye256
用于分词和命名实体识别的人民日报语料库
标准的分词语料库,也可用作命名实体识别。
所属分类:
C++
发布日期:2010-04-15
文件大小:2097152
提供者:
snowpku002
基于条件随机场(CRFs)的中文词性标注方法
本文提出一种基于CRFs 模型的中文词性标注方法。该方法利用CRFs 模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1 月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98. 56 %和96. 60 %。
所属分类:
专业指导
发布日期:2010-05-20
文件大小:353280
提供者:
jiangtinghaha
用来中文分词评测用的北大语料库
北大98年1月份语料库 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n
所属分类:
专业指导
发布日期:2010-12-01
文件大小:8388608
提供者:
acmok
最大匹配法文本分词
基于最大匹配的正向分词和反向分词。通过与训练语料库中进行比对,来对指定文本文件进行分词。训练语料库是人民日报1998年1月的文章,训练语料库是已经分好词的
所属分类:
C++
发布日期:2011-12-25
文件大小:7340032
提供者:
hzh416
汉语词频统计软件
专门对汉语词频进行强大分析统计的软件,自带词库,安装即可使用,可自动导出统计结果,并内含人民日报报纸的词频分析,值得下载
所属分类:
其它
发布日期:2013-08-26
文件大小:14680064
提供者:
jc307727407
ICTPOS3.0汉语词性标记集
计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1. 北大《人民日报》语料库词性标记集; 2. 北大2002新版词性标记集(草稿); 3. 清华大学汉语树库词性标记集; 4. 教育部语用所词性标记集(国家推荐标准草案2002版); 5. 美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;
所属分类:
互联网
发布日期:2014-09-04
文件大小:62464
提供者:
beiyouyu
人民日报1998年1月中文标注语料库
人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
所属分类:
专业指导
发布日期:2016-11-11
文件大小:10485760
提供者:
xudaliang_
人民日报语料库
这个语料库自带分词。
所属分类:
机器学习
发布日期:2017-07-29
文件大小:2097152
提供者:
qq_20511439
哈工大信息检索研究中心同义词词林扩展版及说明
∀同义词词林扩展版 # 收录词语近 7万条, 全部按意义进 行编排, 是一部同义类词典。哈工大信息检索研究室参照多部电子词典资源, 并按照人民日报语料库中 词语的出现频度, 只保留频度不低于 3的 (小规模语料的统计结果 ) 部分词语, 剔除 14 706个罕用词 和非常用词后, 词表共包含 77 343条词语。
所属分类:
机器学习
发布日期:2017-09-21
文件大小:1032192
提供者:
zhengudaoer
人民日报中文分词语料库
用于HMM中文分词训练,代码可以参见:https://blog.csdn.net/qq_38593211/article/details/81637029
所属分类:
机器学习
发布日期:2018-08-13
文件大小:16777216
提供者:
qq_38593211
自然语言词性标注程序
汉语的分词与词性标注程序,基于C++开发,可成功运行,其中的input文件是输入文件,output为输出,有一个自己编写的头文件和一个运行文件,语料库是人民日报语料库
所属分类:
C++
发布日期:2018-02-04
文件大小:950272
提供者:
sh2245237188
PeoplesDailyNER-master.rar
人工智能keras深度学习使用1998年人民日报进行分类学习。 训练分词模型! 内含98年语料库。 语料库是标注过的。
所属分类:
Python
发布日期:2019-09-05
文件大小:24117248
提供者:
zy0412326
分词词库_词性人民日报199801.txt
分词词库_词性人民日报199801.txt
所属分类:
深度学习
发布日期:2020-04-29
文件大小:10485760
提供者:
code_fighter
1998年人民日报语料库全
1998年人民日报语料库全 可用于中文分词,词频统计,等自然语言处理领域
所属分类:
其它
发布日期:2013-05-03
文件大小:2097152
提供者:
itmayue
people-2014.7z
NLP学习使用词库,根据人民日报整理的词库标注,包含train和test,根据日期进行了分组。改词库可作为平时练习或课设的时候使用。
所属分类:
机器学习
发布日期:2020-06-11
文件大小:29360128
提供者:
Us006124
北大人民日报语料库98年1月
北大人民日报语料库98年1月,分词研究用
所属分类:
专业指导
发布日期:2010-08-16
文件大小:512000
提供者:
banana0302
人民日报语料库(中文分词语料库)
人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料 人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
所属分类:
专业指导
发布日期:2020-09-08
文件大小:2097152
提供者:
starmoonh
python实现TF-IDF算法解析
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。 同样,理论我这里不再赘述,因为和阮一峰大神早在2013年就将TF-IDF用一种非常通俗的方式讲解出来 TF-IDF与余弦相似性的应用(一):自动提取关键词 材料 1.语料库(已分好词) 2.停用词表(哈工大停用词表) 3.python3.5 语料库的准备 这里使用的语料库是《人民日报》2015年1月16日至1月18日的发表的新闻。并且在进行TFI
所属分类:
其它
发布日期:2020-12-23
文件大小:491520
提供者:
weixin_38729022
汉语分词标准汇总
文章目录《PFR人民日报标注语料库》词性编码表《现代汉语语料库加工规范——词语切分与词性标注》词性标记计算所 ICTCLAS 3.0汉语词性标记集形容词(1个一类,4个二类)区别词(1个一类,2个二类)连词(1个一类,1个二类)副词(1个一类)叹词(1个一类)方位词(1个一类)前缀(1个一类)后缀(1个一类)数词(1个一类,1个二类)名词 (1个一类,7个二类,5个三类)拟声词(1个一类)介词(1个一类,2个二类)量词(1个一类,2个二类)代词(1个一类,4个二类,6个三类)处所词(1个一类)时
所属分类:
其它
发布日期:2021-01-06
文件大小:288768
提供者:
weixin_38530202
«
1
2
»