点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 新闻语料库
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
用于做自然语言相关处理的新闻语料库。自己写的解析程序下载的
我毕设过程中提取的新闻,可以用来做语料库使用。
所属分类:
专业指导
发布日期:2010-03-13
文件大小:374784
提供者:
finallyliuyu
自然语言处理---语料库
上学期自己下载的新闻,新闻时间是在2009年12月末
所属分类:
专业指导
发布日期:2010-03-13
文件大小:24117248
提供者:
finallyliuyu
自然语言处理语料库新闻文本凤凰新闻第一部分
欢迎大家下载评价,如果对新闻文本纯度有什么建议,欢迎光临我的个人博客http://hi.baidu.com/finallyliuyu 进行交流
所属分类:
Java
发布日期:2010-05-08
文件大小:19922944
提供者:
finallyliuyu
搜狗新闻语料库转存数据库java程序
整理搜狗2008版搜狗新闻分类语料库和全网新闻分类语料库--转存至mysql数据库
所属分类:
Java
发布日期:2011-06-08
文件大小:22528
提供者:
raindreams
网易新闻语料库 文本分类 自然语言处理
网易新闻语料库 文本分类 自然语言处理 网上基本找不到哦~~
所属分类:
其它
发布日期:2013-12-11
文件大小:38797312
提供者:
llwszjj
新闻语料库
包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
所属分类:
Java
发布日期:2016-09-11
文件大小:18874368
提供者:
u013006982
搜狐新闻分类语料库
搜狐新闻分类语料库,主要包含 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事 十个分类,共50多万条记录
所属分类:
机器学习
发布日期:2017-06-19
文件大小:68157440
提供者:
whzhaochao
搜狗实验室新闻分类语料库
搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
所属分类:
机器学习
发布日期:2017-06-19
文件大小:26214400
提供者:
whzhaochao
搜狗新闻语料库
搜狗的新闻中文语料库,可用于word2vec训练用的。。。。。。。。。。。。。。。。。。。。。。。。
所属分类:
机器学习
发布日期:2018-03-31
文件大小:47185920
提供者:
qq_39559491
复旦新闻语料库训练集
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
所属分类:
机器学习
发布日期:2018-11-07
文件大小:29360128
提供者:
ydf_micro
复旦新闻语料库测试集
复旦大学新闻语料库,此为测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
所属分类:
机器学习
发布日期:2018-11-07
文件大小:29360128
提供者:
ydf_micro
复旦新闻语料库训练+测试
复旦大学新闻语料库,该版本已转为UTF-8格式,包含训练集和测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
所属分类:
机器学习
发布日期:2018-11-07
文件大小:123731968
提供者:
ydf_micro
人民网,中新网新闻语料库,几百条
人民网新闻语料库,解压后包含人民网,中新网等最新的几百条新闻,txt的形式
所属分类:
搜索引擎
发布日期:2019-05-09
文件大小:2097152
提供者:
tomatoeslin
中文文本分类_新闻语料库.zip
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
所属分类:
机器学习
发布日期:2020-04-06
文件大小:49283072
提供者:
qq_39496504
新闻和广播网站的藏文文字资源收集和语料库建设
新闻和广播网站的藏文文字资源收集和语料库建设
所属分类:
其它
发布日期:2021-03-18
文件大小:1048576
提供者:
weixin_38650508
新闻语料库中的藏语未知单词识别功能,用于支持基于词典的藏语单词
新闻语料库中的藏语未知单词识别功能,用于支持基于词典的藏语单词
所属分类:
其它
发布日期:2021-03-18
文件大小:750592
提供者:
weixin_38682242
使用新闻语料库的新型微博内容丰富模型
使用新闻语料库的新型微博内容丰富模型
所属分类:
其它
发布日期:2021-03-10
文件大小:148480
提供者:
weixin_38720322
马来语数据集:马来西亚马来语文本语料库,https:malaya.readthedocs.ioenlatestDataset.html-源码
马来语数据集,我们收集了马来西亚语料库! 该存储库用于存储和。 我们将不断更新此存储库。 我们如何收集数据集? 对于新闻,文章和字幕,我们使用搜寻器,您可以从此处获取代码 。 对于Bahasa,大多数情况下我们使用Google Translator,您可以从此处获取代码 。 使用社交媒体,我们使用爬虫从Twitter,Facebook和Instagram捕获大多数实时数据,因此我们仅使用Elasticsearch查询进行搜索。 对于语音,我们使用Macbook Air 2013附带的
所属分类:
其它
发布日期:2021-02-08
文件大小:247463936
提供者:
weixin_42107491
CLUE:中文语言理解基准测评中文语言理解评估基准:数据集,基线,预训练模型,语料库和页首横幅-源码
CLUE基准 数据集,基线,预训练模型,语料库和页首横幅 中文语言理解测评基准,包括预期的数据集,基准(预训练)模型,语料库,排行榜。 我们会选择一系列有一定预期的任务对应的数据集,做为我们测试基准的数据集。这些数据集会覆盖不同的任务,数据量,任务缺陷。 更新: 中文任务测评基准(CLUE基准)-排行榜 排行榜会定期更新数据来源: 分类任务(v1版本,正式版) 模型 得分 参数 空军质量管理委员会 新闻 IFLYTEK' 中国移动通信网 世界标准委员会 CSL 68.77 108M 73
所属分类:
其它
发布日期:2021-02-06
文件大小:2097152
提供者:
weixin_42136791
text-classification-cn:中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法-源码
文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自
所属分类:
其它
发布日期:2021-02-04
文件大小:212972
提供者:
weixin_42101237
«
1
2
3
4
»