点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 英文训练语料
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
中文文本分类中特征抽取方法的比较研究.pdf
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率 DF、 信息增 益 IG、 互信息 MI、 χ2 分布 CHI四种不同的特征选取方法。采用支持向量机(SVM)和 KNN 两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法( IG、 MI和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特
所属分类:
专业指导
发布日期:2009-12-06
文件大小:348160
提供者:
shiyoumaomao
svmcls文本分类程序(含C++源代码+语料库)完整版
svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词
所属分类:
C
发布日期:2010-04-30
文件大小:19922944
提供者:
moxibingdao
中文文本分类中特征抽取方法的比较研究
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、V2 分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN 两种不同的分类器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和CHI) 在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征抽取方法的有效性
所属分类:
专业指导
发布日期:2010-09-02
文件大小:244736
提供者:
guofeng314
SVMCLS 文本自动分类器(可编译Release完整版)--李荣陆
之前的最好资源描述如下: svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0
所属分类:
C
发布日期:2010-09-21
文件大小:9437184
提供者:
superyangtze
digit语音库
数字语音库 英文 可作数字语音分析语料 wav文件 分为训练和测试部分
所属分类:
其它
发布日期:2014-05-29
文件大小:23068672
提供者:
shalaxiu
英文语料库
用于英文分类的测试集和训练集应用,分词,去停用词处理
所属分类:
Java
发布日期:2016-03-04
文件大小:16777216
提供者:
zhangsiyututu
小猪佩奇及蓝色小考拉英文字幕
花很长时间找的, 可用于机器翻译, 知识图谱, 网上很难找到
所属分类:
深度学习
发布日期:2018-04-27
文件大小:321536
提供者:
destino74
AIML语料库 Alice Bot语料库 (中文+英文)
Alice问答系统的aiml格式对话语料,包含中文、英文两种语料,并且还有机器人的属性特征(xml格式,包含姓名性别身高爱好等),供大家训练自己的聊天机器人使用。alicebot的官网已经404了,所以希望这个语料库能帮到大家。
所属分类:
机器学习
发布日期:2018-08-07
文件大小:1048576
提供者:
q448795556
AIML语料库 Alice Bot语料库 (英文,最新版)
Alice问答系统的aiml格式对话语料,最新语料大小7.8MB(不同于之前的官方语料库仅有1~2MB),格式为aiml格式,直接可以供alice bot训练使用。
所属分类:
机器学习
发布日期:2018-08-07
文件大小:7340032
提供者:
q448795556
NLPCC2014评估任务2_基于深度学习的情感分类
该语料共包含中文和英文两种语言,主要是商品评论,评论篇幅都比较短,可以被应用于篇章级或者句子级的情感分析任务。数据集被分为训练数据、测试数据、带标签的测试数据三个文件,共有正向和负向两种极性。 情感分析资源大全:http://blog.csdn.net/qq280929090/article/details/70838025
所属分类:
深度学习
发布日期:2018-01-21
文件大小:5242880
提供者:
qq280929090
英文word2vec模型训练语料
本语料适合于使用word2vec英文训练的语料,共98M,包括常用的英文词汇,训练后效果不错。
所属分类:
算法与数据结构
发布日期:2018-01-26
文件大小:99614720
提供者:
sinat_29694963
英文维基百科词向量训练语料
enwiki-latest-pages-articles1.xml-p10p30302.bz2,维基百科用来训练英文word2vec词向量的语料
所属分类:
深度学习
发布日期:2018-11-22
文件大小:174063616
提供者:
xiedelong
数据集——基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM
数据集——基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM
所属分类:
数据库
发布日期:2019-02-24
文件大小:742
提供者:
qq_41185868
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集—train
所属分类:
数据库
发布日期:2019-02-25
文件大小:451
提供者:
qq_41185868
英文评论情感分析.rar
英文情感分析语料库,包含积极消极两个方面的评价,用于神经网络模型深度学习方面,为需要训练集的同学们提供优质的英文评论数据集,仅供科研学习之用,欢迎下载使用!
所属分类:
深度学习
发布日期:2020-04-12
文件大小:418816
提供者:
weixin_44434035
nlp英文正负向情感分析语料库.zip
语料库的数据还是很多的,全部训练完后你的情感分析精度能提升很多。推荐下载。内含正负向语料库。总体来说价值还是挺高的
所属分类:
机器学习
发布日期:2020-03-14
文件大小:6291456
提供者:
wanghuiqiang1
中英平行语料(共20万句)可用于训练机器翻译
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
所属分类:
深度学习
发布日期:2020-02-15
文件大小:7340032
提供者:
weixin_42014622
中文情感词汇库-极值表
目前,情感倾向分析的方法主要分为两类:一种是基于情感词典的方法;一种是基于机器学习的方法,如基于大规模语料库的机器学习。前者需要用到标注好的情感词典,英文的词典有很多,中文主要有知网整理的情感词典Hownet和台湾大学整理发布的NTUSD两个情感词典,还有哈工大信息检索研究室开源的《同义词词林》可以用于情感词典的扩充。基于机器学习的方法则需要大量的人工标注的语料作为训练集,通过提取文本特征,构建分类器来实现情感的分类。 文本情感分析的分析粒度可以是词语、句子也可以是段落或篇章。段落
所属分类:
算法与数据结构
发布日期:2019-03-08
文件大小:155648
提供者:
fengbenming
机器翻译translation2019zh.zip
翻译语料(translation2019zh),520万个中英文句子对;来自项目nlp_chinese_corpus,其中只有谷歌云盘的连接,国内访问很不方便,所以搬运下来,希望帮助到大家。该语料可以用于机器翻译训练。搬运。
所属分类:
机器学习
发布日期:2020-08-24
文件大小:623902720
提供者:
qq_33293040
text8英文语料库
Text8语料库,自己从ewik8语料库中提取出来的,可以用来训练模型,例如word2Vec模型的训练,注意,只适用于英文!
所属分类:
深度学习
发布日期:2020-09-20
文件大小:80740352
提供者:
weixin_44574901
«
1
2
»