您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中文文本分类中特征抽取方法的比较研究.pdf

  2. 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率 DF、 信息增 益 IG、 互信息 MI、 χ2 分布 CHI四种不同的特征选取方法。采用支持向量机(SVM)和 KNN 两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法( IG、 MI和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特
  3. 所属分类:专业指导

    • 发布日期:2009-12-06
    • 文件大小:348160
    • 提供者:shiyoumaomao
  1. svmcls文本分类程序(含C++源代码+语料库)完整版

  2. svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词
  3. 所属分类:C

    • 发布日期:2010-04-30
    • 文件大小:19922944
    • 提供者:moxibingdao
  1. 中文文本分类中特征抽取方法的比较研究

  2. 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、V2 分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN 两种不同的分类器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和CHI) 在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征抽取方法的有效性
  3. 所属分类:专业指导

    • 发布日期:2010-09-02
    • 文件大小:244736
    • 提供者:guofeng314
  1. SVMCLS 文本自动分类器(可编译Release完整版)--李荣陆

  2. 之前的最好资源描述如下: svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0
  3. 所属分类:C

    • 发布日期:2010-09-21
    • 文件大小:9437184
    • 提供者:superyangtze
  1. digit语音库

  2. 数字语音库 英文 可作数字语音分析语料 wav文件 分为训练和测试部分
  3. 所属分类:其它

    • 发布日期:2014-05-29
    • 文件大小:23068672
    • 提供者:shalaxiu
  1. 英文语料库

  2. 用于英文分类的测试集和训练集应用,分词,去停用词处理
  3. 所属分类:Java

    • 发布日期:2016-03-04
    • 文件大小:16777216
    • 提供者:zhangsiyututu
  1. 小猪佩奇及蓝色小考拉英文字幕

  2. 花很长时间找的, 可用于机器翻译, 知识图谱, 网上很难找到
  3. 所属分类:深度学习

    • 发布日期:2018-04-27
    • 文件大小:321536
    • 提供者:destino74
  1. AIML语料库 Alice Bot语料库 (中文+英文)

  2. Alice问答系统的aiml格式对话语料,包含中文、英文两种语料,并且还有机器人的属性特征(xml格式,包含姓名性别身高爱好等),供大家训练自己的聊天机器人使用。alicebot的官网已经404了,所以希望这个语料库能帮到大家。
  3. 所属分类:机器学习

    • 发布日期:2018-08-07
    • 文件大小:1048576
    • 提供者:q448795556
  1. AIML语料库 Alice Bot语料库 (英文,最新版)

  2. Alice问答系统的aiml格式对话语料,最新语料大小7.8MB(不同于之前的官方语料库仅有1~2MB),格式为aiml格式,直接可以供alice bot训练使用。
  3. 所属分类:机器学习

    • 发布日期:2018-08-07
    • 文件大小:7340032
    • 提供者:q448795556
  1. NLPCC2014评估任务2_基于深度学习的情感分类

  2. 该语料共包含中文和英文两种语言,主要是商品评论,评论篇幅都比较短,可以被应用于篇章级或者句子级的情感分析任务。数据集被分为训练数据、测试数据、带标签的测试数据三个文件,共有正向和负向两种极性。 情感分析资源大全:http://blog.csdn.net/qq280929090/article/details/70838025
  3. 所属分类:深度学习

    • 发布日期:2018-01-21
    • 文件大小:5242880
    • 提供者:qq280929090
  1. 英文word2vec模型训练语料

  2. 本语料适合于使用word2vec英文训练的语料,共98M,包括常用的英文词汇,训练后效果不错。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-01-26
    • 文件大小:99614720
    • 提供者:sinat_29694963
  1. 英文维基百科词向量训练语料

  2. enwiki-latest-pages-articles1.xml-p10p30302.bz2,维基百科用来训练英文word2vec词向量的语料
  3. 所属分类:深度学习

    • 发布日期:2018-11-22
    • 文件大小:174063616
    • 提供者:xiedelong
  1. 数据集——基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM

  2. 数据集——基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM
  3. 所属分类:数据库

    • 发布日期:2019-02-24
    • 文件大小:742
    • 提供者:qq_41185868
  1. 数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集

  2. 数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集—train
  3. 所属分类:数据库

    • 发布日期:2019-02-25
    • 文件大小:451
    • 提供者:qq_41185868
  1. 英文评论情感分析.rar

  2. 英文情感分析语料库,包含积极消极两个方面的评价,用于神经网络模型深度学习方面,为需要训练集的同学们提供优质的英文评论数据集,仅供科研学习之用,欢迎下载使用!
  3. 所属分类:深度学习

    • 发布日期:2020-04-12
    • 文件大小:418816
    • 提供者:weixin_44434035
  1. nlp英文正负向情感分析语料库.zip

  2. 语料库的数据还是很多的,全部训练完后你的情感分析精度能提升很多。推荐下载。内含正负向语料库。总体来说价值还是挺高的
  3. 所属分类:机器学习

    • 发布日期:2020-03-14
    • 文件大小:6291456
    • 提供者:wanghuiqiang1
  1. 中英平行语料(共20万句)可用于训练机器翻译

  2. 中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
  3. 所属分类:深度学习

    • 发布日期:2020-02-15
    • 文件大小:7340032
    • 提供者:weixin_42014622
  1. 中文情感词汇库-极值表

  2. 目前,情感倾向分析的方法主要分为两类:一种是基于情感词典的方法;一种是基于机器学习的方法,如基于大规模语料库的机器学习。前者需要用到标注好的情感词典,英文的词典有很多,中文主要有知网整理的情感词典Hownet和台湾大学整理发布的NTUSD两个情感词典,还有哈工大信息检索研究室开源的《同义词词林》可以用于情感词典的扩充。基于机器学习的方法则需要大量的人工标注的语料作为训练集,通过提取文本特征,构建分类器来实现情感的分类。 文本情感分析的分析粒度可以是词语、句子也可以是段落或篇章。段落
  3. 所属分类:算法与数据结构

    • 发布日期:2019-03-08
    • 文件大小:155648
    • 提供者:fengbenming
  1. 机器翻译translation2019zh.zip

  2. 翻译语料(translation2019zh),520万个中英文句子对;来自项目nlp_chinese_corpus,其中只有谷歌云盘的连接,国内访问很不方便,所以搬运下来,希望帮助到大家。该语料可以用于机器翻译训练。搬运。
  3. 所属分类:机器学习

    • 发布日期:2020-08-24
    • 文件大小:623902720
    • 提供者:qq_33293040
  1. text8英文语料库

  2. Text8语料库,自己从ewik8语料库中提取出来的,可以用来训练模型,例如word2Vec模型的训练,注意,只适用于英文!
  3. 所属分类:深度学习

    • 发布日期:2020-09-20
    • 文件大小:80740352
    • 提供者:weixin_44574901
« 12 »