您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于向量空间模型的多主题Web文本分类方法

  2. 基于向量空间模型的多主题Web文本分类方法.pdf
  3. 所属分类:Web开发

    • 发布日期:2009-08-12
    • 文件大小:238592
    • 提供者:oxwangfeng
  1. 用于文本分类的语料库

  2. 分为10个类大概2000篇多文本,可用于文本分类的语料库
  3. 所属分类:专业指导

    • 发布日期:2009-10-14
    • 文件大小:3145728
    • 提供者:happy_maple
  1. 基于SVM的多类文本分类研究

  2. 本文在中文文本自动分类的基础上对文本多类分类方面做了一些有益的探索,对中 文文本分类的相关技术—中文分词、文本表示、特征提取、分类算法、可视化等方面做 了一些研
  3. 所属分类:其它

    • 发布日期:2010-03-02
    • 文件大小:603136
    • 提供者:wly_luffy
  1. 文本分类算法的比较研究

  2. 本文通过对Bayes、KNN、SVM应用于中文文本分类进行比较实验研究。应用ICTCLAS对中文文档进行分词,在大维数,多数据情况下应用TFIDF进行特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行训练和分类。
  3. 所属分类:其它

    • 发布日期:2010-06-01
    • 文件大小:467968
    • 提供者:chengwh03
  1. 文本分类--分词算法

  2. 一款经典的文本分类器,用java编程实现。包含10万,20万,30万三种词库。适合文本分类,多分类等相关领域的研究应用。
  3. 所属分类:Java

    • 发布日期:2011-08-05
    • 文件大小:4194304
    • 提供者:oceanfan
  1. 利用SVM进行文本分类并研究特征选择对文本分类的影响

  2. 支持向量机是一个具有多类分类能力的非线性分类器。在实际应用中,有可 能出现不同类别样本数目相差很大的情况,比如在解决故障检测等分类问题时,c—sVM训练的分类错误总偏向于样本数较少的类别,因而影响了分类的精确性。为提高精确性,提出了一种优化算法,在训练过程中针对不同类样本,采用不同的权值来优化训练过程,按正负类样本在总样本中所占的比例,加大样本数较少的类别权值,降低样本数较大的类别权值来实现两类样本间的均衡。实验结果表明该方法对两类样本数目相差很大的问题是有效的。
  3. 所属分类:其它

    • 发布日期:2012-04-05
    • 文件大小:731136
    • 提供者:h0120709330208
  1. 文本分类器,KNN,SVM,贝叶斯等都有

  2. 多算法文本分类器,功能强大,界面简洁,自带帮助方便应用学习研究
  3. 所属分类:电子商务

    • 发布日期:2012-04-16
    • 文件大小:8388608
    • 提供者:ys344155411
  1. 文本分类系统

  2. TextClassify文本分类系统适用于中文,英文文本分类。 包括各个文本的关键词输出,可以控制关键词输出个数,也可以对关键词加入黑名单和白名单。 关于TextClassify文本分类系统的改进: 改进jieba中文分词词典 改进黑名单:增加停用词 改进白名单:增加专业词 在TextProcess改进每一类text至多选FileInFolder个:理论上越多越好 deleteN的选取:可以优化 特征词的长度限定:unicode不过长,不过短 特征词词典dict_size的选取:可以优化 特征
  3. 所属分类:Python

    • 发布日期:2014-06-17
    • 文件大小:1048576
    • 提供者:lining0806
  1. 多标签分类学习

  2. 基于数据分解、多标签分类、文本分类、机器学习、情感分析
  3. 所属分类:机器学习

    • 发布日期:2018-04-28
    • 文件大小:1048576
    • 提供者:halfwfarmer
  1. fastText:文本分类和词嵌入工具

  2. 快速文本分类,多文本分类, 词嵌入
  3. 所属分类:深度学习

    • 发布日期:2018-10-17
    • 文件大小:4194304
    • 提供者:m0_37963246
  1. 基于Bootstrapping的文本分类模型

  2. 文中提出一种基于Bootstrapping 的文本分类模型,该模型采用最大熵模型作为分类器,从少量的种子集出发,自动学习更多的文本作为新的种子样本,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子来调整新的种子样本在分类器训练过程中的权重。实验结果表明,在相同的手工训练语料的条件下,与传统的文本分类模型相比这种基于Bootstrapping 的文本分类模型具有明显优势。
  3. 所属分类:C/C++

    • 发布日期:2012-10-17
    • 文件大小:343040
    • 提供者:jslfhao
  1. 文本分类语料库(复旦)测试语料

  2. 文本分类语料库(复旦)测试语料 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。 经过数据清理将训练和测试合并成一个csv文件,可以用pandas.read_csv直接读取,分为两列分别是类别和
  3. 所属分类:互联网

    • 发布日期:2020-05-29
    • 文件大小:274726912
    • 提供者:xmrzh
  1. 基于模糊支持向量机的文本分类

  2. 为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证明该算法有更好的抗干扰能力和更好的分类效果。
  3. 所属分类:其它

    • 发布日期:2020-06-27
    • 文件大小:901120
    • 提供者:weixin_38665490
  1. 文本分类介绍,目前的文本分类模型,数据集和模型对应的代码链接,介绍文本分类的流程和发展史。给出多标签文本分类介绍和对应工具

  2. 文本分类介绍,目前的文本分类模型,数据集和模型对应的代码链接,介绍文本分类的流程和发展史。给出多标签文本分类介绍和对应工具
  3. 所属分类:机器学习

    • 发布日期:2020-08-07
    • 文件大小:2097152
    • 提供者:xiaoqianlizhen
  1. 机器学习实战之朴素贝叶斯(二)文本分类

  2. 朴素贝叶斯(二)文本分类朴素贝叶斯的一般流程用python进行文本分类准备数据:从文本中构建词向量训练算法:从词向量计算概率测试算法:朴素贝叶斯分类函数文档词袋模型 朴素贝叶斯的一般流程 (1)收集数据:任何方法 (2)准备数据:数值型、布尔型 (3)分析数据:特征多,用直方图效果好 (4)训练算法:计算不同的独立特征的多条件概率 (5)测试算法:计算错误率 (6)使用算法:一般应用于文档分类,也可以在任意分类场景 用python进行文本分类 以在线社区留言板为例,构建快速过滤器,判断是否是侮辱
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:50176
    • 提供者:weixin_38705723
  1. 文本分类之多标签分类

  2. 多标签分类综述 意义 网络新闻往往含有丰富的语义,一篇文章既可以属于“经济”也可以属于“文化”。给网络新闻打多标签可以更好地反应文章的真实意义,方便日后的分类和使用。 难点 类标数量不确定,有些样本可能只有一个类标,有些样本的类标可能高达几十甚至上百个。  类标之间相互依赖,例如包含蓝天类标的样本很大概率上包含白云,如何解决类标之间的依赖性问题也是一大难点。 多标签的训练集比较难以获取。 如下方法来解决这个问题: 1.在传统机器学习的模型中对每一类标签做二分类,可以使用SVM、DT、Naïv
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:41984
    • 提供者:weixin_38718262
  1. TextClf:简单易上手的基于pytorch/sklearn的文本分类工具

  2. 文本分类是自然语言处理中最常见的任务之一。从邮箱应用中的垃圾邮件识别到搜索引擎中的query意图判别, 再到商品评论中的情感分析, 这些其实都是我们身边对文本分类的常见需求。 为了帮助大家更好的应对经常遇到的文本分类场景,我最近开发了一个工具箱TextClf,使用TextClf, 你可以通过生成和修改配置文件,快速尝试多种分类算法模型、调整参数、搭建baseline, 有了这个工具箱,你可以从模型搭建、模型训练、模型测试等一系列复杂的实现中脱离出来, 让你能有更多精力关注于数据本身的特点,做针对
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:122880
    • 提供者:weixin_38671048
  1. 《动手学深度学习:文本分类;数据增强;模型微调》

  2. 文本情感分类 文本分类是自然语言处理的一个常见任务,它把一段不定长的文本序列变换为文本的类别。本节关注它的一个子问题:使用文本情感分类来分析文本作者的情绪。这个问题也叫情感分析,并有着广泛的应用。 同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。在本节中,我们将应用预训练的词向量和含多个隐藏层的双向循环神经网络与卷积神经网络,来判断一段不定长的文本序列中包含的是正面还是负面的情绪。后续内容将从以下几个方面展开: 文本情感分类数据集 使用循环神经网络进行情感分类 使用卷积神经网络进行情感
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:34816
    • 提供者:weixin_38692969
  1. Text-Multilabel-Classification-BERT-Tf2.x:文本多标签分类-BERT-Tf2.0-源码

  2. 文本多标签分类-BERT-Tf2.0 该存储库包含针对多标签文本分类的预训练BERT模型的Tensorflow2.0实现。 脚步 从下载数据 借助download_bert.sh下载预训练的模型权重 运行train_bert.py 训练损失和准确性 测试损失和准确性
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:4096
    • 提供者:weixin_42114041
  1. 使用生成模型进行文本分类来挖掘多个领域的区别和共性

  2. 近年来,多个域之间的分布差异已被用于跨域文本分类。沿着这条线,我们在这项研究中显示了两个新的观察结果。首先,数据分布的差异通常是由于不同的域使用不同的索引词来表达相同的概念。其次,概念性要素与文档类之间的关联可以跨域保持稳定。这两个观察结果实际上表明了跨领域的区别和共性。受上述观察的启发,我们提出了一种生成统计模型,称为协作双重PLSA(CD-PLSA),以同时捕获多个域之间的域区别和共性。与仅具有一个潜在变量的概率潜在语义分析(PLSA)不同,该模型具有两个潜在因子y和z,分别对应于单词概念和
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:3145728
    • 提供者:weixin_38694006
« 12 3 4 5 6 7 8 9 10 ... 50 »