您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 朴素贝叶斯文本分类器(java实现)

  2. 本程序实现了基于朴素贝叶斯方法的文本分类,附有源代码、实验报告、可执行程序以及语料库(包括训练集和测试集)
  3. 所属分类:Java

    • 发布日期:2010-06-13
    • 文件大小:1048576
    • 提供者:zh515858237
  1. 文本分类实验报告

  2. 本报告包括完整的文本分类处理过程,包括24万搜狗预料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
  3. 所属分类:VB

    • 发布日期:2016-12-02
    • 文件大小:6291456
    • 提供者:sgfmby1994
  1. 基于mfc的学生信息管理系统

  2. 功能均已实现调通,包含完整实验报告和说明及完整代码。 1.设计内容 ⑴ 利用MFC的向导,创建基于对话框的应用程序,添加按钮、编辑框等控件; ⑵ 设计通讯录的数据结构(如:以数组或者动态链表)和相应的类; ⑶ 完成对通讯录中记录的增加、修改、删除和显示。 ⑷ 将通讯录存入文件。能够打开并显示其中所存的同学信息,并可以进行后续的操作。 2.基本功能描述 ⑴ 添加,删除,修改,保存同学通讯录的信息; ⑵ 分类显示联系人信息; ⑶ 以文本形式导出同学通讯录信息。
  3. 所属分类:C/C++

    • 发布日期:2019-05-07
    • 文件大小:15728640
    • 提供者:m0_38054331
  1. SVM的两个例子(详细,有实验报告)

  2. SVM的两个例子(详细,有实验报告),这是之前找资料的时候花了很多积分下载的,我觉得还是蛮有用的,至少比网上很多人的没有用的错的代码强的多,这是SVM的分类,有对文本的分类,还有SVM最基础的例子。
  3. 所属分类:机器学习

    • 发布日期:2019-07-31
    • 文件大小:12582912
    • 提供者:gouptothesky
  1. 文本分类实验报告(详尽版本)

  2. 本报告包括详尽完整的文本分类处理过程,包括语料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
  3. 所属分类:算法与数据结构

    • 发布日期:2019-01-11
    • 文件大小:4194304
    • 提供者:sgfmby1994
  1. 用于第一个故事检测的多关系术语方案

  2. 第一故事检测(FSD)的目的是识别以前未报告的新兴事件的第一故事,这对于新闻分析,情报收集和国家安全中的实际应用至关重要。 与信息检索,文本聚类,文本分类和其他基于主题的任务相比,FSD是基于事件的,因此面临着同一主题上的多个事件和事件演变的挑战性问题。 为了解决这些挑战,已经为FSD提出了几种利用时间信息,命名实体和主题建模的方案。 在本文中,我们提出了一个称为LGT的新术语加权方案,该方案共同为每个故事的Local元素,Global元素和Topical关联建模。 然后设计了基于LGT的无监督
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_38742532
  1. Faker:虚假信息挑战SBPBRiM-源码

  2. 朝着自动系统检测政治媒体中的虚假信息 介绍 根据各种因素,任何信息都可以是真实的或虚假的。 在此项目中,我们在两个基准数据集上使用深度学习和NLP技术将一段文本分类为真实或伪造。 请查看最终报告以查看有关体系结构和性能指标的更多信息。 说谎者 LIAR数据集有6种不同的类别,从True到Pants fire。 假新闻网 FNN有两个不同的类。 真实和虚假。 分词器 我们使用pyTorch的BERT标记工具。 我们删除了TF-IDF表示的停用词,并保留了双字TF-IDF的停用词。 嵌入 对于骗子
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:34603008
    • 提供者:weixin_42102634
  1. 云环境下软件错误报告自动分类算法改进

  2. 用户提交的软件错误报告随意性大、 主观性强且内容少导致自动分类正确率不高, 需要花费大量人工干.预时间。随着互联网的快速发展用户提交的错误报告数量也不断增加, 如何在海量数据下提高其自动分类的精确度.越来越受到关注。通过改进词频-逆文档频率( TF-IDF) , 考虑到词条在类间和类内出现情况对文本分类的影响, 提出.一种基于软件错误报告数据集的改进多项式朴素贝叶斯算法, 同时在 Hadoop 平台下使用 MapReduce 计算模型实现.该算法的分布式版本。实验结果表明, 改进的多项式朴素贝叶
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:1048576
    • 提供者:weixin_38692043