您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 垃圾邮件数据集

  2. 包含中文邮件数据集和英文邮件数据集,内容丰富。因数据集过大,所以在word文档中存入网址和操作步骤。
  3. 所属分类:机器学习

  1. 美国卡耐基大学垃圾邮件分类数据集

  2. 美国卡耐基大学垃圾邮件分类数据集,英文,已划分好正负样本。总共有5000多条记录,适合数据挖掘,机器学习中贝叶斯分类模型等应用
  3. 所属分类:机器学习

    • 发布日期:2018-07-06
    • 文件大小:1048576
    • 提供者:zhili_wang
  1. 垃圾邮件数据集

  2. 垃圾邮件数据集,由dredze教授提供,属于开源的公共数据集,请勿用于商业目的,若在论文中引用,请标明出处。
  3. 所属分类:深度学习

    • 发布日期:2018-01-18
    • 文件大小:29360128
    • 提供者:luoyanum
  1. 真实垃圾邮件数据集

  2. 该数据集由一系列邮件组成,适用于测试垃圾邮件过滤系统,请勿用作商业目的。
  3. 所属分类:深度学习

    • 发布日期:2018-01-18
    • 文件大小:23068672
    • 提供者:luoyanum
  1. mnist格式的垃圾邮件数据集

  2. 里面有4个文件,训练集及标签:train_images_idx3_ubyte,train_labels_idx1_ubyte,测试集及标签:t10k_images_idx3_ubyte,t10k_labels_idx1_ubyte。其中图像大小都是128*128,训练集有5000多张(ham2000多,spam3000多),测试集1000多张(全为spam)。
  3. 所属分类:深度学习

    • 发布日期:2018-01-21
    • 文件大小:56623104
    • 提供者:luoyanum
  1. 希拉里邮件数据集HillaryEmails

  2. 希拉里邮件数据集HillaryEmails
  3. 所属分类:数据库

    • 发布日期:2019-02-18
    • 文件大小:3145728
    • 提供者:qq_41185868
  1. cnn-dailymail, 获取 cnn/daily邮件数据集( 非匿名)的代码.zip

  2. cnn-dailymail, 获取 cnn/daily邮件数据集( 非匿名)的代码 这里代码生成 cnn/daily邮件摘要数据集的非匿名版本,如 ACL 2017论文所使用的 指针发生器网络 。 它将数据集处理为代码所期望的二进制格式的二进制格式。python 3版本: 这里代码在 python 2中。 如果你想要
  3. 所属分类:其它

    • 发布日期:2019-09-17
    • 文件大小:26214400
    • 提供者:weixin_38744207
  1. 中文垃圾邮件分类数据集

  2. 具有中文垃圾邮件,正常邮件,测试邮件等资料,可以用于朴素贝叶斯分类来检测垃圾邮件
  3. 所属分类:机器学习

    • 发布日期:2020-04-27
    • 文件大小:17825792
    • 提供者:weixin_44473788
  1. data.rar 安然公司邮件数据集(通过有道翻译)

  2. 通过有道翻译,翻译下来的邮件数据及(未完全翻译,不超过8000封邮件,邮件质量、长短不一,翻译得不通顺也没啥关系)。对应的csv文件(存储格式为 序号、主题词、文本)。可以拿去自己贴上分类标签,设计、训练网络,完成邮件分类的任务。
  3. 所属分类:深度学习

    • 发布日期:2020-04-21
    • 文件大小:4194304
    • 提供者:Wade__Hao
  1. 17 机器学习案例——基于朴素贝叶斯算法的文本分类(垃圾邮件过滤)的数据集

  2. 机器学习案例——基于朴素贝叶斯算法的文本分类(垃圾邮件过滤)的数据集,见本人的这篇博客!!!这个资源是本人搜集的支撑数据包!
  3. 所属分类:互联网

    • 发布日期:2020-04-11
    • 文件大小:513024
    • 提供者:qq_37150711
  1. 安然邮件数据集.xlsx

  2. 此数据为已整理好的安然公司邮件数据,可用于深度学习、图论、数学建模等研究。 此数据为已整理好的安然公司邮件数据,可用于深度学习、图论、数学建模等研究。 此数据为已整理好的安然公司邮件数据,可用于深度学习、图论、数学建模等研究。
  3. 所属分类:数据库

    • 发布日期:2020-03-21
    • 文件大小:1048576
    • 提供者:qq_41957148
  1. 机器学习项目---英文邮件数据集

  2. 内含英文垃圾邮件和非垃圾邮件,通过对数据的处理,可以得到一个英文垃圾邮件预测系统。详见链接https://blog.csdn.net/weixin_40391981/article/details/106424636
  3. 所属分类:互联网

    • 发布日期:2020-05-29
    • 文件大小:8388608
    • 提供者:weixin_40391981
  1. 希拉里邮件数据集HillaryEmails,测试使用

  2. 希拉里邮件数据集HillaryEmails,测试使用
  3. 所属分类:数据库

    • 发布日期:2020-08-09
    • 文件大小:16777216
    • 提供者:anminghu
  1. 朴素贝叶斯文本分类数据集

  2. 朴素贝叶斯 分类算法数据集文本挖掘(Text Mining,从文字中获取信息)是一个比较宽泛的概念,这一技术在如今每天都有海量文本数据生成的时代越来越受到关注。目前,在机器学习模型的帮助下,包括情绪分析,文件分类,话题分类,文本总结,机器翻译等在内的诸多文本挖掘应用都已经实现了自动化。   在这些应用中,垃圾邮件过滤算是初学者实践文件分类的一个很不错的开始,例如 Gmail 账户里的“垃圾邮箱”就是一个垃圾邮件过滤的现实应用。下面我们将基于一份公开的邮件数据集 Ling-spam,编写一个垃圾
  3. 所属分类:其它

    • 发布日期:2020-08-31
    • 文件大小:17408
    • 提供者:qq_45531594
  1. 使用朴素贝叶斯过滤垃圾邮件数据集

  2. 数据集说明: 数据集下包含两个文件夹,其中spam文件夹下为垃圾邮件,ham文件夹下为非垃圾邮件。  数据集格式: txt文件
  3. 所属分类:算法与数据结构

    • 发布日期:2020-12-02
    • 文件大小:17408
    • 提供者:master_hunter
  1. txt版本垃圾邮件数据集

  2. 适合nlp入门,垃圾邮件数据集
  3. 所属分类:机器学习

    • 发布日期:2021-01-07
    • 文件大小:3145728
    • 提供者:qq_38175892
  1. Real-CyberSecurity-Datasets:公开数据集可帮助您解决各种网络安全问题-源码

  2. 实时网络安全数据集 公开数据集可帮助您使用机器学习或其他方式解决各种网络安全问题。 祝您学习愉快!!! 目录 ADFA入侵检测数据集 数据集涵盖了Linux和Windows。 它们旨在通过基于系统调用的HIDS进行评估。 僵尸网络和勒索软件检测数据集 ISOT僵尸网络数据集是几个现有的公开可用的恶意和非恶意数据集的组合。 恶意网址数据集 这项研究的长期目标是构建一个使用机器学习技术检测恶意URL(垃圾邮件,网络钓鱼,漏洞利用等)的实时系统。 为此,我们已经探索了一些技术,这些技术包括根据其词
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:3072
    • 提供者:weixin_42131367
  1. Spam-Messages-Classifier:对SMS垃圾邮件数据集实施朴素贝叶斯算法-源码

  2. 垃圾邮件分类器 在SMS垃圾邮件数据集上实施了朴素贝叶斯算法。 数据来自
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:3072
    • 提供者:weixin_42177768
  1. 决策树和随机森林:在泰坦尼克号和垃圾邮件数据集上进行决策树和随机森林分类的​​实现-源码

  2. 决策树和随机森林 垃圾邮件和泰坦尼克号数据集的分类器。 只需从上到下运行提供的iPython Notebook,确保数据集位于同一目录中。 将CSV文件输出到当前目录。
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:125952
    • 提供者:weixin_42113456
  1. enron_fraud:根据电子邮件和财务数据集,建立模型来预测参与安然欺诈案的员工。 根据F1得分,精度和召回率使用特征选择和工程,算法选择和模型选择-源码

  2. 安然欺诈项目 休斯顿的安然综合体- 安然是美国最大的公司之一。 由于公司欺诈,它破产了。 由于联邦调查的结果,大量的安然数据(电子邮件和财务数据)已进入公共记录。 该项目旨在建立一个分类器,该分类器可以基于公共的安然财务和电子邮件数据集来预测安然员工涉及欺诈的情况。 有关安然丑闻的更多详细信息,请参见 。 工作流程 该项目分为3个主要阶段: 功能选择和工程 算法选择 选型 特征选择与工程 首先,清理数据; 由于我们对个人数据感兴趣,因此删除了与“总计”和“公园旅行社”相对应的数据。 另外,“
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:2097152
    • 提供者:weixin_42118160
« 12 3 4 5 6 7 8 9 10 ... 37 »