您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于文本的贝叶斯邮件过滤器

  2. 基于PU1 语料库的垃圾邮件过滤器 特征选择使用的是文档频率和互信息的方法
  3. 所属分类:专业指导

    • 发布日期:2009-06-18
    • 文件大小:1048576
    • 提供者:jin584930459
  1. 垃圾邮件语料库(正常邮件)

  2. 垃圾邮件语料库(正常邮件),实验室课题组使用
  3. 所属分类:Java

    • 发布日期:2008-06-14
    • 文件大小:5242880
    • 提供者:hitszma
  1. 垃圾邮件语料库(垃圾邮件)

  2. 垃圾邮件语料库(垃圾邮件),实习课题组使用
  3. 所属分类:Java

    • 发布日期:2008-06-14
    • 文件大小:4194304
    • 提供者:hitszma
  1. 垃圾邮件语料库

  2. 中国教育和研究计算机紧急响应 垃圾邮件语料库
  3. 所属分类:其它

    • 发布日期:2012-06-21
    • 文件大小:12582912
    • 提供者:lxy81
  1. 垃圾邮件语料库(垃圾邮件)新

  2. 垃圾邮件语料库(垃圾邮件)新 垃圾邮件语料库(垃圾邮件)新
  3. 所属分类:Java

    • 发布日期:2008-11-07
    • 文件大小:9437184
    • 提供者:hitszma
  1. 垃圾邮件语料库(正常邮件)新

  2. 大约9000多正常邮件,垃圾邮件语料库(正常邮件)新
  3. 所属分类:Java

    • 发布日期:2008-11-07
    • 文件大小:5242880
    • 提供者:hitszma
  1. 邮件语料库

  2. 用于邮件分类的语料库
  3. 所属分类:其它

    • 发布日期:2017-04-10
    • 文件大小:15360
    • 提供者:sniper343777
  1. 供垃圾邮件分类的中文邮件语料库

  2. 从外网中得到的56m中文邮件语料,供垃圾邮件分类的数据集
  3. 所属分类:互联网

    • 发布日期:2017-05-24
    • 文件大小:12288
    • 提供者:matherwc
  1. 反垃圾邮件语料库(垃圾邮件&正常邮件)

  2. 如题,希望对大家能有帮助!里面东西很详细!
  3. 所属分类:Java

    • 发布日期:2009-04-10
    • 文件大小:14680064
    • 提供者:chairmanyuu
  1. 电子邮件语料库

  2. 电子邮件语料库,内含多篇中文电子邮件文本以及收发信息
  3. 所属分类:数据库

    • 发布日期:2018-08-27
    • 文件大小:11534336
    • 提供者:huige123huang
  1. SpamEmailDetector.rar

  2. 老师写的垃圾邮件过滤器(仅包含生成语料库和数据标记过程,剩下的我们自己写,博客机器学习实战笔记6——贝叶斯方法里有提到) 还有垃圾邮件的训练样本,测试样本
  3. 所属分类:机器学习

    • 发布日期:2020-05-06
    • 文件大小:215040
    • 提供者:weixin_44916097
  1. PowerWord.exe

  2. 特色功能编辑 离线词典 电脑没联网,可以用词霸吗? 可以! 下载此版本金山词霸时,已经同时下载了英汉/汉英的词库,包含百万词条,可以满足基本查词需求。 浏览器划译 取词划译很好用,但新的浏览器支持吗? 支持!本版本全面支持IE9,Firefox9+,Chrome16+等最新浏览器。另外可以在PDF文件中的取词。独家的译中译功能,支持在取词划译框里再取词翻译,更便捷! 权威词典 软件查词不如纸质词典准确? 该版本包含147本版权词典,这些词典的纸质版总价值超过3000元!涵盖金融
  3. 所属分类:桌面系统

    • 发布日期:2020-04-01
    • 文件大小:9437184
    • 提供者:han_yiyang
  1. Fraudulent E-mail Corpus欺诈邮件语料库-数据集

  2. 该数据集收集了1998年至2007年之间的2500多个“尼日利亚”欺诈信。 fradulent_emails.txt
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:5242880
    • 提供者:weixin_38706007
  1. gpt-neox:基于DeepSpeed库的GPU上类似于GPT-3的模型并行模型的实现。 设计成能够训练数千亿甚至更大参数的模型-源码

  2. GPT-NeoX 该存储库记录了正在进行的用于训练大规模GPU语言模型的工作。 我们当前的框架基于NVIDIA的,并通过技术以及一些新颖的优化功能得到了增强。 如果您正在寻找我们的TPU代码库,请参阅 。 GPT-NeoX正在积极开发中,而且边缘还很粗糙。 GPT-NeoX是一种复杂的野兽,需要时间和患者才能在任何特定环境下工作。 入门 我们的代码库依赖 ,它是对库的自定义修改。 我们强烈建议您在从requirements.txt安装之前使用Anaconda,虚拟机或其他形式的环境隔离。
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:214016
    • 提供者:weixin_42116672
  1. mms2r:从MMS中提取用户媒体(而不是从载体中提取)-源码

  2. mms2r 描述 MMS2R,作者:Mike Mondragon MMS2R是一个库,可将MMS消息的各个部分解码到磁盘,同时去除移动运营商注入的广告。 MMS消息是多部分电子邮件,运营商经常在这些消息中添加商标。 如果您想从MMS获取真正的用户生成的内容,而不必处理运营商带来的麻烦,请使用MMS2R。 如果MMS2R不知道特定的载波,则除了解码和合并其媒体外,不对MMS进行额外的处理。 MMS2R可用于处理任何多部分电子邮件,以方便地访问该邮件所组成的部分。 请与作者联系以添加其他
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:1041408
    • 提供者:weixin_42143221
  1. nlp-datasets:用于自然语言处理(NLP)的带有文本数据的自由公共领域数据集的字母顺序列表-源码

  2. nlp数据集 自由/公共领域数据集的字母顺序列表,其中包含用于自然语言处理(NLP)的文本数据。 如果您正在寻找带注释的语料库或树库,请参阅底部的源,此处的大多数内容只是原始的非结构化文本数据。 数据集(英语,多语言) :截至2011年7月11日的所有公共可用Apache Software Foundation邮件档案(200 GB) :包括2004年8月从blogger.com收集的19,320个博客作者的帖子。681,288个帖子和超过1.4亿个单词。 (298 MB) 由568454
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:9216
    • 提供者:weixin_42148975
  1. 垃圾邮件或非垃圾邮件-源码

  2. 禁止网络钓鱼:使用深度学习检测鱼叉式网络钓鱼攻击 预读 文本分类背后的一个关键思想是文档表示。 我们最初的方法包括简单的CountVectorizer和TF-IDF Vectorizer。 我们处理电子邮件文档,并将词汇的计数/分数传递到我们的分类器中。 我们可以更进一步,将我们的文档表示为一系列嵌入了语义(使用某种概率性技术)的“单词向量”。 创建单词向量是获取大量文本语料并为每个单词创建向量的过程,以使在语料库中共享公共上下文的词在向量空间中彼此紧邻。 一种简单的方法是将每个单词作为整
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:29360128
    • 提供者:weixin_42134143
  1. 垃圾邮件处理者::incoming_envelope:垃圾邮件检测器-源码

  2. :incoming_envelope: 垃圾邮件发送者 :postbox: 垃圾邮件检测器 概要 文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。 垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。 在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。 输出将是一个AP
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:44040192
    • 提供者:weixin_42119866
  1. text-classification-cn:中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法-源码

  2. 文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:212972
    • 提供者:weixin_42101237
  1.  基于改进信息增益的垃圾邮件过滤研究

  2. 信息增益是文本分类中一种有效的特征项选择方法,针对垃圾邮件过滤中的特征项选择问题,提出了一种改进的信息增益方法提取特征词,并采用了最小风险贝叶斯的决策方法,最后在英文语料库上进行实验,实验结果表明改进后的方法降低了过滤器对合法邮件的误判。
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:577536
    • 提供者:weixin_38681301
« 12 »