您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 要求综合运用 STL,实现一个简单的垃圾邮件过滤程序

  2. Homework5 1、问题描述 电子邮件便利了人们之间的沟通,但亦衍生出许多的问题,例 如:  成为病毒散布的有效媒介。  垃圾邮件厂商(Spammer)滥发广告信件,不但浪费了网络带 宽,同时也占据了使用者收件箱的空间,浪费了使用者宝贵 的时间。  骇客伪造寄信者发送欺诈信件,例如:伪造由银行客服人员 发出的信件,谎称使用者密码过期,需要上网变更密码,然 后引诱使用者到恶意网站打入银行账户及密码,有人称这种 手法为网络钓鱼(phishing)。 由于垃圾邮件的问题日益严重,因此有许多
  3. 所属分类:网络基础

    • 发布日期:2009-09-07
    • 文件大小:2048
    • 提供者:tracy_birdwish
  1. 朴素贝叶斯邮件过滤测试

  2. 1. 首先在Parameter.h中将程序的的路径Path改为当前的绝对路径 例如: static char Path[30] = "E:\\ReadDir\\"; 2.程序启动后:会出现"是否启动训练(N(No),Y(Yes)):",此时输入:Y,表示启动训练; 并会出现第一个:"请输入m_switch的值(0 表示开始训练或 1表示启动反馈):", 此时输入:0,这时进行会提取垃圾邮件的中的核心词汇。 不久会出现第二个:"请输入m_switch的值(0 表示开始训练或 1表示启动反馈):"
  3. 所属分类:其它

    • 发布日期:2010-10-14
    • 文件大小:1048576
    • 提供者:wangji1000000
  1. 能过滤注释的词法分析程序

  2. 分别使用某种高级语言和LEX实现一个C语言子集的词法分析器,即从输入的源程序中,识别出各个具有独立意义的单词,滤掉空格和注释
  3. 所属分类:专业指导

    • 发布日期:2011-07-28
    • 文件大小:1048576
    • 提供者:blue2fish
  1. 过滤特定单词

  2. 对一个文本删除特定的单词或者符号。是字符串学习的比较好的资料
  3. 所属分类:C++

    • 发布日期:2013-04-25
    • 文件大小:510976
    • 提供者:renwei1986
  1. c# 分词替换过滤

  2. 对句子进行分词 用每个词去匹配预先定义好的词库 采用树形结构一个单词一个单词的去匹配词句 每个单词找到的词 用来去替换句子中的先有词
  3. 所属分类:C#

    • 发布日期:2013-07-24
    • 文件大小:134144
    • 提供者:gfgdfgsdfgsg
  1. 过滤文章中包含指定单词的句子

  2. 在别处看到这个资源,觉得很好,就转过来了,算法是实现过滤文章中的包含指定单词的句子
  3. 所属分类:C#

    • 发布日期:2013-10-13
    • 文件大小:51200
    • 提供者:fuwenchun
  1. 英文单词词频统计

  2. 大数据背景下经常需要提取关键词热词,该程序即完成对txt格式的英文内容进行词频统计,并按词频排序生成词频统计列表,通过对单词的预处理忽略's n't 'am “”大小写等形式过滤使程序更为准确
  3. 所属分类:C++

    • 发布日期:2016-01-08
    • 文件大小:7168
    • 提供者:atp1992
  1. js实时搜索过滤

  2. js/css实时过滤单词的表单控件js/css实时过滤单词的表单控件
  3. 所属分类:Javascript

    • 发布日期:2018-06-22
    • 文件大小:2048
    • 提供者:impossible_hao
  1. 紫电轻松单词 v1.0.zip

  2. 紫电轻松单词是一款专门为你提供真人语音背单词的软件,该软件具有独特的考试记忆法,帮助你掌握无法背熟的单词,还为你精选单词词频词库,帮助你快速提高你的阅读能力和听力。每个单词都带有英汉双语例句,某些疑难单词还有助记法解释,是您能快速掌握单词的拼写,发音,解释以及具体语言环境中的运用。新颖的记忆方式,不会产生思维疲劳,越背越爱背,一不小心就会上瘾。 紫电轻松单词功能介绍 1、清晰的真人语音,使用最新的低通过滤技术压缩的真人语音,完美再现了单词的发音。 2、独一无二的考试记忆法,人们在考试当中,
  3. 所属分类:其它

    • 发布日期:2019-07-13
    • 文件大小:26214400
    • 提供者:weixin_39841848
  1. ACM单词.docx

  2. 作为一名算法竞赛选手,与英文题目打交道必不可少。打多校和刷题时频频遇到一些高频词,特此整理一下,比赛的时候真的炒鸡有用! 在这里整理的是已经过滤了大部分46级水平常见词汇,筛去了基础算法词汇,选出400多经典算法竞赛高频生词
  3. 所属分类:C/C++

    • 发布日期:2020-09-25
    • 文件大小:31744
    • 提供者:qq_36693514
  1. Python正则获取、过滤或者替换HTML标签的方法

  2. 本文实例介绍了Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法,具体内容如下 python正则表达式关键内容: python正则表达式转义符: . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束 \W 匹配任意不是字母,数字,下划线,汉字的字符 \S 匹配任意不是空白符的字符 \D 匹配任意非数字的字符 \B 匹配不是单词开头或结束的位置
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:60416
    • 提供者:weixin_38710323
  1. C# 撒列实现关键字过滤的实例

  2. 一直对搜索、过滤很好奇,觉得他们很有技术含量,只有非常NB的人才能做。很想知道他们的原理,实现这样的功能,设计是不是必须得非常NB非常奇特,代码是不是要写得非常好,性能非常高。总之这一切都不是我这样级别的人能做的。直到我看了《编程珠玑(第二版)》中的这么一段文字: “假定我们可以在执行搜索之前对文本内容进行预处理,那么我们可以建立一个撒列表(或者搜索树),为文档中的每个不同的单词建立索引,并为每个单词的每次出现存储一个链表,这样的逆向索引使得程序可以很快的找到给定的单词,为了查找短语,我们可以对
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:483328
    • 提供者:weixin_38719564
  1. Python使用正则表达式过滤或替换HTML标签的方法详解

  2. 本文实例讲述了Python使用正则表达式过滤或替换HTML标签的方法。分享给大家供大家参考,具体如下: python正则表达式关键内容: python正则表达式转义符: . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束 \W 匹配任意不是字母,数字,下划线,汉字的字符 \S 匹配任意不是空白符的字符 \D 匹配任意非数字的字符 \B 匹配不是单词开头或结束的位置 [^
  3. 所属分类:其它

    • 发布日期:2020-12-26
    • 文件大小:57344
    • 提供者:weixin_38657115
  1. Spam_detection:电子邮件垃圾邮件过滤-源码

  2. 垃圾邮件检测 电子邮件垃圾邮件过滤:使用Scikit-learn,多项式朴素贝叶斯和SVM分类器实现我们将执行以下步骤来构建分类任务,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件: 准备文本数据。创建单词字典。特征提取过程训练分类器
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:34816
    • 提供者:weixin_42122986
  1. tweet_censor:一个简单的程序,可以过滤来自推文中的显式单词-源码

  2. tweet_censor Makers Academy习题课,精通课程,第ch章。 阵列上为7。 简介:我是在空白之家工作的客户。 我们希望在我们的网站上显示有关我们总裁的正面推文。 但是,我们的总统有点不受欢迎,我们几乎只收到负面新闻。 给我写一个程序,从推文中过滤掉以下单词:“吸”,“坏”,“仇恨”,“愚蠢”,以及最受欢迎的:“危害社会”。 将每个否定词替换为“ CENSORED”,或用“ CENSORED”代替。 已为您提供了一些测试推文。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1024
    • 提供者:weixin_42122881
  1. TextFilter:敏感词过滤系统-源码

  2. 敏感词过滤系统 更多详见 Ubuntu Linux下环境构建: sudo apt-get install python-pip pip install nltk pip install jieba pip install pymongo Config下config文件: 可以进行服务器配置,针对数据库中预定集合的不同区段列, 可以选择语言(中文,英文), 可以设置要过滤的文章数量,时间替换从最近前推 添加邮件通知系统,SendMailFlag =“是”#“否” 结果:细分fil
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:1048576
    • 提供者:weixin_42131618
  1. 域名排序:从长列表中过滤域名。 包含用于过滤一个或两个单词域以及按特定长度过滤域的选项。 同时过滤掉您选择的顶级域名-源码

  2. 域排序 埃米特·贝伦特(Emet Behrendt) 描述 从长列表中过滤域名。 包含用于过滤一个或两个单词域以及按特定长度过滤域的选项。 同时过滤掉您选择的顶级域名。 注意:我强烈建议您使用版本2而非版本1 指示 请参阅每个版本的文件夹中的特定说明。 笔记 版本1已于2019年9月26日完成 第2版​​于2020年11月16日完成
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:13631488
    • 提供者:weixin_42166918
  1. 过滤器:使用Python过滤不适当的词-源码

  2. 筛选 使用Python过滤不适当的单词,并添加错字算法。
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:2048
    • 提供者:weixin_42097208
  1. open-source-words:可视化开源项目中最常用的单词-源码

  2. 介绍 在“媒介:中了解有关此项目的信息 开源词是一个项目,该项目: 使用从结果中收集存储库信息 从这些存储库下载自述文件 将自述文件( md , rst和html )转换为纯文本 计算唯一和总词频,过滤并按词性进行计算 具有讽刺意味的是,该项目包含自述文件(您正在阅读的文档),尽管不太可能成为GitHub上的Top 2000项目的明星。 它从来没有改变过刮过自己的自述文件。 结果 总频率 独特的频率 这些词云是使用的代码使用生成的。 按总频率排列的前10个字是: React 文件 C
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:30408704
    • 提供者:weixin_42121058
  1. 基于互信息和余弦相似度的维吾尔文不良文档信息过滤方案

  2. 针对网页中的维吾尔文不良文档信息的过滤问题,提出一种基于互信息和余弦相似度的不良文档信息过滤方案。首先,对输入文档进行预处理,过滤掉无用单词。然后,利用文档频率(DF)和互信息(MI)相结合,从文档中提取出高区分度的特征向量。最后,利用TF-IDF方法对特征进行加权,并计算加权特征向量与分类模板中的各类加权特征向量之间的余弦相似度,来分类文档并过滤掉不良文档信息。实验结果表明,该方案能够有效过滤不良维吾尔文文档,正确过滤率达到了83.5%。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:878592
    • 提供者:weixin_38502722
« 12 3 4 5 6 7 »