您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. JE中文分词je-analysis-1.5.1.jar

  2. 1.5.1 —— 2006-01-22 修正细粒度分词错误的问题 1.5.0 —— 2007-01-18 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配 增加了Mail地址的匹配 实现了词尾消歧算法第二层的过滤 整理优化了词库 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 2006-07-03 修正细粒度分词错误的问题 1.3.1 —— 2006-0 6-23 修
  3. 所属分类:其它

    • 发布日期:2009-04-28
    • 文件大小:891904
    • 提供者:tiancen2001
  1. JE分词 1.4+1.5

  2. 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配 增加了Mail地址的匹配 实现了词尾消歧算法第二层的过滤 整理优化了词库
  3. 所属分类:其它

    • 发布日期:2010-01-26
    • 文件大小:1048576
    • 提供者:wjm158
  1. ppldic.csv分词词库PHP应用——提取内容关键字

  2. 用RMM分词算法可以实现,调用“ppldic.csv”中英文词库。在分词过程中要过滤掉 标点符号,否则,这些标点符号都将分成一个词,而这些词并不是用户查询搜索的关键内容。
  3. 所属分类:PHP

    • 发布日期:2010-12-20
    • 文件大小:25600
    • 提供者:a738611
  1. WM算法实现_敏感词过滤

  2. WM算法实现_敏感词过滤,java版本 敏感词库为XML格式
  3. 所属分类:网络安全

    • 发布日期:2011-07-28
    • 文件大小:5120
    • 提供者:garnettyige
  1. chinesetokenize中文分词

  2. 1. 识别率达到85%以上。虽然和专业分词系统相比有一定的差距,但对于中型搜索引擎分词需求而言足够了。2. 对于前后歧义有较好的识别效果。如,成都市场报刊 -- 成都 / 市场 / 报刊中国和服装饰公司 -- 中国 / 和服 / 装饰 / 公司我的MSN是eunge.liu@gmail.com,有事找我 -- 我 / 的 / MSN / 是 / eunge.liu@gmail.com / 有事 / 找 / 我3. 标点符号自动过滤,包括ASCII和Unicode标点。4. 自定义噪音词(不知道
  3. 所属分类:其它

    • 发布日期:2008-05-23
    • 文件大小:1037312
    • 提供者:wuqueyouhen
  1. 敏感词过滤系统

  2. 系统主要使用由北京师范大学2000级计算机系张人杰开发制作的基于多叉树的查找的Java工具包:alex-word-filter.jar,工具包自带有2445敏感词的词库。我只是做了简单的应用,写了个小系统。
  3. 所属分类:Java

    • 发布日期:2011-12-28
    • 文件大小:30720
    • 提供者:zzwlufeiwang
  1. 网站关键字过滤词库

  2. 最新网站关键词过滤词库,0分分享
  3. 所属分类:其它

    • 发布日期:2012-02-14
    • 文件大小:12288
    • 提供者:arctobylitao
  1. 网站关键词过滤词库

  2. 网站关键词过滤词库,0分分享。
  3. 所属分类:其它

    • 发布日期:2012-02-14
    • 文件大小:12288
    • 提供者:arctoby
  1. ppldic.csv 分词

  2. 用RMM分词算法可以实现,调用“ppldic.csv”中英文词库。在分词过程中要过滤掉 标点符号,否则,这些标点符号都将分成一个词,而这些词并不是用户查询搜索的关键内容。
  3. 所属分类:PHP

    • 发布日期:2012-05-08
    • 文件大小:25600
    • 提供者:rj06204
  1. c# 分词替换过滤

  2. 对句子进行分词 用每个词去匹配预先定义好的词库 采用树形结构一个单词一个单词的去匹配词句 每个单词找到的词 用来去替换句子中的先有词
  3. 所属分类:C#

    • 发布日期:2013-07-24
    • 文件大小:134144
    • 提供者:gfgdfgsdfgsg
  1. ahocorasick敏感词过滤状态机算法

  2. 来源于网络,共享之。 需要配合敏感词库,这个也不太好弄。
  3. 所属分类:Java

    • 发布日期:2013-12-04
    • 文件大小:117760
    • 提供者:hwxia
  1. 2013年度最新网站不良信息过滤词库

  2. 2013年度最新网站不良信息过滤词库
  3. 所属分类:网络安全

    • 发布日期:2014-06-11
    • 文件大小:3072
    • 提供者:yiwanshangren
  1. 中文分词(C语言版)含技术文档和源代码还有词库

  2. 本中文分词系统,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) 目前系统在进行了大规模分词测试后的大致性能指标如下: 1000字以内的文章完全切分,用时间不超过 10毫秒! 5000字以内的文章完全切分,用时间不超过 500毫秒! 10000字以内的文章完全切分,用时间不超过 1秒! 本版本是简易版,分词准确率为 91.8%,系统稳定性为99.99%,中文分词系统符合工业化的标准! 目前支持中英文混合切分词,各种全角,半角标点符号的过滤! 系统自带词库含有
  3. 所属分类:C

    • 发布日期:2009-02-10
    • 文件大小:1048576
    • 提供者:czw0005
  1. 用纯C语言开发了一个中文分词系统,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例)

  2. 用纯C语言开发了一个中文分词系统,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) 用法很简单,比如:你把中文分词系统解压后保存到D:\那你直接在 dos 窗口下输入: d:\cfenci.exe 然后回车就可以了! 启动无需任何参数。 目前系统在进行了大规模分词测试后的大致性能指标如下: 1000字以内的文章完全切分,用时间不超过 10毫秒! 5000字以内的文章完全切分,用时间不超过 500毫秒! 10000字以内的文章完全切分,用时间不超过 1秒! 本版
  3. 所属分类:C

    • 发布日期:2009-02-10
    • 文件大小:1048576
    • 提供者:sureubet
  1. 用纯C语言开发了一个中文分词系统,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例)

  2. 分词准确率为 91.8%,系统稳定性为99.99%,中文分词系统符合工业化的标准! 用法很简单,比如:你把中文分词系统解压后保存到D:\那你直接在 dos 窗口下输入: d:\cfenci.exe 然后回车就可以了! 启动无需任何参数。 目前系统在进行了大规模分词测试后的大致性能指标如下: 1000字以内的文章完全切分,用时间不超过 10毫秒! 5000字以内的文章完全切分,用时间不超过 500毫秒! 10000字以内的文章完全切分,用时间不超过 1秒! 本版本是简易版,分词准确率为 91.8
  3. 所属分类:C

    • 发布日期:2009-02-10
    • 文件大小:1048576
    • 提供者:jc57160129
  1. linux 下php的filter过滤扩展

  2. 使用php扩展trie_filter,利用词库,过滤敏感词 使用php扩展trie_filter,利用词库,过滤敏感词 使用php扩展trie_filter,利用词库,过滤敏感词
  3. 所属分类:PHP

    • 发布日期:2018-03-29
    • 文件大小:8192
    • 提供者:a729882318
  1. php扩展过滤敏感词

  2. php扩展:trie_filter 过滤敏感词。1.生成敏感词文件,2.加载使用敏感词库,3.查找敏感词。可以循环查找替换,最后输出替换后的文本
  3. 所属分类:PHP

    • 发布日期:2018-07-09
    • 文件大小:2048
    • 提供者:suprich007
  1. 过滤词脏词关键词txt2020年

  2. 几千个脏词关键词过滤词,从网上扒下来的,不知道够不够各位大佬的词库。建议自己再扩充一下.可以通过记事本,或者其他编辑器打开。
  3. 所属分类:专业指导

    • 发布日期:2020-05-15
    • 文件大小:102400
    • 提供者:qq_26097991
  1. 商标品牌词库大全 总.txt

  2. 各个电商平台商标品牌词库汇总,用于品牌过滤以及品牌匹配使用。包含天猫、京东、唯品会、1号店、国美、苏宁等平台。
  3. 所属分类:其它

    • 发布日期:2020-05-07
    • 文件大小:3145728
    • 提供者:liuhangbing
  1. 网站敏感词过滤Java版.zip

  2. 四种敏感词过滤 含过滤词库 ,Java版。匹配度高、过滤速度快。多种实现方式供选择,应用于不同的场景。
  3. 所属分类:Java

    • 发布日期:2020-02-13
    • 文件大小:44032
    • 提供者:yuanjt2008
« 12 3 4 5 6 7 8 »