您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. csw5.0中文分词组件

  2. 一、CSW中分词组件简介 CSW中文分词组件,是一套可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自动摘要、自动分类及信息加工处理等各个领域。 二、本组件特点: 1.适应性强 本组全部件采用
  3. 所属分类:C#

    • 发布日期:2009-09-01
    • 文件大小:3145728
    • 提供者:madl_lxj_163
  1. 一个纯PHP的中文关键字自动提取工具

  2. 因为,提取关键字,肯定要涉及分词,现在的分词算法,最好的估计是统计算法,但是实现稍微复杂一点,用PHP的话,性能往往也不够。 我翻了一下最简单的分词,好像就是向前最大匹配。而且如果字典好的话,据说准确率还挺高的。当然,我没有什么好字典,从中科院的分词软件里面,拿了一本字典。大概有10万的词汇量。当然,你可以用其他的字典,但是一定要有词频。 http://www.cnblogs.com/niniwzw/archive/2010/12/06/1897734.html
  3. 所属分类:PHP

    • 发布日期:2012-09-06
    • 文件大小:496640
    • 提供者:ws07_byyy
  1. 中文分词学习版

  2. 此为学习版,请勿用于商业用途或扩散。 以下描述转至互联网。 ============== 一、CSW中分词组件简介 CSW中文分词组件,是一套可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自
  3. 所属分类:机器学习

    • 发布日期:2018-10-11
    • 文件大小:1048576
    • 提供者:weixin_43387663
  1. php权重计算方法代码分享

  2. 权重计算,稍加修改亦可用于分词,词频统计,全文和spam检测等
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:30720
    • 提供者:weixin_38717450
  1. php实现根据词频生成tag云的方法

  2. 本文实例讲述了php实现根据词频生成tag云的方法。分享给大家供大家参考。具体如下: 这里给定一段文本,分析文本的词频分布,生成tag云 <?php /** * Tag cloud demo based on word frequency * author: unknown * since: 2007-02-27 */ // Store frequency of words in an array $freqData = array(); // Random words $lor
  3. 所属分类:其它

    • 发布日期:2020-12-18
    • 文件大小:35840
    • 提供者:weixin_38687218
  1. PHP编程计算文件或数组中单词出现频率的方法

  2. 本文实例讲述了PHP编程计算文件或数组中单词出现频率的方法。分享给大家供大家参考,具体如下: 如果是小文件,可以一次性读入到数组中,使用方便的数组计数函数进行词频统计(假设文件中内容都是空格隔开的单词): <?php $str = file_get_contents("/path/to/file.txt"); //get string from file preg_match_all("/\b(\w+[-]\w+)|(\w+)\b/",$str,$r); //place words in
  3. 所属分类:其它

    • 发布日期:2020-12-19
    • 文件大小:45056
    • 提供者:weixin_38733787
  1. php权重计算方法代码分享

  2. 复制代码 代码如下:<?php/* vim: set expandtab tabstop=4 shiftwidth=4: */// +————————————————————————//  Name       :   权重计算                                         //  Descr iption:   稍加修改,亦可用于分词,词频统计,全文检索和垃圾检测//  Date       :   2013/12/16 08:51 class weig
  3. 所属分类:其它

    • 发布日期:2020-12-19
    • 文件大小:39936
    • 提供者:weixin_38607554