您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. csw5.0中文分词组件

  2. 一、CSW中分词组件简介 CSW中文分词组件,是一套可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自动摘要、自动分类及信息加工处理等各个领域。 二、本组件特点: 1.适应性强 本组全部件采用
  3. 所属分类:C#

    • 发布日期:2009-09-01
    • 文件大小:3145728
    • 提供者:madl_lxj_163
  1. SCWS简体中文分词辞典txt格式

  2. 这是我在研究中文分词时找到的一个辞典。感谢hightman的基础工作。==============================================SCWS-1.x.x 自述文件 (Written by hightman)HomePage: http://www.hightman.cn...[SCWS 简介]SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正
  3. 所属分类:专业指导

    • 发布日期:2008-03-15
    • 文件大小:5242880
    • 提供者:oldfox126
  1. SCWS繁体中文分词辞典txt格式

  2. 这是我在研究中文分词时找到的一个辞典。感谢hightman的基础工作。==============================================SCWS-1.x.x 自述文件 (Written by hightman)HomePage: http://www.hightman.cn...[SCWS 简介]SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正
  3. 所属分类:专业指导

    • 发布日期:2008-03-15
    • 文件大小:2097152
    • 提供者:oldfox126
  1. 一个纯PHP的中文关键字自动提取工具

  2. 因为,提取关键字,肯定要涉及分词,现在的分词算法,最好的估计是统计算法,但是实现稍微复杂一点,用PHP的话,性能往往也不够。 我翻了一下最简单的分词,好像就是向前最大匹配。而且如果字典好的话,据说准确率还挺高的。当然,我没有什么好字典,从中科院的分词软件里面,拿了一本字典。大概有10万的词汇量。当然,你可以用其他的字典,但是一定要有词频。 http://www.cnblogs.com/niniwzw/archive/2010/12/06/1897734.html
  3. 所属分类:PHP

    • 发布日期:2012-09-06
    • 文件大小:496640
    • 提供者:ws07_byyy
  1. scws中文分词源码包

  2. scws是 基于词频词典的中文分词系统,源码包中含有win下php的dll拓展.测试可用
  3. 所属分类:互联网

    • 发布日期:2014-03-17
    • 文件大小:435200
    • 提供者:qq564766474
  1. 中文分词PHP代码

  2. PHP中文分词实例代码 基本功能: 根据词频词典较为智能的中文分词,支持规则识别人名、地区等。
  3. 所属分类:PHP

    • 发布日期:2018-07-03
    • 文件大小:6144
    • 提供者:lengxuedadou
  1. 中文分词学习版

  2. 此为学习版,请勿用于商业用途或扩散。 以下描述转至互联网。 ============== 一、CSW中分词组件简介 CSW中文分词组件,是一套可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自
  3. 所属分类:机器学习

    • 发布日期:2018-10-11
    • 文件大小:1048576
    • 提供者:weixin_43387663
  1. PHP中文分词 自动获取关键词介绍

  2. 用了大家熟知的scws 还有phpanalysis ,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-10-27
    • 文件大小:59392
    • 提供者:weixin_38749305
  1. php权重计算方法代码分享

  2. 权重计算,稍加修改亦可用于分词,词频统计,全文和spam检测等
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:30720
    • 提供者:weixin_38717450
  1. php实现根据词频生成tag云的方法

  2. 主要介绍了php实现根据词频生成tag云的方法,涉及php分析与操作字符串以及标签云的生成技巧,具有一定参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-10-24
    • 文件大小:33792
    • 提供者:weixin_38741540
  1. php实现根据词频生成tag云的方法

  2. 本文实例讲述了php实现根据词频生成tag云的方法。分享给大家供大家参考。具体如下: 这里给定一段文本,分析文本的词频分布,生成tag云 <?php /** * Tag cloud demo based on word frequency * author: unknown * since: 2007-02-27 */ // Store frequency of words in an array $freqData = array(); // Random words $lor
  3. 所属分类:其它

    • 发布日期:2020-12-18
    • 文件大小:35840
    • 提供者:weixin_38687218
  1. PHP编程计算文件或数组中单词出现频率的方法

  2. 本文实例讲述了PHP编程计算文件或数组中单词出现频率的方法。分享给大家供大家参考,具体如下: 如果是小文件,可以一次性读入到数组中,使用方便的数组计数函数进行词频统计(假设文件中内容都是空格隔开的单词): <?php $str = file_get_contents("/path/to/file.txt"); //get string from file preg_match_all("/\b(\w+[-]\w+)|(\w+)\b/",$str,$r); //place words in
  3. 所属分类:其它

    • 发布日期:2020-12-19
    • 文件大小:45056
    • 提供者:weixin_38733787
  1. php权重计算方法代码分享

  2. 复制代码 代码如下:<?php/* vim: set expandtab tabstop=4 shiftwidth=4: */// +————————————————————————//  Name       :   权重计算                                         //  Descr iption:   稍加修改,亦可用于分词,词频统计,全文检索和垃圾检测//  Date       :   2013/12/16 08:51 class weig
  3. 所属分类:其它

    • 发布日期:2020-12-19
    • 文件大小:39936
    • 提供者:weixin_38607554
  1. scws:开源免费的简易中文分词系统,PHP分词的上乘之选!-源码

  2. SCWS的自述文件 $ Id $ SCWS简介 是Simple Chinese Word Segmentation的首字母缩写(即:简易中文分词系统)。这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分开的词。词是中文的最小语素单位,但在书写时并不像英语会在词之间用间隔分开,所以如何准确并快速分词一直是中文分词的攻关难点。 SCWS采用纯C语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序,支持的中文编码包括GBK , UTF-8等。几乎还提供了扩展模
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:7340032
    • 提供者:weixin_42181545
  1. php_scws.rar

  2. SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。 SCWS 采用纯 C 语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序, 支持的中文编码包括 GBK、UTF-8 等。此外还提供了 PHP 扩展模块, 可在
  3. 所属分类:互联网

    • 发布日期:2021-03-11
    • 文件大小:19456
    • 提供者:famousywm
  1. 开源php中文分词系统SCWS安装和使用实例

  2. 一、SCWS简介 SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。SCWS 采用纯 C 语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序, 支持的中文编码包括 GBK、UTF-8 等。此外还提供了 PHP 扩展模
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:63488
    • 提供者:weixin_38581405
  1. php自动获取关键字的方法

  2. 本文实例讲述了php自动获取关键字的方法。分享给大家供大家参考。 具体实现方法如下: 复制代码 代码如下:$mincipin=5;//最小词频 $minlen=4;//关键字最小长度 tiqukeyword($tiqustr,$minlen,$mincipin); function tiqukeyword($tiqustr,$minlen,$mincipin) {$strlong=strlen($tiqustr); $arr=array(); $k=-1; for($i=0;$i&
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:36864
    • 提供者:weixin_38699724