文件名称:
庖丁分词程序2.0.4,很好的分词程序
开发工具:
文件大小: 5mb
下载次数: 0
上传时间: 2009-07-22
详细说明: 庖丁分词程序,很好的分词程序."庖丁解牛" 使用指南 1、准备 1)将二进制包paoding-analyis.jar放到自己的classpath下 2)将字典文件安装(也就是拷贝)到某个目录下,比如/data/paoding/dic下 3)把配置文件paoding-analysis.properties放到自己的classpath下 4)打开paoding-analysis.properties,把paoding.dic.home属性设置为字 典的安装目录,比如paoding.d ic.home=/data/paoding/dic,特别的,如 果字典是安装在classpath下的dic目录下,则可以简单这样配置该属性: paoding.dic.home=classpath:dic 2、建立索引 1)将庖丁封装成符合Lucene要求的Analyzer规范,获取writer mode的lucene 分析器,writer mode意味要同时支持最大和最小切词。 Paoding paoding = PaodingMaker.make(); Analyzer writerAnalyzer = PaodingAnalyzer.writerMode(paoding); Paoding应保存为一个系统单例为好,以重复利用,它是线程安全的. 2)使用Lucene标准API对文件建立索引。 IndexWriter writer = new IndexWriter(dirctory, writerAnalyzer); ... 3、检索查找 1)使用Lucene标准API对文件进行检索,使用和建立索引时相同种的lucene分析器。 QueryParser parser = new QueryParser("content", writerAnalyzer ); ... 更具体的使用方式参见 examples/net.paoding.analysis.examples.gettingstarted中的示例代码 ...展开收缩
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.