文件名称:
friso:高性能中文令牌生成器,基于ANSI C开发的MMSEG算法,同时支持GBK和UTF-8字符集。完全基于模块化实现,可以轻松嵌入其他程序中,例如:MySQL,PostgreSQL,PHP等-源码
开发工具:
文件大小: 1mb
下载次数: 0
上传时间: 2021-01-30
详细说明:Friso是什么?
Friso是使用c语言开发的一种开源的高级中文分词器,使用流行的mmseg算法实现。完全基于建模设计和实现,可以很方便的植入其他程序中,例如:MySQL,PHP,并提供无需修改即可在各种平台下编译使用,加载完20万的词条,内存占用稳定为14.5M。
Friso核心功能:
中文分词:mmseg算法+ Friso独创的优化算法,各种切分模式。
关键字提取:基于textRank算法。
关键语法提取:基于textRank算法。
关键句子提取:基于textRank算法。
Friso中文分词:
典型切分模式:
简易模式:FMM算法,适合速度要求场合。
复杂模式-MMSEG精细过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。
检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.6.1版本开始)。
最高模式:细粒度切分,专为检索而生,除了中文处理外(不拥有中文的人名,数字识别等智能功能)其他与复杂模式一致(英文,组合词等)。
分词功能特性:
同时支持对UTF-8 / GBK编码的切分,支持php5和php7扩展和sphinx令牌插件。
支持自定义词库。在字典文
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.