文件名称:
mecab-ipadic-neologd:基于Web上用于mecab-ipadic的语言资源的新词词典-源码
开发工具:
文件大小: 58mb
下载次数: 0
上传时间: 2021-02-26
详细说明:mecab-ipadic-NEologd:MeCab的新词词典
对于日语
README.ja.md用日语编写。
文献资料
您可以在以下Wiki中找到更详细的文档和示例。
概述
mecab-ipadic-NEologd是针对MeCab的定制系统字典。
该词典包含许多新词(新词),这些词是从网络上的许多语言资源中提取的。
分析Web文档时,最好同时使用此系统词典和默认词典(ipadic)。
利弊
优点
记录了大约322万对单词(例如,命名实体)的表面/折纸(假名表示汉字的发音)对(包括重复的条目),这些单词不能使用MeCab的默认系统词典正确标记。
该词典的更新过程将自动在开发服务器上运行。 我打算更新这本字典,至少每周更新两次每个星期一和星期四
通过利用Web上的语言资源进行续订时,可以记录一个新的命名实体。 当前正在利用的资源如下。
Hatena关键字的转储数据
日语邮政编码号码数
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.