您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. JE中文分词je-analysis-1.5.1.jar

  2. 1.5.1 —— 2006-01-22 修正细粒度分词错误的问题 1.5.0 —— 2007-01-18 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配 增加了Mail地址的匹配 实现了词尾消歧算法第二层的过滤 整理优化了词库 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 2006-07-03 修正细粒度分词错误的问题 1.3.1 —— 2006-0 6-23 修
  3. 所属分类:其它

    • 发布日期:2009-04-28
    • 文件大小:891904
    • 提供者:tiancen2001
  1. je-analyzer-1.5.3lucene中文分词组件

  2. 分词算法:正向最大匹配 + 词尾多重消歧 + 22万精选词典分词效率:每秒30万字(测试环境迅驰1.6,第一次分词需要1-2秒加载词典) 内存消耗:30M 支持分词粒度控制支持Lucene分词接口支持英文、数字、中文混合分词支持中文词典动态维护 支持中英文噪声词过滤 支持人名匹配 支持地名匹配 支持数量词匹配 支持中文数字匹配 支持日期时间匹配 支持电子邮件匹配 支持商品编码匹配
  3. 所属分类:其它

    • 发布日期:2008-04-14
    • 文件大小:892928
    • 提供者:shylanse
  1. 面向中文DBLP的人名消歧机构名称归一化算法

  2. 面向中文DBLP的人名消歧机构名称归一化算法 详情请见:http://www.datatang.com/member/5878中的相关资料 http://www.cnblogs.com/finallyliuyu/中的相关资料
  3. 所属分类:专业指导

    • 发布日期:2013-05-31
    • 文件大小:18874368
    • 提供者:finallyliuyu
  1. Lucene中文分词组件 JE-Analysis 1.4.0

  2. 该组件免费安装使用传播,无限制商业应用,但暂不开源,也不提供任何保证 分词效率: 第一次分词需要1-2秒(读取词典),之后速度基本与Lucene自带分词持平 运行环境: Lucene 1.9+ 内存消耗: 30M+ 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 2006-07-03 修正细粒度分词错误的问题 1.3.1 —— 2006-06-23 修正在某些情况下分词遗漏的问题 1.3 ——
  3. 所属分类:其它

    • 发布日期:2006-09-22
    • 文件大小:0
    • 提供者:chenxhcc
  1. Lucene中文分词组件 JE-Analysis 1.5.1

  2. 发布于:http://www.jesoft.cn/posts/list/5.page 1.5.1 —— 2006-01-22 修正细粒度分词错误的问题 1.5.0 —— 2007-01-18 全面支持Lucene 2.0 增强了词典维护的API 增加了商品编码的匹配 增加了Mail地址的匹配 实现了词尾消歧算法第二层的过滤 整理优化了词库 1.4.0 —— 2006-08-21 增加词典的动态扩展能力 1.3.3 —— 2006-07-23 修正无法多次增加词典的问题 1.3.2 —— 200
  3. 所属分类:其它

    • 发布日期:2007-01-22
    • 文件大小:891904
    • 提供者:diystar
  1. 高级机器学习:该项目是我的作业提交清华高级机器学习的班级-源码

  2. 先进的机器学习 该项目是我的作业在哪里提交的课是清华高级机器学习。 作业_2 相关代码和具体的报告说明见name-disambiguation文件夹 名字歧义同名消歧 同名消歧是一个具有挑战性的问题,由于数据的杂乱以及同名情景十分复杂,要快速且准确的解决同名消歧问题还有很大的障碍。 论文的冷启动消歧 工作描述 给定一堆拥有同名作者的论文,要求返回一组论文聚类,因为一个聚类内部的论文都是一个人的,不同聚类间的论文论文不属于一个人。最终目的是识别出那些同名作者的论文属于同一个人。 尖端 可以把问题看
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:211968
    • 提供者:weixin_42151772