您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Yard中文分词系统V0.1.1版

  2. Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了歧义划分的问题,但是对人名、地名、组织名、英文、数字等还不能进行很好的切分,在下一个版本中将解决这些问题。中文词典应用了搜狗实验室提供的互联网词库。纯java编写源码和词典在附件中可以下载。本软件为开源软件你可以进行任何修改以适应你的需求,如果你加入了新功能请发送一份副本给我,我们一同完善改
  3. 所属分类:其它

    • 发布日期:2009-06-16
    • 文件大小:1048576
    • 提供者:Soul_fly
  1. 中文地名分词+地名词典创建工具

  2. 学习了部分分词原理和方法,做了相应的改进: 1、创建了两种词典树,做了性能上的比较 2、改进数字词组的分词方法,加入语法的判断 3、提供地名词典创建工具。将地名全名词典分词获得分词后的地名词典,减少词条数目,增加查找速度。程序用一个中等省会城市测试,模糊查询和精确查询效果都不错。 4、加入地名输入提示的工具。 代码采用C#,为学习成果,尚有很多不完善地方,欢迎交流。 词典数据来源于网络!
  3. 所属分类:C#

    • 发布日期:2008-09-05
    • 文件大小:1000448
    • 提供者:killo007
  1. IKAnalyzer中文分词器 3.2.0 源码包.rar

  2. IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 IKAnalyzer3.0特性: 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。 采用了
  3. 所属分类:其它

    • 发布日期:2019-05-25
    • 文件大小:1048576
    • 提供者:weixin_39840515
  1. bels:生物多样性增强定位服务-源码

  2. 生物多样性增强定位服务(BELS) 设想将生物多样性增强定位服务(亲切地称为“ BELS”)是一套服务,以促进识别,持久性,管理,相同As断言,标准化,表示,地理配准以及目标位置范围为目标的基于位置的数据共享。生物多样性。这里的工作源于在社区论坛“ ”以及“”中提出和讨论的概念。 迄今为止,服务包括: 通过 , 和共享的逐字记录数据的基本数据存储 截至2021年1月,在来源(“地名词典”)中找到的“的不同值组合的摘要 位置标识符基于基于Darwin Core位置项内容的公式的SHA256哈希 从
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:2097152
    • 提供者:weixin_42150745
  1. Gazetteer2.0:设想此应用程序为“移动优先”网站,它将在台式计算机上同样良好地运行。它将通过介绍人口,气候,地理和其他数据为所有国家提供概况-源码

  2. 地名词典2.0 设想此应用程序为“移动优先”网站,它将在台式计算机上同样良好地运行。它将通过提供人口统计,气候,地理和其他数据为所有国家提供资料。
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:2097152
    • 提供者:weixin_42097557
  1. MAPA:美索不达米亚古代地名年鉴-源码

  2. MAPA 美索不达米亚古代地名年鉴 地名词典0.1版 “美索不达米亚古代地名年鉴”(MAPA)被计划作为帝国时代美索不达米亚历史地理的长期项目,旨在将文本和遥感数据结合起来,以对景观进行大规模的关系制图。 。 该项目的核心是在地面上和通过卫星在地名和地名词典中的文字和勘测。 文本中的名称将链接到成千上万的阿卡德日常记录,这些记录有多种格式:音译,英文和德文摘要以及英文翻译。 这里以TSV和JSON格式呈现的数据集是从美索不达米亚城市乌鲁克及其周边地区发布的新巴比伦和阿契美尼德时期的法律,经济
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:37888
    • 提供者:weixin_42161450
  1. scws:开源免费的简易中文分词系统,PHP分词的上乘之选!-源码

  2. SCWS的自述文件 $ Id $ SCWS简介 是Simple Chinese Word Segmentation的首字母缩写(即:简易中文分词系统)。这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分开的词。词是中文的最小语素单位,但在书写时并不像英语会在词之间用间隔分开,所以如何准确并快速分词一直是中文分词的攻关难点。 SCWS采用纯C语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序,支持的中文编码包括GBK , UTF-8等。几乎还提供了扩展模
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:7340032
    • 提供者:weixin_42181545
  1. whosonfirst-data-admin-us:美国的Whos On First管理数据,首页-源码

  2. whosonfirst-data-admin-us 谁在第一位是地名词典。 并不是世界上所有地方,而是其中很多地方,我们希望,我们大多数地方都共享一个地方。 该存储库包含美利坚合众国行政场所的记录。 请参阅此文件,以了解Who's On First项目概述,项目原则,注意事项和许可信息。 如果您发现要报告的问题,请在提交。 也可以看看:
  3. 所属分类:其它

    • 发布日期:2021-03-05
    • 文件大小:1064304640
    • 提供者:weixin_42102634
  1. 地名词典-源码

  2. 地名词典 这是第一个移动应用程序,旨在让您在地图上找到自己的位置以及许多相关信息。 该信息包括但不限于: 天气 新闻 货币 时区 Covid统计 技术领域 前端技术: HTML / CSS 引导程序 传单 后端技术: Javascr ipt / JQuery PHP /网址
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:2097152
    • 提供者:weixin_42166918
  1. 地名词典新样式-源码

  2. 地名词典新样式
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:7340032
    • 提供者:weixin_42123456
  1. whosonfirst-data-admin-do:DO的Whos On First管理数据,主页:https:whosonfirst.org-源码

  2. whosonfirst-data-admin-do 谁在第一位是地名词典。 并不是世界上所有地方,而是很多地方,我们希望,我们大多数地方都共享一个地方。 该存储库包含多米尼加共和国行政场所的记录。 请参阅此文件,以了解Who's On First项目概述,项目原则,注意事项和许可信息。 如果您发现要报告的问题,请在提交。 也可以看看:
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:12582912
    • 提供者:weixin_42143161
  1. whosonfirst-data-admin-au:AU的Whos On First管理数据,主页:https:whosonfirst.org-源码

  2. whosonfirst-data-admin-au 谁在第一位是地名词典。 并不是世界上所有地方,而是其中很多地方,我们希望,我们大多数地方都共享一个地方。 该存储库包含澳大利亚行政场所的记录。 请参阅此文件,以获取Who's On First项目概述,项目原则,注意事项和许可信息。 如果您发现要报告的问题,请在提交。 也可以看看:
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:225443840
    • 提供者:weixin_42106765
  1. whosonfirst-data-admin-gb:GB的Whos On First管理数据,主页:https:whosonfirst.org-源码

  2. whosonfirst-data-admin-gb 谁在第一位是地名词典。 并不是世界上所有地方,而是其中很多地方,我们希望,我们大多数地方都共享一个地方。 该存储库包含英国行政场所的记录。 请参阅此文件,以了解Who's On First项目概述,项目原则,注意事项和许可信息。 如果您发现要报告的问题,请在提交。 也可以看看:
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:437256192
    • 提供者:weixin_42099530
  1. whosonfirst-data-admin-sa:SA的Whos On First管理数据,主页:https:whosonfirst.org-源码

  2. whosonfirst-data-admin-sa 谁在第一位是地名词典。 并不是世界上所有地方,而是其中很多地方,我们希望,我们大多数地方都共享一个地方。 该存储库包含沙特阿拉伯行政场所的记录。 请参阅此文件,以了解Who's On First项目概述,项目原则,注意事项和许可信息。 如果您发现要报告的问题,请在提交。 也可以看看:
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:8388608
    • 提供者:weixin_42122306
  1. whosonfirst-data-admin-il:IL的Whos On First管理数据,主页:https:whosonfirst.org-源码

  2. whosonfirst-data-admin-il 谁在第一位是地名词典。 并不是世界上所有地方,而是其中很多地方,我们希望,我们大多数地方都共享一个地方。 该存储库包含以色列行政场所的记录。 请参阅此文件,以了解Who's On First项目概述,项目原则,注意事项和许可信息。 如果您发现要报告的问题,请在提交。 也可以看看:
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:6291456
    • 提供者:weixin_42134117
  1. 地名词典:我的投资组合的第一个官方项目-源码

  2. 地名词典:我的投资组合的第一个官方项目
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:1048576
    • 提供者:weixin_42144086
  1. gzetr:gzetr项目的渐进式Web应用程序实现-源码

  2. ze 国家地名词典
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:731136
    • 提供者:weixin_42144554
  1. whgazetteer:世界历史地名词典平台-源码

  2. 世界历史地名录 这是世界历史地名录(WHG)Web平台和API的存储库。 该项目位于匹兹堡大学的 。 它得到了美国国家人文共济会(NEH)赠款和WHC实物支持的大量资助。 WHG正在汇总研究人员提供的历史地标的证明。 于2020年7月27日发布,并且正在进行增量更新。 在其和有关于WHG的大量信息。 关于该项目的公告和讨论也可以在以及通过我们的Twitter feed 。 变更记录 v1.1a(2021年1月11日) 支持上传和验证.csv,.xlsx和.ods格式 计算国家代码(如果不存在
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:3145728
    • 提供者:weixin_42164702
  1. 地名索引:OSM ElasticSearch地理编码器和地址导出器-源码

  2. OpenStreetMap(OSM)地理编码器 该项目的主要目的是易于使用的地理编码器/地理索引器。 项目由两部分组成:地名词典和地名网站 地名词典 地名词典用于解析osm数据,并对几何进行所有脏工作。 您可以将Gazetteer用作独立的osm处理器,以从osm转储地址。 您可以忽略GazetteerWeb,并在自己的地理编码/地理搜索应用程序中使用数据。 进行osm.bz2转储并生成json 完整的地理编码建筑物 完整的地理编码POI 街道 城市 行政界限 详细信息在这里 您可以
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:268288
    • 提供者:weixin_42108948
  1. city.json:基于GeoNames Gazetteer的Json世界城市-源码

  2. 世界城市 这些城市来自GeoNames地名词典: : 这是原始数据集的描述: 所有人口> 1000或adm div(ca 150.000)所在地的城市[...] 安装 npm install --save cities.json 用法 在node或浏览器(使用webpack )上,它都变得如此简单: ES5 const cities = require('cities.json'); ES6 import cities from 'cities.json'; 由于webpa
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42109732