您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于隐马模型的中国人名自动识别研究

  2. 中国人名的识别是中文未登录词识别的重点和难点,目前的解决方案自身存在一些本质的缺陷,实际效果还难以满足实际需求。本文提出了一种基于角色标注的中国人名自动识别方法。即:利用从语料库中自动抽取的角色信息,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率,准确率也得到了实际提高。实验数据证明:该方法是行之有效、能够成功解决中国人名的自动识别问题。
  3. 所属分类:其它

    • 发布日期:2009-07-05
    • 文件大小:89088
    • 提供者:softloveman
  1. 中国人名银行笔试模拟题目

  2. 中国人名银行笔试模拟题目,希望对大家有帮助。
  3. 所属分类:专业指导

    • 发布日期:2009-12-09
    • 文件大小:35840
    • 提供者:hickery
  1. 计算所汉语词法分析系统ICTCLAS

  2. 词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结
  3. 所属分类:嵌入式

    • 发布日期:2007-11-25
    • 文件大小:2097152
    • 提供者:yanghuan6215
  1. 基于角色标注的中国人名自动识别研究

  2.   该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别 过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完 全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的 召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名
  3. 所属分类:互联网

    • 发布日期:2011-04-18
    • 文件大小:439296
    • 提供者:yuqilong
  1. 自然语言处理-人名识别

  2. 采用统计与规则相结合的混合策略,提出一种中国人名的自动识别方法.该方法利用知识库中的统计信息,对 中国人名作初步的提取,分析中国人名构成的内部特征和外部特征,提取出特征集,并总结出相应的识别规则,对候选人名进 行识别.在此基础上构建了一个中国人名识别系统,并对系统进行了测试,实验表明了算法的可行性和有效性
  3. 所属分类:专业指导

    • 发布日期:2011-05-15
    • 文件大小:729088
    • 提供者:mwzIT
  1. 猴子吃桃 数据结构课程设计 中南大学

  2. [问题描述] 针对自己的班集体中的“人名”设计一个哈希表,使得平均查找长度不超过R,完成相应的建表和查表程序。 [基本要求] 假设人名为中国姓名的汉语拼音形式。待填入哈希表的人名共有30个,取平均查找长度的上限为2。哈希函数用除留余数法构照,用链表法处理冲突。 [测试数据] 读取熟悉的30个人的姓名。
  3. 所属分类:C/C++

    • 发布日期:2011-06-29
    • 文件大小:1024
    • 提供者:wyy533
  1. 基于角色标注的中国人名自动识别研究

  2. 基于角色标注的中国人名自动识别研究, 非常不错的人名识别方法研究
  3. 所属分类:其它

    • 发布日期:2011-09-15
    • 文件大小:89088
    • 提供者:gavinxt
  1. FreeICTCLAS

  2. 计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58%(973专家组评测),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。
  3. 所属分类:专业指导

    • 发布日期:2008-05-17
    • 文件大小:2097152
    • 提供者:zhucunzhi
  1. 数据结构课程设计 哈希表 c语音代码

  2. 1.1 问题描述 针对自己的班集体中的“人名”设计一个哈希表,使得平均查找长度不超过R,完成相应的建表和查表程序。 1.2 基本要求 假设人名为中国姓名的汉语拼音形式。待填入哈希表的人名共有30个,取平均查找长度的上限为2。构造哈希函数,用链表法处理冲突。 1.3 测试数据 读取熟悉的30个人的姓名作测试。
  3. 所属分类:C/C++

    • 发布日期:2011-12-19
    • 文件大小:1048576
    • 提供者:lynne5545
  1. ICTCLAS中文分词论文收集

  2. 基于N-最短路径方法的中文词语粗分模型 基于多层隐马模型的汉语词法分析研究 基于角色标注的中国人名自动识别研究 基于角色标注的中文机构名识别
  3. 所属分类:其它

    • 发布日期:2012-08-08
    • 文件大小:4194304
    • 提供者:chengyunlu
  1. 基于N最短路径方法与中国人名 识别的中文分词系统

  2. 采取基于N-最短路径方法的中文词语粗分模型对中文文本进行粗切分,采取Viterbi算法对切分结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别
  3. 所属分类:专业指导

    • 发布日期:2012-09-25
    • 文件大小:353280
    • 提供者:danisein
  1. ictclas免费代码

  2. 计算所汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System), // 功能有:中文分词;词性标注;未登录词识别。 // 分词正确率高达97.58%(973专家评测结果), // 未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%; // 处理速度为31.5Kbytes/s。
  3. 所属分类:其它

  1. ShootSearch 中文分词组件(c#开源)

  2. ShootSearch 中文分词组件(c#开源) 技术支持:support@shootsoft.net http://www.shootsoft.net 分词算法:词库+最大匹配 词库来自www.jesoft.cn,已经过一定的修改 使用说明: 先加载词库,再进行分词.分词过程重载两次:支持回车的和不支持回车的,注意选择! 可以手动添加词语到sDict.txt,不过每次手动修改后需要调用SortDic()方法,否则无法实现最大匹配! sDict.txt的编码为UTF-8! 示例: 文字内容来自
  3. 所属分类:C#

    • 发布日期:2006-08-18
    • 文件大小:1001472
    • 提供者:shootsoft
  1. 哈希表设计

  2. 针对自己的班集体中的“人名”设计一个哈希表,使得平均查找长度不超过R,完成相应的建表和查表程序。 [基本要求]假设人名为中国姓名的汉语拼音形式。待填入哈希表的人名共有30个,取平均查找长度的上限为2。
  3. 所属分类:C++

    • 发布日期:2013-12-03
    • 文件大小:6144
    • 提供者:u013027250
  1. 中科院分词ICTCLAS5.0_JNI

  2. 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果),基于角色标注的未登录词识别能取得高于90%召回率,其中中国人名的识别召回率接近98%,分词和词性标注处理速度为31.5KB/s。ICTCLAS
  3. 所属分类:C++

    • 发布日期:2016-06-22
    • 文件大小:8388608
    • 提供者:pang_hailong
  1. Java 词海分析 自然语言分析 人名地名机构名提取自定义词典

  2. 中文分词 最短路分词 N-最短路分词 CRF分词 索引分词 极速词典分词 用户自定义词典 词性标注 命名实体识别 中国人名识别 音译人名识别 日本人名识别 地名识别 实体机构名识别 关键词提取 TextRank关键词提取 自动摘要 TextRank自动摘要 短语提取 基于互信息和左右信息熵的短语提取 拼音转换 多音字 声母 韵母 声调 简繁转换 繁体中文分词 简繁分歧词(简体、繁体、臺灣正體、香港繁體) 文本推荐 语义推荐 拼音推荐 字词推荐 依存句法分析 基于神经网络的高性能依存句法分析器
  3. 所属分类:Java

    • 发布日期:2017-10-11
    • 文件大小:22020096
    • 提供者:vip923803855
  1. 中国人常用弱密码top100

  2. 中国人最常使用的弱口令前100,这绝对不是国外人常用的top100,你看字典里面有woaini,5201314,aiwoma,键盘密码,等等口令你就可以确定是中国的,国外的弱口令会有各种单词人名比如john,divide啥的,真假自己看
  3. 所属分类:网络攻防

    • 发布日期:2018-07-31
    • 文件大小:15360
    • 提供者:qq_34165668
  1. Android代码-Java 实现的自然语言处理中文分词

  2. HanLP: Han Language Processing 汉语言处理包 HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-Bigram(速度与精度最佳平衡;一百兆内存) 最短路分词、N-最短路分词 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 感知机分词、CRF分词 词典分词(侧重速度,每
  3. 所属分类:其它

    • 发布日期:2019-08-06
    • 文件大小:22020096
    • 提供者:weixin_39840924
  1. 哈希表设计问题.CPP

  2. 功能描述:针对自己的班同学名单设计一个哈希表,使得平均查找长度不超过2,完成相应的建表和查表程序。 设计要求:假设人名为中国姓名的汉语拼音形式,哈希函数用除留余数法构造,用链表法处理冲突。
  3. 所属分类:C/C++

    • 发布日期:2020-01-28
    • 文件大小:4096
    • 提供者:fengshenbang1
  1. Python课第6周:数字最多数之和、人名最多数统计和单选题

  2. 蜗牛日记20200327 中国大学MOOChttp://www.icourse163.org 《Python语言程序设计》(9期) 2019年07月04日 10:00 – 2019年08月29日 23:30 第六周 组合数据类型 测验 程序设计第1题 题目如下: 数字不同数之和 描述 获得用户输入的一个整数N,输出N中所出现不同数字的和。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:75776
    • 提供者:weixin_38698433
« 12 »