您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. IE信息抽取研究综述

  2. 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹——通过系统化、大规模地定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
  3. 所属分类:专业指导

    • 发布日期:2009-07-04
    • 文件大小:186368
    • 提供者:anyupu
  1. 分词评测工具(bakeoff08)

  2. bakeoff08评测系统, 可以对中文分词, 命名实体识别, 词性标注 进行评测
  3. 所属分类:其它

    • 发布日期:2009-12-08
    • 文件大小:5242880
    • 提供者:kuidi
  1. 文本挖掘中信息抽取研究综述

  2. 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同, 信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分 支,其独特的发展轨迹——通过系统化、大规模地定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的 有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。 回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
  3. 所属分类:专业指导

    • 发布日期:2010-01-24
    • 文件大小:399360
    • 提供者:goodskyfly_1876
  1. 中科院中文分词ictclaszyfc-v2009.zip

  2. 一、ICTCLAS简介   中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精
  3. 所属分类:嵌入式

  1. ICTCLAS2013

  2. 简介: 应各位ICTCLAS用户的要求,张华平博士提前发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性
  3. 所属分类:企业管理

    • 发布日期:2013-01-15
    • 文件大小:7340032
    • 提供者:nickpeng
  1. NLPIR(ICTCLAS2013)中文分词

  2. 张华平博士正式发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持G
  3. 所属分类:其它

    • 发布日期:2013-03-17
    • 文件大小:7340032
    • 提供者:lankelan
  1. 中文分词器nlpir Java32位开发接口

  2. 需配合完整开发包使用,NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。
  3. 所属分类:Java

    • 发布日期:2013-04-15
    • 文件大小:788480
    • 提供者:wskings
  1. conll2010评测程序

  2. 命名实体识别结果的评测,条件随机场命名实体的结果评测
  3. 所属分类:Python

    • 发布日期:2014-04-09
    • 文件大小:13312
    • 提供者:hj398984059
  1. 分词系统NLPIR2013

  2. NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。
  3. 所属分类:Java

    • 发布日期:2014-07-13
    • 文件大小:7340032
    • 提供者:qq_15192337
  1. 中文分词入门与字标注法

  2. 作为中文信息处理的“桥头堡”,中文分词在国内的关注度似乎远远超过了自然语言处理的其他研究领域。在中文分词中,资源的重要性又不言而喻,最大匹配法等需要一个好的词表,而基于字标注的中文分词方法又需要人工加工好的分词语料库。所以想研究中文分词,第一步需要解决的就是资源问题,这里曾经介绍过“LDC上免费的中文信息处理资源”,其中包括一个有频率统计的词表,共计44405条,就可以作为一个不错的中文分词词表使用。而一个好的人工分词语料库,需要很大的人力物力投入,所以无论研究还是商用往往需要一定的费用购买,
  3. 所属分类:深度学习

    • 发布日期:2017-12-14
    • 文件大小:251904
    • 提供者:u011563494
  1. 基于crfsuited的医疗命名实体抽取的Python实现

  2. 基于crfsuited的医疗命名实体抽取的Python实现 医疗电子病例命名实体识别评测任务的一个可执行demo,采用的方法是条件随机场(CRF),实现CRF的第三方库为[python-crfsuite]。目前该demo准确率为68%,召回率为62%,F1值为64.8%。
  3. 所属分类:机器学习

    • 发布日期:2018-07-03
    • 文件大小:414720
    • 提供者:beaujor
  1. conlleval.pl CRF++结果评测工具

  2. 用来评价CRF++,以及wapiti等基于CRF算法开发的的命名实体识别工具。同样适用于基于深度学习的实体识别结果的测评。
  3. 所属分类:机器学习

    • 发布日期:2018-07-23
    • 文件大小:13312
    • 提供者:zhoukaiyin_hzau
  1. cw2vec相关资料,cw2vec论文与Word Vectors

  2. cw2vec相关资料,全国知识图谱与语义计算大会(CCKS2018)8月14日至17日在天津举行,凭借出色的专业能力,阿里健康团队在中文电子病历命名实体识别评测任务中夺冠。 cw2vec: (Learning Chinese Word Embeddings with Stroke n-gram Information) AAAI 2018高分录用的一篇中文词向量论文
  3. 所属分类:深度学习

    • 发布日期:2018-08-18
    • 文件大小:1048576
    • 提供者:hhtnan
  1. 汉语问答系统关键技术研究 吴友政

  2. 本文针对汉语问答技术展开深入研究 [1] 建立了一个具有一定规模并可扩充的汉语问答技术评测平台 [2] 提出了汉语问答系统的提问分类体系及基于多特征的提问分类算法 [3] 设计了基于多特征的汉语命名实体识别算法 [4] 提出了基于主题语言模型的汉语问答系统句子检索算法 [5] 提出了基于无监督学习的问答模式抽取技术
  3. 所属分类:深度学习

    • 发布日期:2019-04-24
    • 文件大小:2097152
    • 提供者:sinat_39443566
  1. Chinese NER Using Lattice LSTM

  2. 命名实体识别,采用基于字的BiLSTM-CRF(Bidirectional LSTM-CRF)模型,利用人工校验的数据集进行训练,最后对该模型进行评测。
  3. 所属分类:深度学习

    • 发布日期:2019-05-17
    • 文件大小:18432
    • 提供者:zrx11094421
  1. 统计自然语言处理

  2. 统计自然语言处理是一本很好的书籍,是一本很基础的书籍目录 序二 第2版前宣 第1版前言 第1章绪论 11基本概念 1.1.1语言学与语音学 2自然语言处理 11.3关于“理解”的标准 1,2自然语言处理研究的内容和面临的困难 1,2,1自然语言处理研宄的内容 1,22自然语言处理涉及的几个层次 1.2.3自然语言处理面临的困难 13自然语言处理的基本方法及其发展 13,1自然语言处理的基本方汏 3,2自然语言处理的发展 14自然语言处理的研究现状 本书的内容安挂 第2章顸备知识 2,1概率论基本
  3. 所属分类:Python

    • 发布日期:2019-03-04
    • 文件大小:25165824
    • 提供者:weixin_34749051
  1. yidu-s4k 医渡云结构化4K数据集

  2. Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:1)医疗命名实体识别;2)医疗实体及属性抽取(跨院迁移)。
  3. 所属分类:深度学习

    • 发布日期:2020-08-16
    • 文件大小:1048576
    • 提供者:weixin_42691585