您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中文电子病历命名实体识别的主动学习方法研究

  2. 主动学习通过选择现有模型中未充分训练的数据进行迭代训练,从而利用少量标注数据训练出较高性能的模型。 传统的主动学习方法只关注数据本身的信息量而忽略了该数据是否孤立。论文提出一种改进的主动学习方法,利用相似病 历中出现的词汇往往雷同的特点,以文档中文字的分布衡量其在样本集的普遍程度,并以此对信息量进行加权。而后实现 该方法,并进行了与消极学习和传统主动学习方法的对比实验。结果表明,该方法相对消极学习与传统的主动学习方法, 效果有明显提升,能够减少对标注数据的需求。
  3. 所属分类:深度学习

    • 发布日期:2018-07-03
    • 文件大小:3145728
    • 提供者:beaujor
  1. NER中文命名实体识别数据集

  2. 中文命名实体识别数据集,很好用。包括组织,机构和人物三个实体。
  3. 所属分类:机器学习

    • 发布日期:2019-07-05
    • 文件大小:1048576
    • 提供者:qq_38268952
  1. 命名实体识别命名实体识别ner_dataset.7z

  2. 这个命名实体识别数据集是本人亲自整理的最终大型的数据集,供各位学习投票模型的亲朋好友们使用,本人亲自测试,效果非常好!!!!!!
  3. 所属分类:其它

    • 发布日期:2020-07-29
    • 文件大小:5242880
    • 提供者:qq_37150711
  1. 一种面向微博文本的命名实体识别方法

  2. 命名实体识别是自然语言处理领域的一项基础性技术。近年来微博等网络社交平台发展迅速,其独特的形式对传统的命名实体识别技术提出了新的挑战。故提出一种基于条件随机场模型的改进方法,针对微博文本短小、语义含糊等特点,引入外部数据源提取主题特征和词向量特征来训练模型,针对微博数据规模大、人工标准化处理代价大的特点,采取一种基于最小置信度的主动学习算法,以较小的人工代价强化模型的训练效果。在新浪微博数据集上的实验证明,该方法与传统的条件随机场方法相比F值提高了4.54%。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:281600
    • 提供者:weixin_38637998
  1. 命名实体识别数据集.rar

  2. 该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下: 以 O 及 O 以 O 康 B-COMPANY_NAME 宽 I-COMPANY_NAME 为 O 代 O 表 O 的 O 国 O 外 O 专 O 利 O 产 O 品 O 低 O 毒 O 杀 O 虫 O 剂 O 吡 B-PRODUCT_NAME 虫 I-PRODUCT_NAME 啉 I-PRODUCT_N
  3. 所属分类:深度学习

  1. DeepNER:天池中药说明书实体识别挑战冠军方案;中文命名实体识别; NER; BERT-CRF&BERT-SPAN&BERT-MRC; Pytorch-源码

  2. 中文-DeepNER-Pytorch 天池中药说明书实体识别挑战冠军方案开源 贡献者: zxx飞翔​​的鱼: : 我是蛋糕王: : 数青峰: : 后续官方开放数据集后DeepNER项目会进行优化升级,包含完整的数据处理,训练,验证,测试,部署流程,提供详细的代码注释,模型介绍,实验结果,提供更普适的基础预训练的中文命名实体识别方案,开箱即用,欢迎星级! (代码框架基于火炬和变压器,框架进行性,解耦性,易读性较高,很容易修改迁移至其他NLP任务中) 环境 python3 . 7 p
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:3145728
    • 提供者:weixin_42116805
  1. 命名实体识别conll 数据集-附件资源

  2. 命名实体识别conll 数据集-附件资源
  3. 所属分类:互联网

  1. custom_ner:自定义命名实体识别-源码

  2. 自定义命名实体识别 在此存储库中,我将构建一个自定义NER,该NER将具有诸如工作时间(JT),组织(ORG),工作角色(JR),工作技能(JS),资格(QN),文档(DOC),编程语言等实体(PL),编程框架(PF)等。本实验使用的数据集由我完全定制,并将包含在存储库中。 这些数据是通过从不同的工作站点进行网络抓取获得的。 我将仅使用他们的职位描述,而不使用网站上的其他数据。 数据大部分是以前确实抄袭的,可以添加一些其他网站。 ->包含所有代码->包含演示代码
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:14680064
    • 提供者:weixin_42131798
  1. 提示:T-NER是一个python工具,用于分析基于命名实体识别(NER)的语言模型微调。 它具有易于使用的界面,可以微调模型,在跨域数据集上进行测试,在此我们可以编译9个公开可用的NER数据集。 模型可以立即部署在我们的Web应用程序上以

  2. T-NER:变形金刚NER T-NER是一个Python工具,用于分析基于命名实体识别(NER)的语言模型微调。 它具有易于使用的界面,可以微调模型,在跨域数据集上进行测试,在此我们可以编译9个公开可用的NER数据集。 模型可以立即部署在我们的Web应用程序上以进行定性分析,而可以部署在微服务的API上。 同时,我们发布所有NER模型检查点,其中在所有数据集上训练最广泛的模型具有43种实体类型。 目录 :内置数据集和自定义数据集 :模型训练 :域内/域外评估 :从模型获取预测的API
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:837632
    • 提供者:weixin_42157188
  1. BERT-NER:使用Google的BERT进行命名实体识别(CoNLL-2003作为数据集)-源码

  2. 为了获得更好的性能,您可以尝试NLPGNN,有关更多详细信息,请参见 。 BERT-NER版本2 使用Google的BERT进行命名实体识别(CoNLL-2003作为数据集)。 原始版本(有关更多详细信息,请参见old_version)包含一些硬代码,并且缺少相应的注释,因此不方便理解。 因此,在此更新版本中,有一些新的想法和技巧(关于数据预处理和图层设计)可以帮助您快速实现微调模型(您只需尝试修改crf_layer或softmax_layer)。 资料夹说明: BERT-NER |___
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:2097152
    • 提供者:weixin_42122306
  1. 双向LSTM-CNN的命名实体识别:双向LSTM-CNN的命名实体识别-源码

  2. 更好的NER 具有双向LSTM-CNN的命名实体识别 命名实体识别的双向LSTM_CNN的keras实现。 原始论文可以在找到 该实现与原始论文的不同之处在于: 不考虑词典 使用存储桶可加快培训速度 使用nadam优化程序代替SGD 结果 该模型在约70个时期内产生90.9%的测试F1得分。 对于给定的体系结构,本文产生的结果是91.14体系结构(带有emb + caps的BILSTM-CNN) 数据集 conll-2003 论文网络模型 使用Keras构建网络模型 运行脚本 pytho
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:1048576
    • 提供者:weixin_42176612
  1. ChineseNER:中文命名实体识别,实体抽取,tensorflow,pytorch,BiLSTM + CRF-源码

  2. 中文NER 本项目使用 python 2.7 张量流1.7.0 火炬0.4.0 对命名实体识别不了解的可以先看一下这篇。顺便求star〜 这是最简单的一个命名实体识别BiLSTM + CRF模型。 数据 数据文件夹中有三个开源数据集可以使用,玻森数据( ),1998年人民日报标注数据,MSRA微软亚洲研究院开源数据。其中,boson数据集有6种实体类型,人民日报语料和MSRA一般只提取人名,地名,组织名三种实体类型。 先运行数据中的python文件处理数据,供模型使用。 张量流版 开始训练
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:13631488
    • 提供者:weixin_42107491
  1. NLP中文命名实体识别案例.rar

  2. 经典论文A Survey on Deep Learning for Named Entity Recognition的实验实现 内含论文,训练测试数据集,模型
  3. 所属分类:互联网

    • 发布日期:2021-02-05
    • 文件大小:40894464
    • 提供者:fade_123456
  1. OntoNotes-5.0-NER-BIO:从OntoNotes 5.0版本中提取的BIO格式的命名实体识别数据集-源码

  2. OntoNotes-5.0-NER-BIO 这是CoNLL-2003格式的版本,带有OntoNotes 5.0版本NER的BIO标记方案。 此格式化的版本基于的说明以及在此存储库中创建的新脚本。 简单地说,名为“(Yuchen Zhang,Zhi Zhong,CoNLL 2013),提出了针对OntoNotes 5.0数据的Train-dev-split,并提供了将其转换为CoNLL 2012格式的脚本。 但是,结果不在BIO标记方案中,不能直接用于许多序列标记体系结构中,例如BLSTM-C
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:87031808
    • 提供者:weixin_42103128
  1. BERT-CH-NER:基于BERT的中文命名实体识别-源码

  2. 基于BERT的中文数据集下的命名实体识别(NER) 基于tensorflow官方代码修改。 环境 Tensorflow:1.13 的Python:3.6 tensorflow2.0会报错。 搜狐比赛 在搜狐这个文本比赛中写了一个基准,使用了bert以及bert + lstm + crf来进行实体识别。 其后只使用BERT的结果如下,具体评估方案请看比赛说明,这里的话只做了实体部分,情感全部为POS进行的测试嘲笑。 使用bert + lstm + crf结果如下 训练验证测试 export B
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42122340
  1. BERT-NER-Pytorch:使用BERT(Softmax,CRF,Span)的中文NER(命名实体识别)-源码

  2. 使用Bert的中文NER BERT代表中文NER。 数据集列表 cner:数据集/ cner 主持人: : 型号清单 BERT + Softmax BERT + CRF BERT +跨度 需求 1.1.0 = <PyTorch <1.5.0 cuda = 9.0 python3.6 + 输入格式 输入格式(首选BIOS标记方案),每个字符的标签为一行。 句子用空行分隔。 美 B-LOC 国 I-LOC 的 O 华 B-PER 莱 I-PER 士 I-PER 我 O 跟
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:495616
    • 提供者:weixin_42109545
  1. Chatito:using使用简单的DSL生成AI聊天机器人,NLP任务,命名实体识别或文本分类模型的数据集!-源码

  2. Chatito 总览 Chatito可帮助您使用简单的DSL生成用于训练和验证chatbot模型的数据集。 如果要使用商业模型,开源框架或编写自己的自然语言处理模型来构建聊天机器人,则需要培训和测试示例。 Chatito在这里为您提供帮助。 该项目包含: 聊天语言 有关完整的语言规范和文档,请参考。 提示 防止过度拟合 如果我们正确使用Chatito,则可以避免过度的问题。 该工具背后的思想是在数据扩充和可能的句子组合的描述之间有一个交集。 它不打算生成可能适合单个句子模型的确定性数据集
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:350208
    • 提供者:weixin_42166918
  1. named_entity_recognition:中文命名实体识别(包括多种模型:HMM,CRF,BiLSTM,BiLSTM + CRF的具体实现)-源码

  2. 中文命名实体识别 数据集 本项目尝试使用了多种不同的模型(包括HMM,CRF,Bi-LSTM,Bi-LSTM + CRF)来解决中文命名实体识别问题,数据集用的是论文ACL 2018 中收集的简历数据,数据的格式如下,它的每个行由一个字及其对应的标注组成,标注集采用BIOES,句子之间用一个空行替换。 美 B-LOC 国 E-LOC 的 O 华 B-PER 莱 I-PER 士 E-PER 我 O 跟 O 他 O 谈 O 笑 O 风 O 生 O 该数据集就位于项目目录下的ResumeNER文件夹里
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:25165824
    • 提供者:weixin_42119281
  1. 实体识别数据集:用于命名实体识别(NER)和实体识别任务的语料库集合。 这些带注释的数据集涵盖多种语言,域和实体类型-源码

  2. 实体识别数据集:用于命名实体识别(NER)和实体识别任务的语料库集合。 这些带注释的数据集涵盖多种语言,域和实体类型
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:2097152
    • 提供者:weixin_42116791
  1. 基于CRF算法的航天命名实体识别

  2. 航天领域相关文本正在飞速累积,随着人类探索太空的进程快速推进,相关文本的累积速度进一步加快。人工阅读整理此类文本显得效率低下,因此,针对航天文本研究信息抽取技术实现信息自动抽取变得十分有价值,而命名实体识别技术又是自动信息抽取的基础,建立一种航天命名实体识别的高效方法具有很重要的现实意义。本文针对航天领域命名实体识别这一特定问题,通过人工构建训练数据集、特征设计和CRF模型训练,建立了一种航天命名实体识别的高效方法。通过与基于字符串匹配的方法相比较,本文所提方法有着更高的准确率和召回率,验证了本
  3. 所属分类:其它

    • 发布日期:2021-01-26
    • 文件大小:4194304
    • 提供者:weixin_38741075
« 12 3 4 5 »