您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. conll2000 conll2002 conll2003 conll2007 conll2012

  2. 本人将conll相关的数据集做了整理,大家可以下载使用,我也写了相关的数据集的说明,也在我的博客里.希望大家有兴趣的可以一块交流学习.
  3. 所属分类:机器学习

    • 发布日期:2018-05-10
    • 文件大小:4194304
    • 提供者:qq_31747765
  1. NNIA_Project:萨尔大学神经网络课程的最终项目-源码

  2. CONLL POS分类 该项目读取一个串联的.conll文件,并写入一个包含令牌和语音相关部分(POS)注释的.tsv文件,以及一个包含有关数据集常规信息的.info摘要文件。 接下来,它使用BERT模型为语料库中的所有句子创建词嵌入,以用作人工神经网络进行POS分类的输入。 目录 基本信息 该项目的目标是最终根据英语单词标记的词性(POS)对其进行分类。 在此阶段,项目将从.conll输入文件中预处理带有POS注释的数据,并对数据集进行汇总。 此外,它还会加载从预处理步骤生成的.tsv文件,并
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:11264
    • 提供者:weixin_42128270
  1. argumentsation_mining_pt-源码

  2. 葡萄牙语的论证挖掘 该存储库包含葡萄牙语的端到端序列标记任务。 它使用来自以下第三方存储库的代码: 来自预处理数据; 注释投影算法; 作为单词对齐工具; 作为神经标记者; 多语言单词嵌入。 用法 就使用脚本文件的的基础上注释投影语料库或脚本的顺序标注模型火车和评价。 有关如何使用标记工具来训练/评估/保存模型的详细说明,请参阅。 建立葡萄牙语数据集 假定以下文件结构:DATASET_ROOT_DIR├──en_pe#有说服力的论文ConLL格式| └──train.dat │└──de
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:81920
    • 提供者:weixin_42168555
  1. Interrogat-rio:用于查询和修改用Python编写的CoNLL-U数据集的环境-源码

  2. 审讯 Interrogatório(Interrogatory)是用于查询和编辑格式的注释的语料库的环境。 根据用户的网络浏览器语言,它有葡萄牙语和英语版本,并且由巴西PUC-Rio语言学系的研究组开发和使用,用于葡萄牙语自然语言处理项目语言资源。 Interrogatório是一部分。 还可以考虑在与Interrogatório相同的文件夹中安装 (一种用于评估带注释的语料库的环境),以将两者集成。 如果您希望使用Ubuntu / Apache2将Interrogatório部署到Web服务
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:23068672
    • 提供者:weixin_42166626
  1. HSCRF-pytorch:ACL 2018:用于神经序列标记的混合半马尔可夫CRF(http:aclweb.organthologyP18-2038)-源码

  2. 混合半马尔可夫CRF 在不使用任何其他语料库或资源的情况下,HSCRF在CoNLL 2003 NER数据集上达到的F1分数为91.38 +/- 0.10。 安装 火炬 该代码基于PyTorch。 您可以找到安装说明。 依存关系 该代码是用Python 2.7和pytorch 0.2.0编写的。 它的依赖关系总结在文件requirements.txt 。 您可以这样安装这些依赖项: pip install -r requirements.txt 代码参考 用法 CUDA_VISIBLE_DEV
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:953344
    • 提供者:weixin_42108054