您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 计算所汉语词性标记集ICTPOS3.0

  2. 计算所汉语词性标记集ICTPOS3.0,计算所汉语词性标记集ICTPOS3.0第三版
  3. 所属分类:专业指导

    • 发布日期:2011-12-28
    • 文件大小:34816
    • 提供者:daimin02love
  1. ictclas50中科院分词软件包

  2. ictclas50中科院分词软件包,包含计算所汉语词性标记集和接口文档
  3. 所属分类:C++

    • 发布日期:2012-05-08
    • 文件大小:8388608
    • 提供者:gifts1912
  1. ICTPOS3.0汉语词性标记集

  2. 计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1. 北大《人民日报》语料库词性标记集; 2. 北大2002新版词性标记集(草稿); 3. 清华大学汉语树库词性标记集; 4. 教育部语用所词性标记集(国家推荐标准草案2002版); 5. 美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;
  3. 所属分类:互联网

    • 发布日期:2014-09-04
    • 文件大小:62464
    • 提供者:beiyouyu
  1. ICTPOS汉语词性标记集.doc

  2. ICTPOS汉语词性标记集.doc定义了:计算所汉语词性标记集,对分词工具分词后的词性详细分类定义
  3. 所属分类:互联网

    • 发布日期:2014-10-26
    • 文件大小:62464
    • 提供者:u010454729
  1. 自然语言处理语料库标注集以及符号说明

  2. 花费大量时间搜集的自然语言处理语料库标注集,包括词性标注集、命名实体识别BIO标注、中文组块分析chunk标记。
  3. 所属分类:机器学习

    • 发布日期:2017-12-09
    • 文件大小:168960
    • 提供者:wustjk124
  1. 中文词性标注

  2. 中文词性标注的科普文章,小标记集。词性标注除了使用《现代汉语语法信息词典》中的26 个词类标记 (名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形 容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、 习用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w)外,增加 了以下3 类标记:①专有名词的分类标记,即人名nr,地名ns,团体机关单位名称nt,其 他专有名词nz;②语素的子类标记,即名语素Ng,动语素V
  3. 所属分类:机器学习

    • 发布日期:2018-04-13
    • 文件大小:302080
    • 提供者:weixin_41808886
  1. 汉语分词标准汇总

  2. 文章目录《PFR人民日报标注语料库》词性编码表《现代汉语语料库加工规范——词语切分与词性标注》词性标记计算所 ICTCLAS 3.0汉语词性标记集形容词(1个一类,4个二类)区别词(1个一类,2个二类)连词(1个一类,1个二类)副词(1个一类)叹词(1个一类)方位词(1个一类)前缀(1个一类)后缀(1个一类)数词(1个一类,1个二类)名词 (1个一类,7个二类,5个三类)拟声词(1个一类)介词(1个一类,2个二类)量词(1个一类,2个二类)代词(1个一类,4个二类,6个三类)处所词(1个一类)时
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:288768
    • 提供者:weixin_38530202
  1. mEx-Models-Manual-源码

  2. 执照:CC BY-NC 4.0 mEx:POS&NER&RelEx手册 mEx型号概述: 任务 语言 数据集 分数 下载型号 命名实体识别 德语 德国肾病语料库(慈善) 83.25 (F1) 关系提取 德语 德国肾病语料库(慈善) 84.0 (F1) 词性标记 德语 德国肾病语料库(慈善) 98.57 (平均) 额外资源: 默认FastText嵌入(Gensim格式): 和 精细调整的FastText嵌入(Gensim格式): 和 MEX微调天才上下文曲面嵌入(向前向后&):& 快速
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:26214400
    • 提供者:weixin_42134054
  1. POS-tagger-for-te-reo-maori-源码

  2. Te ReoMāori的词性标注 该项目使用CRF,BiLSTM和BiLSTM-CRF三种方法来实现毛利语的词法标注。使用了三个数据集,分别是PyTorch的TRM,扩展TRM和UDPOS,其中TRM和扩展TRM是手动标记的数据集。最终,通过准确性评估了实验结果。 环境 硬件 GeForce GTX 1080 软件 作业系统 我同时使用Windows和Linux Python包 您必须在执行此代码之前安装这些软件包。 Python> = 3.6 pytorch == 1.6.0 n
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:16384
    • 提供者:weixin_42146888
  1. NNIA_Project:萨尔大学神经网络课程的最终项目-源码

  2. CONLL POS分类 该项目读取一个串联的.conll文件,并写入一个包含令牌和语音相关部分(POS)注释的.tsv文件,以及一个包含有关数据集常规信息的.info摘要文件。 接下来,它使用BERT模型为语料库中的所有句子创建词嵌入,以用作人工神经网络进行POS分类的输入。 目录 基本信息 该项目的目标是最终根据英语单词标记的词性(POS)对其进行分类。 在此阶段,项目将从.conll输入文件中预处理带有POS注释的数据,并对数据集进行汇总。 此外,它还会加载从预处理步骤生成的.tsv文件,并
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:11264
    • 提供者:weixin_42128270
  1. data-labeling-tool-reactjs-源码

  2. 通用数据工具 在尝试一下,或。 ••• • Universal Data Tool是一个Web /桌面应用程序,用于编辑和注释图像,文本,音频,文档以及查看和编辑在可扩展定义的任何数据。 支援资料 • • • • • • • • 最近更新 特征 与他人实时协作,无需注册! 可在上或作为 使用易于使用的GUI配置项目 下载/上传为易于使用的CSV( )或JSON( ) 支持图像,视频,PDF,文本,音频转录和许多其他格式 可以 用分类,标签,边界框,多边形和点注释图像或视频 使用
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:2097152
    • 提供者:weixin_42097668
  1. 词性标记:在此笔记本中,您将使用石榴库为通用标记集的部分词性标记构建隐藏的Markov模型。 隐藏的马尔可夫模型已经能够在真实文本语料库上使用较大的标签集来实现> 96%的标签准确性。 隐藏的马尔可夫模型也已用于语音识别和语音生成,机

  2. 词性标记 在此笔记本中,您将使用石榴库为通用标签集的语音标签建立隐藏的马尔可夫模型。 隐藏的马尔可夫模型已经能够在真实文本语料库上使用较大的标签集来实现> 96%的标签准确性。 隐藏的马尔可夫模型也已用于语音识别和语音生成,机器翻译,生物信息学的基因识别以及用于计算机视觉的人体手势识别等。
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:135168
    • 提供者:weixin_42122988
  1. Data-analysis-python-projects:这是我从头开始构建的基本项目,我使用Python进行编程-源码

  2. 数据分析明星项目投资组合 这是我从头开始构建的基本项目,我使用Python进行编程。 虹膜数据集分析-机器学习项目 在这个项目中,我处理了150个数据样本的虹膜数据集,并且通过使用6种不同的算法,我试图通过预测模型找到最合适的算法,后来我在测试数据集上使用了构建的模型来查看正确性的预测,因此具有萼片长度,花瓣宽度等4个特征,我们可以预测花朵的类别。 朴素贝叶斯数据分析 在这个项目中,我将朴素贝叶斯算法应用于天气数据集(糖尿病预测数据集和乳腺癌检测数据集),该数据集预测是否应该玩游戏。 语音
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:18874368
    • 提供者:weixin_42157166
  1. NLP进度:用于跟踪自然语言处理(NLP)进度的存储库,包括最常见的NLP任务的数据集和最新技术-源码

  2. 跟踪自然语言处理的进度 目录 英语 越南文 印地语 中文 有关更多中文任务,数据集和结果,请访问网站。 法文 俄语 西班牙文 葡萄牙语 韩语 尼泊尔文 孟加拉 波斯语 本文档旨在跟踪自然语言处理(NLP)的进展,并概述最常见的NLP任务及其相应的数据集的最新技术(SOTA)。 它旨在涵盖传统和核心的NLP任务,例如依赖关系解析和词性标记,以及最新的任务,例如阅读理解和自然语言推理。 主要目的是为读者提供基准数据集的快速概述以及他们感兴趣的任务的最新技术,这是进一步研究的垫脚石。 为此,如果存在
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:371712
    • 提供者:weixin_42127369
  1. Qutuf:Qutuf(قُطُوْف):阿拉伯语形态分析仪和词性标注器作为专家系统-源码

  2. 阿拉伯语形态分析仪(带词干分析器)和词性标注器 Qutuf(Quetuf):阿拉伯语形态分析仪(包括词根提取和根提取),以及作为专家系统的词性标注器。 现在可通过作为实验性Web服务使用。 Qutuf旨在成为阿拉伯语NLP(自然语言处理)框架的核心 在Qutuf,已经确定并实施了一些新概念。 类似于在预处理阶段的“第一规范化”和“第二规范化”文本形式,以及在词性标记任务中的“过早标记”和“过期标记”。 此外,POS标记被设计和实现为基于规则的专家系统。 基于形态特征标签集构建的POS标签集已
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:10485760
    • 提供者:weixin_42153615
  1. 海底:海底-越南NLP工具包-源码

  2. 开源越南自然语言处理工具包 Underthesea是: :water_wave: 越南语NLP工具包。 Underthesea是一套开源Python模块数据集和教程,支持研究和开发。 我们提供了极其简单的API,可将经过预训练的NLP模型快速应用于越南语文本,例如分词,词性标记(PoS),命名实体识别(NER),文本分类和依存关系分析。 :water_wave: 一个Pytorch库。 Underthesea得到最流行的深度学习库之一,可以轻松地训练您的深度学习模型并使用Underthe
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:7340032
    • 提供者:weixin_42161450
  1. textacy:NLP,spaCy之前和之后-源码

  2. textacy:NLP,spaCy之前和之后 textacy是一个基于高性能spaCy库的Python库,用于执行各种自然语言处理(NLP)任务。 通过将基础知识-令牌化,词性标记,依赖项解析等-委托给另一个库, textacy主要关注于之前和之后的任务。 产品特点 通过用于处理一个或多个文档的便捷方法访问spaCy,并通过自定义扩展名和自动语言识别扩展其功能,从而为文本应用正确的spaCy管道 下载包含文本内容和元数据的数据集,从国会演讲到历史文献再到Reddit评论 轻松以多种常用格式在磁盘
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:319488
    • 提供者:weixin_42099176
  1. spark-nlp:最先进的自然语言处理-源码

  2. Spark NLP:最先进的自然语言处理 Spark NLP是建立在Apache Spark ML之上的自然语言处理库。 它为机器学习管道提供了简单,高性能和准确的NLP注释,这些注释在分布式环境中易于扩展。 Spark NLP带有1100多种预训练的管道和模型,支持192多种语言。 它支持可在集群中无缝使用的最新转换器,例如BERT , XLNet , ELMO , ALBERT和Universal Sentence编码器。 它还提供令牌化,分词,词性标记,命名实体识别,依赖性分析,拼写检查
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:143654912
    • 提供者:weixin_42104906
  1. 天才:最先进的自然语言处理(NLP)框架-源码

  2. 最新的NLP的非常简单的框架。 由和朋友们开发。 重要信息:(30.08.2020)我们将模型移到了新服务器上。 请更新您的Flair到最新版本! 天才是: 强大的NLP库。 Flair允许您在文本上应用我们最先进的自然语言处理(NLP)模型,例如命名实体识别(NER),词性标记(PoS),感觉歧义消除和分类,并带有支持Swift增加的语言数量。 生物医学NER库。 Flair通过医学NER的最新模型为生物提供特殊支持,并支持32多种生物医学数据集。 文本嵌入库。 Flair具有简单的
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:475136
    • 提供者:weixin_42102220
  1. BiLSTM-POS-Tagger:基于双向LSTM网络(PyTorch)的词性标注器-源码

  2. BiLSTM-POS-Tagger 基于双向LSTM网络(PyTorch)的词性标注器 要训​​练网络,请使用rnn_train.py(确保提供带标签的数据集) 要加载网络并标记句子,请使用rnn_annotate.py Data.py和TaggerModel.py包含各自的类
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:10485760
    • 提供者:weixin_42141437
« 12 »