您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. NLP算法面试必备!史上最全!PTMs:NLP预训练模型的全面总结.md

  2. **预训练模型(Pre-trained Models,PTMs)**的出现将NLP带入了一个全新时代。2020年3月18日,**邱锡鹏老师**发表了**关于NLP预训练模型的综述《Pre-trained Models for Natural Language Processing: A Survey》**[[1\]](https://zhuanlan.zhihu.com/p/115014536#ref_1),这是一篇**全面的综述**,**系统**地对PTMs进行了**归纳分类**。 知乎上发
  3. 所属分类:深度学习

    • 发布日期:2020-04-08
    • 文件大小:48128
    • 提供者:qq_27206435
  1. NLP词向量介绍

  2. 全文均为笔者的理解,不权威也不一定准确,如有错误欢迎指正。 NLP的核心问题,就是学习不同语境下的语义表示,所谓的语义表示呢,就是以量化的方式来表示一个单词,即我们今天要说的——词向量。词向量作为一种预训练模型在NLP领域应用非常广泛,词向量可以看作是用来表达词的语义。在这个领域,一个重要的挑战为一个单词在不同的上下文里有可能表示不一样的语义,该如何解决这个问题呢?那就是加入了上下文信息来区分同一词的多个的意义。而词向量又是如何发展为能进行一词多义的语义消歧的呢,那就一起看看词向量的发展之路吧!
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:316416
    • 提供者:weixin_38530536
  1. nlp_windows_exe_ui:python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键词提取,文本分类-源码

  2. nlp_windows_exe_ui 介绍 python3.6-制作一个包含NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词,词性标注,关键字提取,文本分类;由于要打包成exe的关系,我将原本的项目的多一个文件的集成到一个python文件(合并文件)里,只保留了使用该系统所需要的函数,方便打包,通俗地讲就是,生成生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据) 运行这个系
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:20971520
    • 提供者:weixin_42129113
  1. automated-essay-grading-system:这是一个系统,借助scikit-learn,Keras,Seaborn,Gensim,NLTK,情节,脾气暴躁,熊猫-源码

  2. 介绍 这是一个系统,借助scikit-learn,Keras,Seaborn,Gensim,NLTK,普罗蒂,矮胖,熊猫。 有关更多详细信息,请参阅unpublished-conference-paper.pdf 。 抽象的 摘要-基于人的评分论文的任务由于需要的时间长,其性质的主观性,所涉及的困难以及关注的焦点而需要解决,这是最大的麻烦,它需要尽可能地减少错误的可能性。 在大多数情况下,由于需要大量教师,因此,一篇论文至少要由不同的人评分两次。 这些原因促使我们在此范围内进行更多调查和探索。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:62914560
    • 提供者:weixin_42127748
  1. PaddleNLP:基于PaddlePaddle 2.0的NLP核心库和模型动物园-源码

  2. 简体中文| 简介 PaddleNLP 2.0具有丰富的模型库,简洁易用的API与高性能的分布式训练的能力,可以为飞轮开发者提升文本建模效率,并提供基于Padddle 2.0的NLP领域最佳实践。 特性 丰富的模型库 涵盖了NLP主流应用相关的前沿模型,包括中文词向量,预训练模型,词法分析,文本分类,文本匹配,文本生成,机器翻译,通用对话,问答系统等,更多详细介绍请查看。 简洁易用的API 深度兼容飞轮2.0的高层API体系,提供可替换的文本建模模块,可大幅度减少数据处理,组网,训练互换的代码开发
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:2097152
    • 提供者:weixin_42146086
  1. aravec:AraVec是一个经过预训练的分布式单词表示(单词嵌入)开源项目,旨在为阿拉伯语NLP研究社区提供免费使用和功能强大的单词嵌入模型-源码

  2. AraVec 3.0 神经网络的进步导致了计算机视觉,语音识别和自然语言处理(NLP)等领域的发展。 NLP中最有影响力的最新发展之一是单词嵌入的使用,其中单词被表示为连续空间中的向量,捕获了它们之间的许多句法和语义关系。 AraVec是一个经过预培训的分布式单词表示(单词嵌入)开源项目,旨在为阿拉伯语NLP研究社区提供免费使用和功能强大的单词嵌入模型。 AraVec的第一个版本在六个不同的阿拉伯语内容域的基础上提供了六种不同的词嵌入模型; 推文和维基百科本文介绍了用于构建模型的资源,采用的
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1015808
    • 提供者:weixin_42128141
  1. nlpcda:一键中文数据增强包; NLP数据增强,bert数据增强,EDA:pip install nlpcda-源码

  2. NLP中文数据增强一键中文数据增强工具 使用: pip install nlpcda 开源不易,欢迎star :glowing_star: pypi: ://pypi.org/project/nlpcda/ 介绍 一键中文数据增强工具,支持: 经过细节特殊处理,比如不改变年月日数字,尽量保证不改变原文语义。即使改变也能被猜出来、能被猜出来、能被踩出来、能被菜粗来、被菜粗、能菜粗来 计划中的未来内容 增加多线程操作,一键操作 随机噪声注入?随机插入一些字符,太简单实现了。 利用pingyin
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:540672
    • 提供者:weixin_42138545