您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 一种改进的基于同义词替换的中文文本信息隐藏方法

  2. 通过深入分析当前针对中文的基于同义词替换的自然语言信息隐藏算法,发现由于存在大量不完全可替换的同义词词组,经过同义词替换后可能会破坏句子的语义一致性。针对这一缺点,提出了一种改进的基于同义词替换的中文文本信息隐藏算法。该算法利用知网对同义词词组进行分类,对于不完全可替换的同义词词组,通过依存句法分析来获取同义词的上下文搭配词语,根据搭配词语判断是否进行替换。实验结果表明,该算法能有效的排除错误的同义词替换,替换的准确率达到89.1%。
  3. 所属分类:其它

    • 发布日期:2008-11-20
    • 文件大小:187392
    • 提供者:d_day1978
  1. 自然语言处理文本分类实验

  2. Python文本分类总结:贝叶斯,逻辑回归,决策树,随机森林,SVM,词向量,TFIDF,神经网络,CNN,LSTM,GRU,双向RNN,LDA:含文本10分类语料、机器学习算法、深度学习算法、专家系统,文本分类结果及结论
  3. 所属分类:深度学习

    • 发布日期:2020-09-27
    • 文件大小:52428800
    • 提供者:Yellow_python
  1. 基于跨语言语料库的汉语和老挝语单词分布

  2. 单词表示是自然语言处理的基础研究内容。目前,单语言单词的分布式表示在一些神经概率语言(NPL)研究中显示出令人满意的应用效果,而对于跨语言单词的分布式表示,研究很少。在国内外。 针对这两种语言中名词和动词的分布相似性的问题,我们通过弱监督学习扩展法等方法将互译的单词,同义词,上位词嵌入中文语料库中,从而在跨语言环境中实现了老挝单词分布。学中文和老挝。 我们利用之前学习的跨语言单词的分布式表示来计算双语文本的相似度,并对汉语和老挝的混合文本语料库进行分类,实验结果表明该建议对这两个任务具有令人满意
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:442368
    • 提供者:weixin_38719643
  1. 挖掘专利知识实现关键词自动抽取

  2. 关键词是人们快速判断是否要详细阅读文件内容的重要线索,关键词自动抽取在信息检索、自然语言处理等研究领域均有重要应用。设计了一种新的关键词自动抽取方法,使计算机能够像人类专家一样,利用知识库对目标文本进行学习和理解,最终自动抽取出关键词。专利数据因其数据量庞大、内容丰富、表达准确、专业权威而被选中作为知识库来源。详细讨论了专利数据的特性,挖掘不同专利间的知识关联,针对某一知识领域构造背景知识库,在此基础上进行目标文本的关键词自动抽取。与目标文本相关的专利文集中每个专利的专利发明人、权利人、专利引用
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_38627234
  1. 基于变分自动编码器的情感分类多任务学习[J]

  2. 随着大数据的快速增长,在自然语言处理中已经成功地提出了许多用于情感分类的文本表示方法。 但是,这些方法基于单任务监督目标学习来解决此问题,并且不考虑它们与多个任务的相对关系。 基于这些缺陷,在这项工作中,我们认为这些任务是相对的,并使用权重共享参数来学习神经网络模型中文本的表示形式,我们引入并研究了一种具有变分自动编码器生成模型的多任务方法( MTVAE)通过共同学习它们。 对亚马逊评论数据的六个子集进行的实验结果表明,该方法可以通过其他相关任务有效地提高情感分类的准确性。
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:578560
    • 提供者:weixin_38696143
  1. Age-classification-of-blog-posts:根据年龄分类的博客文章-源码

  2. 博客帖子的年龄分类 在Google colab上设计和实现。 在将数字数据分类为指定标签的过程中,已经提出了几种有监督的机器学习方法。 但是,自然语言的分类比较少,因为它面临着复杂的挑战,例如在机器级别阅读语言。 本文研究了使用机器学习对博客进行分类的功效。 我们设计了一个文本分类实验,将博客分为三个用户组:“青少年”,“成人”和“成熟”。 我们的经验发现表明,利用机器学习模型和正确的特征向量化可以改善显示给用户的内容,而不是随机选择的内容。
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:114688
    • 提供者:weixin_42175035
  1. transformers_rda-源码

  2. PyTorch和TensorFlow 2.0的最新自然语言处理 :hugging_face: 变形金刚提供了数千种经过预训练的模型,可以对100多种语言的文本执行任务,例如分类,信息提取,问题解答,摘要,翻译,文本生成等。 其目的是使尖端的NLP易于所有人使用。 :hugging_face: Transformers提供了API,可以在给定的文本上快速下载和使用那些经过预训练的模型,在您自己的数据集上对其进行微调,然后在我们的上与社区共享。 同时,每个定义架构的python模块都可以独立使
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:8388608
    • 提供者:weixin_42133753
  1. AI_Sarcasm_Generation:回购包含我在与同事的机器学习Msc课程期间所做的项目的代码,模型和开发。 我们试图训练一个RNN编码器-解码器,它可以产生讽刺性的句子-源码

  2. AI_Sarcasm_Generation 该项目的目的是建立将在自然语言处理(NLP)领域中使用的神经网络算法,以建立特定的人类交互数据集。 在过去的几年中,在文本和语言生成方面,深度学习算法的性能越来越优于传统模型。 因此,我们试图采用不同的深度学习模型,以生成对人类中立的输入评论做出回应的讽刺性句子。 我们在此项目中进行的所有实验都是基于过去的研究,这些研究大多试图对讽刺评论进行分类。 因此,这是一个已经消除了讽刺评论的数据集,我们不需要在数据收集上浪费时间。 在该项目期间,为了确定模型
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:1048576
    • 提供者:weixin_42104181
  1. 融合文本概念化与网络表示的观点检索

  2. 观点检索是自然语言处理领域中的一个热点研究课题.现有的观点检索模型在检索过程中往往无法根据上下文将词汇进行知识、概念层面的抽象,在语义层面忽略词汇之间的语义联系,观点层面缺乏观点泛化能力.因此,提出一种融合文本概念化与网络表示的观点检索方法.该方法首先利用知识图谱分别将用户查询和文本概念化到正确的概念空间,并利用网络表示将知识图谱中的词汇节点表示成低维向量,然后根据词向量推出查询和文本的向量,并用余弦公式计算用户查询与文本的相关度,接着引入基于统计机器学习的分类方法挖掘文本的观点.最后,利用概念
  3. 所属分类:其它

    • 发布日期:2021-02-08
    • 文件大小:1048576
    • 提供者:weixin_38679276
  1. TextInfoExp:自然语言处理实验(sougou数据集),TF-IDF,文本分类,聚类,词向量,情感识别,关系撤消等-源码

  2. 建立实验环境 1个安装python(2.7) 2安装点: 2.1下载pip 2.2解压缩后,安装指令python setup.py install 2.3 pip升级python -m pip install --upgrade pip 2.4 pip安装扩展包pip install jieba(这里以jieba包为例),如果速度较慢,可转换内部的阿里源,即pip install jieba -i --trusted-host mirrors.aliyun.com 3安装pycha
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:79691776
    • 提供者:weixin_42122432
  1. 变形金刚::hugging_face:变形金刚:Pytorch和TensorFlow 2.0的最新自然语言处理-源码

  2. PyTorch和TensorFlow 2.0的最新自然语言处理 :hugging_face: 变形金刚提供了数千种经过预训练的模型,可以对文本执行多种任务,例如100多种语言的分类,信息提取,问题解答,摘要,翻译,文本生成等。 其目的是使尖端的NLP易于所有人使用。 :hugging_face: Transformers提供了API,可在给定的文本上快速下载和使用那些经过预训练的模型,在您自己的数据集上对其进行微调,然后在我们的上与社区共享。 同时,每个定义架构的python模块都可以独立
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:7340032
    • 提供者:weixin_42173205
  1. 基于分层注意力网络的方面情感分析

  2. 基于深度学习的方面情感分析是自然语言处理的热点之一。针对方面情感,提出基于方面情感分析的深度分层注意力网络模型。该模型通过区域卷积神经网络保留文本局部特征和不同句子时序关系,利用改进的分层长短期记忆网络(LSTM)获取句子内部和句子间的情感特征。其中,针对LSTM添加了特定方面信息,并设计了一个动态控制链,改进了传统的LSTM。在SemEval 2014的两个数据集和Twitter数据集上进行对比实验得出,相比传统模型,提出的模型的情感分类准确率提高了3%左右。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38678510