您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于LexRank的自动摘要代码

  2. 一个可以用来对评论进行自动摘要的小程序。稍作修改可以用来对文档进行自动摘要。并且使用到LexRank算法对句子的相似性进行投票打分,确定句子的重要性。代码可用,易扩展。
  3. 所属分类:Java

    • 发布日期:2012-10-25
    • 文件大小:18432
    • 提供者:glorychen1
  1. 句子相似性建模综述

  2. 句子相似性建模综述,包含传统方法和深度学习方法,并比较不同方法的优劣。附件中包含参考文献pdf,综述pdf 以及presentation ppt。
  3. 所属分类:机器学习

    • 发布日期:2017-11-10
    • 文件大小:11534336
    • 提供者:baeseulging
  1. nlp工具 word2vec nltk textblob crf++ 机器人 中文翻译 繁体转简体 关键词 主题 命名体识别 分词 聚类 词性标注 词向量

  2. 本资源属于代码类,是一些nlp工具的使用 nlp 工具 word2vec nltk textblob crf++ (1)机器人 (2)中文翻译,及繁体转简体 (3)关键词提取,主题提取,摘要提取 (4)命名体识别 (5)分词 (6)情感分析,正负类分析 (7)近义词,同义词,句子相似性 (8)聚类,监督,无监督 (9)词性标注 (10)词向量提取
  3. 所属分类:机器学习

    • 发布日期:2018-07-20
    • 文件大小:1048576
    • 提供者:u013378306
  1. python学习笔记

  2. python的基础笔记,其实实现是个简单版本并不难,文本切成句子,以句子相似性作为相互链接的权值,构造一个矩阵。有了权值矩阵就可以利用pagerank来得到每个句子的最终得分。计算好没个句子的出度入度,给个初始的得分,迭代更新至收敛,得分最高则作为摘要。计算句子相似性有很多办法,切词算集合距离,sentence2vec 算欧式距离等等,切词集合距离的办法比较糙,效果一般,还是考虑了语意相似会好一些。这种办法一般在比较规矩的文档,如新闻,效果还可以
  3. 所属分类:Python

    • 发布日期:2019-01-04
    • 文件大小:463872
    • 提供者:weixin_44239869
  1. 神经机器翻译代码库nmt.hybrid.zip

  2. nmt.hybrid 是最先进的神经机器翻译系统,可以处理非常复杂的语言,如捷克语使用混合字字模型。这个代码库还可以训练基于注意力的模型,并具有我们以前的 nmt.matlab 代码库的所有功能。为什么使用 Matlab?Matlab 支持 GPU,所以代码也很快。特性:训练混合词字符以及基于注意力的一般模型。可以整合包括混合模型的模型的波束搜索解码器。源词表达算法和评估词相似性任务或执行tsne图的代码。句子陈述算法和分数重新排名的代码。 标签:nmthybrid
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:2097152
    • 提供者:weixin_39840387
  1. Python-BERTScore利用来自BERT的预训练上下文嵌入并通过余弦相似性匹配候选和参考句子中的单词

  2. BERTScore利用来自BERT的预训练上下文嵌入,并通过余弦相似性匹配候选和参考句子中的单词
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:590848
    • 提供者:weixin_39841882
  1. A_Neural_Probabilistic_Language_Model

  2. 关于语言方面的神经网络论文 统计语言建模的目标是学习联合概率 单词序列的功能。 这本质上很难,因为 维度的诅咒:我们建议用自己的武器来对抗它。 在所提出的方法中,同时学习(1)每个单词的分布式代表(即单词之间的相似性)以及(2) 单词序列的概率函数,用这些表示法表示。 获得泛化是因为一系列单词 以前从未见过如果它是由单词构成的高概率 这与形成已经看过的句子的单词类似。 我们报告 使用神经网络进行概率函数的实验,显示 在两个文本语料库中,所提出的方法非常显着地证明了最先进的三元模型。
  3. 所属分类:机器学习

    • 发布日期:2019-09-11
    • 文件大小:211968
    • 提供者:qq_33913982
  1. TF-IDF与余弦相似性的应用(二) 找出相似文章

  2. 上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,”Google新闻”在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到”余弦相似性”(cosine similiarity)。下面,我举一个例子来说明,什么是”余弦相似性”。 为了简单起见,我们先从句子着手。   句子A:我喜欢看电视,不喜欢看电影。   句子B:我不喜欢看电视,也不喜欢看电影。 请问怎样才能计算上面两句
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:92160
    • 提供者:weixin_38724106
  1. sentence_similarity_using_Python:句子_相似性_使用_Python-源码

  2. 句子相似度 此文件夹包含用Jupyter笔记本编写的用于构建句子相似性模型的示例和最佳实践。 和实用程序脚本用于加速笔记本中的模型构建过程。 句子相似性分数可用于各种应用程序中,例如搜索/检索,最近邻或基于内核的分类方法,推荐和排序任务。 什么是句子相似度 句子相似度或语义文本相似度是衡量两段文本的相似程度或表达相同含义的程度。 相关任务包括释义或重复标识,搜索和匹配应用程序。 用于文本相似性的常用方法包括简单的词向量点积,成对分类,以及最近的深度神经网络。 句子相似度通常通过以下两个步骤来计
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:401408
    • 提供者:weixin_42150341
  1. 基于新的句子层次聚类方法的印尼文本自动摘要

  2. 随着Internet的发展,信息量呈指数增长,自动文本摘要技术变得越来越重要。 目前,大多数关于自动摘要技术的研究都应用于常见的语言,例如中文和英文,但在资源匮乏的语言中却很少。 在本文中,我们构建了印尼语自动摘要数据集,并对印尼语自动摘要进行了相关研究。 并且在本文中,我们提出了一种基于句子相似度聚类的高效的基于提取的自动文本摘要方法。 基于聚类的思想,本文考虑了句子的语义,并根据句子与句子之间的相似性对句子进行聚类。 根据规则提取摘要,最后得到摘要结果。 该方法不仅保证了摘要的完整性,重要性
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:288768
    • 提供者:weixin_38517095
  1. 利用词的内部结构进行汉语普通句子表示

  2. 我们引入一种新颖的混合字符词结构,以利用单词内部结构的丰富语义信息来改进汉语句子的表示形式。 我们的体系结构使用两个关键策略。 第一个是字符上的遮罩门,用于学习单词中字符之间的关系。 第二个是单词的最大池操作,自适应地找到原子和组成词表示形式的最佳混合。 最后,将所提出的体系结构应用于各种句子组成模型,在句子相似性任务上,该模型的性能大大超过了基线模型。
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:412672
    • 提供者:weixin_38653155
  1. nlp:各种nlp框架(自然语言处理)集成以及使用包括word2vec nltk textblob crf ++等-源码

  2. Lhy-NLP 集成各种nlp框架 使用包括word2vec nltk textblob crf ++等 (1)机器人 (2)中文翻译,及繁体转简体 (3)关键词提取,主题提取,摘要提取 (4)命名体识别 (5)分词 (6)情感分析,正负类分析 (7)近义词,同义词,句子相似性 (8)聚类,监督,无监督 (9)词性标注 (10)词向量提取 . ├── chatbot #########################机器人 │   ├── __init__.py │   └── readMe
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:1048576
    • 提供者:weixin_42106765
  1. metacurate-lexicon:一种Web服务,通​​过Web GUI和RESTful API公开语义相似性搜索-源码

  2. Metacurate词典 tl; dr Metacurate词典以及随附的API是对将Web服务部署到平台即服务Heroku的可行性的调查结果,该Web服务使用大量合理的单词嵌入。 详细 可以在上找到metacurate词典(它在免费的dyno上运行,因此需要30秒左右的时间才能启动)。 这是一个python / Flask Web应用程序,它公开接口(Web GUI和RESTful API)以在词典中查找语义相似(多词)的术语,以及将原始文本适当地预处理为句子和术语的功能令牌。 词典中的单词
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:103809024
    • 提供者:weixin_42131352
  1. BertSimilarity:使用Google的BERT算法计算两个句子的相似度。利用Bert计算句子相似度。语义相似度计算-源码

  2. 伯特相似度 基于Google的BERT模型来进行语义相似度计算。代码基于tensorflow 1。 1.基本原理 简单来说就是将需要需要计算的相似性的两个句子先分解在一起,然后通过伯特模型获取获取整体的编码信息,然后通过全连接层将维,输出相似和不相似的概率。 1.1模型结构 模型结构所示如下: 1.1.1数据预处理 本文使用Bert模型计算相似度前,首先要对输入数据进行预处理,例如当要处理的文本是: 如何得知关闭借呗 想永久关闭借呗 首先进行文本按token化,切成分割的文字排列: [如
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:2097152
    • 提供者:weixin_42099755
  1. text2vec:text2vec,中文文本到vetor。(文本向量化表示工具,包括词向量化,句子向量化,句子相似度计算)-源码

  2. text2vec text2vec,中文文本给vetor。(文本向量化表示工具,包括词向量化,句子向量化) 特征 文本向量表示 字词粒度,通过腾讯AI Lab开放式的大规模扩展中文 (文件名:light_Tencent_AILab_ChineseEmbedding.bin密码:tawe),获取字词的word2vec矢量表示。 句子粒度,通过求句子中所有单词词嵌入的预先计算得到。 篇章粒度,可以通过gensim库的doc2vec得到,应用替代,本项目不实现。 文本相似度计算 基准方法,估计两个句
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:144384
    • 提供者:weixin_42149145
  1. Siamese-LSTM:用于评估Quora问题对数据集的句子之间语义相似性的Siamese LSTM-源码

  2. 连体LSTM 使用MaLSTM模型(暹罗网络+曼哈顿距离的LSTM)检测问题对之间的语义相似性。 使用的训练数据集是原始Quora问题对数据集(使用的〜363K对)的子集。 这是Keras基于和。 先决条件 纸,文章 数据 参考文献 原始作者的GitHub 基于TensorFlow的实现 Kaggle的test.csv太大了,所以我就只提取前20个问题,并创建了一个名为test-20.csv和它在使用predict.py 。 您应该将所有数据文件./data目录。 怎么跑 训练 $ py
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:8192
    • 提供者:weixin_42102634
  1. 相似度:相似度:相似度计算工具包,java编写。用于词,短语,句子,词法分析,情感分析,语义分析等相关的相似度计算-源码

  2. 相似 适用词,语法,句子,词法分析,情感分析,语义分析等相关的相似度计算。 相似度是由一系列算法组成的Java版相似度计算工具包,目标是传播自然语言处理中相似度计算方法。相似度是工具实用,性能高效,架构清晰,语料时新,可自定义的特点。 相似性提供下列功能: 词相似度计算 词林编码法相似度 汉语语义法相似度 知网词相似度 字面编辑距离法 初步相似度计算 简单而言相似度 句子相似度计算 词性和词序结合法 编辑距离算法 Gregor编辑距离法 优化编辑距离法 文本相似度计算 余弦相似度 编辑距离算
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:23068672
    • 提供者:weixin_42139357
  1. 余弦相似性计算及python代码实现过程解析

  2. A:西米喜欢健身 B:超超不爱健身,喜欢打游戏 step1:分词 A:西米/喜欢/健身 B:超超/不/喜欢/健身,喜欢/打/游戏 step2:列出两个句子的并集 西米/喜欢/健身/超超/不/打/游戏 step3:计算词频向量 A:[1,1,1,0,0,0,0] B:[0,1,1,1,1,1,1] step4:计算余弦值 余弦值越大,证明夹角越小,两个向量越相似。 step5:python代码实现 import jieba import jieba.analyse def words2v
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:38912
    • 提供者:weixin_38665822
  1. python代码如何实现余弦相似性计算

  2. 这篇文章主要介绍了python代码如何实现余弦相似性计算,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 A:西米喜欢健身 B:超超不爱健身,喜欢打游戏 step1:分词 A:西米/喜欢/健身 B:超超/不/喜欢/健身,喜欢/打/游戏 step2:列出两个句子的并集 西米/喜欢/健身/超超/不/打/游戏 step3:计算词频向量 A:[1,1,1,0,0,0,0] B:[0,1,1,1,1,1,1] step4:计算余弦值 余弦值越大,证
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:43008
    • 提供者:weixin_38658086
  1. AutoenCODE:AutoenCODE是一种深度学习基础架构,可将源代码片段编码为矢量表示形式,可用于学习相似性-Source code learning

  2. 自动编码 AutoenCODE是一种深度学习基础架构,可将源代码片段编码为矢量表示形式,可用于学习相似性。 该存储库包含有关如何学习给定文本语料库(源代码或任何其他文本语料库)的句子级嵌入的代码,数据和说明。 然后,可以将学习到的嵌入(即,连续值向量)用于识别语料库中句子之间的相似性。 AutoenCODE使用神经网络语言模型( [3])和预言神经网络( [4]),该神经网络语言模型预先训练了语料库中的词嵌入,并递归地结合了嵌入以学习句子级嵌入。 AutoenCODE由和构建,并在以下研
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:17825792
    • 提供者:weixin_42134240
« 12 »