您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于句子向量空间模型的案例知识库关键技术研究

  2. 随着信息技术的发展,经验知识管理已成为企事业单位的核心竞争力量。在人类的经验知识结构中,非结构化知识占很大比例,案例知识是非结构化经验知识的一种重要的形式,案例知识的高效交流、共享和充分利用已成为借鉴已有经验知识来解决新问题的源泉。存储案例知识的案例知识库是基于案例推理的基础和必要条件,案例知识库的研究有深远意义。 本文重点研究基于本体和句子向量空间模型(SVSM,Sentence Vecter Space Model)的案例知识库关键技术,完成的主要工作如下: 1.建立了案例知识库的三层立体
  3. 所属分类:专业指导

    • 发布日期:2010-04-03
    • 文件大小:2097152
    • 提供者:chunjunlu
  1. 支持向量机svm入门

  2. 以简单易懂的句子介绍了SVM,让读者很容易入门
  3. 所属分类:专业指导

    • 发布日期:2011-06-21
    • 文件大小:647168
    • 提供者:hahahahaye
  1. 基于概念向量空间模型的中文自动文摘系统

  2. 本文提出了一种基于hownet提取出词语的词义,用词语的词义代替传统的词形频率统计方法,并基于词义排歧建立主题语义概念向量空间模型。通过对抽取出的语句进行句子相似度的计算提高文摘精确度,设计实现了一个中文自动文摘系统。
  3. 所属分类:其它

  1. 基于双向LSTM的句子向量模型

  2. 此模型既可以用于训练词向量,也可以将句子表示成句子向量,质量都比较高
  3. 所属分类:深度学习

    • 发布日期:2018-06-04
    • 文件大小:25600
    • 提供者:qq_25807909
  1. nlp工具 word2vec nltk textblob crf++ 机器人 中文翻译 繁体转简体 关键词 主题 命名体识别 分词 聚类 词性标注 词向量

  2. 本资源属于代码类,是一些nlp工具的使用 nlp 工具 word2vec nltk textblob crf++ (1)机器人 (2)中文翻译,及繁体转简体 (3)关键词提取,主题提取,摘要提取 (4)命名体识别 (5)分词 (6)情感分析,正负类分析 (7)近义词,同义词,句子相似性 (8)聚类,监督,无监督 (9)词性标注 (10)词向量提取
  3. 所属分类:机器学习

    • 发布日期:2018-07-20
    • 文件大小:1048576
    • 提供者:u013378306
  1. 中文句子向量生成代码

  2. 利用现有的python自带的包gensim调用doc2vec进行词向量生成,向量的维度可以自己指定,代码主要是针对中文进行处理的,自己给定训练语料,然后调用该代码可以实现对每一个句子直接给出指定维度的向量
  3. 所属分类:机器学习

  1. Python-基于同义词词林知网指纹字词向量向量空间模型的句子相似度计算

  2. self complement of Sentence Similarity compute based on cilin, hownet, simhash, wordvector,vsm models,基于同义词词林,知网,指纹,字词向量,向量空间模型的句子相似度计算。
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:7340032
    • 提供者:weixin_39840924
  1. Python-自然语言处理闲聊机器人BERT句向量相似度文本分类数据增强

  2. 闲聊机器人(chatbot),BERT句向量-相似度(Sentence Similarity),文本分类(Text classify) 数据增强(text augment enhance),同义句同义词生成,句子主干提取(mainpart),中文汉语短文本相似度,文本特征工程,keras-http-service调用
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:2097152
    • 提供者:weixin_39840387
  1. 句子相似度评估数据集

  2. 句子相似度数据,可用于评估词向量、句向量的优劣,句子成对出现,有人工的相似度打分
  3. 所属分类:深度学习

    • 发布日期:2019-01-12
    • 文件大小:409600
    • 提供者:sinat_38269823
  1. BERT预训练模型字向量提取工具–使用BERT编码句子

  2. 本文将介绍两个使用BERT编码句子(从BERT中提取向量)的例子。 (1)BERT预训练模型字向量提取工具 本工具直接读取BERT预训练模型,从中提取样本文件中所有使用到字向量,保存成向量文件,为后续模型提供embdding。 本工具直接读取预训练模型,不需要其它的依赖,同时把样本中所有 出现的字符对应的字向量全部提取,后续的模型可以非常快速进行embdding github完整源码 #!/usr/bin/env python # coding: utf-8 __author__ = 'xmxo
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:59392
    • 提供者:weixin_38515362
  1. Top2Vec:Top2Vec学习联合嵌入的主题,文档和单词向量-源码

  2. 更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。 Top2Vec Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。训练Top2Vec模型后,您可以: 获取检测到的主题数。 获取主题。 获取主题大小。 获取层次结构主题。 通过关键字搜索主题。 按主题搜索文档。 通过关键字搜索文档。 查找类似的单词。 查找类似的文档。 使用公开模型 有关其工作原理的更多详细信息,请参见。 好处 自动查找主题数。 无需停用词列表
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:6291456
    • 提供者:weixin_42097533
  1. sentence-transformers:BERT和XLNet的句子嵌入-源码

  2. 句子转换器:使用BERT / RoBERTa / XLM-RoBERTa&Co.和PyTorch的多语言句子嵌入 该框架提供了一种简单的方法来计算句子和段落的密集向量表示形式(也称为句子嵌入)。 这些模型基于诸如BERT / RoBERTa / XLM-RoBERTa等的转换器网络,并经过专门调整以有意义的句子嵌入,以使具有相似含义的句子在向量空间中接近。 我们为100多种语言提供了越来越多的,并针对各种用例进行了微调。 此外,该框架允许轻松,以在您的特定任务上实现最佳性能。 有关完整文档
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:6291456
    • 提供者:weixin_42116734
  1. 基于句子向量的情绪不平衡分类过采样方法

  2. 基于句子向量的情绪不平衡分类过采样方法
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:335872
    • 提供者:weixin_38635794
  1. sentence_similarity_using_Python:句子_相似性_使用_Python-源码

  2. 句子相似度 此文件夹包含用Jupyter笔记本编写的用于构建句子相似性模型的示例和最佳实践。 和实用程序脚本用于加速笔记本中的模型构建过程。 句子相似性分数可用于各种应用程序中,例如搜索/检索,最近邻或基于内核的分类方法,推荐和排序任务。 什么是句子相似度 句子相似度或语义文本相似度是衡量两段文本的相似程度或表达相同含义的程度。 相关任务包括释义或重复标识,搜索和匹配应用程序。 用于文本相似性的常用方法包括简单的词向量点积,成对分类,以及最近的深度神经网络。 句子相似度通常通过以下两个步骤来计
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:401408
    • 提供者:weixin_42150341
  1. InferSent:InferSent句子嵌入-源码

  2. 推断 InferSent是一种句子嵌入方法,可为英语句子提供语义表示。 它接受了自然语言推理数据的培训,并且很好地概括了许多不同的任务。 我们从和评估工具包中提供了经过预训练的英语句子编码器。 最近的更改:删除了train_nli.py,为了简单起见,仅保留了预训练的模型。 原因是除了简单的脚本之外,我没有更多的时间来维护该回购协议以获取句子嵌入。 依存关系 这段代码是用python编写的。 依赖项包括: Python 2/3 (最新版本) NLTK> = 3 下载单词向量 下
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:275456
    • 提供者:weixin_42112894
  1. 基于句子的情感分析:基于句子的情感分析-源码

  2. SemEval-2013:Twitter中的情感分析 句级情感分析 说明 一种可以全部学习的模型(语言模型和情感分析-> sentiment2vec) 版 se-v1.ipynb:使用所有LSTM输出向量的总和来预测情感标签。 se-v2.ipynb:使用总和的所有LSTM输出向量来预测情感标签。 se-v3.ipynb:使用而不是一键向量。 数据与结果 准确率67% 先决条件 张量流1.2 ipython笔记本 作者 平度
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:96468992
    • 提供者:weixin_42151036
  1. nlp_xiaojiang:自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT语法向量-相似度(句子相似度),XLNET语法向量-相似度(文本xlnet嵌入),文本分类(文本分类),实体提取(ner,bert + bi

  2. nlp_xiaojiang AugmentText - 回译(效果比较好) - EDA(同义词替换、插入、交换和删除)(效果还行) - HMM-marko(质量较差) - syntax(依存句法、句法、语法书)(简单句还可) - seq2seq(深度学习同义句生成,效果不理想,seq2seq代码大都是 [https://github.com/qhduan/just_another_seq2seq] 的,效果不理想) 聊天宝 - 检索式ChatBot - 像ES那样直接检索(如使用fuz
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:2097152
    • 提供者:weixin_42117082
  1. laseremddingddings:作为点子软件包的LASER多语言句子嵌入-源码

  2. 激光嵌入 开箱即用的多语言句子嵌入。 laserembeddings是Facebook Research的 (语言不可知的句子表示形式)的点子封装,可立即投入生产的端口,用于计算多语言句子嵌入。 :sparkles: 版本1.1.0在这里! 什么是新的? Windows上的日语额外内容又回来了! :Japan: 语境 是由Facebook Research创建的脚本和模型的集合,这些脚本和模型用于为零镜头跨语言传输计算多语言句子嵌入。 这是什么意思? LASER能够将句子转换为与语
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:108544
    • 提供者:weixin_42120997
  1. text2vec:text2vec,中文文本到vetor。(文本向量化表示工具,包括词向量化,句子向量化,句子相似度计算)-源码

  2. text2vec text2vec,中文文本给vetor。(文本向量化表示工具,包括词向量化,句子向量化) 特征 文本向量表示 字词粒度,通过腾讯AI Lab开放式的大规模扩展中文 (文件名:light_Tencent_AILab_ChineseEmbedding.bin密码:tawe),获取字词的word2vec矢量表示。 句子粒度,通过求句子中所有单词词嵌入的预先计算得到。 篇章粒度,可以通过gensim库的doc2vec得到,应用替代,本项目不实现。 文本相似度计算 基准方法,估计两个句
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:144384
    • 提供者:weixin_42149145
  1. bert-as-service:使用BERT模型将可变长度句子映射到固定长度向量-源码

  2. 您在寻找X即服务吗? 试试! X可以是albert,pytorch-transformer,vgg,resnet,videobert或任何深度学习表示模型吗? •••• • 了解如何使用Jina通过任何深度学习表示来提取特征向量 伯特即服务 使用BERT模型作为句子编码服务,即将可变长度的句子映射到固定长度的向量。 •••• •••• 韩晓制作• :globe_with_meridians: 它是什么 BERT是为预训练语言表示而的NLP模型。 它利用了在网络上公开提供的大量纯文本数据
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:3145728
    • 提供者:weixin_42116713
« 12 3 4 5 »