您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中文短语文本相似度计算新方法.pdf

  2. 中文短语文本相似度计算新方法.pdf中文短语文本相似度计算新方法.pdf中文短语文本相似度计算新方法.pdf中文短语文本相似度计算新方法.pdf
  3. 所属分类:其它

    • 发布日期:2011-07-25
    • 文件大小:239616
    • 提供者:q345852047
  1. Web Data Mining (英文)

  2. 目录回到顶部↑ 第一部分 数据挖掘基础. 第1章 概述3 1.1 什么是万维网3 1.2 万维网和互联网的历史简述4 1.3 web数据挖掘5 1.3.1 什么是数据挖掘6 1.3.2 什么是web数据挖掘7 1.4 各章概要8 1.5 如何阅读本书10 文献评注10 第2章 关联规则和序列模式12 2.1 关联规则的基本概念12 2.2 apriori算法14 2.2.1 频繁项目集生成14 2.2.2 关联规则生成17 2.3 关联规则挖掘的数据格式19 2.4 多最小支持度的关联规则挖掘
  3. 所属分类:专业指导

    • 发布日期:2012-05-02
    • 文件大小:8388608
    • 提供者:chen_767
  1. WordsMatching

  2. Words Matching 词语相似度短语相似算法源码
  3. 所属分类:C#

    • 发布日期:2015-01-17
    • 文件大小:260096
    • 提供者:jr00661637
  1. 计算文本相似度

  2. 基于关键词Jarccard距离的文本相似度计算 "TF/IDF算法:主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很高的关键度。\n", "\n", "TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与 用户查询之间相关程度的度量或评级。" .
  3. 所属分类:机器学习

    • 发布日期:2017-11-14
    • 文件大小:3072
    • 提供者:ibm555
  1. 主题模型Python工具包Gensim.zip

  2. Gensim是一个相当专业的主题模型Python工具包。在文本处理中,比如商品评论挖掘,有时需要了解每个评论分别和商品的描述之间的相似度,以此衡量评论的客观性。评论和商品描述的相似度越高,说明评论的用语比较官方,不带太多感情色彩,比较注重描述商品的属性和特性,角度更客观。gensim就是  Python 里面计算文本相似度的程序包。示例代码:针对商品评论和商品描述之间的相似度,怎么使用gensim来计算?原理1、文本相似度计算的需求始于搜索引擎。搜索引擎需要计算“用户查询”和爬下来的众多”网页
  3. 所属分类:其它

    • 发布日期:2019-07-18
    • 文件大小:42991616
    • 提供者:weixin_39841848
  1. 中文短语相似度计算方法研究及应用

  2. 文本相似度计算作为中文信息处理中的一项基础性技术,被广泛应用到文本分类、文本聚类、信息检索等多个领域,长期以来受到了众多学者的关注和研究。在信息大爆炸所带来的大量文本信息的数据堆积中,很大一部分是短文本数据或短语数据,因此,在短文本数据信息的处理问题上,短语的相似度计算变得越来越重要。本文就是针对中文短语信息的处理问题,提出了一种新的中文短语相似度计算方法。在算法的设计过程中,本文分析了短语间相匹配文字的位置、匹配位置的偏移值、匹配文字长度等多种因素,提出了中文短语间相似度的计算公式,并给出了该
  3. 所属分类:教育

    • 发布日期:2020-03-07
    • 文件大小:15728640
    • 提供者:sohopeter
  1. 文本语义相似度计算方法研究及应用

  2. 文本相似度计算一直是自然语言处理领域研究中的一个基础问题。而文本语义相似度计算则是在文本相似度计算基础上增加了语义分析,在语义层面对文本相似度作进一步的分析研究,具有广阔的应用背景。本文针对句子级别的文本语义相似度计算问题,提出了应用结构化特征和神经网络的方法,并将该方法应用到一个实际的问答系统中,取得了良好的效果。本文深入研究文本语义相似度计算方法,主要研究内容如下:(1)基于结构化表示的文本语义相似度计算方法针对句子级文本相似度计算方法中平面特征表征性弱的问题,本文提出了应用结构化特征来表示
  3. 所属分类:机器学习

    • 发布日期:2020-03-07
    • 文件大小:6291456
    • 提供者:sohopeter
  1. 英语考试资料

  2. 英语四级考试题型选词填空题之解题技巧初探 英语四级考试题型选词填空题之解题技巧初探 选词填空题是大学英语四级考试的新题型,... 每个正确选项均有干扰项,相互干扰的选项之间不是同义词或近义词。因此,要做好选词... 考生可以通过逻辑关系词来确定答案。 常见的逻辑关系词如下: (1)并列关系:and, or, ... 2011年6月大学英语四级真题 这也是四级考试中常见的选项设置,用同义词或近义词替换掉文中的词汇。这要求考试在备考时,重点词汇及其同义词反义词都要有所了解。其他选项文中没有提
  3. 所属分类:其它

    • 发布日期:2013-08-27
    • 文件大小:20971520
    • 提供者:u011843638
  1. 讯飞语音提取版v2.1.0.1712.rar

  2. 讯飞语音功能介绍: 就论国内的语音识别来说,由科大讯飞推出的安卓版讯飞输入法可谓是首屈一指的,其的语音库、识别度都高达90%以上(前提是说话要清楚) 科大讯飞之前推出过windowspc端的讯飞输入法(语音词库及识别能力皆和安卓版大抵相似),由于用户数量问题,有一段时间内放弃了。但后来由于优异的识别能力,重新得到用户的赏识,讯飞输入法在7月底重新推出了内测版本的讯飞输入法。 在稳定性和识别性上,讯飞这一次做出了优化和改正,给用户们带来全新的识别体验。 讯飞语音支持多种方言: 可自定义语音词库:
  3. 所属分类:编解码

    • 发布日期:2020-08-19
    • 文件大小:97517568
    • 提供者:Lsc_hei
  1. KeyBERT:使用BERT进行最少的关键字提取-源码

  2. 基伯特 KeyBERT是一种最小且易于使用的关键字提取技术,它利用BERT嵌入来创建与文档最相似的关键字和关键字短语。 相应的媒体帖子可以在 找到。 目录 2.1。2.2。2.3。2.4。2.5。 1.关于项目 尽管已经有很多方法可用于关键字生成(例如 , ,TF-IDF等),但我想创建一种非常基本但功能强大的方法来提取关键字和关键字。这就是KeyBERT进来的地方!它使用BERT嵌入和简单的余弦相似性来查找文档中与文档本身最相似的子短语。 首先,使用BERT提取文档嵌入,以获得文档级表示。
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:78848
    • 提供者:weixin_42133861
  1. 通过标签传播学习共指解析中的名词短语照应性

  2. 名词短语隐喻性的知识可能会在共指解析中得到有益的利用,从而绕过非隐喻名词短语的解析。 然而,令人惊讶地注意到,最近将自动获取的照应性信息并入共指解析系统的尝试远非期望。 本文提出了一种全局学习方法,该方法通过标签传播算法确定名词短语的隐喻性,以提高基于学习的共指分辨率。 为了消除标签传播中的巨大计算负担。 在算法中,我们采用加权支持向量作为关键实例,以表示训练文本中所有带有照应性标记的NP实例。 此外,探索了两种核,即基于特征的RBF(径向基函数)核和具有近似匹配的卷积树核,以计算两个名词短语之
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:405504
    • 提供者:weixin_38603936
  1. 相似度:相似度:相似度计算工具包,java编写。用于词,短语,句子,词法分析,情感分析,语义分析等相关的相似度计算-源码

  2. 相似 适用词,语法,句子,词法分析,情感分析,语义分析等相关的相似度计算。 相似度是由一系列算法组成的Java版相似度计算工具包,目标是传播自然语言处理中相似度计算方法。相似度是工具实用,性能高效,架构清晰,语料时新,可自定义的特点。 相似性提供下列功能: 词相似度计算 词林编码法相似度 汉语语义法相似度 知网词相似度 字面编辑距离法 初步相似度计算 简单而言相似度 句子相似度计算 词性和词序结合法 编辑距离算法 Gregor编辑距离法 优化编辑距离法 文本相似度计算 余弦相似度 编辑距离算
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:23068672
    • 提供者:weixin_42139357