您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于聚类与并对词袋模型参考的检索

  2. 该源码采用SIFT提取特征,结合了聚类算法和余弦定理对图像进行检索。该代码对词袋模型中用一个特征向量表示图像具有很高参考价值。在SIFT-Feature文件夹中有部分代码要放到开始的文件中,注意使用。
  3. 所属分类:专业指导

    • 发布日期:2018-04-12
    • 文件大小:19922944
    • 提供者:qq_31762497
  1. 基于文本挖掘的电网检修工作票辅助决策方法研究

  2. 电网检修工作票中蕴含大量有价值的信息,通过历史工作票的检索利用可以有效辅助检修工作票的决 策,传统检索方法效率低、工作量大且无法实现历史工作票的全面有效参考。基于此,提出一种基于文本挖掘的电网检修工作票辅助决策方法。首先分析并归纳传统工作票检索的局限性及工作票文本的特点;之后结合电力知识对文本进行预处理,根据表述不规范等问题,提出一种包含主词和辅词的改进双层词袋模型;最后利用余弦相似度实现检修设备关键信息与历史场景间的多变量相似性匹配,将匹配结果进行降序排列。通过挖掘工作票间隐含的内在联系,实
  3. 所属分类:项目管理

    • 发布日期:2020-03-09
    • 文件大小:553984
    • 提供者:sohopeter
  1. FAQ-system:基于火力发电厂知识问答库的检索式问答系统问答系统对话系统-源码

  2. FAQ系统 基于火力发电厂知识问答库的检索式问答系统 1,将火力发电厂知识问答数据集(Q.txt和A.txt)通过预先,整合为格式规范的数据。2,基于词袋模型和TFIDF模型,采用余弦相似度作为标准,对测试3,将相似问题集合中的问题进行排序,同时返回其对应的答案给用户。
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:5120
    • 提供者:weixin_42168230
  1. Similarity_matching_system:这个是一个《电商标题数据相似度匹配系统》,使用方法有:tfidf +词袋模型,余弦相似度,word2vec-源码

  2. 相似性匹配系统 这个是一个《电商标题数据相似度匹配系统》,使用方法有:tfidf +词袋模型,余弦相似度,word2vec 1.基本方法 1.1结巴分词 1.2 TF-IDF 1.3余弦相似度 1.4 word2vec 2.项目:《电商标题数据相似度匹配系统》 2.1项目原理 2.2项目代码 ------------------------------------完------------- -------------------------------------------- 更多NL
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:7340032
    • 提供者:weixin_42102401
  1. 聚合神经词嵌入用于文档表示

  2. 自然语言处理(NLP)的最新进展表明,分布式模型可以有效地获取单词的语义上有意义的表示。 在这种情况下,文本文档可以看作是词袋嵌入(BoWE),剩下的问题是如何获取文档的固定长度矢量表示以进行有效的文档处理。 除了这些启发式聚合方法之外,最近的工作表明,人们可以利用Fisher Fisher(FK)框架以有原则的方式基于BoWE生成文档表示。 在这项工作中,单词是通过潜在语义索引(LSI)嵌入到欧氏空间中的,而高斯混合模型(GMM)被用作基于FK的非线性聚合的生成模型。 在这项工作中,我们提出了
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:277504
    • 提供者:weixin_38701640
  1. 基于语义分布相似度的主题模型

  2. 潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(expectation maximization)算法框架下,使用GPU(generalized Pólya urn)模型加入单词—单词和文档—主题语义分布相似度来引导主题建模,从语义关联层面上削弱了词袋假设对主题产生的影响。在四个公开数据集上的实验表明,基于语义分布相似度的主题模型在
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:678912
    • 提供者:weixin_38722607
  1. The Bag-of-Opinions Method for Car Review Sentiment Polarity Classification

  2. ~本文针对网络评论倾向分级问题,提出了一种基于观点袋模型和语言学规则的多级情感分类方法。通过分析句子中的词性搭配关系,设计了12种抽取特征-观点搭配模式,并对存在问题给出了解决策略。依据汉语用词特点和词汇在汽车领域的特殊用法,提出搭配四元组的情感倾向极性值计算方法。在此基础上,利用获取的搭配四元组及其情感倾向极性,建立文本的向量化表示,并构造了权重计算公式。最后,利用文本余弦相似度计算方法实现对评论文本的五级情感极性分类。通过在COAE2012任务3的汽车数据集上进行的测试,取得了较好的分类结果
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:1048576
    • 提供者:weixin_38670318
  1.  基于改进的Bag of Visual Words算法的SAR图像目标分类

  2. “视觉词袋”(Bag of Visual Words,BOV)算法是一种有效的基于语义特征表达的物体识别算法。针对传统BOV模型存在的不足,综合利用SAR图像的灰度和纹理特征,提出基于感兴趣目标 (Target of Interest,TOI)的 “视觉词袋”算法。首先,对训练图像进行TOI选取,用灰度共生矩阵模型提取TOI的纹理特征,再结合灰度特征,组成多维特征向量集,以簇内相似度最高、数据分布密度最大为准则,生成“视觉词袋”。其次,对测试图像,依据已生成的“视觉词袋”,采用支持向量机(Sup
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:1048576
    • 提供者:weixin_38747087