点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 文本相似性
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
一种文本相似性的度量方法和计算机方法
摘要:本文提出了一种判定两个文本相似性的度量方法,定义了相似度和摘录度,对其意义做了简单的分析;并用动态规划的思想给出了时间复杂度为O(mn)的计算方法。 一种文本相似性的度量方法和计算方法。
所属分类:
其它
发布日期:2009-06-04
文件大小:30720
提供者:
tzmdjh
4种文本相似性的度量方法和计算机方法
4种文本相似性的度量方法和计算机方法 有数据结结构和算法
所属分类:
其它
发布日期:2010-03-18
文件大小:30720
提供者:
haoyanbin2005
文本相关性相似性聚类演示程序
我的专业工作案例可以从以下链接下载: http://pan.baidu.com/s/1dDIlXXB 需要预先安装同一目录下的VB6运行环境,然后才可以安装应用程序。 安装和测试过程中有问题可以直接联系我。 中英文文本自动摘要、自动校对、自动分类、相关性与相似性聚类、主题词与标签自动生成、微博(短文本)聚类和情感分析。我的研究成果,欢迎下载传播。
所属分类:
C
发布日期:2015-02-22
文件大小:10485760
提供者:
gztwhhy
2017-9-19文本相似性-文本表示.pptx
文本挖掘一般流程 文本相似性度量方法 文本表示方法 最后讲述一种新的文本表示方法CCODM
所属分类:
机器学习
发布日期:2019-08-23
文件大小:11534336
提供者:
veyoun123
文本相似性在抄袭问题中的应用研究
Internet的高速增长同时带动了信息的高速增长,这些信息基本是以文本形式保存的。文本信息的特点是无结构,即便有也是极其有限的结构。文本相似性是文本挖掘研究的一个重点也是一个难点。从文本特征得到文本相似性信息是本文的主要研究方向。本文采用了PHP+MYSQL的开发环境对文本相似性的计算过程进行了模拟。计算过程采用的是余弦相似度和Jaccard相似度这两种基于向量内积的方法。在实验过程中通过对文本特征的操作来判断文本之间是否相似,另外还实现了将文本转化为简单的字符串集合进行比较来判断文本是否相似
所属分类:
其它
发布日期:2020-05-22
文件大小:382976
提供者:
weixin_38683195
Python文本相似性计算之编辑距离详解
大家在做爬虫的时候,很容易保持一些相似的数据,这些相似的数据由于不完全一致,如果要通过人工一一的审核,将耗费大量的时间,大家对编辑距离应该有所了解,这篇文章我们先来了解下什么是编辑距离,然后在学习Python如何计算编辑距离,下面来一起学习学习吧。
所属分类:
其它
发布日期:2020-09-21
文件大小:74752
提供者:
weixin_38675797
Python 比较文本相似性的方法(difflib,Levenshtein)
今天小编就为大家分享一篇Python 比较文本相似性的方法(difflib,Levenshtein),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
所属分类:
其它
发布日期:2020-09-20
文件大小:46080
提供者:
weixin_38710127
Python 比较文本相似性的方法(difflib,Levenshtein)
最近工作需要用到序列匹配,检测相似性,不过有点复杂的是输入长度是不固定的,举例为: input_and_output = [1, 2, '你好', 世界', 12.34, 45.6, -21, '中国', '美丽'] 其中,需要从input_and_output 中选取不固定长度的一段作为输入,且顺序不定,然后去与总体进行比较,找出最符合的,开始是对汉字进行数值化编码,不过后来由于出现汉字越来越多,遂放弃该方法,转向别的方式,查找资料发现了两个python包广被推荐,从下面来看各有优缺点,记录
所属分类:
其它
发布日期:2020-12-23
文件大小:51200
提供者:
weixin_38615397
文本相似性热度统计(python版)
0. 写在前面 节后第一篇,疫情还没结束,黎明前的黑暗,中国加油,武汉加油,看了很多报道,发现只有中国人才会帮助中国人,谁说中国人一盘散沙?也许是年龄大了,看到全国各地的医务人员源源不断的告别家人去支援湖北,看到医务人员、肺炎病人的故事,总会忍不住落泪,中国加油,中国人加油! 1. 场景描述 背景不写了,只谈技术,做的是文本相似性统计,因需要从文本描述性信息中分析同类信息,以便后续重点关注,数据量比较大,大概20多万,人工效率低,需要算法来实现。 根据需求要从不同维度进行统计: (1)分组不分句
所属分类:
其它
发布日期:2021-01-07
文件大小:65536
提供者:
weixin_38658564
Text-Similarity-Web-App:简单的Web应用程序可查找用户输入的两段文本之间的相似性-源码
文本相似性Web应用程序 简单的Web应用程序可查找用户输入的两段文本之间的相似性 介绍: 这是一个简单的Flask Web应用程序,它接收2条文本并吐出2条文本之间的相似度百分比。该算法绝非完美。它需要更多的改进,但这是一个很好的起点。 注意事项: 标点符号将代替其原始符号。我使用了 ,其中包含许多标点符号及其扩展形式。我已将其作为json文件包含在内,因此以后任何人都可以进一步扩展。 重复的单词不会增加相似性。我将使用一组,因此重复的单词将不会计入。 我使用了一个名为“ Inflect”的库
所属分类:
其它
发布日期:2021-03-18
文件大小:2048
提供者:
weixin_42127748
时空文本查询:回顾和机会
近年来,基于位置的服务得到了快速发展。 结果,时空文本查询在现实生活中变得无处不在。 在过去十年中,该领域已经完成了大量工作,以有效地支持各种不同的查询。 不幸的是,目睹了很少的文献对这些作品进行系统地分类并进行了全面的比较。 为了解决这个问题,在本文中,我们对该领域进行了详细的调查。 首先,为了捕捉不同算法之间的主要差异,我们从文本角度将时空文本查询分为两类:时空文本包含性查询,时空文本相似性查询;时空文本相似性查询;时空文本相似性查询;时空文本相似性查询。 其次,对各个类别中的现有指标进行了
所属分类:
其它
发布日期:2021-03-14
文件大小:355328
提供者:
weixin_38558655
sentence_similarity_using_Python:句子_相似性_使用_Python-源码
句子相似度 此文件夹包含用Jupyter笔记本编写的用于构建句子相似性模型的示例和最佳实践。 和实用程序脚本用于加速笔记本中的模型构建过程。 句子相似性分数可用于各种应用程序中,例如搜索/检索,最近邻或基于内核的分类方法,推荐和排序任务。 什么是句子相似度 句子相似度或语义文本相似度是衡量两段文本的相似程度或表达相同含义的程度。 相关任务包括释义或重复标识,搜索和匹配应用程序。 用于文本相似性的常用方法包括简单的词向量点积,成对分类,以及最近的深度神经网络。 句子相似度通常通过以下两个步骤来计
所属分类:
其它
发布日期:2021-03-08
文件大小:401408
提供者:
weixin_42150341
Fetch_Rewards_Challenge:在Python中比较文本相似性而不导入任何库-源码
Fetch_Rewards_Challenge 在不导入任何库的情况下比较Python中的文本相似性
所属分类:
其它
发布日期:2021-02-27
文件大小:3072
提供者:
weixin_42151729
基于部件关联图的文本相似性检测研究
基于部件关联图的文本相似性检测研究
所属分类:
其它
发布日期:2021-02-10
文件大小:5242880
提供者:
weixin_38738528
基于协同过滤和文本相似性的Web文本情感极性分类算法
基于协同过滤和文本相似性的Web文本情感极性分类算法
所属分类:
其它
发布日期:2021-02-09
文件大小:449536
提供者:
weixin_38674883
nlp-journey:与自然语言处理有关的文档,文件和代码,包括主题模型,单词嵌入,命名实体识别,文本分类,文本生成,文本相似性,机器翻译)等。 所有代码均已实现intensorflow 2.0-源码
NLP旅程 全部在tensorflow 2.0中实现, 1.基础 2.书籍( 代码:txqx) 图形模型手册。 深度学习。 神经网络和深度学习。 语音和语言处理。 3.论文 01)变压器纸 BERT:用于语言理解的深度双向变压器的预训练。 GPT-2:语言模型是无监督的多任务学习者。 Transformer-XL:Transformer-XL:超出固定长度上下文的注意力语言模型。 XLNet:用于语言理解的通用自回归预训练。 RoBERTa:稳健优化的BERT预训练方法。 D
所属分类:
其它
发布日期:2021-02-06
文件大小:5242880
提供者:
weixin_42103587
tldrstory:基于AI的标题和故事文本理解-源码
人工智能驱动的标题和故事文本理解 tldrstory是一个由AI驱动的框架,用于理解与故事相关的标题和文本内容。 tldrstory在文本上应用零标记标签,从而可以对内容进行动态分类。 该框架还构建了一个txtai索引,该索引启用了文本相似性搜索。 可自定义的Streamlit应用程序和FastAPI后端服务使用户可以查看和分析处理的数据。 tldrstory有相应的,涵盖了本自述文件及更多内容。 看看这个! 例子 以下链接是使用tldrstory构建的示例应用程序。 这些演示也可以在上找到。
所属分类:
其它
发布日期:2021-02-03
文件大小:5242880
提供者:
weixin_42134054
Macropodus:自然语言处理工具Macropodus,基于Albert + BiLSTM + CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯NLP的工具(工
Macropodus是一个以Albert + BiLSTM + CRF网络架构为基础,用大量中文语料训练的自然语言处理工具包。将提供中文分词,词性标注,命名实体识别,关键词提取,文本摘要,新词发现,文本相似度,计算器,数字转换,拼音转换,繁简转换等常见的NLP功能。 目录 安装 注意事项默认不安装nlg-yongzhuo, 如果需要该功能自行安装; 默认不指定numpy, pandas, scikit-learn版本, 过高或者过低的版本可能不支持 标准版本的依赖包详见 requirements
所属分类:
其它
发布日期:2021-02-03
文件大小:5242880
提供者:
weixin_42112685
nlp-in-practice:用于解决实际文本数据问题的入门代码。 包括:Gensim Word2Vec,短语嵌入,具有逻辑回归的文本分类,具有pyspark的单词计数,简单的文本预处理,预训练的嵌入等等-源码
NLP实践 使用这些NLP,文本挖掘和机器学习代码示例和工具来解决现实世界中的文本数据问题。 笔记本/来源 第一列中的链接将您带到带有源代码的子文件夹/存储库。 任务 相关文章 来源类型 描述 python脚本 使用PySpark提取大量数据的短语。 使用这些短语注释文本或将这些短语用于其他下游任务。 python脚本+笔记本 使用字数统计或tfidf可视化热门关键字 笔记本 如何正确使用Word2Vec以获得所需的结果 python脚本 如何使用PySpark读取带有字数示例的不同格式的文件
所属分类:
其它
发布日期:2021-02-03
文件大小:97517568
提供者:
weixin_42172204
文本相似性热度统计算法实现(一)-整句热度统计
1. 场景描述 软件老王在上一节介绍到相似性热度统计的4个需求(文本相似性热度统计(python版)),根据需求要从不同维度进行统计: (1)分组不分句热度统计(根据某列首先进行分组,然后再对描述类列进行相似性统计); (2)分组分句热度统计(根据某列首先进行分组,然后对描述类列按照标点符号进行拆分,然后再对这些句进行热度统计); (3)整句及分句热度统计;(对描述类列/按标点符号进行分句,进行热度统计) (4)热词统计(对描述类类进行热词统计,反馈改方式做不不大) 2. 解决方案 热词统计统计
所属分类:
其它
发布日期:2021-01-20
文件大小:90112
提供者:
weixin_38669674
«
1
2
3
4
5
6
7
8
»