文件名称:
Top2Vec:Top2Vec学习联合嵌入的主题,文档和单词向量-源码
开发工具:
文件大小: 6mb
下载次数: 0
上传时间: 2021-03-20
详细说明:更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。
Top2Vec
Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。训练Top2Vec模型后,您可以:
获取检测到的主题数。
获取主题。
获取主题大小。
获取层次结构主题。
通过关键字搜索主题。
按主题搜索文档。
通过关键字搜索文档。
查找类似的单词。
查找类似的文档。
使用公开模型
有关其工作原理的更多详细信息,请参见。
好处
自动查找主题数。
无需停用词列表。
无需词干/词形限制。
适用于短文本。
创建联合嵌入的主题,文档和单词向量。
内置搜索功能。
它是如何工作的?
该算法所做的假设是,许多语义上相似的文档都表明了一个潜在的主题。第一步是创建文档和单词向量的联合嵌入。将文档和单词嵌入向量空间后,算法的目标是找到文档的密集簇,然后确定哪些单词将这些文档
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.