搜索资源 - word2vec.ipynb - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - word2vec.ipynb

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

word2vec.ipynb
基于skip-gram的word2vec完整实现，基于tesorflow实现。
所属分类：机器学习
- 发布日期：2019-07-27
- 文件大小：356352
- 提供者：hfutzhouyonghang

Optimized-Word2Vec:该存储库包含其他功能，已扩展到2013年推出的传统Word2Vec库-源码
定制的Word2Vec 该存储库包含其他功能，已扩展到2013年推出的传统Word2Vec库直接克隆存储库并开始使用它。下面给出了如何命名和存储文件的详细信息： ->使用3个选项制作的模型-跳过图模型，通用单词袋，负采样。 ->您可以更改以下模型参数：视窗尺寸向量大小学习率二次采样您要训练的纪元数。 ->使用的优化程序是SGD。 ->除了reuters数据集的主要代码ipynb，整个训练语料库和测试语料库（numpy数组）（可以从此处直接下载）之外，
所属分类：其它
- 发布日期：2021-03-21
- 文件大小：8388608
- 提供者：weixin_42099070

novel_recommendation_system:小说推荐系统-源码
[目录] 小说推荐系统代码 RecSys_CountVectorizer.ipynb：词频统计后计算余弦相似度。 RecSys_Word2Vec.ipynb：PySpark Word2Vec再计算余弦相似度数据存储于data文件夹下。爬虫获取笔趣阁上的一万部小说信息，如标题，作者，字数，简介信息等。结果存储于results文件夹下 CountVectorizer结果 Word2Vec结果
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：3145728
- 提供者：weixin_42112894

coursework-源码
该存储库包含一些文件，这些文件包含作为我的主人的工作的一部分进行的实验（稍后将添加说明）。要重现结果，请执行以下操作：将数据文件夹和数据集的路径写到config.py中，这些路径将被记录并在工作中使用。运行parse.ipynb文件。配置日期中的文件将被解析，最终的数据集将被构建。运行数据集statistics.ipynb文件（可选）：它包含有关数据的一些统计信息。运行clean.py文件：将形成清除了嘈杂数据的文本。运行以下文件之一： Word2Vec.ipynb ，
所属分类：其它
- 发布日期：2021-03-09
- 文件大小：88064
- 提供者：weixin_42166918

w2v：使用Spark使用Twitter数据对Word2Vec进行建模。博客：-源码
基于Spark的机器学习，用于捕获词义在此存储库中，您将了解如何使用Twitter数据构建Word2Vec模型。要获得有关如何在IBM 上构建模型的端到端教程，请选择仓库。先决条件：安装Python，numpy和Apache Spark I.）安装Anaconda会同时安装Python，numpy和其他Python软件包。如果有兴趣，请访问 II。）下载并安装Apache Spark，请转到此处： : 该步骤对我在Mac 上安装Spark 1.5.1很有用。 III。）在这里
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：899072
- 提供者：weixin_42175971

reddit-word-vectors：使用https：pushshift.io对Reddit数据进行处理-源码
RWV（Reddit单词向量）使用线程从pushshift下载reddit帖子和评论使用Gensim库从提取的句子中制作Word2vec，Doc2vec或FastText模型有关如何使用此脚本的更多信息，请参见example.ipynb。示例word2vec模型可以在找到。结果与“ cat”最相似的50个词（浮点数是余弦相似度）：狗：0.84小狗：0.71小猫：0.69小狗：0.69奇瓦瓦狗：0.68哈士奇：0.65哈巴狗：0.65猫：0.62小猫：0.61鸟：0.61小猎犬：0
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：14336
- 提供者：weixin_42131861

Kaggle自动化作文检查系统：我对Kaggle AES项目的尝试（https：www.kaggle.comcasap-aes）-源码
Kaggle自动化作文检查系统我对Kaggle AES项目的尝试（）线性回归模型使用Word2Vec模型和自定义生成的启发式特征来获得0.9359的均二次加权kappa分数。笔记本： CustomFeatureGeneration.ipynb-为数据集生成自定义功能。 Data_Exploration.ipynb-探索数据集和自由格式可视化。线性回归Model.ipynb-模型的建立和学习在这里进行。辅助函数和所需的库导入： ./utils/helperfunctions.p
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：18874368
- 提供者：weixin_42150341