点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - word2vec.ipynb
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
word2vec.ipynb
基于skip-gram的word2vec完整实现,基于tesorflow实现。
所属分类:
机器学习
发布日期:2019-07-27
文件大小:356352
提供者:
hfutzhouyonghang
Optimized-Word2Vec:该存储库包含其他功能,已扩展到2013年推出的传统Word2Vec库-源码
定制的Word2Vec 该存储库包含其他功能,已扩展到2013年推出的传统Word2Vec库 直接克隆存储库并开始使用它。下面给出了如何命名和存储文件的详细信息: ->使用3个选项制作的模型-跳过图模型,通用单词袋,负采样。 ->您可以更改以下模型参数: 视窗尺寸 向量大小 学习率 二次采样 您要训练的纪元数。 ->使用的优化程序是SGD。 ->除了reuters数据集的主要代码ipynb,整个训练语料库和测试语料库(numpy数组) (可以从此处直接下载)之外,
所属分类:
其它
发布日期:2021-03-21
文件大小:8388608
提供者:
weixin_42099070
novel_recommendation_system:小说推荐系统-源码
[目录] 小说推荐系统 代码 RecSys_CountVectorizer.ipynb:词频统计后计算余弦相似度。 RecSys_Word2Vec.ipynb:PySpark Word2Vec再计算余弦相似度 数据 存储于data文件夹下。 爬虫获取笔趣阁上的一万部小说信息,如标题,作者,字数,简介信息等。 结果 存储于results文件夹下 CountVectorizer结果 Word2Vec结果
所属分类:
其它
发布日期:2021-03-11
文件大小:3145728
提供者:
weixin_42112894
coursework-源码
该存储库包含一些文件,这些文件包含作为我的主人的工作的一部分进行的实验(稍后将添加说明)。 要重现结果,请执行以下操作: 将数据文件夹和数据集的路径写到config.py中,这些路径将被记录并在工作中使用。 运行parse.ipynb文件。 配置日期中的文件将被解析,最终的数据集将被构建。 运行数据集statistics.ipynb文件(可选):它包含有关数据的一些统计信息。 运行clean.py文件:将形成清除了嘈杂数据的文本。 运行以下文件之一: Word2Vec.ipynb ,
所属分类:
其它
发布日期:2021-03-09
文件大小:88064
提供者:
weixin_42166918
w2v:使用Spark使用Twitter数据对Word2Vec进行建模。 博客:-源码
基于Spark的机器学习,用于捕获词义 在此存储库中,您将了解如何使用Twitter数据构建Word2Vec模型。 要获得有关如何在IBM 上构建模型的端到端教程,请选择仓库。 先决条件:安装Python,numpy和Apache Spark I.)安装Anaconda会同时安装Python,numpy和其他Python软件包。 如果有兴趣,请访问 II。)下载并安装Apache Spark,请转到此处: : 该步骤对我在Mac 上安装Spark 1.5.1很有用。 III。)在这里
所属分类:
其它
发布日期:2021-02-06
文件大小:899072
提供者:
weixin_42175971
reddit-word-vectors:使用https:pushshift.io对Reddit数据进行处理-源码
RWV(Reddit单词向量) 使用线程从pushshift下载reddit帖子和评论 使用Gensim库从提取的句子中制作Word2vec,Doc2vec或FastText模型 有关如何使用此脚本的更多信息,请参见example.ipynb。 示例word2vec模型可以在找到。 结果 与“ cat”最相似的50个词(浮点数是余弦相似度): 狗:0.84小狗:0.71小猫:0.69小狗:0.69奇瓦瓦狗:0.68哈士奇:0.65哈巴狗:0.65猫:0.62小猫:0.61鸟:0.61小猎犬:0
所属分类:
其它
发布日期:2021-02-04
文件大小:14336
提供者:
weixin_42131861
Kaggle自动化作文检查系统:我对Kaggle AES项目的尝试(https:www.kaggle.comcasap-aes)-源码
Kaggle自动化作文检查系统 我对Kaggle AES项目的尝试( )线性回归模型使用Word2Vec模型和自定义生成的启发式特征来获得0.9359的均二次加权kappa分数。 笔记本: CustomFeatureGeneration.ipynb-为数据集生成自定义功能。 Data_Exploration.ipynb-探索数据集和自由格式可视化。 线性回归Model.ipynb-模型的建立和学习在这里进行。 辅助函数和所需的库导入: ./utils/helperfunctions.p
所属分类:
其它
发布日期:2021-02-04
文件大小:18874368
提供者:
weixin_42150341