您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. word2vec.ipynb

  2. 基于skip-gram的word2vec完整实现,基于tesorflow实现。
  3. 所属分类:机器学习

  1. Optimized-Word2Vec:该存储库包含其他功能,已扩展到2013年推出的传统Word2Vec库-源码

  2. 定制的Word2Vec 该存储库包含其他功能,已扩展到2013年推出的传统Word2Vec库 直接克隆存储库并开始使用它。下面给出了如何命名和存储文件的详细信息: ->使用3个选项制作的模型-跳过图模型,通用单词袋,负采样。 ->您可以更改以下模型参数: 视窗尺寸 向量大小 学习率 二次采样 您要训练的纪元数。 ->使用的优化程序是SGD。 ->除了reuters数据集的主要代码ipynb,整个训练语料库和测试语料库(numpy数组) (可以从此处直接下载)之外,
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:8388608
    • 提供者:weixin_42099070
  1. novel_recommendation_system:小说推荐系统-源码

  2. [目录] 小说推荐系统 代码 RecSys_CountVectorizer.ipynb:词频统计后计算余弦相似度。 RecSys_Word2Vec.ipynb:PySpark Word2Vec再计算余弦相似度 数据 存储于data文件夹下。 爬虫获取笔趣阁上的一万部小说信息,如标题,作者,字数,简介信息等。 结果 存储于results文件夹下 CountVectorizer结果 Word2Vec结果
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:3145728
    • 提供者:weixin_42112894
  1. coursework-源码

  2. 该存储库包含一些文件,这些文件包含作为我的主人的工作的一部分进行的实验(稍后将添加说明)。 要重现结果,请执行以下操作: 将数据文件夹和数据集的路径写到config.py中,这些路径将被记录并在工作中使用。 运行parse.ipynb文件。 配置日期中的文件将被解析,最终的数据集将被构建。 运行数据集statistics.ipynb文件(可选):它包含有关数据的一些统计信息。 运行clean.py文件:将形成清除了嘈杂数据的文本。 运行以下文件之一: Word2Vec.ipynb ,
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:88064
    • 提供者:weixin_42166918
  1. w2v:使用Spark使用Twitter数据对Word2Vec进行建模。 博客:-源码

  2. 基于Spark的机器学习,用于捕获词义 在此存储库中,您将了解如何使用Twitter数据构建Word2Vec模型。 要获得有关如何在IBM 上构建模型的端到端教程,请选择仓库。 先决条件:安装Python,numpy和Apache Spark I.)安装Anaconda会同时安装Python,numpy和其他Python软件包。 如果有兴趣,请访问 II。)下载并安装Apache Spark,请转到此处: : 该步骤对我在Mac 上安装Spark 1.5.1很有用。 III。)在这里
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:899072
    • 提供者:weixin_42175971
  1. reddit-word-vectors:使用https:pushshift.io对Reddit数据进行处理-源码

  2. RWV(Reddit单词向量) 使用线程从pushshift下载reddit帖子和评论 使用Gensim库从提取的句子中制作Word2vec,Doc2vec或FastText模型 有关如何使用此脚本的更多信息,请参见example.ipynb。 示例word2vec模型可以在找到。 结果 与“ cat”最相似的50个词(浮点数是余弦相似度): 狗:0.84小狗:0.71小猫:0.69小狗:0.69奇瓦瓦狗:0.68哈士奇:0.65哈巴狗:0.65猫:0.62小猫:0.61鸟:0.61小猎犬:0
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:14336
    • 提供者:weixin_42131861
  1. Kaggle自动化作文检查系统:我对Kaggle AES项目的尝试(https:www.kaggle.comcasap-aes)-源码

  2. Kaggle自动化作文检查系统 我对Kaggle AES项目的尝试( )线性回归模型使用Word2Vec模型和自定义生成的启发式特征来获得0.9359的均二次加权kappa分数。 笔记本: CustomFeatureGeneration.ipynb-为数据集生成自定义功能。 Data_Exploration.ipynb-探索数据集和自由格式可视化。 线性回归Model.ipynb-模型的建立和学习在这里进行。 辅助函数和所需的库导入: ./utils/helperfunctions.p
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:18874368
    • 提供者:weixin_42150341