您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 维基百科中文语料word2vec训练后结果

  2. 中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
  3. 所属分类:机器学习

    • 发布日期:2017-06-03
    • 文件大小:234
    • 提供者:yangyangrenren
  1. Word2Vec结果

  2. Word2Vec结果 Word2Vec结果 Word2Vec结果 Word2Vec结果
  3. 所属分类:直播技术

    • 发布日期:2018-05-04
    • 文件大小:161480704
    • 提供者:huwei2221
  1. 机器学习算法工程师校招面试题库.pdf

  2. 机器学习算法工程师校招面试题库 涵盖数学基础、机器学习算法、深度学习、自然语言处理、计算机基础项目等。ξ NOWCODER. COM 牛客网一一互联网学习求职必备神器 名企校招历年笔试面试真题,尽在牛客网 可能就问的项日多一些,或者你说哪里精通可能面试官就多去问你这些。而且此图是根据题 库数据整理出来,并不是根据实际单场面试整理,比如基础部分不会考那么多,会从中抽着 考 但是面试中必考的点且占比非常大的有机器学习算法,机器学习和算法。 决定你是否能拿 sp offer(高薪ofer)以及是否
  3. 所属分类:机器学习

    • 发布日期:2019-07-15
    • 文件大小:4194304
    • 提供者:yangyang3401
  1. Python-word2vec使用word2vec改进搜索结果

  2. word2vec:使用word2vec改进搜索结果
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:12288
    • 提供者:weixin_39841856
  1. word_embeddings, 博客文章"Making Sense of Word2vec"的代码.zip

  2. word_embeddings, 博客文章"Making Sense of Word2vec"的代码 基于的词嵌入评价用于评估 word2vec,手套,SPPMI和 SPPMI svd方法的博客帖子代码:可以理解word2vec的含义。运行 run_all.sh 以运行所有实验。 带有结果的日志将存储在数据目录中。要从博客文章复制我
  3. 所属分类:其它

    • 发布日期:2019-09-18
    • 文件大小:8192
    • 提供者:weixin_38744153
  1. word2vec+LSTM_Mini.rar

  2. word2vec+lstm情感分析(三分类)+使用说明 使用方法: 1、修改 ../data/neg(消极)../data/pos(积极)../data/neutral(中立)训练数据 及 ../data/sum(测试数据)(本数据为我上网download数据库,是不同情感方向的评价数据。) 2、运行 ../lstm/lstm_train 并修改 参数列表 (建议只修改代码30-33行)及 (119行代码)x_train, x_test, y_train, y_test = train_tes
  3. 所属分类:机器学习

    • 发布日期:2019-09-27
    • 文件大小:112197632
    • 提供者:qq_36238975
  1. sent-conv-torch, 基于卷积神经网络的文本分类.zip

  2. sent-conv-torch, 基于卷积神经网络的文本分类 在中的语句卷积码代码在 Torch 中实现了 Kim ( 2014 ) 语句卷积代码。 它复制现有数据集的结果,并允许对任意其他文本数据集的模型进行训练。快速入门要以hdf5格式生成数据,请运行以下( 使用 word2vec. bin
  3. 所属分类:其它

    • 发布日期:2019-10-10
    • 文件大小:5242880
    • 提供者:weixin_38744375
  1. 煤矿安全隐患信息自动分类方法

  2. 人工分类方式难以满足海量煤矿安全隐患信息的分类要求,而基于概率统计的文本自动分类方法分类准确率较低。针对上述问题,提出了一种基于Word2vec和卷积神经网络的煤矿安全隐患信息自动分类方法。首先对隐患信息进行分词、去停用词等预处理,然后应用Word2vec来表征词之间的语义相似性关系,最后利用卷积神经网络提取隐患信息的局部上下文高层特征,并使用Softmax分类器实现隐患信息的自动分类。实验结果表明,该方法实现了端到端的自动分类,可有效提升分类的准确性和全面性。
  3. 所属分类:其它

    • 发布日期:2020-05-07
    • 文件大小:237568
    • 提供者:weixin_38682790
  1. wikipedia 训练简体中文word2vec模型-训练结果.rar

  2. wikipedia 训练简体中文得到的word2vec模型,课程作业,仅供大家参考哈 Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。
  3. 所属分类:Python

    • 发布日期:2019-12-31
    • 文件大小:120586240
    • 提供者:u012993835
  1. python使用Word2Vec进行情感分析解析

  2. python实现情感分析(Word2Vec) ** 前几天跟着老师做了几个项目,老师写的时候劈里啪啦一顿敲,写了个啥咱也布吉岛,线下自己就瞎琢磨,终于实现了一个最简单的项目。输入文本,然后分析情感,判断出是好感还是反感。看最终结果:↓↓↓↓↓↓ 1 2 大概就是这样,接下来实现一下。 实现步骤 加载数据,预处理 数据就是正反两类,保存在neg.xls和pos.xls文件中, 数据内容类似购物网站的评论,分别有一万多个好评和一万多个差评,通过对它们的处理,变成我们用来训练模型的特征
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:431104
    • 提供者:weixin_38684328
  1. 优化进阶、word2vec、词嵌入进阶

  2. 一、优化进阶 目标函数有关自变量的梯度代表了目标函数在自变量当前位置下降最快的方向。因此,梯度下降也叫作最陡下降(steepest descent)。在每次迭代中,梯度下降根据自变量当前位置,沿着当前位置的梯度更新自变量。然而,如果自变量的迭代方向仅仅取决于自变量当前位置,这可能会带来一些问题。对于noisy gradient,我们需要谨慎的选取学习率和batch size, 来控制梯度方差和收敛的结果。 给定学习率,梯度下降迭代自变量时会使自变量在竖直方向比在水平方向移动幅度更大。那么,我
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:588800
    • 提供者:weixin_38584043
  1. NLP-Radiological-Reports:生成特征并预测病理结果-源码

  2. NLP-放射学报告 生成特征并预测病理结果。 (1)使用“ Generate features.py”生成特征; (2)使用“ Predict_train.py”预测病理结果。 模型 这项研究的计划。 BiLSTM,双向长期短期记忆; CNN,卷积神经网络; ANN,人工神经网络。 数据 Radiological_reports.csv显示了一些有关我们数据的示例。 token_vec_100.txt显示了Word2Vec的一些示例。 放射学报告中句子的长度和频率 生成特征的损失和准确性 R
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:399360
    • 提供者:weixin_42124497
  1. BeerMachineLearning-源码

  2. Project3_BeerQuality 该项目旨在查看啤酒评论,以根据文本评论确定一些项目。 从提取,我们将基于不同类型的机器学习进行分析。 在创建此模型时,我们旨在使用高精度在最合适的位置推荐最佳类型的啤酒。 过程: 我们将使用文本评论进行Word2Vec模型分析 然后,我们将基于Word2Vec结果创建k均值聚类分析,该结果将像啤酒一样聚类并一起审阅结果。 经过此分析,我们计划检查结果簇以从结果中收集含义 然后将群集与得分结果联系在一起 从那里我们将绘制结果图并确定下一个最佳步骤 目
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:22020096
    • 提供者:weixin_42131414
  1. novel_recommendation_system:小说推荐系统-源码

  2. [目录] 小说推荐系统 代码 RecSys_CountVectorizer.ipynb:词频统计后计算余弦相似度。 RecSys_Word2Vec.ipynb:PySpark Word2Vec再计算余弦相似度 数据 存储于data文件夹下。 爬虫获取笔趣阁上的一万部小说信息,如标题,作者,字数,简介信息等。 结果 存储于results文件夹下 CountVectorizer结果 Word2Vec结果
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:3145728
    • 提供者:weixin_42112894
  1. NLP推文-源码

  2. NLP推文 该存储库中的文件由密码本组成,该密码本对提取出的Tweet进行情感分析,以识别不良药物作用。 库和数据集 该数据集是从twitter api提取的。 使用的图书馆: pandas , numpy , nltk , torch , sklearn , os , sys , model , flair , random , Word2Vec 结果 我们成功地训练了模型,以从推文中提取药物不良React,并将其与包含药物不良React的标准库进行匹配。
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:259072
    • 提供者:weixin_42132056
  1. text-cnn:嵌入Word2vec词向量的CNN中文文本分类-源码

  2. 使用CNN和Word2vec进行文本分类 本文是参考gaussic大牛的“ text-classification-cnn-rnn”后,基于同样的数据集,嵌入词级别操作的CNN文本分类实验结果,gaussic大牛是基于字符级的;进行了第二版的更新:1。加入不同的卷积核; 2。加入正则化; 3。词唯一的中文或英文,删除掉文本中数字,符号等类型的词; 4。删除长度为1的词训练结果较第一版有所提升,验证集准确率从96.5%达到97.1%,测试准确率从96.7%达到97.2%。 本实验的主要目是为了探索
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:16410356
    • 提供者:weixin_42175035
  1. instagram_hashtag_analysis::camera:抓取并分析Instagram Hashtag数据:KoNLPY生成gensim word2Vec和scikit-learn TF-IDF-源码

  2. instagram_hashtag_analysis 抓取并分析Instagram标签数据 文件头编号 0:根据#keyword的搜索结果抓取Instagram帖子 1:使用大熊猫创建和纠缠数据集 2:KoNLPy标记可兰经名词,朝鲜语动作词 3:提取类似的文档,并使用gensim制作word2Vec模型 4:不使用scikit-learn库的TF-IDF代码 5:使用scikit-learn库的tfidfvectorizer提取相似的文档 음을다음을음을 0:#keyword검색,해시태그
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:73728
    • 提供者:weixin_42170790
  1. GermanWordEmbeddings:获取和预处理德语语料库,使用word2vec(gensim)训练模型并使用生成的测试集对其进行评估的工具包-源码

  2. 关于在英语语料库上进行词嵌入训练的研究很多。 该工具包通过在德语语料库上应用深度学习,以训练和评估德语模型。 有关项目,评估结果和的概述可在或直接在此存储库中找到。 该项目是根据发布的。 开始吧 确保已安装Python 3以及以下库: pip install gensim nltk matplotlib numpy scipy scikit-learn 现在,您可以下载并在您的Shell中执行它,以自动下载此工具包和相应的语料库文件并进行模型训练和评估。 请注意,这可能需要大量时间! 您
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:399360
    • 提供者:weixin_42116734
  1. nlp-in-practice:用于解决实际文本数据问题的入门代码。 包括:Gensim Word2Vec,短语嵌入,具有逻辑回归的文本分类,具有pyspark的单词计数,简单的文本预处理,预训练的嵌入等等-源码

  2. NLP实践 使用这些NLP,文本挖掘和机器学习代码示例和工具来解决现实世界中的文本数据问题。 笔记本/来源 第一列中的链接将您带到带有源代码的子文件夹/存储库。 任务 相关文章 来源类型 描述 python脚本 使用PySpark提取大量数据的短语。 使用这些短语注释文本或将这些短语用于其他下游任务。 python脚本+笔记本 使用字数统计或tfidf可视化热门关键字 笔记本 如何正确使用Word2Vec以获得所需的结果 python脚本 如何使用PySpark读取带有字数示例的不同格式的文件
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:97517568
    • 提供者:weixin_42172204
  1. 对Python中gensim库word2vec的使用详解

  2. pip install gensim安装好库后,即可导入使用: 1、训练模型定义 from gensim.models import Word2Vec model = Word2Vec(sentences, sg=1, size=100, window=5, min_count=5, negative=3, sample=0.001, hs=1, workers=4) 参数解释: 1.sg=1是skip-gram算法,对低频词敏感;默认sg=0为CBOW算法。 2.size是输出词向量的维数
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:54272
    • 提供者:weixin_38638002
« 12 3 »