您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 从Word2Vec到BERT:上下文嵌入 (Contextual Embedding) 最新综述论文.pdf

  2. 词嵌入表示向量是自然语言处理的重要组成部分。最近来自牛津大学和DeepMind等撰写了关于上下文嵌入表示的综述论文,详述了当前预训练模型的代表性工作等。
  3. 所属分类:机器学习

    • 发布日期:2020-03-19
    • 文件大小:225280
    • 提供者:syp_net
  1. TweetDisasterAnalysis-源码

  2. 词嵌入和递归神经网络用于灾害鸣叫分类 魏伯阳邱乐川 客观的 该项目致力于使用不同的词嵌入和递归神经网络对进行分类。 我们正在探索TF-IDF,Word2Vec,LSTM和BERT如何执行二进制分类任务,特别是针对此样本数据集。 数据 来自Kaggle Competition的推文灾难数据用于从数据清理,建模到评估的整个流程。 数据由通用分隔值形式的培训和测试文件组成。 培训和测试文件包含3243和7​​503唯一行和4个功能。 可以在数据目录中以cleaned.csv找到已清理的数据。 背景 用
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:1048576
    • 提供者:weixin_42131705
  1. Faker:虚假信息挑战SBPBRiM-源码

  2. 朝着自动系统检测政治媒体中的虚假信息 介绍 根据各种因素,任何信息都可以是真实的或虚假的。 在此项目中,我们在两个基准数据集上使用深度学习和NLP技术将一段文本分类为真实或伪造。 请查看最终报告以查看有关体系结构和性能指标的更多信息。 说谎者 LIAR数据集有6种不同的类别,从True到Pants fire。 假新闻网 FNN有两个不同的类。 真实和虚假。 分词器 我们使用pyTorch的BERT标记工具。 我们删除了TF-IDF表示的停用词,并保留了双字TF-IDF的停用词。 嵌入 对于骗子
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:34603008
    • 提供者:weixin_42102634