您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. SentAugment:SentAugment是NLP的一种数据增强技术,可以从大量的句子中检索相似的句子。它可以与自我训练和知识提炼结合使用,或用于获取复述。-源码

  2. 已发送 SentAugment是用于NLP中半监督学习的一种数据增强技术。它使用最新的句子嵌入来构造大量句子的信息。然后,大型句子嵌入空间可用于检索任何语言理解任务的域内未注释句子,从而可以利用诸如自我训练和知识提取之类的半监督学习技术。这意味着您无需使用半监督学习技术就可以假设无注释句子的存在。在我们的论文《,我们表明SentAugment与自我训练或知识提炼结合使用时,可以在多种语言理解任务上获得巨大收益。 依存关系 I.大型句子库 我们的方法基于大量的CommonCrawl网络句子。对于
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:227328
    • 提供者:weixin_42136791
  1. PaperReading:每天阅读过的论文的简要笔记-源码

  2. 270.《决策前先征求父母子女_充分利用分层结构进行自我监督分类法的发展》,腾讯,刘邦 分类树扩展的工作,用于腾讯的疫情问答场景。刘邦的博士论文可以一读。 269.联合学习 《保护数百万人的隐私保护技术_预防卒中联合预测模型》 FL使用传统模型,也是目前主要做的工作 《自然语言处理的机构联合学习的实证研究》 FL使用TextCNN的经验性工作 《联邦政府:通过整体蒸馏进行联合学习以提取医疗关系》 内容:FL透析医疗关系撤除 结果:实现了隐私保护,但指标下降 核心:在通信,不在计算 科普:
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:5120
    • 提供者:weixin_42129412
  1. Natural_Language_Processing_Specialization:该存储库包含来自深度学习AI NLP系列的自然语言处理课程的材料-源码

  2. Natural_Language_Processing_Specialization 该存储库包含来自深度学习AI NLP系列的自然语言处理课程的材料。 课程1:具有分类空间和向量空间的自然语言处理 主题:使用逻辑回归,朴素贝叶斯和单词向量来实现情感分析,完整类比并翻译单词。 第一周:逻辑回归 在这堂课中,我学习了将文本中的特征提取到数值向量中,然后使用逻辑回归为推文构建二进制分类器。 主题:情感分析,逻辑回归,数据预处理,计算词频,特征提取,词汇创建,监督学习 实验室: 任务: 第二周:朴素
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:240123904
    • 提供者:weixin_42097668
  1. 去噪变压器自动编码器-源码

  2. 降噪变压器自动编码器 此回购保存了我对Kaggle竞赛解决方案中的降噪自动编码器部分。 我的大部分工作都花在了训练降噪自动编码器网络上,以捕获输入之间的关系,并将学习到的表示形式用于下游监督模型。 复制单个模型 获取代码并移至代码目录。 按照指定安装python软件包。 下载比赛数据并修改的路径。 在单个GPU机器上运行python train.py并等待大约20个小时。 通过岭回归,其交叉验证的RMSE得分应为0.8412。 关于网络 该网络是一个AutoEncoder网络,中间层是
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:185344
    • 提供者:weixin_42153615
  1. 关系提取监督学习-源码

  2. 数据 [] 用法 下载并解压缩数据,并将其放入文件夹data 。 下载并解压缩StanfordCoreNLP并将其放入文件夹data 。 运行preprocess.py python3 preprocess.py 下载并解压单词嵌入,并将其放入文件夹embedding 。 运行convert.py python3 convert.py 运行run.py训练和测试模型。 python2 run.py 使用官方得分手检查最终的预测结果。 perl semeval2010_task
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:25165824
    • 提供者:weixin_42099942
  1. menrva:Python机器学习平台-源码

  2. 月经 用于监督机器学习的Python平台 三层平台 纠缠:合并,重塑,提取特征**当前不可用 建模:预处理,培训和评估)**正在开发中 服务:分层服务和管理模型**服务可用 1-数据整理 易于合并,重塑和自动特征工程。 2-建模 支持回归和分类。 执行一键编码,标签编码和空值插补。 然后逐步将模型从简单训练到复杂,并并行执行超参数调整和模型选择。 最后报告模型质量统计信息,诊断报告(ROC曲线,列联矩阵等)并序列化最佳模型。 3-模型管理 将新模型持久化到磁盘,然后使用Redis从内存中提供模型
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:45056
    • 提供者:weixin_42121086
  1. co-author_link_prediction_V1-源码

  2. 合作者_link_prediction_V1 这是一个python代码,用于在两个公共可用的cauthorship网络数据集中实施链接预测: 1-ArnetMiner 2dblp 每个cauthorship网络均以图表形式显示。 该图是使用R代码运行network_graph_similarity.R脚本生成的,该脚本还会在网络中的每个两个顶点/节点之间生成一些相似性特征。 除了从作者网络中提取的其他功能以外,这些功能还用于训练进行链接预测的机器学习分类器。 有关此链接预测方法和使用此
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:4194304
    • 提供者:weixin_42128537
  1. ML_paper_list:我的阅读评论积压中的论文博客视频项目列表-源码

  2. 机器学习阅读清单 我的阅读/审阅积压工作中的论文/博客/视频/项目列表及其主题 自然语言处理(NLP) 面向组合任务的语义解析的低资源域自适应( ) 具有上下文化跨度表示形式的实体,关系和事件提取( ) 通过DistanceNet-Bandits进行文本分类的多源域自适应( ) 带有显式释义的可控文本简化( ) 不带重新参数化技巧的离散变分递归主题模型( ) 使预训练的语言模型更好的学习者( ) LightXML:具有动态负采样的变压器,用于高性能极端多标签文本分类(
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:6144
    • 提供者:weixin_42134168