您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 斯坦德机器阅读理解SQuAD2.0数据集

  2. 斯坦福机器阅读理解竞赛的数据集SQuAD2.0,基于 SQuAD(Stanford Question Answering Dataset)的文本理解挑战赛,是行业内公认的机器阅读理解领域的顶级水平测试;它构建了一个包含十万个问题的大规模机器阅读理解数据集,选取超过 500 篇的维基百科文章。数据集中每一个阅读理解问题的答案是来自给定的阅读文章的一小段文本 —— 以及,现在在 SQuAD 2.0 中还要判断这个问题是否能够根据当前的阅读文本作答。
  3. 所属分类:深度学习

    • 发布日期:2019-02-28
    • 文件大小:9437184
    • 提供者:sinat_20280061
  1. squad-v1.1数据集.rar

  2. squad-v1.1的数据集,包括训练集和开发集两个json文件。squad是机器阅读理解受众非常广的数据集,提供数据资源以进行实验。
  3. 所属分类:深度学习

    • 发布日期:2020-04-23
    • 文件大小:7340032
    • 提供者:weixin_40692863
  1. SQuAD2.0.zip

  2. 阅读理解数据集SQuAD-V2, 对应的MRC代码可参考https://github.com/shawroad。 实现了很多阅读理解算法。
  3. 所属分类:深度学习

    • 发布日期:2020-03-17
    • 文件大小:9437184
    • 提供者:shawroad88
  1. squad-v1.zip

  2. 原始的Squad-v1数据集。大家可以去下载. 对应的MRC相关代码可参考https://github.com/shawroad
  3. 所属分类:深度学习

    • 发布日期:2020-03-17
    • 文件大小:8388608
    • 提供者:shawroad88
  1. SQuAD_2.0.zip

  2. Stanford Question answer Dataset (SQuAD)是一个阅读理解数据集,由众包工作者在维基百科文章上提出的问题组成,其中每个问题的答案都是对应阅读文章的一段文字,或者说是一段跨度,或者这个问题可能是无法回答的。资源为v2.0版的SQuAD数据集
  3. 所属分类:互联网

    • 发布日期:2020-06-28
    • 文件大小:9437184
    • 提供者:qq_34510639
  1. tydiqa:TyDi QA包含11万种类型多样的语言中的200k带有人类注释的问题-答案对,编写时没有看到答案,也没有使用翻译,并且被设计用于培训和评估自动问题解答系统。该存储库为数据集提供评估代码和基线系统-源码

  2. TyDi QA:类型多样的语言中寻求信息的问题解答的基准 |||||| || 该存储库包含有关TyDi质量保证的信息,用于评估数据集结果的代码,数据集基线系统的实现以及有关使用数据集的一些建议。 想要了解最新的更新和新版本吗?加入我们的低流量。 介绍 TyDi QA是一个问答数据集,涵盖11种类型多样的语言,具有204K个问答对。 TyDi QA的语言在类型学(每种语言所表达的语言特征集)方面具有多种多样的特点,因此我们希望在该语言集上表现良好的模型能够在世界上大量语言中得到概括。它包含在仅英语
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:849920
    • 提供者:weixin_42118056
  1. SQuAD(The Standford Question Answering Dataset)斯坦福问答数据集-数据集

  2. Standford Question Answering Dataset (SQuAD) is a reading comprehension dataset by Standford University and has two versions. 斯坦福问答数据集是由斯坦福大学创建的阅读理解数据集,有两个版本。 Know What You Don’t Know- Unanswerable Questions for SQuAD paper.pdf LUKE.pdf SQuAD1.1.p
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:11534336
    • 提供者:weixin_38584642
  1. NLP-Question-Answering-System:斯坦福大学SQuAD数据集上的NLP项目-源码

  2. NLP问题解答系统 斯坦福大学SQuAD数据集上的NLP项目 回答信息检索和自然语言处理(NLP)领域的问题,该问题与构建自动化系统有关,该系统以自然语言回答人类提出的问题。 有两种类型的系统; 封闭域质量检查和开放域质量检查。 封闭域质量检查与构建可回答特定领域问题的系统有关。 因此,给定一段文本,我们希望开发能够回答该特定文本问题的系统。 开放域质量保证可以处理几乎所有问题,并且可以依靠一般本体论和世界知识。 这些系统通常具有更多可用于提取答案的数据。 在此任务中,我们关注的是封闭域质
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:1024
    • 提供者:weixin_42157567
  1. cs224n-源码

  2. 斯坦福大学CS224N类项目的资料库 项目提案 项目里程碑 资料资讯 域内数据 数据集\ indomain_train \ nat_questions中的条目数:50000 数据集\ indomain_train \ newsqa中的条目数:50000 数据集\ indomain_train \ squad中的条目数:50000 数据集\ indomain_val \ nat_questions中的条目数:12836 数据集\ indomain_val \ newsqa中的条目数:421
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:6144
    • 提供者:weixin_42176612
  1. Open_QG:开源QG系统(Question Generation,问题生成),基于Pytorch和Transformer编写-源码

  2. 开源QG系统(Question Generation,问题生成) 当前实验结果不理想,但确实是按照标准变压器实现的,有兴趣的大佬拿来做baseline的话提升空间应该会很大(手动滑稽)作者目前在做别的QG研究,暂时无暇继续完善该项目,有兴趣的大佬可以直接叉,也欢迎在issue区留言或者直接找到作者的联系方式 系统基本介绍 使用Python版本:Python3.6(其中模型评估部分脚本基于Python2.7)使用深度学习框架:Pytorch0.4.1使用模型结构:变压器使用数据集:SQuAD(可扩
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:6291456
    • 提供者:weixin_42131367
  1. SQuAD:建立斯坦福问答数据集的质量检查系统-源码

  2. 队 为斯坦福问答数据集建立质量保证体系( ) 请阅读此博客以获取详细信息: : 第一个文件create_emb.ipynb负责为训练数据集的Wikipedia文章中的所有句子和问题创建一个嵌入句子的字典。 第二个文件unsupervised.ipynb使用句子嵌入来计算句子和问题之间的距离,基于欧几里得和余弦相似度。 最后,它从距问题最短距离的每个段落中提取设置。 目前,它们的准确度分别为45%和63%。 最后一个文件将此问题视为监督学习问题,其中我拟合多项逻辑回归,随机森林和xg
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:9437184
    • 提供者:weixin_42151305
  1. Question-Answering-SQUAD:基于DistilBERT的问答模型,在SQUAD数据集上进行了训练和评估-源码

  2. 问题解答小队 问题回答是回答问题(通常是阅读理解性问题)的任务,但是在遇到无法根据提供的上下文回答的问题时放弃。 我们在此项目中依赖的主要方法是Transformer。 具体来说,我们采用在Masked LM和Next Sentence Prediction上进行了预训练的DistilBERT模型,添加了新的问题解答负责人,并为我们的任务训练了新模型。 我们使用预训练的转换器而不是构建适用于问答任务的特定深度学习模型(LSTM,CNN等)的原因是,我们可以更快地进行开发,并且可以通过使用更少的数
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:150528
    • 提供者:weixin_42098251
  1. emoji-gan-源码

  2. 使用GAN生成带有表情符号的面Kong 设置 我们使用conda来管理我们的依赖项。 使用所需的依赖关系创建一个名为squad的环境,并使用它激活它。 conda env create -f environment.yml conda activate emoji-gan 好去! 图像预处理 为了清理数据集,我们将原始视频帧裁剪为仅包含人脸(使用dlib的人脸检测器),并将它们缩小为128x128图像,以便进行更快的实验。 使用以下命令运行图像预处理: conda activate emo
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:2097152
    • 提供者:weixin_42097533
  1. TranslateAlignRetrieve:来自ccasimiro88的合成QA语料库生成叉子的Translate-Align-Retrieve(TAR)方法-源码

  2. 用于合成QA语料库生成的Translate-Align-Retrieve(TAR)方法 该存储库包含TAR方法的实现,该方法是为将斯坦福大学问答数据集(SQuAD)自动翻译为西班牙语而设计和实现的。 它分为四个文件夹: src/tar :TAR方法的代码 SQuAD-es-v1.1 :SQuAD v1.1培训数据集的西班牙语翻译 SQuAD-es-v2.0 :SQuAD v2.0培训数据集的西班牙语翻译 src/qa :用于根据经过预训练的Multilingual-BERT模型(使用SQuAD
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:35651584
    • 提供者:weixin_42118770
  1. mzutils-源码

  2. 张墨涵的实用工具 这是一个个人实用程序的工具箱,其中包含各种方法来完成与数据清理和预处理有关的杂项工作,尤其是针对JSON,CSV,SQL和许多其他数据格式的数据集,例如SQuAD,GLUE,Deepmind CNN / DailyMail等数据集。 该工具箱的唯一目的是重用代码并使Mohan Zhang的生活更轻松。 整个工具包(无任何规范)均已获得MIT许可。 通过
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:24576
    • 提供者:weixin_42143161
  1. 问题解答:流行的SQuAD数据集的Match-LSTM和Answer指针的TensorFlow实现-源码

  2. Match-LSTM和答案指针(Wang和Jiang,ICLR 2016) 此仓库尝试在同一张纸上重现2016年论文中的match-lstm和answer指针实验。 许多预处理锅炉代码来自Stanford CS224D。 代码的内容在qa_model.py中。 为了使代码正确,我不得不修改tensorflow的原始注意力机制实现。 给定一组段落,运行train.py训练模型,并运行qa_answer.py生成答案。 请通过与我联系以获取更多信息。 该代码还充当示例代码,展示了如何将tens
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:8388608
    • 提供者:weixin_42134285
  1. tflite-android-transformers:借助具有Android演示应用程序的TensorFlow Lite,DistilBERT GPT-2可进行设备上的推理-源码

  2. 具有Android演示的TensorFlow Lite变形金刚 转换从 库,并在Android上使用它们。 如果您正在iOS上寻找《变形金刚》,也可以查看我们的回购。 模型的演示(BERT在GLUE上的性能的97%)已针对SQuAD数据集上的问答进行了微调。 它从数据集中提供48个段落供用户选择。 使用或生成设备上的文本(与相同的蒸馏过程,速度比GPT-2快2倍,小33%) 模型生成 models_generation目录中提供了用于转换模型的示例脚本。 请注意,它们需要夜间版本的Tensor
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:47185920
    • 提供者:weixin_42097914
  1. R-NET-Keras:开放的R-NET实施和详细分析:https:git.iovd8dx-源码

  2. Keras中的R-NET实施 该存储库试图重现在提出的结果。 该报告描述了一个复杂的神经网络,称为旨在回答问题。 描述了详细信息。 R-NET是斯坦福QA数据库上目前最好的单一模型(2017年8月25日): 。 SQuAD数据集使用两个性能指标,完全匹配(EM)和F1分数(F1)。 在测试集上,人类绩效估计为EM = 82.3%和F1 = 91.2%。 该报告描述了R-NET的两个版本: 第一个称为R-NET (Wang et al., 2017) (指尚未在线提供的论文),并且在测试
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:8388608
    • 提供者:weixin_42102713
  1. 数据集:with具有快速,易于使用和高效的数据处理工具的ML模型最大的即用型NLP数据集中心-源码

  2. :hugging_face:Datasets是一个轻量级的库,提供两个主要功能: 一线数据加载器,可用于许多公共数据集:一线可下载和预处理任何 上提供的主要公共数据集(使用467种语言和方言!)。 使用像squad_dataset = load_datasets("squad")这样的简单命令,即可将这些数据集中的任何一个准备好在数据加载器中用于训练/评估ML模型(Numpy / Pandas / PyTorch / TensorFlow / JAX), 高效的数据预处理:对上述公共数据集以
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:28311552
    • 提供者:weixin_42131424
  1. SQUAD2.Q-Augmented-Dataset:问题的SQUAD 2.0的增强版-源码

  2. SQuAD 2.Q-增强数据集 开发人员 Chadha( )和Rewa Sood( ) 这是我们在之上生成的增强数据集的一个版本。 该存储库称为SQuAD 2.Q,因为使用过程仅扩充了SQuAD 2.0数据集中的问题。 使用python脚本(augment.py),可以轻松地将工作扩展到Context段落。 为什么只是问题? SQuAD 2.0是一个数据集,上下文来自维基百科的段落,问题由云工作者编写。 当云工作者编写问题时,它会固有地增加人类云工作者的句法差异和语法用法。 这里的想法
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:37748736
    • 提供者:weixin_42110533
« 12 »