搜索资源 - fasttext训练数据 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - fasttext训练数据

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

keras示例程序
addition_rnn.py 执行序列学习以执行两个数字（作为字符串）的添加。 antirectifier.py 演示如何为Keras编写自定义图层。 babi_memnn.py 在bAbI数据集上训练一个内存网络以进行阅读理解。 babi_rnn.py 在bAbI数据集上训练一个双支循环网络，以便阅读理解。 cifar10_cnn.py 在CIFAR10小图像数据集上训练一个简单的深CNN。 conv_filter_visualization.py 通过输入空间中的渐变上升可视化 VGG1
所属分类：深度学习
- 发布日期：2017-10-23
- 文件大小：10485760
- 提供者：manoerina0411

fasttext.rar
新闻主题分类数据集，数据集的优点是训练和测试样本都很大，训练12万，测试集也有12万，标注效果好，标注准确率达到了95%。
所属分类：深度学习
- 发布日期：2019-05-24
- 文件大小：190840832
- 提供者：qianyongismydream

cooking.stackexchange.tar.gz
Stack exchange 网站的烹饪部分下载问题示例及其相应标签数据集，用于fastText模型训练
所属分类：机器学习
- 发布日期：2019-06-02
- 文件大小：457728
- 提供者：cymy001

采用fasttext对文本公告进行分类
该代码文件包括以下几个部分：（1）nlp_utils.py 数据功能处理函数（2）fast_text_train.py 训练代码（3）fast_text_predict.py 利用meta模型预测代码（4）frozen_graph.py 模型固化及预测代码（5）saves 训练得到的模型文件（6）word2id_dict.txt、label2id_dict.txt 训练时得到的字典文件
所属分类：深度学习
- 发布日期：2020-07-08
- 文件大小：85983232
- 提供者：jingyi130705008

fasttext训练数据集
Bag of Tricks for Efficient Text Classification, fastText Unofficial PyTorch Implementation of "Bag of Tricks for Efficient Text Classification", 2016, A. Joulin, E. Grave, P. Bojanowski, and T. Mikolov
所属分类：深度学习
- 发布日期：2020-11-11
- 文件大小：835715072
- 提供者：zhaolanyi

L25词嵌入进阶GloVe模型
词嵌入进阶在“Word2Vec的实现”一节中，我们在小规模数据集上训练了一个 Word2Vec 词嵌入模型，并通过词向量的余弦相似度搜索近义词。虽然 Word2Vec 已经能够成功地将离散的单词转换为连续的词向量，并能一定程度上地保存词与词之间的近似关系，但 Word2Vec 模型仍不是完美的，它还可以被进一步地改进：子词嵌入（subword embedding）：FastText 以固定大小的 n-gram 形式将单词更细致地表示为了子词的集合，而 BPE (byte pair encod
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：82944
- 提供者：weixin_38697940

OGeek-源码
lgb 代码入口：sh base_run.sh。写了很多冗余特征，跑起来非常慢，需要做一下特征选择。线上提交后0.7154。代码中用到了分词和词向量，需要将切词的代码换成自己的切词代码，需要自己提供词向量。我的预训练向量是之前使用百科文本作为预料利用FastText训练出来的。恩数据准备：python3 data / data_preprocess.py。代码入口：python3 src / run_model.py train / pred。写了两个网络cnn_network_
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：617472
- 提供者：weixin_42131790

Amazon Reviews for Sentiment Analysis-数据集
该数据集由数百万个Amazon客户评论（输入文本）和星级（输出标签）组成，用于学习如何训练fastText进行情感分析。这里的想法是数据集不仅仅是玩具-合理规模的真实业务数据-但可以在适度的笔记本电脑上在几分钟内进行训练。 Amazon Reviews for Sentiment Analysis_datasets.zip
所属分类：其它
- 发布日期：2021-03-17
- 文件大小：516947968
- 提供者：weixin_38675969

Natural-Language-Processing-源码
自然语言处理 bentrevett的pytorch教程。 하였고정수，한국어로설명을다。讲解 1- Pytorch的torchtext的照片。 torchtext데이데이스（IMDb数据集）current递归神经网络（RNN）영화의가가정적인리뷰인지，부정적인리뷰인지를다。加载数据，创建训练/测试/验证拆分，构建词汇表，创建数据迭代器，定义模型并实施训练/评估/测试循环。 performance이가학습하기튜토리얼이므로性能가좋지않습니다。 2- 1구현한工作流程변형하여정확도
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：368640
- 提供者：weixin_42159267

COVID-19WordEmbeddings:COVID-19阿拉伯语词嵌入是COVID-19 Tweets的特定于领域的预训练分布式词表示，旨在为阿拉伯语NLP研究社区提供免费使用和功能强大的词嵌入模型-源码
COVID-19阿拉伯文字嵌入我们利用从2020年1月到2020年4月的收集的整个COVID-19数据集构建了单词向量模型。通过删除转发和重复的推文，我们最终获得了2,821,940条推文。我们考虑两种值得注意的词嵌入生成方法：word2vec和FastText。使用这些特定于域的预训练词嵌入模型（COVID-19）将比在AI任务中使用其他通用的预训练词嵌入模型更为准确。引文如果您想使用我们的预训练模型，请使用以下bibtext引用此工作： article{alqurashi202
所属分类：其它
- 发布日期：2021-03-14
- 文件大小：2048
- 提供者：weixin_42131439

AnalogyDataset:用于类比知识探测的数据集-源码
类比数据集用于类比知识探测的数据集： SAT风格的类比测试：单词对列表：剧本：从检索wiki-common-word-pairs，这是在Wikipedia转储中对选定单词对进行训练的单词对嵌入模型。：使用类比测试数据集和wiki-common-word-pairs的单词对，使用FastText计算在Wikipedia上的。 usage: get_relative_embedding.py [-h] [-o OUTPUT] [-w WINDOW_SIZE] [--minimum-
所属分类：其它
- 发布日期：2021-03-12
- 文件大小：8192
- 提供者：weixin_42168230

SEED-源码
SE_ASTER 介绍这是论文“ SEED：用于场景文本识别的语义增强的编码器-解码器框架”的实现。此代码基于，我们衷心感谢ayumiymk的出色回购和帮助。如何使用环保 PyTorch == 1.1.0 torchvision == 0.3.0 fasttext == 0.9.1 详细信息可以在requests.txt中找到火车准备数据从下载预训练的语言模型（bin）更新lib / tools / create_all_synth_lmdb.py中的路径运行lib / to
所属分类：其它
- 发布日期：2021-03-12
- 文件大小：91136
- 提供者：weixin_42122988

rda:“ Rissanen数据分析代码”-源码
Rissanen数据分析下面，我们将逐步介绍用于产生结果的过程。要了解我们如何在数据集上训练模型，请浏览自述文件以查看我们用来训练该模型的bash代码段和python脚本。要查看训练模型后如何计算最小描述长度，请参阅scr ipts/plot_results_prequential.ipynb 。代码概述： film/ ：用于在CLEVR上训练FiLM模型的代码（从修改） transformers/ ：用于训练其他基于变压器的模型的代码（从修改） scr ipts/ ：用于
所属分类：其它
- 发布日期：2021-03-07
- 文件大小：9437184
- 提供者：weixin_42125867

DME：用于改进语句表示的动态元嵌入-源码
用于改进语句表示的动态元嵌入的论文代码和模型。要求 Python 2.7或3.6+ PyTorch> = 0.4.1 火炬文本> = 0.2.3 火炬视觉> = 0.2.1 空间> = 2.0.11 NumPy> = 1.14.0 jsonlines tqdm 六入门下载数据首先，您应该准备好经过预训练的嵌入和经过预处理的数据集。对于嵌入，运行 python get_embeddings.py --embeds fasttext,glov
所属分类：其它
- 发布日期：2021-03-04
- 文件大小：36864
- 提供者：weixin_42128270

atmt：机器翻译的方法-源码
atmt 机器翻译的方法在tatoeba英语到西班牙语数据集上测试了不同的新机器翻译算法。目前已实施： seq2seq.py-RNN编码器和解码器，请注意，无需预先训练的嵌入。 seq2seq_embeddings.py-RNN编码器和解码器，注意FastText嵌入。 rql.py-具有代理在线翻译的循环Q学习算法。设置： git clone https://github.com/grypesc/atmt cd atmt && mkdir data python3 -m ven
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：19456
- 提供者：weixin_42101237

监督产品相似度：:balance_scale:神经网络，用于对两个产品标题是否代表同一实体进行分类-源码
产品匹配神经网络用法 iPython Notebook旨在用作神经网络的测试平台。 TestingGrounds.ipynb只是了解不同功能和模型的地方。这也是我在将新代码放入实际python文件之前编写新代码的地方。 torch_train_model.py是在哪里训练模型。 TestingModels.ipnb.py允许您测试自己的不同标题/字符串，以查看模型的性能如何。 src目录是用于创建数据和生成模型的函数。 models目录包含到目前为止已训练的不同模型，以及fastTe
所属分类：其它
- 发布日期：2021-02-16
- 文件大小：57344
- 提供者：weixin_42097967

bnlp：BNLP是孟加拉语的自然语言处理工具包-源码
孟加拉自然语言处理（BNLP） BNLP是孟加拉语的自然语言处理工具包。该工具将帮助您标记孟加拉语文本，嵌入孟加拉语单词，孟加拉语POS标签，孟加拉语名称实体识别，构造孟加拉语NLP的神经模型。安装 PIP安装程序（Python：3.5、3.6、3.7、3.8已通过测试，操作系统：Linux，Windows已通过测试） pip install bnlp_toolkit 或升级 pip install -U bnlp_toolkit 预训练模型下载链接训练细节用孟加拉语维基百科转储数
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：11534336
- 提供者：weixin_42136365

nlp-tutorial：NLP（自然语言处理）教程列表-源码
NLP教程在PyTorch上构建的NLP（自然语言处理）教程列表。目录有关如何实现和适应简单的实词NLP任务的分步教程。文字分类此仓库提供了带有简单注释的简单PyTorch文本分类实现。在这里，我们使用Huffpost新闻语料库，包括相应的类别。在此数据集上训练的分类模型基于新闻标题和描述来识别新闻文章的类别。关键字： CBoW，LSTM，fastText，文本文字化此文本分类教程在IMDb电影评论数据集上训练了一个变压器模型，用于情感分析。它提供了带有简单注释的简单PyT
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：1009778688
- 提供者：weixin_42119866

基于FastText的短文本分类
在大数据背景下，如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标，对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候，根据用户提出的直接或者间接的信息来快速判断用户的真实意图，过滤无用冗余信息后返回一个概率最大答案给用户。FastText是Facebook AI Research推出的文本分类和词训练工具，它的最大特点是模型简单并且在文本分类的准确率上，和现有的深度学习的方法效果相近，即在保证了准确率的情况下大大缩短了分类时间。
所属分类：其它
- 发布日期：2021-01-12
- 文件大小：1048576
- 提供者：weixin_38659648