搜索资源 - tokenization-源码 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - tokenization-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

StringToken
String tokenization is defined as the problem that consists of breaking up a string into tokens which are seperated by delimiters. Both tokens and delimiters are themselves strings. Commonly used string structures that require the use of string toke
所属分类：其它
- 发布日期：2006-02-23
- 文件大小：4194304
- 提供者：chenxh

simple_preprocessing:这是使用python进行的简单预处理-源码
简单的预处理这是使用python进行的简单预处理如何使用将其放在同一目录中使用以下命令在文件中导入简单的预处理 import simple_preprocessing import preprocessing 对于proces，您可以使用字符串和数组 _input = "example" data_input = preprocessing ( _input ) 这个简单的预处理流程是cleaning => tokenization => filtering =>
所属分类：其它
- 发布日期：2021-03-17
- 文件大小：2048
- 提供者：weixin_42109178

tokenization-源码
tokenization
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：494592
- 提供者：weixin_42128988

QuestionClassifier：5500标记的问题数据集上的问题分类器-源码
问题分类器问题分类器管道 tokenization->word embedding->sentence vector->training the classifier 提交味精 [your task]: what you did in this commit 例如：“ wordEmbedding：word2vec模型初始化” ...
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：122880
- 提供者：weixin_42140846

ulm-basenet：通过转移学习实现用于文本分类的ULMFit算法的实现-源码
ulm基网实施使用包装。在代码ulmfit.py直接改编自代码。安装 conda create -n ulm_env python=3.6 pip -y source activate ulm_env # pytorch conda install pytorch pytorch=0.3.1 cuda90 -c pytorch -y # spacy (for tokenization) conda install -c conda-forge spacy -y python -m spa
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：14336
- 提供者：weixin_42168902

JapaneseTokenizers：旨在尽可能轻松地使用JapaneseTokenizer-源码
这是什么？这是日语令牌生成器（AKA令牌生成器）的简单python包装器该项目旨在调用令牌生成器，并将句子尽可能容易地拆分为令牌。并且，该项目支持各种Tokenization工具的通用接口。因此，比较各种标记器的输出很容易。也有此项目。如果发现任何错误，请向github问题报告。或任何拉请求是欢迎的！要求 Python 2.7 Python 3.x 在3.5、3.6、3.7中签入产品特点各种令牌生成器之间的简单/通用接口简单/通用接口，用于使用停用词或词性条件进行
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：57344
- 提供者：weixin_42119866

A2L:积极减少神经机器翻译的冗余-源码
自述文件 NAACL-HLT 2021论文的代码为：主动2学习：主动减少序列标记和机器翻译的主动学习方法中的冗余（ACL链接）（Arxiv链接）回购目录结构： . +-- A2L for Seq Tagging | +-- model | +-- scr ipts (9 files) +-- A2L for NMT +-- 3 folders (for each AL strategy) | +-- 5 folders for each method (in
所属分类：其它
- 发布日期：2021-04-01
- 文件大小：944128
- 提供者：weixin_42138545

TOKENIZATION-源码
TOKENIZATION
所属分类：其它
- 发布日期：2021-03-26
- 文件大小：4096
- 提供者：weixin_42109732

pgc-java-client-master-源码
自述文件使用应用程序运行./pgc-generate [mode]并提供所需的参数以生成客户端库。 mode是 java-client生成Java客户端库 tokenization-android创建一个Android tokenization项目，包括一个演示应用程序注意：为使构建成功， --output-dir local.properties --output-dir必须包含一个local.properties文件，该文件将sdk.dir属性设置为有效的Android SDK的位置
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：431104
- 提供者：weixin_42133918