您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. StringToken

  2. String tokenization is defined as the problem that consists of breaking up a string into tokens which are seperated by delimiters. Both tokens and delimiters are themselves strings. Commonly used string structures that require the use of string toke
  3. 所属分类:其它

    • 发布日期:2006-02-23
    • 文件大小:4194304
    • 提供者:chenxh
  1. simple_preprocessing:这是使用python进行的简单预处理-源码

  2. 简单的预处理 这是使用python进行的简单预处理 如何使用 将其放在同一目录中 使用以下命令在文件中导入简单的预处理 import simple_preprocessing import preprocessing 对于proces,您可以使用字符串和数组 _input = "example" data_input = preprocessing ( _input ) 这个简单的预处理流程是cleaning => tokenization => filtering =>
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:2048
    • 提供者:weixin_42109178
  1. tokenization-源码

  2. tokenization
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:494592
    • 提供者:weixin_42128988
  1. QuestionClassifier:5500标记的问题数据集上的问题分类器-源码

  2. 问题分类器 问题分类器 管道 tokenization->word embedding->sentence vector->training the classifier 提交味精 [your task]: what you did in this commit 例如:“ wordEmbedding:word2vec模型初始化” ...
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:122880
    • 提供者:weixin_42140846
  1. ulm-basenet:通过转移学习实现用于文本分类的ULMFit算法的实现-源码

  2. ulm基网 实施使用包装。 在代码ulmfit.py直接改编自代码。 安装 conda create -n ulm_env python=3.6 pip -y source activate ulm_env # pytorch conda install pytorch pytorch=0.3.1 cuda90 -c pytorch -y # spacy (for tokenization) conda install -c conda-forge spacy -y python -m spa
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:14336
    • 提供者:weixin_42168902
  1. JapaneseTokenizers:旨在尽可能轻松地使用JapaneseTokenizer-源码

  2. 这是什么? 这是日语令牌生成器(AKA令牌生成器)的简单python包装器 该项目旨在调用令牌生成器,并将句子尽可能容易地拆分为令牌。 并且,该项目支持各种Tokenization工具的通用接口。 因此,比较各种标记器的输出很容易。 也有此项目。 如果发现任何错误,请向github问题报告。 或任何拉请求是欢迎的! 要求 Python 2.7 Python 3.x 在3.5、3.6、3.7中签入 产品特点 各种令牌生成器之间的简单/通用接口 简单/通用接口,用于使用停用词或词性条件进行
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:57344
    • 提供者:weixin_42119866
  1. A2L:积极减少神经机器翻译的冗余-源码

  2. 自述文件 NAACL-HLT 2021论文的代码为: 主动2学习:主动减少序列标记和机器翻译的主动学习方法中的冗余 (ACL链接)(Arxiv链接) 回购目录结构: . +-- A2L for Seq Tagging | +-- model | +-- scr ipts (9 files) +-- A2L for NMT +-- 3 folders (for each AL strategy) | +-- 5 folders for each method (in
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:944128
    • 提供者:weixin_42138545
  1. TOKENIZATION-源码

  2. TOKENIZATION
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:4096
    • 提供者:weixin_42109732
  1. pgc-java-client-master-源码

  2. 自述文件 使用应用程序 运行./pgc-generate [mode]并提供所需的参数以生成客户端库。 mode是 java-client生成Java客户端库 tokenization-android创建一个Android tokenization项目,包括一个演示应用程序注意:为使构建成功, --output-dir local.properties --output-dir必须包含一个local.properties文件,该文件将sdk.dir属性设置为有效的Android SDK的位置
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:431104
    • 提供者:weixin_42133918