您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 预处理命令的学习心得.txt

  2. 宏定义、文件包含、条件编译 编译器在处理这个代码之前会对MAXTIME进行处理替换为1000。 在这里define的定义可以说是简单的文本替换 2.define的“函数定义” define可以像函数那样接受一些参数,如下 #define max(x,y) (x)>(y)?(x):(y); 但是这样做的话存在隐患,例子如下: #define Add(a,b) a+b; 在一般使用的时候是没有问题的,但是如果遇到如:c * Add(a,b) * d的时候就会出现问题,代数式的本意是a+b然后
  3. 所属分类:C

    • 发布日期:2009-05-31
    • 文件大小:2048
    • 提供者:xo_zhang
  1. LINUX处理文本命令

  2. LINUX处理文本命令 处理文本和文本文件的命令 一. sort 文件排序, 通常用在管道中当过滤器来使用. 这个命令可以依据指定的关键字或指定的字符位置, 对文件行进行排序. 使用-m选项, 它将会合并预排序的输入文件. 想了解这个命令的全部参数请参考这个命令的info页. 二. tsort 拓扑排序, 读取以空格分隔的有序对, 并且依靠输入模式进行排序. 三. uniq 这个过滤器将会删除一个已排序文件中的重复行. 这个命令经常出现在sort命令的管道后边. 四. expand, unex
  3. 所属分类:Linux

    • 发布日期:2009-06-04
    • 文件大小:8192
    • 提供者:lengyuedao123
  1. 多用途文本文件预处理工具

  2. FMPP is a general-purpose text file preprocessor tool that uses FreeMarker templates. It is particularly designed for HTML preprocessor, for the generation of complete (static) home-pages: directory structure that contains HTML-s, image files, etc.
  3. 所属分类:Web开发

    • 发布日期:2009-09-07
    • 文件大小:4194304
    • 提供者:cys_web
  1. C#处理文本文件和打印和打印预览

  2. C#处理文本文件和打印和打印预览,非常有用
  3. 所属分类:C#

    • 发布日期:2009-09-16
    • 文件大小:92160
    • 提供者:kevinbright
  1. 重载(文件对话框)CFileDialog类并自定义控件

  2. 这个工程用VS2008生成,实现了对文件对话框(CFileDialog)类的派生,可以在自己的文件对话框中加入自己想要的控件,并可定位原文件对话框位置(用ID为stc32的控件定位). 这样就可以方便地实现文件预览:比如文件预览,文本内容预览等等.
  3. 所属分类:C++

    • 发布日期:2010-10-13
    • 文件大小:73728
    • 提供者:xiaohuh421
  1. 在文本压缩中联合使用LZSS和LZW

  2. 摘要本文分析了艺和刀算法在文本压缩中各自的长处和不足, 以它们的实用算法和】的中文文本改进算法 公资和为基础, 设计了联合使用和, 原理的飞从义算法。算法具有良好的通用性、实时性, 对个各种长度 的样本文本文件取得的压缩比均高于比和」, 高出幅度分别达到一。算法无须任何预处理, 并可用于压缩其它文字的 文本文件。
  3. 所属分类:其它

    • 发布日期:2010-10-19
    • 文件大小:284672
    • 提供者:sd_junxi
  1. C标准库函数(头文件索引)0分放送

  2. 一下是从pdf复制的全部内容,没有帐号的也可以看到,不过pdf中有相应的链接,使用方便一些而已,enjoy! C标准库 C标准库.........................................................................................................................................1 1 输入与输出 .....................................
  3. 所属分类:C

    • 发布日期:2010-11-07
    • 文件大小:293888
    • 提供者:wzwahl36
  1. VS.NET 2005 C#webprintpreview打印预览控件

  2. 本控件可以在Visual Studio系列的开发环境下使用,支持C/S结构的应用程序,也支持B/S结构的应用程序。实现Web环境下的打印预览。本控件提供大量的属性与方法,可以处理文本信息,图形信息、表格信息的打印预览功能,在应用程序的开发过程中可以对Visual Studio环境下的各种表格控件进行直接的打印预览,方便数据信息的预览与打印。 文本信息:处理各种文字信息,主要分标题信息、普通文字信息、文字段落信息,根据当前坐标位置显示各种样式的文字信息,自定义文字的样式与颜色、字体大小。可以满足
  3. 所属分类:Web开发

    • 发布日期:2010-11-23
    • 文件大小:2097152
    • 提供者:sunlei638
  1. Java写的多语言预处理器

  2. 简介: 类似于C的预处理,可以根据定义的变量,在后面的条件判断中,取舍不同代码段。 适用于:需要生成多个版本,根据不同的变量,环境等。 例如:针对不同移动设备,因为大部分代码可以共用,需要针对不同设备设置不同的参数。 特点: 1.可以使用 命令行,GUI,Ant Task来运行 2.适用任何纯文本文件。支持有单行注释的代码源文件。可以自定义注释字符,来支持更多的代码源文件。 3.支持布尔,整形,浮点,字符型数据类型 4.支持语法检查 5.支持代码导出(生成新版本根据预处理变量)和 非导出(仅注
  3. 所属分类:Java

    • 发布日期:2011-03-21
    • 文件大小:45
    • 提供者:adolfdi
  1. 文本的预处理程序,包括如何断句等(非常准确)

  2. 1. 删除文件中的中文、西文空格 2. 将篇章切分为一个个的句子,切分标志为:。 ! ? … ;等,句中如果有引号,要求左右匹配 3. 对句子按长度从大到小分行排序。 4. 在每行句子前加上序号 5. 统计一个文件中各种长度的句子的频次,按照句长频次降序输出统计结果
  3. 所属分类:专业指导

    • 发布日期:2009-03-03
    • 文件大小:319488
    • 提供者:u010640524
  1. matlab开发-为日文文本预处理管道

  2. matlab开发-为日文文本预处理管道。此工具箱预处理日语文本文件(GUI)
  3. 所属分类:其它

    • 发布日期:2019-08-24
    • 文件大小:719872
    • 提供者:weixin_38744207
  1. plagiarism_detection:窃检测器,用于检查文本文件并执行二进制分类; 将文件标记为抄袭还是不抄袭,取决于文本文件与提供的源文本的相似程度-源码

  2. 抄袭项目,机器学习部署 该存储库包含用于使用AWS SageMaker部署a窃检测器的代码和相关文件。 项目概况 在这个项目中,您将负责构建a窃检测器,该检测器将检查文本文件并执行二进制分类。 根据该文本文件与提供的源文本的相似程度,将该文件标记为抄袭或不抄袭。 侦查窃是一个活跃的研究领域。 这项任务很艰巨,解释的答案和原始作品之间的差异通常并不那么明显。 该项目将分为三个主要笔记本: 笔记本1:数据探索 加载of窃文本数据的语料库。 探索现有的数据功能和数据分布。 这第一台笔记本是不是
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:512000
    • 提供者:weixin_42137032
  1. TextClassificationSystem:系统的介绍如何构建一个完整的文本分类系统,包括数据预处理,主要方法的原理介绍和实现细节,实验结果与分析,网页演示的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:htt

  2. 文字分类系统 系统的介绍如何构建一个完整的文本分类系统,包括数据预处理,主要方法的原理介绍和实现细节,实验结果与分析,网页演示的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏: :
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:6291456
    • 提供者:weixin_42127835
  1. ucto:Unicode标记器。 Ucto标记文本文件:将单词与标点符号分开,并拆分句子。 它提供了其他几个基本的预处理步骤,例如更改大小写,您都可以使用它们使文本适合进一步处理,例如索引,词性标记或机器翻译。 Ucto带有针对多种语言的标

  2. Ucto-基于规则的令牌生成器 Centre for Language and Speech technology, Radboud University Nijmegen Induction of Linguistic Knowledge Research Group, Tilburg University 网址: : Ucto标记文本文件:将单词与标点符号分开,并拆分句子。 这是几乎所有自然语言处理应用程序的首要任务之一。 Ucto提供了其他几个基本的预处理步骤,例如更改大小写,您都可
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:454656
    • 提供者:weixin_42169674
  1. 构件:用于文本预处理的构件-源码

  2. 建筑模块 以下是我们在文本语料库实验室中使用的语料库工具的列表。 它们旨在作为通用的构建基块,允许我们在不同流程之间进行转换。 每个工具都应视为独立工具,并且包括代码( ~/code )和文档( ~/docs )。 ~/code所有工具的合并的requirements.txt文件。 该文档将包括有关代码用途以及如何运行代码的说明。 先决条件 所有脚本均遵循我们的标准和指令。 剧本 所有脚本命令均以PowerShell语法显示。 如果您使用其他外壳程序,则语法会有所不同。 在任何脚本的前面添加
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:21504
    • 提供者:weixin_42116805
  1. 工具:专门用于NLP的预处理和postititing工具(bash,perl,python)-源码

  2. 预处理和发布工具,特别是用于NLP的 自然语言处理သုတေသနအရင်ဆုံး文本文件တွေကို清理လုပ်တာ, 编码ပြောင်းတာ, ရှိနေတဲ့格式ကိုကိုယ်လိုချင်တဲ့ပုံစံဖြစ်အောင် စာလုံးတွေ, စသည်ဖြင့်လုပ်ရတဲ့အလုပ်တွေက 实验နေ့စဉ်လိုလိုshell,perl(Python语言)နဲ့ တစ်ခါတလေမှာ格式နောက်တခြား格式နောက်တခြားပြောင်းဖို့အတွက်ရေးလိုက်
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:12582912
    • 提供者:weixin_42120283
  1. NLP-Flask网站:一个用于所有NLP任务的简单Flask网站,包括文本预处理,关键字提取,文本摘要等。创建日期:2019年1月30日-源码

  2. 建立日期:2019年1月30日 NLP-Flask网站 静态文件夹包含所有CSS和图像模板文件夹包含所有HTML页面api.py文件包含到HTML页面和python脚本的所有路由注意:如果您对FLASK和webapp不太了解,请访问: : 执行 运行api.py 运行代码后,打开它给您的URL 多田!! 网络应用程序将打开! 仍然对如何运行感到困惑? 好吧,然后打开您的终端, cd $python api.py 它会给打开一个链接单击,该Web应用程序将在您的Web浏览器中打开。
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:12582912
    • 提供者:weixin_42102220
  1. TextCluster:短文本聚类预处理模块-源码

  2. 短文本聚类 项目介绍 短文本聚类是常用的文本预处理步骤,可以用于洞察文本常见模式,分析设计语义解析规范,加速相似句子查询等。本项目实现了内存友好的短文本聚类方法,并提供了相似句子查询接口。 依赖库 点安装tqdm解霸 使用方法 聚类 python cluster.py --infile ./data/infile \ --output ./data/output 具体参数设置可以参考cluster.py文件内_get_parser()函数参数说明,包含设置分词词典,重置词,匹配采样数,匹配度阈值
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42131414
  1. torchtext-summary:torchtext摘要:torchtext使用总结,从零开始逐步实现了torchtext文本预处理,包括截断补长,词表排列,使用预训练词向量,可以使用PyTorch的可迭代数据等步骤。并结合Pytorch

  2. torchtext的使用总结,并结合Pytorch实现LSTM 版本说明 PyTorch版本:0.4.1 火炬文字:0.2.3 python:3.6 文件说明 Test-Dataset.ipynb Test-Dataset.py使用torchtext进行文本预处理的笔记本和py版。 Test-Dataset2.ipynb使用Keras和PyTorch进行数据集进行文本预处理。 Language-Model.ipynb使用gensim加载预训练的词向量,并使用PyTorch实现语言模型。
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:44032
    • 提供者:weixin_42131890
  1. nlp-in-practice:用于解决实际文本数据问题的入门代码。 包括:Gensim Word2Vec,短语嵌入,具有逻辑回归的文本分类,具有pyspark的单词计数,简单的文本预处理,预训练的嵌入等等-源码

  2. NLP实践 使用这些NLP,文本挖掘和机器学习代码示例和工具来解决现实世界中的文本数据问题。 笔记本/来源 第一列中的链接将您带到带有源代码的子文件夹/存储库。 任务 相关文章 来源类型 描述 python脚本 使用PySpark提取大量数据的短语。 使用这些短语注释文本或将这些短语用于其他下游任务。 python脚本+笔记本 使用字数统计或tfidf可视化热门关键字 笔记本 如何正确使用Word2Vec以获得所需的结果 python脚本 如何使用PySpark读取带有字数示例的不同格式的文件
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:97517568
    • 提供者:weixin_42172204
« 12 3 4 5 6 7 8 9 10 ... 33 »