您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于统计的网页正文信息抽取方法

  2. 为了把自然语言处理技术有效的运用到网页文档中,本文提出了一种依靠统计信息,从中文新闻类 网页中抽取正文内容的方法。该方法先根据网页中的HTML 标记把网页表示成一棵树,然后利用树中每个 结点包含的中文字符数从中选择包含正文信息的结点。该方法克服了传统的网页内容抽取方法需要针对不 同的数据源构造不同的包装器的缺点,具有简单、准确的特点,试验表明该方法的抽取准确率可以达到95 %以 上。采用该方法实现的网页文本抽取工具目前为一个面向旅游领域的问答系统提供语料支持,很好的满足了 问答系统的需求。
  3. 所属分类:旅游

    • 发布日期:2009-06-12
    • 文件大小:43008
    • 提供者:hui22021616
  1. IE信息抽取研究综述

  2. 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹——通过系统化、大规模地定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
  3. 所属分类:专业指导

    • 发布日期:2009-07-04
    • 文件大小:186368
    • 提供者:anyupu
  1. 文本挖掘中信息抽取研究综述

  2. 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同, 信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分 支,其独特的发展轨迹——通过系统化、大规模地定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的 有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。 回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。
  3. 所属分类:专业指导

    • 发布日期:2010-01-24
    • 文件大小:399360
    • 提供者:goodskyfly_1876
  1. PDFBox-0.7.3.jar

  2. PDFBox-0.7.3.jar(一种常见的PDF文本抽取工具)
  3. 所属分类:Java

    • 发布日期:2010-06-01
    • 文件大小:3145728
    • 提供者:zhaokaihehe
  1. 非常好用的PDF编辑工具

  2. Foxit PDF Editor 是第一个真正的PDF文件编辑软件。许多人都希望能找到一个象编辑其它类型的文档的编辑器,事实上在 Foxit PDF Editor 出现之前,根本没有这样的工具。每一个PDF 文件都包含很多页面,每一页包含各种可视对象,如文本对象、图形对象和图像对象。而每一个对象都由其属性来定义其显示的方式。 Foxit PDF Editor 的功能包括: -编辑现有 PDF 文件或创建全新的PDF文件。 -以和 Adobe PDF Reader 几乎相同的效果显示 PDF 文
  3. 所属分类:其它

    • 发布日期:2010-07-13
    • 文件大小:2097152
    • 提供者:zheshiyigemi
  1. 全能文本批量替换查找工具7.5

  2. 基本介绍】 字符串的批量查找、替换、抽取和统计 可以批量处理多个文件; 可以批量处理多个串的替换、查找、抽取; 可以处理换行符、制表符等特殊字符的匹配替换; 可以进行通配符、大小写开关、全字匹配甚至正则表达式等特殊模式的匹配替换; 可以实现批量修改、删除、增加、重复、移位等; 可以保存替换定义方案并反复使用; 除了支持TEXT、HTML格式,还支持WORD、EXCEL、POWERPOINT格式; 除了支持文件内容批量替换,还可以对文件名批量改名、编号;
  3. 所属分类:其它

    • 发布日期:2011-03-21
    • 文件大小:1048576
    • 提供者:gdliujiang
  1. 文本抽取小工具

  2. 当你想在一个文本文件中抽取出出现某字符串时,是否反感自己一行行得找?用这个工具就可以解决问题^_^,当然还可以进行改进,改成match regexp
  3. 所属分类:C#

    • 发布日期:2008-03-29
    • 文件大小:20480
    • 提供者:powerlly
  1. PowerGrep文本批量抽取工具

  2. 很好用的语料库工具,或者说是批量文本抽取工具。
  3. 所属分类:专业指导

    • 发布日期:2011-03-30
    • 文件大小:11534336
    • 提供者:zhangbc1
  1. Flash 工具包 swftools-0.9.1

  2. SWFTools 是一组用来处理 Flash 的 swf 文件的工具包,包括: 1. 合并工具 swfcombine 2. 抽取工具 swfextract 3. PDF/JPEG/PNG/AVI/TTF/WAV 到 SWF 的转换工具 :pdf2swf, jpeg2swf, png2swf, avi2swf, font2swf, and wav2swf| 4. 文本解析工具 swfstrings 5. SWF 解析器 swfdump 6. SWF 读写库 rfxswflib 一个简单的将PDF
  3. 所属分类:Web开发

    • 发布日期:2011-12-08
    • 文件大小:13631488
    • 提供者:huxiao9467
  1. Excel新增工具集

  2. Microsoft Office Excel 新增系列工具 帮 助 文 件 一、必要条件: 请确认您安装了Microsoft Office Excel2003、2007或2010非简装版,系统平台是:Winxp/vista/win7/2000/2003/2008。 二、功能介绍: 本软件以插件形式安装到Microsoft Office Excel的COM组件中,在菜单栏(Excel2003)或加载项(Excel2007和Excel2010)中增加“新增工具”菜单,使得Excel增加了如下十四大
  3. 所属分类:嵌入式

    • 发布日期:2011-12-20
    • 文件大小:2097152
    • 提供者:w781010
  1. ETL工具Kettle用户手册

  2. 目录 Kettle 3.0 用户手册 ...................................................................................................................... 1 Kettle 3.0 用户手册 .............................................................................................
  3. 所属分类:Oracle

    • 发布日期:2012-02-09
    • 文件大小:10485760
    • 提供者:chenbb110
  1. pdfbox-1.6.0

  2. pdfbox-1.6.0 PDF文本抽取工具,用Lucene处理pdf必备
  3. 所属分类:Java

    • 发布日期:2012-04-04
    • 文件大小:7340032
    • 提供者:pengpeng2046
  1. dul8/9/10.2.0.4

  2. DUL是Data Unloader的缩写,为Oracle公司工程师 Bernard van Duijnen 开发,以标准C写成,可以直接从Oracle的数据文件中读取数据,转换为DMP或文本格式输出,在特殊情况下可以用来进行数据恢复。 这些特殊情况主要指,数据库没有有效备份、或者系统表空间损坏,或者在非归档模式下的不可逆数据损失等等,一旦普通手段失去作用,DUL就可以作为最后一招来最大限度的挽救用户数据。 然而DUL并非一个商业工具,这个工具仅在Oracle内部流通,但是逐渐的,DUL也开始流
  3. 所属分类:Oracle

    • 发布日期:2012-06-29
    • 文件大小:311296
    • 提供者:jycjyc
  1. Tika in Action

  2. 文本抽取工具,目前可以抽取出RAR文件以外几乎所有文件的文本信息。编程语言为java
  3. 所属分类:其它

    • 发布日期:2013-01-29
    • 文件大小:15728640
    • 提供者:askmen2009
  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3145728
    • 提供者:vcfriend
  1. 文本挖掘技术

  2. 第一章:引言 第二章:文本特征提取技术 第三章:文本检索技术 第四章:文本自动分类技术 第五章:文本自动聚类技术 第六章:话题检测跟踪技术 第七章:文本过滤技术 第八章:关联分析技术 第九章:文档自动摘要技术 第十章:信息抽取 第十一章:智能问答(QA)技术 第十二章:文本情感分析技术 第十三章:Ontology 第十四章:半结构化文本挖掘方法 第十五章:文本挖掘工具与应用
  3. 所属分类:其它

    • 发布日期:2014-07-25
    • 文件大小:12582912
    • 提供者:mashu999
  1. tika-app-1.14 文本解析文件内容抽取

  2. Tika是Apache下开源的文档内容解析工具,支持上千种文档格式(如PPT、XLS、PDF)。Tika使用统一的方法对各种类型文件进行内容解析,封装了各种格式解析的内部实现,可用于搜索引擎索引、内容分析、转换等场景。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-05-10
    • 文件大小:55574528
    • 提供者:weixin_37895613
  1. 文本挖掘技术

  2. 第一章:引言 第二章:文本特征提取技术 第三章:文本检索技术 第四章:文本自动分类技术 第五章:文本自动聚类技术 第六章:话题检测跟踪技术 第七章:文本过滤技术 第八章:关联分析技术 第九章:文档自动摘要技术 第十章:信息抽取 第十一章:智能问答(QA)技术 第十二章:文本情感分析技术 第十三章:Ontology 第十四章:半结构化文本挖掘方法 第十五章:文本挖掘工具与应用
  3. 所属分类:其它

    • 发布日期:2018-08-10
    • 文件大小:12582912
    • 提供者:qq_38327551
  1. Delphi软件国际化工具集

  2. 可以方便实现Delphi和BCB开发的软件实现国际化目标. 全部为开源免费. 工具集中包含如下几个部分: 1. gnugettext.pas的使用说明 -- manual(GnuGetText.pdf); 2. gnugettext.pas源代码; 3. ggt-translate-setup.exe -- 从包含Delphi和BCB源代码的目录中抽取文本的工具包(Win10下可以正常使用, 解决dxgettext-1.2.2.exe的问题); 4. Poedit-2.3.5890-setup
  3. 所属分类:Delphi

    • 发布日期:2020-04-26
    • 文件大小:25165824
    • 提供者:houdw2006
  1. Txt综合处理工具

  2. 一个综合文本处理工具,包括文本去重,文本拆分,文本合并,文本信息抽取等
  3. 所属分类:Java

    • 发布日期:2019-03-07
    • 文件大小:533504
    • 提供者:weixin_44738231
« 12 3 4 5 6 7 8 »