搜索资源 - 抽取中文 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 抽取中文

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

基于统计的网页正文信息抽取方法
为了把自然语言处理技术有效的运用到网页文档中,本文提出了一种依靠统计信息,从中文新闻类网页中抽取正文内容的方法。该方法先根据网页中的HTML 标记把网页表示成一棵树,然后利用树中每个结点包含的中文字符数从中选择包含正文信息的结点。该方法克服了传统的网页内容抽取方法需要针对不同的数据源构造不同的包装器的缺点,具有简单、准确的特点,试验表明该方法的抽取准确率可以达到95 %以上。采用该方法实现的网页文本抽取工具目前为一个面向旅游领域的问答系统提供语料支持,很好的满足了问答系统的需求。
所属分类：旅游
- 发布日期：2009-06-12
- 文件大小：43008
- 提供者：hui22021616

Ｗｅｂ表格信息抽取研究综述
对Web中的信息抽取技术的详细论述，包含了诸如中文分词，检索等的算法和理论方面。
所属分类：Web开发
- 发布日期：2009-08-19
- 文件大小：807936
- 提供者：whatsthat

Spring-OSGI 1.0 M3 中文手册
Spring是一个全功能的Java/JEE应用框架。它提供了一个轻量级的容易和一个用于依赖注入的非侵入式编程模块，AOP功能和便携式服务抽取。OSGI服务平台提供了一个动态应用执行环境，模块能随时被加载，更新或卸载。当然它对模块和版本控制有很好的支持。 Spring Dynamic Modules使编写一个部署在OSGI执行环境中的Spring应用变得简单，它能利用OSGI框架提供的服务。Spring的osgi支持也使构建在Spring框架中的OSGI应用开发变得更简单，更高产。对于企业级应用
所属分类：Java
- 发布日期：2009-09-15
- 文件大小：159744
- 提供者：johney521

中文文本分类中特征抽取方法的比较研究.pdf
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率 DF、信息增益 IG、互信息 MI、 χ2 分布 CHI四种不同的特征选取方法。采用支持向量机(SVM)和 KNN 两种不同的分类器以考察不同抽取方法的有效性。实验结果表明 ,在英文文本分类中表现良好的特征抽取方法( IG、 MI和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因 ,并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特
所属分类：专业指导
- 发布日期：2009-12-06
- 文件大小：348160
- 提供者：shiyoumaomao

共现和互信息技术论文
共现和互信息的一些论文，主要是应用！共现和互信息常用于数据抽取和中文信息处理中！里面包含相关的一些论文都是PDF的，看看还可以照做。共现和互信息的一些论文，主要是应用！
所属分类：专业指导
- 发布日期：2010-02-19
- 文件大小：5242880
- 提供者：wenming606

基于GATE的中文专利摘要的抽取
论文利用开源抽取工具gate 中科院分词工具ICTCLAS 对摘要的批量提取
所属分类：其它
- 发布日期：2010-03-02
- 文件大小：503808
- 提供者：wly_luffy

基于本体的专利摘要知识抽取球
采用知识工程的方法，对“新能源汽车”中文专利摘要进行研究分析，提出一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则，并利用这些规则对专利摘要进行知识抽取结果，抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库进行尝试，验证基于本体对专利摘要进行知识抽取的可行性。
所属分类：专业指导
- 发布日期：2010-03-02
- 文件大小：610304
- 提供者：wly_luffy

Lucene.Net2.X中文注释版源码
What’s Lucene Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能. Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能. 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅是一个工具,一个Library.你也可以把它理解为一个将索引,搜索功能封装的很好的一套简单易用的API.利用这套API你可以做很多有关搜索的事情,而且很
所属分类：C#
- 发布日期：2010-03-24
- 文件大小：596992
- 提供者：shengbinjiang

Lucene.Net2.3.China中文注（个别连接超时）
Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能. Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能. 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅是一个工具,一个Library.你也可以把它理解为一个将索引,搜索功能封装的很好的一套简单易用的API.利用这套API你可以做很多有关搜索的事情,而且很方便. Lucene可以对任
所属分类：C#
- 发布日期：2010-03-29
- 文件大小：687104
- 提供者：shengbinjiang

LJCorpus中文语料库分析软件
LJCorpus试用版本下载地址下载地址：http://www.lingjoin.com/download/LJCorpus.rar 介绍： LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统，应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术，目前，东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析，极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括： 1. 新词发现：
所属分类：专业指导
- 发布日期：2010-04-17
- 文件大小：12582912
- 提供者：lingjoin

中文信息处理中若干关键技术的研究
随着科学技术的高速发展及名种资源数量的不断增多为了提高效率，信息处理己经成为当前最重要的研究内容，其中涉及到切词和属性选择、信息抽取、自然语言理解、自动聚类和分类、自动摘要、自动标引和主题识别、信息结构分析、文本生成以及信息检索等等。其中，属性选择是一项较为重要的基础性研究工作，为其它的研究提供基础和前提。而其它研究工作可以有效地、而且较为准确地抽取出有用信息、挖掘出新的知识，提高获取大量有用信息的效率和速度。
所属分类：专业指导
- 发布日期：2010-09-02
- 文件大小：8388608
- 提供者：guofeng314

中文文本分类中特征抽取方法的比较研究
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、V2 分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN 两种不同的分类器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和CHI) 在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征抽取方法的有效性
所属分类：专业指导
- 发布日期：2010-09-02
- 文件大小：244736
- 提供者：guofeng314

信息抽取技术（IE）概述
介绍了信息抽取(IE) 技术的基本概念、信息抽取系统的抽取过程。对现有的信息抽取系统构建方法进行了分类和介绍, 并对这些方法进行了讨论和比较, 同时指出了构建中文信息抽取系统所需要解决的关键的基础问题。
所属分类：专业指导
- 发布日期：2010-10-16
- 文件大小：66560
- 提供者：DangY85

Web中文信息抽取技术与命名实体识别方法的研究.pdf
Web中文信息抽取技术与命名实体识别方法的研究.pdf
所属分类：Web开发
- 发布日期：2010-12-05
- 文件大小：3145728
- 提供者：skycity0713

关键概念抽取系统
关键概念抽取系统，以中文分词为基础，结合加权词频算法，从大量文本中抽取出关键的概念。
所属分类：Java
- 发布日期：2012-06-05
- 文件大小：2097152
- 提供者：dinghaojie1991

从源代码中抽取中文字符串的工具的源代码
从源代码中抽取中文字符串的工具的源代码，从源代码中抽取中文字符串，修改为其他语言后替换原文件，以生成不同语言版本的软件
所属分类：C++
- 发布日期：2012-08-16
- 文件大小：31744
- 提供者：dongsy326

代码中文抽取器
用于抽取代码中的中文，可以过滤掉注释中的中文类型，只抽取正文中的中文，使用java实现，目前支持C++ java js jsp html sql ，可扩展性强代码，抽取出的中文可以导出到Excel
所属分类：Java
- 发布日期：2013-11-13
- 文件大小：675840
- 提供者：zhao251021539

使用jieba进行关键字抽取
Python那些事——如何用Python抽取中文关键词。jieba使用
所属分类：机器学习
- 发布日期：2017-12-12
- 文件大小：6144
- 提供者：xyxb2011

中文信息抽取关键技术研究与实现
中文信息抽取关键技术研究与实现-中文信息抽取的研究主要是通过对一些英语信息抽取方法和技术的借鉴来实现，希望通过移植这些方法和技术，达到中文信息抽取的目的。这种研究思路取得了不错的成果，但汉语本身的特点决定了完全照搬外文信息抽取的方法不足以很好地解决中文的信息抽取。
所属分类：专业指导
- 发布日期：2018-07-17
- 文件大小：12582912
- 提供者：pritry

jiagu：jiagu深度学习自然语言处理工具知识图谱关系抽取中文分词词性标注命名实体识别情感分析新词发现-源码
Jiagu自然语言处理工具将提供中文分词，词性标注，命名实体识别，情感分析，知识图谱关系转移，关键字检索，文本摘要，新词发现，情感分析，文本聚类等常用自然语言处理功能。参考了各大工具优缺点制作，将Jiagu回馈给大家。目录提供的功能有：中文分词词性标注命名实体识别知识图谱关系抽取关键词提取文字摘要新词发现情感分析文本聚类等等。。。。安装方式点安装 pip install -U jiagu 如果比较慢，可以使用清华的pip源： pip install -U jiagu
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：58720256
- 提供者：weixin_42127783

« 12 3 4 5 6 7 8 9 10 ... 17 »