您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 搜索引擎核心技术总体介绍

  2. 搜索引擎关键技术总体介绍,共分为一、搜索引擎总体介绍;二、爬虫技术介绍;三、中文分词和排序算法介绍;四、查询/存储技术、Cache Server介绍;五、内部、外部监控系统介绍;六、移动通信运营商搜索引擎独特优势
  3. 所属分类:其它

    • 发布日期:2009-08-03
    • 文件大小:1048576
    • 提供者:lql46211
  1. 一个关于搜索引擎技术简介的ppt

  2. 搜索引擎技术介绍 一、搜索引擎总体介绍 二、爬虫技术介绍 三、中文分词和排序算法介绍 四、查询/存储技术、Cache Server介绍 五、内部、外部监控系统介绍 六、移动通信运营商搜索引擎独特优势
  3. 所属分类:其它

    • 发布日期:2009-12-05
    • 文件大小:1048576
    • 提供者:xutaota223
  1. ICTC-6

  2. N-最短路径中文词语粗分是分词过程中非常重要的一步,而原有ICTCLAS中该部分代码也是我认为最难读懂的部分,到现在还有一些方法没有弄明白,因此我几乎重写了NShortPath类。要想说明N-最短路径代码是如何工作的并不容易,所以分成两步分,本部分先说说SharpICTCLAS中1-最短路径是如何实现的,在下一篇文章中再引申到N-最短路径。1、数据表示这里我们求最短路的例子使用如下的有向图,每条边的权重已经在图中标注出来了。(图一)根据上篇文章内容,该图该可以等价于如下的二维表格表示:(图二)
  3. 所属分类:C

    • 发布日期:2008-01-21
    • 文件大小:6
    • 提供者:whydmn
  1. 自己动手写搜索引擎(罗刚著).doc

  2. 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
  3. 所属分类:其它

    • 发布日期:2011-04-18
    • 文件大小:6291456
    • 提供者:qq736655941
  1. Lucene介绍,全文检索

  2. Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具体的安装和使用简介:系统结构介绍和演示 Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展 从Lucene我们还可以学到什么 另外,如果是在选择全文引擎,现在也许是试试Sphinx的时候了:相比Lucene速度更快,有中文分词的支
  3. 所属分类:Java

    • 发布日期:2011-05-29
    • 文件大小:38912
    • 提供者:duanqz
  1. C#编程经验技巧宝典

  2. C#编程经验技巧宝典源代码,目录如下:第1章 开发环境 11.1 Visual Studio开发环境安装与配置 20001 安装Visual Studio 2005开发环境须知 20002 配置合适的Visual Studio 2005开发环境 20003 设置程序代码行序号 30004 开发环境全屏显示 30005 设置窗口的自动隐藏功能 30006 根据需要创建所需解决方案 40007 如何使用“验证的目标架构”功能 41.2 Visual Studio开发环境的使用 40008 为程序设
  3. 所属分类:C#

    • 发布日期:2008-06-01
    • 文件大小:5242880
    • 提供者:sis_ying
  1. 自己动手写搜索引擎(罗刚)

  2. 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
  3. 所属分类:Java

    • 发布日期:2012-04-25
    • 文件大小:3145728
    • 提供者:jayghost
  1. 淘特站内搜索引擎For(PhpCmsV9)

  2. 该产品是淘特站内搜索引擎For PhpCmsV9特别定制版,系统安装后,就可以索引、模糊查询PhpCmsV9的文章数据了(无需连接数据库哦),支持按标题、全文检索,搜索时间在毫秒级,前台因为不在访问数据库,其性能和安全是门户级别的,很适合规模较大特别是数据量在百万以上的网站使用。 本系统采用中文分词算法,支持将Access,Sqlserver,Mysql,Oralce等流行数据库中的数据批量生成索引,前台搜索程序不需要在检索数据库,实现性能和安全双提升。经过优化的索引技术,搜索千万篇文章所用时
  3. 所属分类:Java

    • 发布日期:2013-01-21
    • 文件大小:14680064
    • 提供者:cctcc
  1. 淘特站内搜索引擎For(帝国cms7.0)

  2. 该产品是淘特站内搜索引擎For 帝国Cms7.0特别定制版,系统安装后,就可以索引、模糊查询帝国Cms7.0的文章数据了(无需连接数据库哦),支持将帝国CMS中所有的模型及相关的表数据索引到搜索引擎中,达到一键全站查询的效果。支持按标题、全文检索,搜索时间在毫秒级,前台因为不在访问数据库,其性能和安全是门户级别的,很适合规模较大特别是数据量在百万以上的网站使用。 本系统采用中文分词算法,支持将Access,Sqlserver,Mysql,Oralce等流行数据库中的数据批量生成索引,前台搜索程
  3. 所属分类:Java

    • 发布日期:2013-01-22
    • 文件大小:14680064
    • 提供者:cctcc
  1. 全文检索研究

  2. 中文检索软件关键技术   中文分词技术   索引和检索的相关技术   相关度的算法   多种格式文档统一处理 全文检索系统   索引引擎(索引概念,常规索引,oracle,sql server, 全文索引)存、取、归纳   查询引擎   文本分析引擎
  3. 所属分类:C/C++

    • 发布日期:2013-02-05
    • 文件大小:645120
    • 提供者:nikixiong
  1. SQLite学习手册_中文全本

  2. SQLite具有多方面的特性。它是一个数据库,一个程序库,一个命令行工具,也是一个学习关系型数据库的很好的工具。确实有很多途径可以使用它——内嵌环境、网站、操作系统服务、脚本语言和应用程序。对于程序员来说,SQLite就象一个数据传送带,提供了一种方便的将应用程序绑定的数据的方法。就象传送带一样,对SQLite的使用没有终点。 除了仅仅作为一个存储容器,SQLite还可以作为一个单纯的数据处理的工具。如果大小和复杂性合适,使用SQLite可以很容易地将应用程序所使用的数据结构转化为表,并保存在
  3. 所属分类:SQLite

    • 发布日期:2013-04-03
    • 文件大小:563200
    • 提供者:peng5525603
  1. 基于Lucene的教学资源垂直搜索引擎的研究与实现

  2. 着计算机和网络技术的迅速发展,互联网上的教育资源呈指 数级增长"如何能够在这数量巨大!形式多样的信息中准确地找到自 己需要的呢?通用搜索引擎在针对某一具体领域检索资源时,搜索结 果往往覆盖面非常广泛,信息相关性差,不能很好地为用户提供准确 的检索服务"而垂直搜索引擎则是针对某一个行业!某一特定人群需 求所设计的专业搜索引擎,它只搜索特定领域,并且可以对搜索结果 按照该领域内人们所关心的关键信息予以呈现,这样能够为用户提 供更高质量的检索服务" 本文使用Lucene和其它相关技术实现一个教育领域
  3. 所属分类:互联网

    • 发布日期:2013-04-09
    • 文件大小:5242880
    • 提供者:yongbuyanbao
  1. 搜索引擎技术介绍ppt

  2. 搜索引擎技术入门介绍,分析爬虫技术,中文分词和排序算法介绍,查询/存储技术、Cache Server介绍
  3. 所属分类:其它

    • 发布日期:2008-09-11
    • 文件大小:1048576
    • 提供者:k700k700
  1. 面向美食网站的搜索及点评与图片去重模块的设计与实现

  2. 本课题所研究的内容是某美食类网站关于图片,内容的处理以及垂直搜索 的问题。对于图片处理,简单来说是图片的匹配,采用匹配算法过滤出重复的 图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图 片信息,使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计 算图片的相似度数据来实现。内容处理问题即点评处理,该问题与图片处理类 似,通过中文分词算法对点评内容进行分词,然后根据规则对待匹配的内容进 行排序,最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进 行专项搜索,
  3. 所属分类:PHP

  1. Oracle9i的init.ora参数中文说明

  2. Oracle9i初始化参数中文说明 Blank_trimming: 说明: 如果值为TRUE, 即使源长度比目标长度 (SQL92 兼容) 更长, 也允许分配数据。 值范围: TRUE | FALSE 默认值: FALSE serializable: 说明: 确定查询是否获取表级的读取锁, 以防止在包含该查询的事务处理被提交之前更新任何对象读取。这种操作模式提供可重复的读取, 并确保在同一事务处理种对相同数据的两次查询看到的是相同的值。 值范围: TRUE | FALSE 默认值: FALSE
  3. 所属分类:Oracle

    • 发布日期:2008-11-07
    • 文件大小:58368
    • 提供者:qujianwei
  1. C++中文分词源码,分词的方法

  2. 西方语言在语句(或从句)内词汇之间存在分割符(空格),而汉语的词汇在语句中是连续排列的。因此,汉语词汇的切分(分词)在中文信息处理的许多应用领域,如机器翻译、文献检索、文献分类、文献过滤、以及词频统计等,是非常重要的第一步。 自动分词是基于字符串匹配的原理进行的。迄今为止,已经有许多文献对各种分词方法进行探讨,其着重点或为分词的速度方面,或为分词的精度方面以及分词的规范。本文主要探讨分词的速度问题,通过实验对比和理论分析,说明我们所提出的算法是有效的。 目前人们所提出的分词方法,在考虑效率问题
  3. 所属分类:其它

    • 发布日期:2008-11-12
    • 文件大小:334848
    • 提供者:johnzhjfly
  1. C#开发实战1200例(第一卷+第二卷)+源码下载地址.txt

  2. 主要内容有C#开发环境的使用、C#语言基础应用、字符串处理技术、数组和集合的使用、面向对象编程技术、数据结构与算法、Windows窗体基础、特色窗体界面、窗体控制技术、MDI窗体和继承窗体、Windows常用控件的使用、Windows不错控件的使用、DataGridView数据控件、自定义用户控件、文件基本操作、文件夹基本操作、文件流操作、加密、解密及解压缩文件、C#与Word互操作、高效应用Excel、基本图形绘制、图像处理技术、常用图表应用、动画处理技术、音频与视频控制。配书光盘附带了实例
  3. 所属分类:C#

  1. klsstt_Java分词器word.1.3.1.jar

  2. 这是一个支持java的分词库,word分词库,实现语法分析和语料库统计相结合的方法,具备汉语切分技术、汉语语法分析技术、汉语依存关系分析技术。通过分词、词性标注等语义分析算法,再基于各类词库(包括专业词库、错误词库等),实现对客户提交的文献中的普通中文词汇、英文拼写、标点、数字、科技计量、重句、异形词、领导人姓名职务、领导人排序、政治性问题、目录、标题和图例公式序号等各种类型的错误。
  3. 所属分类:机器学习

    • 发布日期:2020-03-20
    • 文件大小:25165824
    • 提供者:klsstt
  1. 快速构建PHP全文检索——马明练

  2. 信息检索,全文检索,IR基础,反向索引,同步机制,批量处理检索比较 全文检索数据库LKE 索引使用事先建好的全文索引用不到索引,只能遍历匹配 % eight%也会匹配 height 匹配效笑/通过分词器切割匹配,良好\9m%me就不能匹配颠 支持中文、英文词干 倒的ⅹx.net. XXX. COm 相关度基于概率模型的相关性算无相关算法,匹配一次或多次 法,越相关的排在越前面 无明显区别 可定制通过定制分词器,实现不同 索引规则 难以定制 结论支持大数据,性能高效果好/效率低,相关性差,模糊检索
  3. 所属分类:PHP

    • 发布日期:2019-03-04
    • 文件大小:1048576
    • 提供者:danyidanfei
  1. Python Trie树实现字典排序

  2. 一般语言都提供了按字典排序的API,比如跟微信公众平台对接时就需要用到字典排序。按字典排序有很多种算法,最容易想到的就是字符串搜索的方式,但这种方式实现起来很麻烦,性能也不太好。Trie树是一种很常用的树结构,它被广泛用于各个方面,比如字符串检索、中文分词、求字符串最长公共前缀和字典排序等等,而且在输入法中也能看到Trie树的身影。 什么是Trie树 Trie树通常又称为字典树、单词查找树或前缀树,是一种用于快速检索的多叉树结构。如图数字的字典是一个10叉树: 同理小写英文字母或大写英文字母的
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:243712
    • 提供者:weixin_38689027
« 12 »