您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 北京大学网络体系结构实习-搜索-wbia-报告及源码

  2. 北京大学网络体系结构实习-搜索-wbia-报告及源码 内含《 BBS“十大”博物馆及检索系统(Hoten) 》的所有相关文档,包括爬虫源码、分词、建索引、界面。 还有《基于时间的活动分类搜索》的项目计划书。 1.1 项目背景 1.1.1 项目动机 我们曾经有一个想法,就是想做BBS系统信息的收集与检索系统。但是,一个朋友告诉我,我们每天都很“忙”,连看新闻的时间都没有,哪还有时间去看不起BBS,我们每天上进心BBS,假如不是发表文章的话,无非就是想关注一下今日的“十大”而已。后来,我们再调查了
  3. 所属分类:网络基础

    • 发布日期:2009-05-06
    • 文件大小:4194304
    • 提供者:gusui
  1. 面向主题的中文搜索引擎的设计与实现_陈静_北京大学硕士论文

  2. WWW网络的迅猛增长使得搜索引擎面临了前所未有的挑战,搜索引擎如何适应这种规模的急剧膨胀,成为一个备受关注的问题。面向主题搜索引擎可以有选择性的抓取与主题相关的网页。选取的对象是一个或一组事先预定义的主题,其特征由样本网页标志,而不是关键词。一般性的搜索引擎总是抓取尽量多的网页以满足所有可能的查询请求;而主题搜索被设计为只抓取与选定主题相关的网页。这不仅能够大大减少系统对硬件和网络资源的需求,而且还有助于提高抓取的准确率和搜索结果的更新速度。 本文首先对比通用搜索引擎与主题搜索引擎的区别,总结
  3. 所属分类:其它

    • 发布日期:2009-07-08
    • 文件大小:352256
    • 提供者:rockychan1206
  1. sql2005全文检索.doc

  2. SQL Server 2005全文检索技术在网站上的应用实录 http://tech.ddvip.com 2008年01月21日 社区交流 Excel服务器-用Excel做管理系统 关键字: DataGuard checkpoint 动态查询 synonyms 卸载SQL 2005 SQL Server群集 内容摘要:本文提供了网站如何设计和实现基于SQL Server 2005的全文检索实例,希望能对正在使用SQL Server 2005构建网站搜索的同仁有所裨益。 一、前言 “人类失去搜索
  3. 所属分类:其它

    • 发布日期:2009-09-09
    • 文件大小:518144
    • 提供者:a522920779a
  1. 刘云峰博客自动采集系统

  2. 博客采集系统是由工作在顶级门户网站的几名资深高级工程师利用爬虫技术(蜘蛛机器人,spider)、分词技术和网页萃取技术,利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用 博客采集系统 http://www.myworld.net.cn/
  3. 所属分类:Web开发

    • 发布日期:2009-12-10
    • 文件大小:1020928
    • 提供者:f15910
  1. 垂直搜索与Web实体提取和关系分析

  2. 垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。 垂直搜索的技术   垂直搜索引擎大体上需要以下技术
  3. 所属分类:Web开发

    • 发布日期:2010-03-07
    • 文件大小:522240
    • 提供者:queenie_sun
  1. 网趣网上购物系统时尚版

  2. 网趣网上购物系统的部分特点与精华:   一、支持商品批量增加、批量修改功能,所有商品可一次修改完成,特别方便!   二、支持7种在线支付:北京网银、NPS、快钱、贝宝、云网、支付宝、财付通接口。   三、率先支持Excel批量导入商品功能,下载Excel模板批量添加商品一次完成!   四、删除商品的同时,可以自动删除商品图片,大大节约空间!   五、率先支持商品图片水印设置,彰显网站的独特风格!   六、支持商品三级分类设置,分类划分更明细:大类->小类->子类->商品   
  3. 所属分类:Flash

    • 发布日期:2010-03-20
    • 文件大小:4194304
    • 提供者:flydream920
  1. 快速建站首选—NiceWordsv5.0

  2. 利用爬虫技术(蜘蛛机器人,spider)和分词技术,结合白帽SEO,利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用NiceWords智能建站系统,只需要在配置页面上设置几个关键词,NiceWords就能全自动的生成一套能自动更新的网站了。
  3. 所属分类:Web开发

    • 发布日期:2010-06-08
    • 文件大小:5242880
    • 提供者:abenmao2009
  1. 网趣网上购物系统的部分特点与精华

  2. 网趣网上购物系统的部分特点与精华:   一、支持商品批量增加、批量修改功能,所有商品可一次修改完成,特别方便!   二、支持7种在线支付:北京网银、NPS、快钱、贝宝、云网、支付宝、财付通接口。   三、率先支持Excel批量导入商品功能,下载Excel模板批量添加商品一次完成!   四、删除商品的同时,可以自动删除商品图片,大大节约空间!   五、可以选择修改商品时上传图片是否覆盖原有图片,节约宝贵的空间!   六、率先支持商品图片水印设置,彰显网站的独特风格!   七、支持商品三级分类设置
  3. 所属分类:Flash

    • 发布日期:2010-08-08
    • 文件大小:4194304
    • 提供者:yjiawen
  1. NiceWords 2.0

  2. Nicewords是由工作在顶级门户网站的几名资深高级工程师利用爬虫技术(蜘蛛机器人,spider)和分词技术,结合白帽SEO(规避了一切风险的搜索引擎优化),利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用NiceWords智能建站系统,只需要在配置页面上设置几个关键词,NiceWords就能全自动的生成一套能自动更新的网站了。 您要做的仅仅是设置几个关键词,其他的一切交给NiceWords来完成! 简单的
  3. 所属分类:系统集成

    • 发布日期:2011-03-11
    • 文件大小:793600
    • 提供者:gp3618
  1. maiyigo3.14最新中文商业版.rar

  2. maiyigo v3.14 中文正式版 修正了原版本,后台无法添加关键词。 新增自动升级功能 新增自定义URl重写 新增Rss聚合 新增智能定向采集 真正可用的原装maiyigo的dezend版 安装在根目录下,不需要修改任何文件,直接安装使用即可。 请注意查看官方做的安装说明readme.txt 如果需要安装到子目录下,比如www.94384.com/maiyigo/ 那就需要修改application\config\constants.php里面 $temp_url .= "/cn/";这
  3. 所属分类:MySQL

    • 发布日期:2011-03-14
    • 文件大小:1048576
    • 提供者:y6z8com
  1. 相关词抓取软件

  2. 百度相关词抓取软件,做竞价优化的可以来看看
  3. 所属分类:其它

    • 发布日期:2013-01-09
    • 文件大小:2097152
    • 提供者:oeiuu
  1. lucene+中文IK分词器 例子

  2. lucene3.5 + ik中文分词器例子,可从网页抓取输出流,并通过关键字查询相关文件
  3. 所属分类:Java

    • 发布日期:2014-06-26
    • 文件大小:3145728
    • 提供者:mxd_001
  1. 易搜索站内全文检索搜索引擎

  2. 导航的根源在于分类,当有100条信息的时候,我们使用类别来定位信息,当有10000条信息的时候,我们用标签来定位信息,当有100..00条信息的时候,无论怎么分类都是难以寻找的,于是就有了搜索… 当一个网站信息越积越多,搜索将会变得越来越重要。以至于终于有一天,当网站发现50%以上的用户来到你的网站第一件事是搜索的时候,搜索就将成为没有“导航”的导航。因此站内搜索成了网站建设的当务之急。随着网络应用的深入,信息量的爆炸性增长,站内搜索成为每个优秀网站必须具备的功能。纵观中国大中小网站,绝大多数
  3. 所属分类:其它

    • 发布日期:2008-12-27
    • 文件大小:228352
    • 提供者:redmethod
  1. 鑫河搜索引擎推广工器 v5.8.23.9.zip

  2. 鑫河软件的搜索引擎推广工器软件可以查询站点的PR值(Pagerank)、Alexa世界排名、Sogou指数、中国网站排名等,以及在几个主要搜索引擎中的收录和反向链接(但只能说是参考数据),具有友情链接查询功能、站长常用工具以及域名查询等实用功能(SEO推广),同时此软件将提供数百万以上的IP地址让你使用,并支持电信3G无线网卡上网换IP,支持联通3G无线网卡上网换IP,支持家庭光纤上网用户,支持家庭宽带ADSL上网用户,支持家庭路由器上网用户更换IP支持代理IP更换IP的功能,同时也支持VPN
  3. 所属分类:其它

    • 发布日期:2019-07-15
    • 文件大小:4194304
    • 提供者:weixin_39841365
  1. PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件示例

  2. 主要介绍了PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件,涉及php基于curl的页面抓取及正则匹配相关操作技巧,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-10-18
    • 文件大小:51200
    • 提供者:weixin_38674883
  1. php获取百度收录、百度热词及百度快照的方法

  2. 本文实例讲述了php获取百度收录、百度热词及百度快照的方法。分享给大家供大家参考。具体如下: 获取百度收录: <?php /* 抓取百度收录代码 */ function baidu($s){ $baidu="http://www.baidu.com/s?wd=site:".$s; $site=file_get_contents($baidu); //$site=iconv("gb2312", "UTF-8", $site); ereg("找到相关网页(.*)篇,", $site,
  3. 所属分类:其它

    • 发布日期:2020-12-18
    • 文件大小:45056
    • 提供者:weixin_38581447
  1. data_analysis:抓取和分析reddit帖子的脚本-源码

  2. 数据分析项目 介绍: 各种Python脚本可抓取reddit帖子,分析数据集,过滤相关数据并计算分数。然后,将处理此信息并将其输出为简明JSON。 收集,收集帖子并清理获取reddit数据,然后过滤掉多余的元数据以仅显示帖子标题 compile_word_count和compute_pony_lang在表演中获取字符对话的大型csv数据集,并按字符,情节等显示单词数。 compute_tfidf提取一个“收集的”数据集,并为整个集合计算TF-IDF。该脚本还删除了停用词,以进行更相关的分析 f
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:2097152
    • 提供者:weixin_42129970
  1. nlp_consulting_project:Capgemini数据营-第1节:抓取-源码

  2. NLP咨询项目:为伦敦餐厅Bokan 37定义以数据为导向的策略 该项目有五个主要步骤: 数据采集 数据清理 词嵌入 主题提取 情绪分析 设置 git clone https://github.com/hehlinge42/nlp_consulting_project.git cd nlp_consulting_project pip install -r requirements.txt 建筑学 第一场:TripAdvisor的抓取工具 删除TripAdvisor用户在英国的网站( )上的
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:553648128
    • 提供者:weixin_42139042
  1. PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件示例

  2. 本文实例讲述了PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件。分享给大家供大家参考,具体如下: 一、百度搜索关键词【软件开发网】 【软件开发网】搜索链接 https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=脚本之家&rsv_pq=ab33cfeb000086a2&rsv_t=7c65vT3KzHCNfGYOIn/DSS+OQUiCycaspxWzSOBfkHYpgRIPKMI74WIi8K8&
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:57344
    • 提供者:weixin_38508126
  1. JobBoardApp:网络抓取工具可根据角色和位置从受欢迎的工作站点中提取清单-源码

  2. JobBoardApp 应用程序是使用Python和Django框架构建的,用于查找和发布所有最近的化学工程工作清单。 该应用程序旨在帮助所有经验水平的工程师进行搜索并应用于相关工作。 搜索中包括的职业网站是Linkedin,Indeed和Monster,并且只有离Phildelphia 50英里以内的领事角色。 注意:将搜索词更改为任何职位或职位,几乎不需要更改代码。 过程 使用Django views.py文件在访问时启动应用程序 求职网站被请求和BeautifulSoup刮掉 从每个站点
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:23552
    • 提供者:weixin_42099116
« 12 3 4 »