您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 协同推荐于数据挖掘论文

  2. 研究者们已经提出了关联规则挖掘的各种各样的数据表 示模式,它们能被广泛地分类为平行数据布局、垂直数据布 局和两者的结合。大多数的候选式产生——检查迭代算法(如 Apriori)使用平行数据布局。大多数模式增长算法(如 FP- Growth 和 H-Mine)使用平行和垂直数据布局的一个组合。
  3. 所属分类:其它

    • 发布日期:2009-06-06
    • 文件大小:770048
    • 提供者:parrylc
  1. datascraper

  2. DataScraper应用领域: 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量抓取网页数据,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地抓取网页数据,输出富含语义元数据的XML格式的抓取结果文件,确保自动化的数据集成和
  3. 所属分类:Web开发

    • 发布日期:2009-12-19
    • 文件大小:173056
    • 提供者:tigersz
  1. Web网页抓取/页面信息提取软件包MetaSeeker组件datascraper中文版

  2. MetaSeeker是一个Web网页抓取/数据抽取/页面信息提取工具包,能够按照用户的指导,从Web页面上筛选出需要的信息,并输出含有语义结构的提取结果文件(XML文件),众所周知,Web页面显示的信息是给人阅读的,对于机器来说,是无结构的,MetaSeeker解决了一个关键问题:将无结构的Web页面信息转换成有结构的适于机器处理的信息。可以应用于专业搜索、Mashup和Web数据挖掘领域。 DataScraper:是Web页面信息提取(网页抓取/抽取)工具,利用MetaStudio生成的各种
  3. 所属分类:Web开发

    • 发布日期:2010-01-06
    • 文件大小:173056
    • 提供者:tigersz
  1. Web网页抓取/页面信息提取软件包MetaSeeker组件metastudio中文版

  2. MetaSeeker是一个Web网页抓取/数据抽取/页面信息提取工具包,能够按照用户的指导,从Web页面上筛选出需要的信息,并输出含有语义结构的提取结果文件(XML文件),众所周知,Web页面显示的信息是给人阅读的,对于机器来说,是无结构的,MetaSeeker解决了一个关键问题:将无结构的Web页面信息转换成有结构的适于机器处理的信息。可以应用于专业搜索、Mashup和Web数据挖掘领域。 MetaStudio是Web页面信息结构描述工具,提供GUI界面,作为Firefox扩展(Firefo
  3. 所属分类:Web开发

    • 发布日期:2010-01-06
    • 文件大小:491520
    • 提供者:tigersz
  1. 垂直行业b2b网站策划总体方案

  2. 目录 一、 网站建设市场分析及网站的定位 4 1. 分析 4 2. 网站定位 4 3. 目标 4 4. 网站服务对象分析 4 二、 网站的技术解决方案 5 1. 网站盈利模式 5 2. 人员职能分配 5 3. 网站投资计划 6 4. 投资回报计划 6 三、 网站整体策划 6 1. 网站的基本属性 6 2. 网站的导航系统 6 3. 功能模块 6 4. 网站首页 11 5. 主要栏目 11 6. 网页设计 14 7. 网站开发环境搭建 14 四、 网站的维护 15 1. 服务器及相关软硬件的维护
  3. 所属分类:Java

    • 发布日期:2010-01-14
    • 文件大小:205824
    • 提供者:HmilyHeart
  1. 垂直搜索引擎赢利模式探讨

  2. 垂直搜索引擎赢利模式探讨,不依赖网站访问量,利用所挖掘的行业信息的双向特性,通过信息 撮合和定向信息发送等手段来实现赢利。
  3. 所属分类:Java

    • 发布日期:2010-04-12
    • 文件大小:351232
    • 提供者:shadowleaf
  1. 文档魔法豆—垂直搜索互动社区

  2. 原名“在线文档搜囤王”,现更名为“文档魔法豆—垂直搜索互动社区”,在魔法豆社区里您可以快速搜索文档、网页、知识、购物等等信息,多达上百个搜索引擎挖掘,全世界的资讯都可掌握在手中。除了快速搜索,您还可以进行便捷浏览、快速下载、与网友互动交流、聊天、文档共享、文档交易、文档团购等等应用。 魔法豆社区—没有您找不到的信息,只有您意想不到的惊喜。 本软件纯绿色无病毒,无插件,下载后安装即可免费使用。
  3. 所属分类:电信

    • 发布日期:2011-03-16
    • 文件大小:5242880
    • 提供者:tx010net
  1. 文档魔法豆—垂直搜索互动社区

  2. 原名“在线文档搜囤王”,现更名为“文档魔法豆—垂直搜索互动社区”,在魔法豆社区里您可以快速搜索文档、网页、知识、购物等等信息,多达上百个搜索引擎挖掘,全世界的资讯都可掌握在手中。除了快速搜索,您还可以进行便捷浏览、快速下载、与网友互动交流、聊天、文档共享、文档交易、文档团购等等应用。 魔法豆社区—没有您找不到的信息,只有您意想不到的惊喜。
  3. 所属分类:其它

    • 发布日期:2011-06-03
    • 文件大小:17825792
    • 提供者:tx010net
  1. datascraper

  2. DataScraper应用领域: 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量抓取网页数据,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地抓取网页数据,输出富含语义元数据的XML格式的抓取结果文件,确保自动化的数据集成和
  3. 所属分类:其它

    • 发布日期:2012-02-07
    • 文件大小:173056
    • 提供者:dd359851405
  1. 站点垂直挖掘模型的研究和实现

  2. 在通过对结构挖掘和内容挖掘的理论研究和方法改进基础上,本章从实际应用的角度出发,分析具体的实际应用需求,设计和实现了基于结构挖掘和内容挖掘的站点垂直挖掘模型。站点垂直挖掘模型由一系列科学严谨的信息挖掘理论和方法构成,通过结构挖掘和内容挖掘,逐步将拥挤、充满噪声的无结构化站点信息转换简洁、扼要的结构化信息。模型选取招标网站作为主题站点进行实验。招标网页信息种类繁多,网页结构形式多变,正文包含半结构化和自由化文本,同时,实用性比较强,选取招标站点作为实例具有较好的参照性。
  3. 所属分类:其它

    • 发布日期:2013-03-30
    • 文件大小:439296
    • 提供者:zhangfei2018
  1. Hadoop分布式架构下大数据集的并行挖掘

  2. 基于Hadoop分布式计算平台,给出一种适用于大数据集的并行挖掘算法。该算法对非结构化的原始大数据集以及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的Hadoop计算节点进行处理,以减少各个计算节点的存储数据,进而减少各个计算节点执行交集操作的次数,提高并行挖掘效率。实验结果表明,给出的并行挖掘算法解决了大数据集挖掘过程中产生的大量数据通信、中间数据以及执行大量交集操作的问题,算法高效、可扩展。
  3. 所属分类:其它

    • 发布日期:2014-05-24
    • 文件大小:352256
    • 提供者:xiongdaye318
  1. 频繁项及关联规则的挖掘

  2. 在VC6.0环境下用MFC做的一个频繁项挖掘、增量式关联规则挖掘程序,内置测试数据,解压后可直接运行
  3. 所属分类:C++

    • 发布日期:2008-11-22
    • 文件大小:9437184
    • 提供者:lore_home
  1. 垂直模式类高效用模式挖掘的改进算法

  2. 由于高效用模式挖掘较为复杂,提高其挖掘算法的效率是数据挖掘的研究热点。HUPminer算法是典型的基于垂直模式类的高效用模式挖掘算法,虽然能够有效地减少效用列表的总个数,但对于项集的划分,效用列表需要更多的空间。针对该问题,在HUI-miner算法的基础上充分考虑了1扩展集中项集的关联性,减少了效用列表个数,提出了改进的IHUI-miner算法。实验结果表明,改进算法IHUI-miner在时间效率和减少效用列表的个数上都优于HUP-miner与HUI-miner算法。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:232448
    • 提供者:weixin_38677505
  1. 面向网络股评观点的垂直搜索引擎设计与实现

  2. 股票市场是国家宏观经济环境的晴雨表。网民对股市评论观点在很大程度上反映了股市行情,也影响着股市涨跌。因此,通过网络文本情感极性分析技术和搜索引擎技术来挖掘网络股评观点是当前信息和金融学科的交叉研究课题热点之一。设计了一种融合全文搜索和观点挖掘的面向网络股评的垂直搜索引擎系统结构,提出了一种面向网络股评主题数据采集的定点收割算法和爬虫结构,并建立了一种网络股评的多粒度模糊计算的无监督情感极性分类方法,能实现股评观点的在线分析。通过对实现的垂直搜索引擎的测试表明,其在情感极性分类精度、爬虫数据采集效
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:378880
    • 提供者:weixin_38661008
  1. 基于垂直分布方法的关联规则算法及改进

  2. 数据挖掘中的关联规则挖掘近些年一直是人们研究的热点。但是关联规则挖掘的经典算法Apriori存在着挖掘效率低、系统开销大等问题。AprioriTid、DIC等算法,也仅从某一方面进行了改进。针对上述问题,提出了一种新的改进算法,新算法从三大方面对原有的算法进行了改进,以此提高算法的效率,降低系统的开销。
  3. 所属分类:其它

    • 发布日期:2020-10-21
    • 文件大小:350208
    • 提供者:weixin_38556189
  1. 使用垂直数据格式挖掘频繁项集

  2. 关联规则是数据挖掘的主要技术之一,它是描述数据库中一组数据项之间的某种潜在关系的规则。关联规则挖掘算法——Apriori算法,主要过程是对频繁项集的挖掘,而在对频繁项集的挖掘中首先要生成候选频繁项集,然后再从候选集中确定出满足最小支持度计数的频繁项集,这会耗费大量的CPU开销。使用垂直数据格式挖掘频繁项集可避免候选项目集的求解。
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:206848
    • 提供者:weixin_38687904
  1. 一种使用N-list快速挖掘频繁项集的新算法

  2. 频繁项目集的挖掘已成为数据挖掘中的一个基本问题,并且在许多重要的数据挖掘任务中发挥着至关重要的作用。 在本文中,我们提出了一种新颖的垂直数据表示形式,称为N-list,该表示形式源自于一种类似于FP-tree的编码前缀树(称为PPC-tree),该树存储了有关频繁项集的关键信息。 基于N列表数据结构,我们开发了一种有效的挖掘算法PrePost,用于挖掘所有频繁项集。 PrePost的效率是通过以下三个原因实现的。 首先,N-list是紧凑的,因为具有公共前缀的事务共享PPC树的相同节点。 其次,
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:1048576
    • 提供者:weixin_38607971
  1. 基于临时表的数据流中前k个封闭频繁模式挖掘算法

  2. 在本文中,我们提出了一种算法TKBT(基于TKTT的top-k封闭频繁项集),可有效地挖掘数据流中的top-k封闭频繁项集。 首先根据滑动窗口中数据流的数据连续性和可变性,定义了一种新颖的结构BWT(位向量窗口表)。 在BWT水平方向上,我们使用位向量来表示事务,在最旧,最新的窗口以及当前时间的所有窗口中记录项目数,从而减少了新窗口滑入时项目数的计算时间。在BWT垂直方向上,我们设置了窗口分区,这使得我们只需要在出现新窗口时用相应的最新窗口替换最旧的窗口信息即可。 TKTT(top-k临时表)的
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:1048576
    • 提供者:weixin_38713009
  1. IDSG:一种新的频繁序列挖掘算法

  2. 在研究已有算法的基础上提出了一种频繁序列挖掘算法IDSG.该算法通过在频繁项(而不是频繁项集,即无需先求出所有频繁项集)间建立关联图,并在垂直数据库表达的基础上,借助简单的时态连接得到频繁序列完全集.整个过程只需扫描原始数据库两遍,有效减少磁盘I/O.另外,优化策略的正确运用,有助于减少候选序列的个数.分析及实验表明,较之同类算法,算法IDSG在效率上有了明显提高.
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:617472
    • 提供者:weixin_38675746
  1. 基于垂直数据格式频繁闭项集的选择性集成算法的研究

  2. 集成学习是现今机器学习领域研究的热点问题,选择性集成通过对基分类器进行选择来提高集成分类器的泛化能力,降低预测开销。模式挖掘是一种将问题转化为事务数据库中模式的全新挖掘策略。本文将垂直数据格式频繁闭项集的模式挖掘方法应用于分类器的选择过程,利用垂直数据结构、频繁闭项集及模式挖掘方法的优势,提出一种预测性能更好、更加高效的选择性集成分类算法。
  3. 所属分类:其它

    • 发布日期:2021-01-28
    • 文件大小:1048576
    • 提供者:weixin_38710566
« 12 3 4 »