您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于数据流的任意形状聚类算法

  2. 近年来,由于硬件技术的高速发展,人们获取数据的能力得到了极大的提高.现实生活中,经常可以看到这样的情况:大量需要处理的数据以很快的速度产生.例如,美国一条高速公路上的传感器网络每天可以收集到高达几百万条的数据,而电讯电话公司大型交换机上每天记录的通话记录就高达几千万条.由于数据量太大、数据产生的速度太快,按传统的数据库应用模式处理这些数据,即完整、详细地收集这些数据,清洗后将其储存在数据库中,再交由计算机仔细处理已成为不可能完成的任务.由有限的数据到有限的数据处理能力,计算机工作者们有了着新的
  3. 所属分类:其它

    • 发布日期:2010-05-17
    • 文件大小:533504
    • 提供者:hooray1986124
  1. Web挖掘中的数据预处理算法研究

  2. Web 挖掘的预处理是生成用户模式和进行信息推荐的基础。文章研究了Web 挖掘预处理的三个主要步骤: 数据清洗、用户识别和会话识别, 给出了各个步骤的关键算法, 并提出了一种基于注册用户和Cookies 技术、用户IP 等综合因素来改进用户识别的算法。
  3. 所属分类:Web开发

    • 发布日期:2008-03-10
    • 文件大小:82944
    • 提供者:robaklsa
  1. K-means聚类算法

  2. 基于合成控制时序数据的k均值算法,将数据分为制定的簇类个数。内附原始数据和数据清洗后的数据。
  3. 所属分类:Java

    • 发布日期:2012-01-10
    • 文件大小:474112
    • 提供者:angelsonxuan
  1. Fresoar Data Migration 2.0 数据抽取(ETL) 工具

  2. Fresoar Data Migration 2.0 软件产品介绍 Fresoar Data Migration 2.0 (简称FDM 2.0)软件产品作为ETL工具,提供了一套高效、稳定的数据迁移解决方案,我们不只提供软件产品,更重要的我们还提供细致周到的数据迁移解决方案服务,最大化的满足客户需求。当前软件工具支持IBM DB2、Oracle、MS-SQL Server、MySQL常用数据库,提供了友好的、易操作的、可拓展的数据迁移过程。 其中本软件产品提供了数据抽取、数据清洗、数据转换、数
  3. 所属分类:Oracle

    • 发布日期:2012-12-06
    • 文件大小:559104
    • 提供者:fresoar2012
  1. Fresoar Data Manager 数据抽取工具(ETL)

  2. Fresoar Data Migration 2.0 软件产品介绍 Fresoar Data Migration 2.0 (简称FDM 2.0)软件产品作为ETL工具,提供了一套高效、稳定的数据迁移解决方案,我们不只提供软件产品,更重要的我们还提供细致周到的数据迁移解决方案服务,最大化的满足客户需求。当前软件工具支持IBM DB2、Oracle、MS-SQL Server、MySQL常用数据库,提供了友好的、易操作的、可拓展的数据迁移过程。 其中本软件产品提供了数据抽取、数据清洗、数据转换、数
  3. 所属分类:Oracle

    • 发布日期:2012-12-08
    • 文件大小:686080
    • 提供者:fresoar2012
  1. RFID数据清洗处理策略与算法

  2. RFID清洗算法描述,策略运用,rfid工作原理。
  3. 所属分类:其它

    • 发布日期:2013-02-28
    • 文件大小:1048576
    • 提供者:wuxinmiao86
  1. 对基于MPN数据清洗算法的改进

  2. 数据清洗算法的改进,对传统数据清洗方法改进研究。
  3. 所属分类:MySQL

    • 发布日期:2013-08-20
    • 文件大小:887808
    • 提供者:u011752162
  1. 垂直搜索中的数据清洗和排序算法研究

  2. 垂直搜索中的数据清洗和排序算法研究,关于数据分拣
  3. 所属分类:Java

    • 发布日期:2014-11-18
    • 文件大小:3145728
    • 提供者:qq_23464961
  1. 数据仓库ETL算法详解

  2. 1. ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去; 2. 常用的ETL工具:主要有三大主流工具,分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCR Teradata公司的ETL Automation.还有其他开源工具,如PDI(K
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-08
    • 文件大小:113664
    • 提供者:lt_csvn
  1. 数据清洗理论研究-模型、算法

  2. 刚才在CSDN花了一个资源分下载了一份《数据清洗研究》文档,看后实在觉得内容较题目不妥,不如叫做“数据清洗浅谈”为好。鉴于此,上传一份经典论文,关于数据清洗技术的理论模型和算法的文章。 本不想要资源分的,不过在这里什么都要花钱,还是为自己攒点吧。 谢谢。
  3. 所属分类:其它

    • 发布日期:2009-02-17
    • 文件大小:309248
    • 提供者:mwenying
  1. 常用数据挖掘算法总结及Python实现 文字版+code

  2. 本书适合有志于从事数据挖掘的初学者,需要的朋友可看看 第一部分 数据挖掘与机器学习数学基础3 第一章 机器学习的统计基础3 第二章 探索性数据分析(EDA) .11 第二部分 机器学习概述14 第三章 机器学习概述14 第三部分 监督学习---分类与回归16 第四章 KNN(k 最邻近分类算法) 16 第五章 决策树19 第六章 朴素贝叶斯分类29 第七章 Logistic 回归 .32 第八章 SVM 支持向量机42 第九章 集成学习(Esemble Learning)43 第十一章 模型评
  3. 所属分类:Python

    • 发布日期:2018-04-21
    • 文件大小:4194304
    • 提供者:mycoffee1990
  1. 数据清洗研究综述

  2. 介绍数据清洗问题产生的背景和国内外研究现状。 给出数据清洗的定义和对象, 说明数据清洗的基本原理、模型, 分析相关算法与工具, 给出数据清洗评估方法; 并对今后数据清洗的研究和应用进行展望。
  3. 所属分类:其它

    • 发布日期:2018-08-07
    • 文件大小:561152
    • 提供者:godmayknow
  1. 常用数据挖掘算法总结及Python实现

  2. 该文档总结了常用的数据挖掘的算法原理以及Python实践内容,为初学者提供良好的参考资料,需要的朋友可看看! 第一部分 数据挖掘与机器学习数学基础3 第一章 机器学习的统计基础3 第二章 探索性数据分析(EDA).11 第二部分 机器学习概述14 第三章 机器学习概述14 第三部分 监督学习---分类与回归16 第四章 KNN(k 最邻近分类算法) 16 第五章 决策树19 第六章 朴素贝叶斯分类29 第七章 Logistic 回归 .32 第八章 SVM 支持向量机42 第九章 集成学习(E
  3. 所属分类:Python

    • 发布日期:2019-03-29
    • 文件大小:4194304
    • 提供者:weixin_44523404
  1. 大数据简历,内含有数据项目的简历,大数据 简历

  2. 大数据详细项目简历: 离线项目:于用户行为标签的智能气象服务系统 个人职责: 1.运用Flume采集源数据,存放于Kafka消息队列中 2.采用Kstream框架对数据进行初步数据清洗与变换,使用Java API将数据导入HBase 3.使用Hive集成Hbase,对数据进行ETL,进一步清洗处理数据 4.协助使用Hive提取特征值,运用Spark ML构建模型 5.参与模型检验与随机森林算法调优 6.参与编写脚本文件将数据导出到MySQL中,运用Tableau工具进行可视化分析 参与编写部分O
  3. 所属分类:互联网

    • 发布日期:2020-04-28
    • 文件大小:31744
    • 提供者:qq_46359356
  1. 基于时序关系的RFID不确定数据清洗算法

  2. 很好的一篇论文,写的非常好,对大家有很大的帮助,内容也很新颖
  3. 所属分类:电子商务

    • 发布日期:2013-01-21
    • 文件大小:620
    • 提供者:wuxinmiao86
  1. 基于改进Apriori算法的煤矿物态隐患系统设计与应用

  2. 为了更深入地研究和利用激增的煤炭隐患数据,对某煤矿的隐患及其属性进行了研究、分析与分层,构建了属性的星形全连接模型;并通过数据清洗、概化及连续属性离散化等数据挖掘技术,将大量原始隐患数据转化为适用挖掘的数据。应用经剪枝和连接步的优化改进的Apriori算法,对该煤矿近两年的物态隐患数据记录进行挖掘,得到频繁项集,导出关联规则;最后利用SQL Server 2008数据库和VS2010平台,构建并实现了煤矿物态隐患信息挖掘系统。
  3. 所属分类:其它

    • 发布日期:2020-07-07
    • 文件大小:181248
    • 提供者:weixin_38733367
  1. 基于盒式图的数据过滤与回归分析算法

  2. 软件度量是对软件开发项目、过程及其产品进行数据定义、收集以及分析的持续性定量化过程,目的在于对此加以理解、预测、*估、控制和改善,从而保证软件开发中的高效率、低成本、高质量[1]。但是,得到正确的度量只是测量程序的一部分。软件质量是与所收集和分析的数据质量密切相关的,数据清洗过程的目的就是要解决“脏数据”的问题。数据清洗是指去除或修补源数据中的不完整、不一致、含噪声的数据。在源数据中,可能由于疏忽、懒惰,甚至为了保密使系统设计人员无法得到某些数据项的数据[2]。根据决策系统中“garbage i
  3. 所属分类:其它

    • 发布日期:2020-11-06
    • 文件大小:82944
    • 提供者:weixin_38692202
  1. 人工智能在线特征系统中的数据存取技术

  2. 主流互联网产品中,不论是经典的计算广告、搜索、推荐,还是垂直领域的路径规划、司机派单、物料智能设计,建立在人工智能技术之上的策略系统已经深入到了产品功能的方方面面。相应的,每一个策略系统都离不开大量的在线特征,来支撑模型算法或人工规则对请求的精准响应,因此特征系统成为了支持线上策略系统的重要支柱。美团点评技术博客之前推出了多篇关于特征系统的文章,如《机器学习中的数据清洗与特征处理综述》侧重于介绍特征生产过程中的离线数据清洗、挖掘方法,《业务赋能利器之外卖特征档案》侧重于用不同的存储引擎解决不同的
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:1048576
    • 提供者:weixin_38686924
  1. 基于浮动车移动轨迹的新增道路自动发现算法

  2. 为了实现电子地图数据的动态更新,以支持日新月异的交通路网的地理信息服务,提出一种基于浮动车技术的新增道路自动发现算法。系统实时计算大规模浮动车数据移动轨迹,并与现有图层进行图像配准以提取疑似新增道路集,进而通过筛选过滤算法对数据集进行数据清洗,并自动地生成包含其位置和长度等信息的疑似新增道路报表及其临时图层。实验结果表明,该算法可快捷地自动发现新增道路,新增道路最快发现时间小于5 min,是解决目前交通道路图层更新滞后问题的一种有效方法。
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:1048576
    • 提供者:weixin_38680340
  1. 基于改进bin算法的风电机组风速-功率数据清洗

  2. 风速-功率是风电机组发电性能的重要指标,对风电场的运行管理具有重要意义。风速-功率数据是通过安装在风电场的监视控制与数据采集(SCADA)系统采集得到的,原始数据存在大量噪声,给后续应用研究带来了很大的挑战。基于风速-功率数据的空间分布特征,将风速-功率数据分为3类,并改进了数据预处理方法bin算法,提出了基于分区域(dbin)算法的异常数据识别清洗方法及流程。实验结果表明,dbin算法识别异常数据的效率比传统算法更高,具有较强的通用性。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:9437184
    • 提供者:weixin_38538585
« 12 3 4 »