您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据挖掘数据预处理.pdf

  2. 该片主要讲述数据挖掘的前期数据处理工作,包括数据清洗、集成、转换、消减步骤
  3. 所属分类:专业指导

    • 发布日期:2010-05-10
    • 文件大小:324608
    • 提供者:aqing280
  1. The Data Warehouse ETL Toolkit (中文版).pdf

  2. 抽取-转换-加载(Extract-Transform-Load)系统是数据仓库的基础。一个设计良好的ETL系统从源系统抽取数据,执行数据质量和一致性标准,然后规格化数据,从而使分散的源数据可以集中在一起使用,最终再以可以展现的格式提交数据,以便应用开发者可以创建应用系统,也使最终用户可以制定决策。该书围绕这四个步骤进行组织。 ETL系统既能成就数据仓库也能毁了它。因为虽然创建ETL系统是后台工作,对于最终用户并不可见,但是对于实施和维护一个典型的数据仓库系统来说,它所耗费的资源会很容易达到70
  3. 所属分类:数据库

    • 发布日期:2013-03-13
    • 文件大小:4194304
    • 提供者:tonyyubaohui
  1. 数据清洗研究.rar

  2. 数据清洗研究.rar pdf文件 中文
  3. 所属分类:专业指导

    • 发布日期:2008-10-24
    • 文件大小:25600
    • 提供者:a38906
  1. Admaster混合异构数据的清洗、存储、挖掘架构选型和设计策略

  2. Admaster混合异构数据的清洗、存储、挖掘架构选型和设计策略.pdf
  3. 所属分类:互联网

    • 发布日期:2015-01-07
    • 文件大小:3145728
    • 提供者:fuhj02
  1. 干净的数据 clean data

  2. 理解数据清洗在整个数据科学过程中的作用 掌握数据清洗的基础知识,包括文件清洗、数据类型、字符编码等 发掘电子表格和文本编辑器中与数据组织和操作相关的重要功能 学会常见数据格式的相互转换,如JSON、CSV和一些特殊用途的格式 采用三种策略来解析和清洗HTML文件中的数据 揭开PDF文档的秘密,提取需要的数据 借助一系列解决方案来清洗存放在关系型数据库里的坏数据 创建自己的干净数据集,为其打包、添加授权许可并与他人共享 使用书中的工具以及Twitter和Stack Overflow数据,完成两个
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-11
    • 文件大小:31457280
    • 提供者:feloxx
  1. 网络数据采集 [美]米切尔 中文版 pdf

  2. 第一部分 创建爬虫 第1章 初见网络爬虫 2 第2章 复杂HTML解析 11 第3 章 开始采集 26 第4 章 使用API 42 第5 章 存储数据 61 第6 章 读取文档 80 第二部分 高级数据采集 第7 章 数据清洗 94 第8 章 自然语言处理 103 第9 章 穿越网页表单与登录窗口进行采集 120 第10 章 采集Javascr ipt 128 第11 章 图像识别与文字处理 139 第12 章 避开采集陷阱 154 第13 章 用爬虫测试网站 164 第14 章 远程采集 1
  3. 所属分类:Python

    • 发布日期:2017-11-30
    • 文件大小:8388608
    • 提供者:jinmie0193
  1. 干净的数据-数据清洗入门与实践

  2. 本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。 【电子版来自互联网,仅供预览及学习交流使用,不可用于商业用途,如有版权问题,请联系删除,支持正版,喜欢的 请购买正版书籍: htt
  3. 所属分类:算法与数据结构

    • 发布日期:2018-05-13
    • 文件大小:31457280
    • 提供者:fd2025
  1. Best_Practices_in_Data_Cleaning

  2. 数据清洗实战 非常详细的 英文原版教程 高清pdf SAS软件实现
  3. 所属分类:互联网

    • 发布日期:2018-06-02
    • 文件大小:4194304
    • 提供者:acehand
  1. 贵州省大数据清洗加工规范.pdf

  2. 贵州省大数据清洗加工规范,大数据中数据清理规范文档。
  3. 所属分类:算法与数据结构

    • 发布日期:2019-08-12
    • 文件大小:1048576
    • 提供者:kissguagua6
  1. 数据清洗指南.pdf

  2. 讲述了人工智能领域的数据清洗的各种指导和方法:数据缺失、混乱、重复怎么办?最全数据清洗指南!要获得优秀的模型,⾸先需要清洗数据。这是⼀篇如何在 Python 中执⾏数据清洗的分步指南。
  3. 所属分类:深度学习

    • 发布日期:2020-05-22
    • 文件大小:2097152
    • 提供者:qq_16774117
  1. 从数据到特征.pdf

  2. 讲解机器学习的特征工程步骤 样本选取与拆分 1 数据归集 :实现相关的2 数据可视化:直观呈现分布、快速了解质量 数据可视化:直观呈现分布、快速了解质量 数据可视化:直观呈现分布、快速了解质量 数据可视化:直观呈现分布、快速了解质量 3 数据清洗:处理缺失确保可用性 数据清洗:处理缺失确保可用性 4 特征设计:数据转换与归一化 正态、标准特征设计:数据转换与归一化 正态、标准特征设计:数据转换与归一化 正态、标准5 特征加工,重构数据:建刻画场景 特征加工,重构数据:建刻画
  3. 所属分类:机器学习

    • 发布日期:2020-02-04
    • 文件大小:2097152
    • 提供者:lsbq7745
  1. whyu小记-PowerCenter 关于Excel源的导入.pdf

  2. 在实际中应用etl的指导 实际使用etl数据清洗整合的方案。数据清洗 存储 转换的指导方案,理论联系实际。etl工具使用总结。
  3. 所属分类:其它

    • 发布日期:2020-01-02
    • 文件大小:89088
    • 提供者:hegang7939
  1. whyu小记-ETL数据加载策略.pdf

  2. 在实际中应用etl的指导 实际使用etl数据清洗整合的方案。数据清洗 存储 转换的指导方案,理论联系实际。etl工具使用总结。
  3. 所属分类:算法与数据结构

    • 发布日期:2020-01-02
    • 文件大小:71680
    • 提供者:hegang7939
  1. 数据清洗研究.pdf

  2. 在实际中应用etl的指导 实际使用etl数据清洗整合的方案。数据清洗 存储 转换的指导方案,理论联系实际。
  3. 所属分类:其它

    • 发布日期:2020-01-02
    • 文件大小:33792
    • 提供者:hegang7939
  1. 数据仓库建设方案-2018-3-28.pdf

  2. 数据仓库建设方案、数据仓库整体架构、数据挖掘、数据清洗、转换源数据数据导入 数据仓库 服务层 调度 查询 ETL 数据仓库 报表 PDM 访 Oracle 数质量 检查 统计分析 掉用户 惜误 制 回濠 日志 ODS 元数据管理 备份与恢复 T用户 数据仓库管理 数据仓库监控/管理 数据合库技术架构图 业主团EE与人产交所产户金头订解户生 初构注册 参与人相操作人注册 关业务与注 推荐产品 顶日中、托 开资金结草账户 图户柜关用产品户 业约红 账户注销 账户变更 务 产品注 变更登记 链产品
  3. 所属分类:其它

    • 发布日期:2019-10-15
    • 文件大小:241664
    • 提供者:qj309429631
  1. 标准送审稿2019DevOps研发运营(3).pdf

  2. 标准送审稿2019DevOps研发运营(3).pdfYDT1756T2018 7.11配置对象 ..11 7.12配置数据 11 8容量和成本管理 81容量管理…… 12 81.1基础设施容量 12 812业务容量 12 8,2成本管理… 13 821成本合理性 822预算与核算 13 9高可用管理 4 91应用高可用管理, 14 911弹性能力 14 912柔性能力 15 913运行与维护管理 .15 92数据高可用管理…. 16 921数据库高可用 16 922缓存高可用 17 10业务连续
  3. 所属分类:互联网

    • 发布日期:2019-07-05
    • 文件大小:1048576
    • 提供者:zl3533
  1. 官方资料:Oracle 11g中的信息集成.pdf

  2. 官方资料:Oracle 11g中的信息集成 数据集成技术路线图;数据迁移技术;数据联合技术;数据库网关;数据复制技术;流技术:体系架构;ELT技术;OWB;数据清洗;匹配-合并;数据对象设计-统一编辑器;元数据服务;
  3. 所属分类:其它

    • 发布日期:2020-06-22
    • 文件大小:33554432
    • 提供者:newttt
  1. 京东等数据化运营速成手册.pdf

  2. 用于提升互联网公司员工的数据应用能力,即数据化运营能力。首先,从最常用的数据图表切入,帮助执行层正确地绘图,管理层正确地看图;接着,梳理运营中最基本的数据应用知识,涉及数据获取、数据清洗、数据认知、分析框架、指标体系、运营实验等内容。然后,介绍作者认为必要的统计学知识,包括假设检验、方差分析、回归分析和时间序列分解,并引入了管理科学中的规划求解方法。最后,介绍了数据分析工具的发展趋势,并分享了作者近些年的工作及学习心得。 《京东等数据化运营速成手册》适用于互联网公司的数据分析师、运营人员、产品
  3. 所属分类:其它

    • 发布日期:2020-07-20
    • 文件大小:28311552
    • 提供者:qilin08310
  1. 【数据科学笔记】第三章 数据清洗与预处理.pdf

  2. 讲述了如何使用r语言来清理数据和数据与预处理,很多好用实用的小函数。
  3. 所属分类:机器学习

    • 发布日期:2021-02-04
    • 文件大小:438272
    • 提供者:weixin_43773228
  1. 我的数据竞赛经验:本人多次机器学习与大数据竞赛Top5的经验总结,满满的干货,拿好不谢-源码

  2. 数据科学竞赛经验谈 如何做数据分析?如何做数据清洗?如何做特征工程?(面向关系型数据的特征工程系统化分析方法)如何做特征选择?如何选择合适的机器学习模型?如何调参?如何做模型融合?如何上分刷榜? 请各位直接到以下链接阅读: : 想咨询竞赛经验,快速上分,争夺奖金的同学,欢迎来到大卫的小屋与我交流: 纯文字PDF版已经制作完成,已与PPT版一起上传至我的知识星球
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:6144
    • 提供者:weixin_42109732
« 12 3 4 »