您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 详解BI项目中的ETL

  2. L是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI 项目重要的一个环节。通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。
  3. 所属分类:专业指导

    • 发布日期:2010-01-08
    • 文件大小:30720
    • 提供者:veedoo
  1. 大数据号码清洗系统详解

  2. 对于大数据前端处理的号码采集与清洗做详细介绍
  3. 所属分类:电信

    • 发布日期:2016-06-07
    • 文件大小:311296
    • 提供者:ctd070809
  1. 大数据整理分析号码数据清洗测拨详解

  2. 主要对于大数据整理,大数据分析,以及号码数据清洗,号码拨测系统的搭建,以及组网等介绍.
  3. 所属分类:互联网

    • 发布日期:2016-07-14
    • 文件大小:190464
    • 提供者:ctd070809
  1. 数据仓库ETL算法详解

  2. 1. ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去; 2. 常用的ETL工具:主要有三大主流工具,分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCR Teradata公司的ETL Automation.还有其他开源工具,如PDI(K
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-08
    • 文件大小:113664
    • 提供者:lt_csvn
  1. ETL详解.docx

  2. 1 ETL是什么 3 2 ETL和大数据有什么关联 3 3 ETL有哪些过程,要进行哪些操作 3 3.1 抽取作业 4 3.1.1 手工开发抽取作业时候的常用方法 4 3.1.2 更新数据的时间和数量的问题 5 3.2 转换作业 8 3.2.1 数据清洗 8 3.2.2 数据转换 9 3.3 加载作业 11 3.4 流程控制 11 3.4.1 流程步骤控制能力 12 3.4.2 系统的划分和前后流程的依赖 12 3.4.3 合理的调度算法 12 3.4.4 日志和警告系统 12 3.4.5 较高
  3. 所属分类:互联网

    • 发布日期:2020-04-30
    • 文件大小:66560
    • 提供者:liliu0401
  1. ETL设计详解(数据抽取、清洗与转换).docx

  2. qqqadfgDADSD沙发asdvavadvasdvasdvasdvasdadvasdasdvasdvasdasdvasdvasdvasdvasdv
  3. 所属分类:其它

    • 发布日期:2020-02-29
    • 文件大小:20480
    • 提供者:qq_43725031
  1. 实例详解机器学习如何解决问题

  2. 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还 是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有 侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问 题。我们结合美团在机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器 学习InAction系列”标签的文章),介绍机器学习在解决工业界问题的实战中所需的基本技 术、经验和技巧。本文主要结合实际问题,概要地介绍机器学习解决实际问题的整个流
  3. 所属分类:机器学习

    • 发布日期:2019-07-02
    • 文件大小:1048576
    • 提供者:abacaba
  1. python数据清洗系列之字符串处理详解

  2. 主要介绍了python数据清洗之字符串处理的相关资料,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-21
    • 文件大小:242688
    • 提供者:weixin_38553791
  1. Pandas 数据处理,数据清洗详解

  2. 今天小编就为大家分享一篇Pandas 数据处理,数据清洗详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-20
    • 文件大小:57344
    • 提供者:weixin_38622827
  1. 对python数据清洗容易遇到的函数-re.sub bytes string详解

  2. 今天小编就为大家分享一篇对python数据清洗容易遇到的函数-re.sub bytes string详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  3. 所属分类:其它

    • 发布日期:2020-09-19
    • 文件大小:59392
    • 提供者:weixin_38576811
  1. django ORM之values和annotate使用详解

  2. 任务需求:项目中有个问题表,存储所有的问题,以_id为编号,由于_id未做唯一校验,所以早期数据有多个问题使用同一编号的情况。 需求就是找出编号有重复的数据,只保留第一个 开始之前 使用了values和annotate两个函数 简单的来说values可以理解成展示models指定列的值 annotate起到了group by的作用, 所以我做的事就是对指定字段按个数进行统计,然后留下重复编号的数据,进行清洗 看看数据库数据 查看每条数据的_id的值 对_id数据条数进行统计 转换数据格式为
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:55296
    • 提供者:weixin_38737521
  1. 详解Pandas 处理缺失值指令大全

  2. 前言 运用pandas 库对所得到的数据进行数据清洗,复习一下相关的知识。 1 数据清洗 1.1 处理缺失数据 对于数值型数据,分为缺失值(NAN)和非缺失值,对于缺失值的检测,可以通过Python中pandas库的Series类对象的isnull方法进行检测。 import pandas as pd import numpy as np string_data = pd.Series(['Benzema', 'Messi', np.nan, 'Ronaldo']) string_dat
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:56320
    • 提供者:weixin_38706045
  1. Pandas 数据处理,数据清洗详解

  2. 如下所示: # -*-coding:utf-8-*- from pandas import DataFrame import pandas as pd import numpy as np """ 获取行列数据 """ df = DataFrame(np.random.rand(4, 5), columns=['A', 'B', 'C', 'D', 'E']) print df print df['col_sum'] = df.apply(lambda x: x.sum(), axis=1)
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:58368
    • 提供者:weixin_38590456
  1. python数据清洗系列之字符串处理详解

  2. 前言 数据清洗是一项复杂且繁琐(kubi)的工作,同时也是整个数据分析过程中最为重要的环节。有人说一个分析项目80%的时间都是在清洗数据,这听起来有些匪夷所思,但在实际的工作中确实如此。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变的更适合进行后续的分析工作。换句话说就是有”脏”数据要洗,干净的数据也要洗。 在数据分析中,特别是文本分析中,字符处理需要耗费极大的精力,因而了解字符处理对于数据分析而言,也是一项很重要的能力。 字符串处理方法 首先我们先了解下都有哪些基础方法 首先
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:244736
    • 提供者:weixin_38586279
  1. Python使用Pandas库常见操作详解

  2. 本文实例讲述了Python使用Pandas库常见操作。分享给大家供大家参考,具体如下: 1、概述 Pandas 是Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas常用于处理带行列标签的矩阵数据、与 SQL 或 Excel 表类似的表格数据,应用于金融、统计、社会科学、工程等领域里的数据整理与清洗、数据分析与建模、数据可视化与制表等工作。 数据类型:Pandas 不改变原始的输入数据,而是复制数据生成新的对象,有普通对象构成的
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:92160
    • 提供者:weixin_38698367
  1. 详解python深浅拷贝区别

  2. 在Python中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。 浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复制 深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用的其他对象我也复制。 深浅拷贝的作用 1,减少内存的使用 2,以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份
  3. 所属分类:其它

    • 发布日期:2021-01-01
    • 文件大小:112640
    • 提供者:weixin_38743084
  1. 干货分享|详解特征工程与推荐系统及其实践

  2. 本文来自于网络,本文主要介绍了特征工程,以及一些常见的特征工程的方法,以及自然语言处理的特征工程,希望对您的学习有所帮助。协同过滤CollaborativeFiltering特征工程FeatureEngineering推荐系统实战注意点首先我们看一下机器学习的五大环节。一是特征工程。第二是算法定义和调参,就是你该选择什么样的算法,用什么样的参数进行调节。第三是数据采集和清洗,接下来是实现这个算法并进行优化。‘I’代表和业务生产系统集成,所以我们就会简称为FaDAI这五大步骤。特征工程是这五大环节
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:575488
    • 提供者:weixin_38677244
  1. 干货分享|详解特征工程与推荐系统及其实践

  2. 本文来自于网络,本文主要介绍了特征工程,以及一些常见的特征工程的方法,以及自然语言处理的特征工程,希望对您的学习有所帮助。协同过滤CollaborativeFiltering特征工程FeatureEngineering推荐系统实战注意点 首先我们看一下机器学习的五大环节。一是特征工程。第二是算法定义和调参,就是你该选择什么样的算法,用什么样的参数进行调节。第三是数据采集和清洗,接下来是实现这个算法并进行优化。‘I’代表和业务生产系统集成,所以我们就会简称为FaDAI这五大步骤。特征工程是这五大环
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:575488
    • 提供者:weixin_38555350
  1. Yii2中的场景(scenario)和验证规则(rule)详解

  2. 前言 场景,顾名思义,就是一个情景,一种场面。在yii2中也有场景,这个场景跟你所理解的场景含义差不多。 和用户有交互的系统必不可少的功能包括收集用户数据、校验和处理。实际业务中,往往还需要将数据进行持久化存储。出于安全考虑,开发人员应当牢牢把握“客户端的输入都是不可信”的准则,客户端传过来的数据先进行过滤和清洗后再存储或传递到内部系统。 Yii2推荐使用Model类来收集和校验用户数据,持久化的ActiveRecord类是其子类。Model类的load和validate两个方法,分别用来收集
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:105472
    • 提供者:weixin_38704284
  1. 详解用Python处理HTML转义字符的5种方式

  2. 写爬虫是一个发送请求,提取数据,清洗数据,存储数据的过程。在这个过程中,不同的数据源返回的数据格式各不相同,有 JSON 格式,有 XML 文档,不过大部分还是 HTML 文档,HTML 经常会混杂有转移字符,这些字符我们需要把它转义成真正的字符。 什么是转义字符 在 HTML 中 、& 等字符有特殊含义( 用于标签中,& 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用 HTML 的转义字符串(Escape Sequence),例如 < 的转义字符
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:50176
    • 提供者:weixin_38679178
« 12 »