点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 数据清洗详解
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
详解BI项目中的ETL
L是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI 项目重要的一个环节。通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。
所属分类:
专业指导
发布日期:2010-01-08
文件大小:30720
提供者:
veedoo
大数据号码清洗系统详解
对于大数据前端处理的号码采集与清洗做详细介绍
所属分类:
电信
发布日期:2016-06-07
文件大小:311296
提供者:
ctd070809
大数据整理分析号码数据清洗测拨详解
主要对于大数据整理,大数据分析,以及号码数据清洗,号码拨测系统的搭建,以及组网等介绍.
所属分类:
互联网
发布日期:2016-07-14
文件大小:190464
提供者:
ctd070809
数据仓库ETL算法详解
1. ETL的定义:是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去; 2. 常用的ETL工具:主要有三大主流工具,分别是Ascential公司的Datastage、Informatica公司的Powercenter、NCR Teradata公司的ETL Automation.还有其他开源工具,如PDI(K
所属分类:
算法与数据结构
发布日期:2017-11-08
文件大小:113664
提供者:
lt_csvn
ETL详解.docx
1 ETL是什么 3 2 ETL和大数据有什么关联 3 3 ETL有哪些过程,要进行哪些操作 3 3.1 抽取作业 4 3.1.1 手工开发抽取作业时候的常用方法 4 3.1.2 更新数据的时间和数量的问题 5 3.2 转换作业 8 3.2.1 数据清洗 8 3.2.2 数据转换 9 3.3 加载作业 11 3.4 流程控制 11 3.4.1 流程步骤控制能力 12 3.4.2 系统的划分和前后流程的依赖 12 3.4.3 合理的调度算法 12 3.4.4 日志和警告系统 12 3.4.5 较高
所属分类:
互联网
发布日期:2020-04-30
文件大小:66560
提供者:
liliu0401
ETL设计详解(数据抽取、清洗与转换).docx
qqqadfgDADSD沙发asdvavadvasdvasdvasdvasdadvasdasdvasdvasdasdvasdvasdvasdvasdv
所属分类:
其它
发布日期:2020-02-29
文件大小:20480
提供者:
qq_43725031
实例详解机器学习如何解决问题
随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还 是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有 侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问 题。我们结合美团在机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器 学习InAction系列”标签的文章),介绍机器学习在解决工业界问题的实战中所需的基本技 术、经验和技巧。本文主要结合实际问题,概要地介绍机器学习解决实际问题的整个流
所属分类:
机器学习
发布日期:2019-07-02
文件大小:1048576
提供者:
abacaba
python数据清洗系列之字符串处理详解
主要介绍了python数据清洗之字符串处理的相关资料,需要的朋友可以参考下
所属分类:
其它
发布日期:2020-09-21
文件大小:242688
提供者:
weixin_38553791
Pandas 数据处理,数据清洗详解
今天小编就为大家分享一篇Pandas 数据处理,数据清洗详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
所属分类:
其它
发布日期:2020-09-20
文件大小:57344
提供者:
weixin_38622827
对python数据清洗容易遇到的函数-re.sub bytes string详解
今天小编就为大家分享一篇对python数据清洗容易遇到的函数-re.sub bytes string详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
所属分类:
其它
发布日期:2020-09-19
文件大小:59392
提供者:
weixin_38576811
django ORM之values和annotate使用详解
任务需求:项目中有个问题表,存储所有的问题,以_id为编号,由于_id未做唯一校验,所以早期数据有多个问题使用同一编号的情况。 需求就是找出编号有重复的数据,只保留第一个 开始之前 使用了values和annotate两个函数 简单的来说values可以理解成展示models指定列的值 annotate起到了group by的作用, 所以我做的事就是对指定字段按个数进行统计,然后留下重复编号的数据,进行清洗 看看数据库数据 查看每条数据的_id的值 对_id数据条数进行统计 转换数据格式为
所属分类:
其它
发布日期:2020-12-17
文件大小:55296
提供者:
weixin_38737521
详解Pandas 处理缺失值指令大全
前言 运用pandas 库对所得到的数据进行数据清洗,复习一下相关的知识。 1 数据清洗 1.1 处理缺失数据 对于数值型数据,分为缺失值(NAN)和非缺失值,对于缺失值的检测,可以通过Python中pandas库的Series类对象的isnull方法进行检测。 import pandas as pd import numpy as np string_data = pd.Series(['Benzema', 'Messi', np.nan, 'Ronaldo']) string_dat
所属分类:
其它
发布日期:2020-12-17
文件大小:56320
提供者:
weixin_38706045
Pandas 数据处理,数据清洗详解
如下所示: # -*-coding:utf-8-*- from pandas import DataFrame import pandas as pd import numpy as np """ 获取行列数据 """ df = DataFrame(np.random.rand(4, 5), columns=['A', 'B', 'C', 'D', 'E']) print df print df['col_sum'] = df.apply(lambda x: x.sum(), axis=1)
所属分类:
其它
发布日期:2020-12-25
文件大小:58368
提供者:
weixin_38590456
python数据清洗系列之字符串处理详解
前言 数据清洗是一项复杂且繁琐(kubi)的工作,同时也是整个数据分析过程中最为重要的环节。有人说一个分析项目80%的时间都是在清洗数据,这听起来有些匪夷所思,但在实际的工作中确实如此。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变的更适合进行后续的分析工作。换句话说就是有”脏”数据要洗,干净的数据也要洗。 在数据分析中,特别是文本分析中,字符处理需要耗费极大的精力,因而了解字符处理对于数据分析而言,也是一项很重要的能力。 字符串处理方法 首先我们先了解下都有哪些基础方法 首先
所属分类:
其它
发布日期:2020-12-24
文件大小:244736
提供者:
weixin_38586279
Python使用Pandas库常见操作详解
本文实例讲述了Python使用Pandas库常见操作。分享给大家供大家参考,具体如下: 1、概述 Pandas 是Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas常用于处理带行列标签的矩阵数据、与 SQL 或 Excel 表类似的表格数据,应用于金融、统计、社会科学、工程等领域里的数据整理与清洗、数据分析与建模、数据可视化与制表等工作。 数据类型:Pandas 不改变原始的输入数据,而是复制数据生成新的对象,有普通对象构成的
所属分类:
其它
发布日期:2020-12-23
文件大小:92160
提供者:
weixin_38698367
详解python深浅拷贝区别
在Python中对象的赋值其实就是对象的引用。当创建一个对象,把它赋值给另一个变量的时候,python并没有拷贝这个对象,只是拷贝了这个对象的引用而已。 浅拷贝:拷贝了最外围的对象本身,内部的元素都只是拷贝了一个引用而已。也就是,把对象复制一遍,但是该对象中引用的其他对象我不复制 深拷贝:外围和内部元素都进行了拷贝对象本身,而不是引用。也就是,把对象复制一遍,并且该对象中引用的其他对象我也复制。 深浅拷贝的作用 1,减少内存的使用 2,以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份
所属分类:
其它
发布日期:2021-01-01
文件大小:112640
提供者:
weixin_38743084
干货分享|详解特征工程与推荐系统及其实践
本文来自于网络,本文主要介绍了特征工程,以及一些常见的特征工程的方法,以及自然语言处理的特征工程,希望对您的学习有所帮助。协同过滤CollaborativeFiltering特征工程FeatureEngineering推荐系统实战注意点首先我们看一下机器学习的五大环节。一是特征工程。第二是算法定义和调参,就是你该选择什么样的算法,用什么样的参数进行调节。第三是数据采集和清洗,接下来是实现这个算法并进行优化。‘I’代表和业务生产系统集成,所以我们就会简称为FaDAI这五大步骤。特征工程是这五大环节
所属分类:
其它
发布日期:2021-02-24
文件大小:575488
提供者:
weixin_38677244
干货分享|详解特征工程与推荐系统及其实践
本文来自于网络,本文主要介绍了特征工程,以及一些常见的特征工程的方法,以及自然语言处理的特征工程,希望对您的学习有所帮助。协同过滤CollaborativeFiltering特征工程FeatureEngineering推荐系统实战注意点 首先我们看一下机器学习的五大环节。一是特征工程。第二是算法定义和调参,就是你该选择什么样的算法,用什么样的参数进行调节。第三是数据采集和清洗,接下来是实现这个算法并进行优化。‘I’代表和业务生产系统集成,所以我们就会简称为FaDAI这五大步骤。特征工程是这五大环
所属分类:
其它
发布日期:2021-01-27
文件大小:575488
提供者:
weixin_38555350
Yii2中的场景(scenario)和验证规则(rule)详解
前言 场景,顾名思义,就是一个情景,一种场面。在yii2中也有场景,这个场景跟你所理解的场景含义差不多。 和用户有交互的系统必不可少的功能包括收集用户数据、校验和处理。实际业务中,往往还需要将数据进行持久化存储。出于安全考虑,开发人员应当牢牢把握“客户端的输入都是不可信”的准则,客户端传过来的数据先进行过滤和清洗后再存储或传递到内部系统。 Yii2推荐使用Model类来收集和校验用户数据,持久化的ActiveRecord类是其子类。Model类的load和validate两个方法,分别用来收集
所属分类:
其它
发布日期:2021-01-21
文件大小:105472
提供者:
weixin_38704284
详解用Python处理HTML转义字符的5种方式
写爬虫是一个发送请求,提取数据,清洗数据,存储数据的过程。在这个过程中,不同的数据源返回的数据格式各不相同,有 JSON 格式,有 XML 文档,不过大部分还是 HTML 文档,HTML 经常会混杂有转移字符,这些字符我们需要把它转义成真正的字符。 什么是转义字符 在 HTML 中 、& 等字符有特殊含义( 用于标签中,& 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用 HTML 的转义字符串(Escape Sequence),例如 < 的转义字符
所属分类:
其它
发布日期:2021-01-20
文件大小:50176
提供者:
weixin_38679178
«
1
2
»