搜索资源 - 数据清洗英文 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 数据清洗英文

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

最新epson清零软件sscserve 4.3
epson 清零软件打印机用到一定的时候会提示您的硬件过期，到爱普生维修站只需几分钟便可好！就是所说的清零！希望这个软件提供给所有拥有爱普生打印机的朋友们，你们从此以后不用再去花钱清零了，自己就可以办到！此软件还有很多功能，包括清洗打印头，分单色清洗或全部清洗和强力清洗！重新刷新墨合计数（对没有连续供墨芯片的连续供墨系统是非常有用的），重新刷新打印机数据等等。。。因为自己英文水平有限，也只能参照英文和别的朋友发的帮助来了解到这一点点！希望会汉化此软件的朋友能够汉化一下，让更多的我们国家的朋
所属分类：其它
- 发布日期：2012-06-02
- 文件大小：960512
- 提供者：dly_2012

pandas英文教程
很全面的pandas教程，可以作为工具书参考
所属分类：算法与数据结构
- 发布日期：2017-06-15
- 文件大小：7340032
- 提供者：qq_25136353

ETL数据挖掘
ETL，是英文 Extract-Transform-Load 的缩写，用来描述将数据从来源端经过抽取（extract）、转换（transform）、加载（load）至目的端的过程。ETL一词较常用在数据仓库，但其对象并不限于数据仓库。 ETL是构建数据仓库的重要一环，用户从数据源抽取出所需的数据，经过数据清洗,最终按照预先定义好的数据仓库模型，将数据加载到数据仓库中去。
所属分类：Oracle
- 发布日期：2017-11-14
- 文件大小：52224
- 提供者：qq_38882679

Best_Practices_in_Data_Cleaning
数据清洗实战非常详细的英文原版教程高清pdf SAS软件实现
所属分类：互联网
- 发布日期：2018-06-02
- 文件大小：4194304
- 提供者：acehand

Cody‘s_Data_Cleaning_Techniques_Using_SAS_（Second_Edtion）
Table of Contents List of Programs ix Preface xv Acknowledgments xvii Checking Values of Character Variables Introduction 1 Using PROC FREQ to List Values 1 Descr iption of the Raw Data File PATIENTS.TXT 2 Using a DATA Step to Check for Invalid Valu
所属分类：讲义
- 发布日期：2018-09-18
- 文件大小：947200
- 提供者：yanghefeng22

eng_text_norm.zip
一个英文文本数据清洗工具，之前做项目的一个衍生物。Python 实现。
所属分类：机器学习
- 发布日期：2019-08-14
- 文件大小：5120
- 提供者：qq_36726835

公司英文名称(84万).rar
数据清洗了千万级工商数据，提取了84万标准英文公司名称，来源某查，简单清洗，可自行深度清洗
所属分类：互联网
- 发布日期：2020-04-02
- 文件大小：5242880
- 提供者：china_python

【NLP之文本预处理】使用正达则式去除或替换无用信息
文本预处理介绍文本预处理一般是指将原始数据通过数据转换,缺失处理等手段转化为符合要求的“新”数据集的过程。预处理本身是一件极其耗费时间的事情，繁琐且涉及细节很多。预处理做的不好，对后面的建模分析等等都会有很大的影响。对于自然语言的文本数据,处理过程一般包括文本清洗、分词等，其中每个步骤在中英文处理时都有些不同,如中文分词的难度远大于英文,而英文需要转换大小写、词形还原等步骤。接下来将会分别介绍中英文预处理中的重点环节，结合实际介绍和使用包括jeba,NLTK 等工具包,实现分词和词干提取等
所属分类：其它
- 发布日期：2020-12-22
- 文件大小：47104
- 提供者：weixin_38747444

数据清洗之 csv文件读写
csv文件读写 pandas内置了10多种数据源读取函数，常见的就是CSV和EXCEL 使用read_csv方式读取。结果为dataframe格式在读取csv文件时，文件名称尽量是英文参数较多，可以自行控制，但很多时候用默认参数读取csv时，注意编码，常用编码为utf-8、gbk、gbk2312和gb18030等使用to_csv方法快速保存 import numpy as np import pandas as pd import os os.getcwd() 'D:\\Jupyte
所属分类：其它
- 发布日期：2020-12-21
- 文件大小：133120
- 提供者：weixin_38620314

Python英文文本分词(无空格)模块wordninja的使用实例
在NLP中，数据清洗与分词往往是很多工作开始的第一步，大多数工作中只有中文语料数据需要进行分词，现有的分词工具也已经有了很多了，这里就不再多介绍了。英文语料由于其本身存在空格符所以无需跟中文语料同样处理，如果英文数据中没有了空格，那么应该怎么处理呢？今天介绍一个工具就是专门针对上述这种情况进行处理的，这个工具叫做：wordninja，地址在这里。下面简单以实例看一下它的功能: def wordinjaFunc(): ''' https://github.com/yishuihanh
所属分类：其它
- 发布日期：2020-12-31
- 文件大小：51200
- 提供者：weixin_38587155

Tianchi-Multi-Task-Learning:第一名克莱登大学二队方案分享-源码
实验环境 CUDA版本：11.0驱动程序版本：450.80.02 GPU：TITAN XP Python：3.7.9 pytorch：1.7.0操作系统：ubuntu 20.04 安装依赖包 pip install -r requirements.txt 解决方案及算法说明数据预处理：数据清洗（剔除中文，非英文，非数字符号）文本截断：通过对各任务句子长度的分析，选择句子长度256作为截断标准，不足补0 数据输入由于任务二和任务三存在轴向的类别不均衡问题，因此训练集和验证集的划分采用分层的
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：87040
- 提供者：weixin_42169971

学习笔记(05):Python数据清洗实战-csv文件读写
数据清洗之文件操作读取：csv文件实用read_csv方法读写，结果为dataframe格式读写csv文件，文件名称用英文参数较多，可以自行控制，很多使用默认参数读csv，常用编码utf-8,gbk,gbk2312,gb18030 实用to_csv快速保存 import numpy as np import pandas as pd #便于更改文件路径 import os #假如默认的路径下有一ex.csv文件 fd_data = pd.read_csv(‘ex.csv’) f
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：32768
- 提供者：weixin_38674627

Python实现非正太分布的异常值检测方式
工作中，我们经常会遇到数据异常，比如说浏览量突增猛降，交易量突增猛降，但是这些数据又不是符合正太分布的，如果用几倍西格玛就不合适，那么我们如何来判断这些变化是否在合理的范围呢？小白查阅一些资料后，发现可以用箱形图，具体描述如下：箱形图（英文：Box plot），又称为盒须图、盒式图、盒状图或箱线图，是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。箱形图最大的优点就是不受异常值的影响，能够准确稳定地描绘出数据的离散分布情况，同时也利于数据的清洗。异常值可以设置为上四分位数的
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：74752
- 提供者：weixin_38706055