您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 最新epson清零软件sscserve 4.3

  2. epson 清零软件打印机用到一定的时候会提示您的硬件过期,到爱普生维修站只需几分钟便可好!就是所说的清零!希望这个软件提供给所有拥有爱普生打印机的朋友们,你们从此以后不用再去花钱清零了,自己就可以办到! 此软件还有很多功能,包括清洗打印头,分单色清洗或全部清洗和强力清洗!重新刷新墨合计数(对没有连续供墨芯片的连续供墨系统是非常有用的),重新刷新打印机数据等等。。。因为自己英文水平有限,也只能参照英文和别的朋友发的帮助来了解到这一点点! 希望会汉化此软件的朋友能够汉化一下,让更多的我们国家的朋
  3. 所属分类:其它

    • 发布日期:2012-06-02
    • 文件大小:960512
    • 提供者:dly_2012
  1. pandas英文教程

  2. 很全面的pandas教程,可以作为工具书参考
  3. 所属分类:算法与数据结构

    • 发布日期:2017-06-15
    • 文件大小:7340032
    • 提供者:qq_25136353
  1. ETL数据挖掘

  2. ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。 ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
  3. 所属分类:Oracle

    • 发布日期:2017-11-14
    • 文件大小:52224
    • 提供者:qq_38882679
  1. Best_Practices_in_Data_Cleaning

  2. 数据清洗实战 非常详细的 英文原版教程 高清pdf SAS软件实现
  3. 所属分类:互联网

    • 发布日期:2018-06-02
    • 文件大小:4194304
    • 提供者:acehand
  1. Cody‘s_Data_Cleaning_Techniques_Using_SAS_(Second_Edtion)

  2. Table of Contents List of Programs ix Preface xv Acknowledgments xvii Checking Values of Character Variables Introduction 1 Using PROC FREQ to List Values 1 Descr iption of the Raw Data File PATIENTS.TXT 2 Using a DATA Step to Check for Invalid Valu
  3. 所属分类:讲义

    • 发布日期:2018-09-18
    • 文件大小:947200
    • 提供者:yanghefeng22
  1. eng_text_norm.zip

  2. 一个英文文本数据清洗工具,之前做项目的一个衍生物。Python 实现。
  3. 所属分类:机器学习

    • 发布日期:2019-08-14
    • 文件大小:5120
    • 提供者:qq_36726835
  1. 公司英文名称(84万).rar

  2. 数据清洗了千万级工商数据,提取了84万标准英文公司名称,来源某查,简单清洗,可自行深度清洗
  3. 所属分类:互联网

    • 发布日期:2020-04-02
    • 文件大小:5242880
    • 提供者:china_python
  1. 【NLP之文本预处理】使用正达则式去除或替换无用信息

  2. 文本预处理介绍 文本预处理一般是指将原始数据通过数据转换,缺失处理等手段转化为符合要求的“新”数据集的过程。预处理本身是一件极其耗费时间的事情,繁琐且涉及细节很多。预处理做的不好,对后面的建模分析等等都会有很大的影响。 对于自然语言的文本数据,处理过程一般包括文本清洗、分词等,其中每个步骤在中英文处理时都有些不同,如中文分词的难度远大于英文,而英文需要转换大小写、词形还原等步骤。 接下来将会分别介绍中英文预处理中的重点环节,结合实际介绍和使用包括jeba,NLTK 等工具包,实现分词和词干提取等
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:47104
    • 提供者:weixin_38747444
  1. 数据清洗之 csv文件读写

  2. csv文件读写 pandas内置了10多种数据源读取函数,常见的就是CSV和EXCEL 使用read_csv方式读取。结果为dataframe格式 在读取csv文件时,文件名称尽量是英文 参数较多,可以自行控制,但很多时候用默认参数 读取csv时,注意编码,常用编码为utf-8、gbk、gbk2312和gb18030等 使用to_csv方法快速保存 import numpy as np import pandas as pd import os os.getcwd() 'D:\\Jupyte
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:133120
    • 提供者:weixin_38620314
  1. Python英文文本分词(无空格)模块wordninja的使用实例

  2. 在NLP中,数据清洗与分词往往是很多工作开始的第一步,大多数工作中只有中文语料数据需要进行分词,现有的分词工具也已经有了很多了,这里就不再多介绍了。英文语料由于其本身存在空格符所以无需跟中文语料同样处理,如果英文数据中没有了空格,那么应该怎么处理呢? 今天介绍一个工具就是专门针对上述这种情况进行处理的,这个工具叫做:wordninja,地址在这里。 下面简单以实例看一下它的功能: def wordinjaFunc(): ''' https://github.com/yishuihanh
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:51200
    • 提供者:weixin_38587155
  1. Tianchi-Multi-Task-Learning:第一名克莱登大学二队方案分享-源码

  2. 实验环境 CUDA版本:11.0驱动程序版本:450.80.02 GPU:TITAN XP Python:3.7.9 pytorch:1.7.0操作系统:ubuntu 20.04 安装依赖包 pip install -r requirements.txt 解决方案及算法说明 数据预处理:数据清洗(剔除中文,非英文,非数字符号) 文本截断:通过对各任务句子长度的分析,选择句子长度256作为截断标准,不足补0 数据输入 由于任务二和任务三存在轴向的类别不均衡问题,因此训练集和验证集的划分采用分层的
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:87040
    • 提供者:weixin_42169971
  1. 学习笔记(05):Python数据清洗实战-csv文件读写

  2. 数据清洗之文件操作 读取:csv文件 实用read_csv方法读写,结果为dataframe格式 读写csv文件,文件名称用英文 参数较多,可以自行控制,很多使用默认参数 读csv,常用编码utf-8,gbk,gbk2312,gb18030 实用to_csv快速保存 import numpy as np import pandas as pd #便于更改文件路径 import os #假如默认的路径下有一ex.csv文件 fd_data = pd.read_csv(‘ex.csv’) f
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:32768
    • 提供者:weixin_38674627
  1. Python实现非正太分布的异常值检测方式

  2. 工作中,我们经常会遇到数据异常,比如说浏览量突增猛降,交易量突增猛降,但是这些数据又不是符合正太分布的,如果用几倍西格玛就不合适,那么我们如何来判断这些变化是否在合理的范围呢? 小白查阅一些资料后,发现可以用箱形图,具体描述如下: 箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。 异常值可以设置为上四分位数的
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:74752
    • 提供者:weixin_38706055