您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Python数据分析 升级版

  2. 01.第一讲 工作环境准备及数据分析建模理论基础 02.第二讲 数据采集与操作 03.第三讲_数据分析工具Pandas 04.第四讲_数据可视化 05.第五讲_时间序列数据分析 06.第六讲_文本数据分析 07.第七讲_图像数据处理及分析 08.第八讲_机器学习基础及机器学习库scikit-learn入门 09.第九讲_项目实战
  3. 所属分类:Python

    • 发布日期:2017-04-24
    • 文件大小:34
    • 提供者:qq_16192915
  1. 机器学习工程师从算法基础到实战案例

  2. 【课程内容】 第一阶段:Python数据分析与建模库 Python快速入门 科学计算库Numpy 数据分析处理库Pandas 可视化库Matplotlib Seaborn可视化库 第二阶段:机器学习经典算法 回归算法 决策树与随机森林 贝叶斯算法 Xgboost 支持向量机算法 时间序列AIRMA模型 神经网络基础 神经网络架构 PCA降维与SVD矩阵分解 聚类算法 推荐系统 Word2Vec 第三阶段:机器学习案例实战 使用Python分析科比生涯数据 案例实战-信用卡欺诈检测 Python
  3. 所属分类:机器学习

    • 发布日期:2018-03-14
    • 文件大小:76
    • 提供者:u013844840
  1. Python数据分析

  2. 本书是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组、matplotlib和pandas开始,陆续介绍了数据加工、数据处理和数据可视化等内容。同时,本书还介绍了信号处理、数据库、文本分析、机器学习、互操作性和性能优化等高级主题。在本书的结尾,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。
  3. 所属分类:Python

    • 发布日期:2018-02-28
    • 文件大小:5242880
    • 提供者:zy1761069
  1. Python数据分析和人工智能随堂笔记(千峰)

  2. Python数据分析和人工智能随堂笔记(千峰) 包含:numpy,opencv,pandas,数据预处理,美国大选政治献金,scipy,机器学习与回归算法,决策树,贝叶斯&文本处理,支持向量机,tensorflow……
  3. 所属分类:机器学习

    • 发布日期:2020-05-06
    • 文件大小:1048576
    • 提供者:SFS_Ccjm
  1. Python读写文本的代码.zip

  2. 提供了Python读写文本和读写excel的代码。Python拥有丰富且优质量的库,这些库涉及游戏开发,科学计算,数据库接口,网络脚本编程,资源提供等各个方面。 *资源库:PYPl ——拥有超过85000个Python模块和脚本,这些资源库可以用来解决各种数据库处理,计算机视觉实现,数据分析等情况 *机器学习和数据科学库:如 TensorFlow , Scikit-Learn , Keras , Pandas *标准库和第三方库:提供各种WEb框架,爬虫框架,机器学习框架,数据分析框架
  3. 所属分类:互联网

    • 发布日期:2020-07-27
    • 文件大小:2048
    • 提供者:weixin_41486747
  1. 11个Python Pandas小技巧让你的工作更高效(附代码实例)

  2. 本文为你介绍Pandas隐藏的炫酷小技巧,我相信这些会对你有所帮助。 或许本文中的某些命令你早已知晓,只是没意识到它还有这种打开方式。 Pandas是一个在Python中广泛应用的数据分析包。市面上有很多关于Pandas的经典教程,但本文介绍几个隐藏的炫酷小技巧,我相信这些会对你有所帮助。 1. read_csv 这是读取数据的入门级命令。当要你所读取的数据量特别大时,试着加上这个参数nrows = 5,就可以在载入全部数据前先读取一小部分数据。如此一来,就可以避免选错分隔符这样的错误啦(数据
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:81920
    • 提供者:weixin_38628647
  1. 在Python中利用Pandas库处理大数据的简单介绍

  2. 在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:     硬件环境         CPU:3.5 GHz Intel Core i7         内存:32 GB HDDR 3 1600 MHz       
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:235520
    • 提供者:weixin_38632797
  1. python 数据分析–数据处理工具Pandas(1)

  2. 数据处理工具Pandas1. 序列和数据框的构造1.1 构造序列1.2 构造数据框2. Pandas从外部读取数据2.1 文本文件的读取2.2 电子表格的读取2.3 数据库的读取3. 数据描述统计 说明: 本文用到的数据集下载地址: 链接:https://pan.baidu.com/s/1zSOypUVoYlGcs-z2pT2t0w 提取码:z95a Pands模块可以帮助数据分析师轻松地解决数据的预处理问题,如数据类型的转换、缺失值的处理、描述性统计分析、数据的汇总等。Pandas模块的核心
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:561152
    • 提供者:weixin_38546024
  1. Pandas数据处理学习笔记完整(待更)

  2. 这里写目录标题pandas文件读写1.1读取文本文件1.2 文本文件存储1.3 读取Excel文件1.4 Excel文件存储二 Series2.1 创建Series对象2.2 Series基本操作2.3 Series小结三 DataFrame3.1 DataFrame基本操作:3.2 numpy中的描述性统计函数3.3 Pandas中数值型特征的描述性统计方法3.4 DataFrame数据:类别型特征的描述性统计四 转换与处理时间序列数据4.1 转换字符串时间为标准时间 pandas文件读写 P
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:1048576
    • 提供者:weixin_38693476
  1. Pandas文本数据分析

  2. import pandas as pd df = pd.read_csv('superstarinfo.txt') df.head() 序号 中文名 性别 国籍 民族 星座 血型 身高 体重 出生地 出生日期 毕业院校 代表作品 0 1 赵丽颖 女 中国 汉族 天秤座 A型 165cm 44.6kg 河北省廊坊市 1987年10月16日 NaN 花千骨、楚乔传、陆贞传奇、杉杉来了、知否知否应是绿肥红瘦、乘风破浪、西游记女儿国 1 2 迪丽热巴 女 中国 维吾尔族 双子座 N
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:117760
    • 提供者:weixin_38630463
  1. 【技巧】11 个 Python Pandas 小技巧让你更高效

  2. 作者 / Shiu-TangLi,翻译 / 吴振东校对 / 王雨桐,编辑 / 昱良或许本文中的某些命令你早已知晓,只是没意识到它还有这种打开方式。Pandas是一个在Python中广泛应用的数据分析包。市面上有很多关于Pandas的经典教程,但本文介绍几个隐藏的炫酷小技巧,我相信这些会对你有所帮助。 1. read_csv这是读取数据的入门级命令。当要你所读取的数据量特别大时,试着加上这个参数 nrows = 5,就可以在载入全部数据前先读取一小部分数据。如此一来,就可以避免选错分隔符这样的错误
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:236544
    • 提供者:weixin_38604395
  1. web-scraping-challenge:构建一个Web应用程序,该应用程序会抓取各种网站以获取与火星任务有关的数据,并在单个HTML页面中显示该信息-源码

  2. 网页抓取作业-火星任务 在此作业中,您将构建一个Web应用程序,该应用程序将刮擦各个网站以获取与“火星任务”相关的数据,并将该信息显示在单个HTML页面中。 第1步-刮 使用Jupyter Notebook,BeautifulSoup,Pandas和Requests / Splinter完成初始刮擦。 创建一个名为task_to_mars.ipynb的Jupyter Notebook文件,并使用该文件完成所有的抓取和分析任务。 以下概述了您需要抓取的内容。 美国宇航局火星新闻 刮擦NASA火星
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:468992
    • 提供者:weixin_42138376
  1. UNGDC:联合国一般辩论语料库(UNGDC)是通常在每年9月举行的高级别联合国论坛上发表的所有演讲的数据集-源码

  2. 联合国开发计划署 联合国一般性辩论(UNGD)是每年一度的高级别活动,每个联合国会员国都可以向所有其他会员国讲话。 UNGD语料库(UNGDC)提供了1970年至2018年期间200个国家/地区的英语演讲文本:总共约8,093场演讲。 UNGDC数据集由Slava Jankin Mikhaylov,Alexander Baturo和Niheer Dasandi于2017年创建。有关最新版本,请参见其。 您也可以在此上找到其所有复制材料。 他们在《研究与政治》( Research&Politic
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:5242880
    • 提供者:weixin_42181693
  1. 情感分析-源码

  2. 情绪分析 情感分析用于分析情感和评估内容,以将其区分为积极,消极和中立。 大多数评论网站出于商业目的使用情绪分析。 对推文的情感分析可以区分出各种各样的数据。 同样,推文在数据中具有不同的特征,例如主题标签,消息长度,表情符号,这些特征可以构成进行情感分析的方式。 情感分析(也称为观点挖掘)使用自然语言处理来识别和分类文本数据的情感或态度。 它可以在文档,句子或多媒体内容上完成。 可以使用不同的机器学习算法(例如决策树分类,逻辑回归,线性回归等)进行情感分析。 先决条件 请在运行代码之前安装以下
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:738304
    • 提供者:weixin_42108948
  1. 数据分析师课程-源码

  2. 完整的数据分析师培训:Python,NumPy,Pandas,数据收集,预处理,数据类型,数据可视化 你会学到什么 本课程提供了成为数据分析师所需的完整准备 用按需的数据技能填写简历:Python编程,NumPy,熊猫,数据准备-数据收集,数据清理,数据预处理,数据可视化; 数据分析,数据分析 全面了解数据分析师的角色 学习初学者和高级Python 学习Python数学 我们将教您NumPy和熊猫,基础知识和进阶知识 能够处理文本文件 了解不同的数据类型及其内存使用情况 了解如何通过简单的脚本
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:551936
    • 提供者:weixin_42143806
  1. Text-Preprocessing-App-Reviews:使用Python Pandas处理数据; 使用Python NLTK和正则表达式进行文本预处理-源码

  2. Text_Preprocessing_App_Reviews 对从Google Play商店检索到的应用程序评论数据进行了数据整理和探索性数据分析 使用Python NLTK库和正则表达式对914054条评论进行了文本预处理 可视化每个应用类别的评分和评论时间的时间变化
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:195584
    • 提供者:weixin_42135462
  1. nlp_profiler:一个简单的NLP库允许使用一个或多个文本列来分析数据集。 给定数据集和包含文本数据的列名称时,NLP Profiler将返回有关该列中文本的高级见解或低级粒度统计信息-源码

  2. NLP探查器 ||| ||| 一个简单的NLP库,允许使用一个或多个文本列来分析数据集。 给定数据集和该列中包含文本数据的列名称时,NLP Profiler会返回有关文本的高级洞察或低级/粒度统计信息。 简而言之:可以将其视为使用pandas.describe()函数或在数据框架上运行 ,但适用于包含文本列的数据集,而不是通常的柱状数据集。 目录 社区/聊天/通讯: 你从图书馆得到什么? 输入熊猫数据框系列作为输入参数。 您将获得一个新的数据框,该数据框具有有关每行已解析文本的各种功
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42117340
  1. 墨西哥政府报告:2019年墨西哥政府报告上的文本挖掘,涵盖从PDF文件中提取文本到绘制结果的过程-源码

  2. 墨西哥政府报告文本分析 该存储库记录了以下过程:从PDF中提取文本,进行清理,将其通过NLP管道传递,并用图形显示结果。 PDF是9月1日发布的2019年政府报告。 PDF位于数据文件夹中。 要求 该项目使用以下Python库 PyPDF2 :用于从PDF文件中提取文本。 spaCy :用于将提取的文本传递到NLP管道中。 NumPy :用于快速矩阵运算。 pandas :用于分析数据集并从中获取见解。 matplotlib :用于创建图形和绘图。 seaborn :用于增强matp
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:14680064
    • 提供者:weixin_42171132
  1. texthero:从零到英雄的文本预处理,表示和可视化-源码

  2. 从零到英雄的文本预处理,表示和可视化。 •••• •• 从零到英雄 Texthero是一个Python工具箱,可快速轻松地处理基于文本的数据集。 Texthero非常简单易学,可以在熊猫上使用。 Texthero具有与Pandas相同的表现力和力量,并有大量文献记载。 Texthero是现代的,是为2020年代的程序员设计的,几乎没有语言方面的知识。 您可以将Texthero视为帮助您理解和使用基于文本的数据集的工具。 给定表格数据集,很容易掌握主要概念。 相反,在给定文本数据集的情况下,
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:23068672
    • 提供者:weixin_42144707
  1. [AI 基础] Pandas使用总结

  2. 前言 Pandas是机器学习三剑客之一,我们知道Numpy能够对数据进行很好的分析、操作、矩阵计算等,Pandas更侧重于数据的处理和分析,它的底层是使用Numpy实现的,在数据处理和分析方面提供了强大的功能。下面就总结一下日常使用操作。 程序运行环境:window10 Python3.7 (Anaconda) Pandas 1.0.1 编辑工具:jupyter 在日常数据分析中,经常使用的是CSV文件,本文也主要记录该文件的相关处理方式。 (补充:默认的csv文件是以“,”隔开的文本文件,使用
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:88064
    • 提供者:weixin_38715721
« 12 3 »