您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第100页

« 1 2 ... 95 96 97 98 99 100.01 .02 .03 .04 .05 ... 1441 »

[spark] Spark入门实战系列 超清自解压 PDF文件

说明:spark入门级资料推荐,开始是介绍简装 编译运行等基础介绍,从第五章开始 Hive介绍及部署 Hive实战 SparkSQL介绍 实战 深入了解运行计划及调优 SparkStreaming原理介绍 实战 SparkMLlib机器学习及SparkMLlib简介 实战 SparkGraphX介绍及实例 分布式内存文件系统Tachyon介绍及安装部署
<ren365880> 在 上传 | 大小:33554432

[Hadoop] HDFS软件包.zip

说明:hadoop-lzo-master.zip、lz4-1.7.5.tar.gz、lzo-2.06.tar.gz、nexus-2.9.0.war、hadoop2x-eclipse-plugin.zip、jdk-8u111.zip
<weixin_38411989> 在 上传 | 大小:476053504

[spark] scala模型分析.emmx

说明:史上最强思维导图记忆scala array方法
<qq_44671288> 在 上传 | 大小:60416

[算法与数据结构] 加拿大天气变化历史数据.zip

说明:自己通过编程实现了对2019年中国研究生数学建模E题中所给资源加拿大天气变化历史数据的一个汇总,方便大家查看,
<density__> 在 上传 | 大小:24117248

[Hive] pyhive离线安装.rar

说明:离线环境下pyhive的安装依赖。 python版本:3.8 操作系统:linux 包含:对应版本信息的所有依赖项及一个readme说明文件。
<lvjianjin128> 在 上传 | 大小:6291456

[Hadoop] 实验数据集--14万popular_tweets.xlsx

说明:Twitter数据集14万条包括文本,时间,转推关系、回复关系,作者等一系列信息,Twitter的社交网络连接数据集,包含Twitter当中的用户转发关系。可以用于社交网络数据分析研究、异常检测、事件检测与演化模型分析、情感分析、链接预测,信息传播等方面的研究
<qq_20066141> 在 上传 | 大小:10485760

[spark] #Verzuz--实验数据集15万-20200901.xlsx

说明:Twitter数据集15万条包括文本,时间,转推关系、回复关系,作者等一系列信息,Twitter的社交网络连接数据集,包含Twitter当中的用户转发关系。可以用于社交网络数据分析研究、异常检测、事件检测与演化模型分析、情感分析、链接预测,信息传播等方面的研究
<qq_20066141> 在 上传 | 大小:75497472

[spark] 信息集成:元数据管理全景.pdf

说明:信息集成:元数据管理系统 信息集成:元数据管理系统 信息集成:元数据管理系统 信息集成:元数据管理系统 信息集成:元数据管理系统
<qingqichiyu> 在 上传 | 大小:37748736

[Hadoop] 大数据之HDFS.docx

说明:大数据-HDFS支持文档 包含HDFS讲解与实战命令:$>start-all.sh $>stop-all.sh $>start-dfs.sh $>start-yarn.sh $>stop-dfs.sh $>stop-yarn.sh
<weixin_38411989> 在 上传 | 大小:2097152

[spark] spark知识点整理.docx

说明:自己整理的大数据spark技术要点,基本都是面试会问到的。至少我招聘大数据工程师的时候,都会围绕这些问题来问。
<va_key> 在 上传 | 大小:355328

[Hadoop] 谷歌三大论文.rar

说明:公共资源 2003年Google在SOSP会议上发表了大数据历史上第一篇公认的革命性论文——《 GFS: The Google File System 》;2004年,Google又发表了另一篇非常重要的论文——《 MapReduce: Simplefied Data Processing on Large Clusters 》;2006年,Google发布了第三篇重要论文——《 BigTable: A Distributed StorageSystem for Structured Data
<jason_9527> 在 上传 | 大小:2097152

[Hadoop] apache-atlas-2.1.0-sources.tar.gz

说明:Atlas是一组可扩展的核心基础数据治理服务:使企业在Hadoop环境内有效满足合规性要求,并允许与企业数据生态系统集成。 Atlas为组织提供开放式元数据管理和治理功能,以构建其数据资产目录,对资产进行分类和管理,并为数据科学家、分析师和数据治理团队提供围绕这些数据资产的协作功能。
<hupingzhi> 在 上传 | 大小:13631488
« 1 2 ... 95 96 97 98 99 100.01 .02 .03 .04 .05 ... 1441 »