您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Field.Guide.to.Hadoop.An.Introduction.to.Hadoop

  2. If your organization is about to enter the world of big data, you not only need to decide whether Apache Hadoop is the right platform to use, but also which of its many components are best suited to your task. This field guide makes the exercise man
  3. 所属分类:Web开发

    • 发布日期:2015-04-13
    • 文件大小:6291456
    • 提供者:ramissue
  1. IT赛道题库(1).zip

  2. 1.在HBase写数据的业务逻辑实现过程中,如下哪个接口或类是不需要涉及的? A. Put B. HTable C. HBaseAdmin D. PutList Answer: C 2.在MapReduce的应用程序开发中,下列哪个JAVA类负责管理和运行一个计算任务? A. lob B. Context C. FileSystem D. Configuration Answer: A 3.Fusionlnsight HD中,Oozie在提交作业前需要先上传本作业所依赖的配置文件和jar包到H
  3. 所属分类:其它

    • 发布日期:2019-05-25
    • 文件大小:8388608
    • 提供者:uiguiy
  1. C++ 读写 parquet 文件 Demo

  2. 项目使用vs2015,使用的git上的三方开源框架,进行了裁剪,基于C++创建,读写parquet文件。
  3. 所属分类:Hadoop

    • 发布日期:2020-04-17
    • 文件大小:55574528
    • 提供者:Fennudemasan
  1. miniparquet:读取Parquet文件子集的库-源码

  2. 迷你实木复合地板 miniparquet是Parquet文件常见子集的阅读器。 miniparquet仅支持矩形数据结构(无嵌套表),仅支持Snappy压缩方案。 miniparquet没有(零,无,0),并且非常轻巧。 它可以在几秒钟内编译为1 MB以下的二进制大小。 安装 Miniparquet是C ++库,一个Python包和一个R包。 像这样安装R软件包: devtools::install_github("hannesmuehleisen/miniparquet") 可以通过键入
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:205824
    • 提供者:weixin_42136477
  1. geo-arrow-spec:在Apache Arrow和Apache Parquet中存储地理空间数据的规范-源码

  2. 地理箭头规格 在Apache Arrow和Apache Parquet中存储地理空间数据的规范。 项目指定了与语言无关的标准化列式存储格式。 它支持共享计算库,零拷贝共享内存和流式消息传递,进程间通信等,并且受到许多编程语言的支持。 Feather文件格式是此内存格式的磁盘表示形式。 是一种高效的列式存储格式(源自Hadoop生态系统)。 它是用于表格数据的一种广泛使用的文件格式,其基于C语言(Python,R)的实现包含在Apache Arrow项目中。 地理空间数据通常采用表格格式,其
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:2048
    • 提供者:weixin_42102358
  1. parquet_to_root:从Parquet到ROOT TTree的简单转换器-源码

  2. parquet_to_root 从Parquet到ROOT TTree的简单翻译器 安装: pip3 install parquet_to_root 需要PyROOT和pyarrow 。 后者可以通过pip安装; 前者比较复杂,但是如果您正在阅读本文,您可能会知道如何获得它。 (此软件包中的测试使用miniconda:conda conda install -c conda-forge root forge conda install -c conda-forge root 。) 要从命令
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:325632
    • 提供者:weixin_42135753
  1. aws-data-wrangler:AWS上的Pandas-与Athena,Glue,Redshift,Timestream,QuickSight,Chime,CloudWatchLogs,DynamoDB,EMR,SecretManage

  2. AWS Data Wrangler AWS上的Pandas 易于与Athena,Glue,Redshift,Timestream,QuickSight,Chime,CloudWatchLogs,DynamoDB,EMR,SecretManager,PostgreSQL,MySQL,SQLServer和S3(Parquet,CSV,JSON和EXCEL)集成。 开源计划| 资源 资料下载 安装指令 pip install awswrangler conda install -c con
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42131728
  1. ChoETL:.NET c#的ETL框架(用于CSV,Flat,Xml,JSON,键值,Parquet和Yaml格式文件的解析器编写器)-源码

  2. Cinchoo ETL .NET的ETL框架 简单,直观的.NET提取,转换和加载(ETL)库。 极其快速,灵活且易于使用。 Cinchoo ETL是基于代码的ETL框架,用于从多个来源提取数据,转换并将其加载到.NET环境中自己的数据仓库中。 您可以立即将数据存储在数据仓库中。 安装 要安装Cinchoo ETL(.NET Framework),请在程序包管理器控制台中运行以下命令 PM> Install-Package ChoETL 要安装Cinchoo ETL(.NET Stan
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:4194304
    • 提供者:weixin_42129412