您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. geo-arrow-spec:在Apache Arrow和Apache Parquet中存储地理空间数据的规范-源码

  2. 地理箭头规格 在Apache Arrow和Apache Parquet中存储地理空间数据的规范。 项目指定了与语言无关的标准化列式存储格式。 它支持共享计算库,零拷贝共享内存和流式消息传递,进程间通信等,并且受到许多编程语言的支持。 Feather文件格式是此内存格式的磁盘表示形式。 是一种高效的列式存储格式(源自Hadoop生态系统)。 它是用于表格数据的一种广泛使用的文件格式,其基于C语言(Python,R)的实现包含在Apache Arrow项目中。 地理空间数据通常采用表格格式,其
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:2048
    • 提供者:weixin_42102358
  1. pyfitparquet:将Garmin FITTCX文件的ETL支持到Apache Parquet-源码

  2. PyFit实木复合地板 pyfitparquet软件包支持将Garmin 和文件ETL转换为列格式。 它旨在在conda环境中使用。 使用两个配置文件来微调ETL行为: 和 。 通常,这些文件分别控制镶木地板输出文件的列和行结构,以及TCX标记名称到FIT / Parquet field_names的映射。 请在配置文件本身中查看详细注释,以进一步了解其用法。 尽管可以直接在$CONDA_PREFIX安装树下直接修改配置文件,但是重新安装pyfitparquet会将配置恢复为默认值。 要在整个
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:519168
    • 提供者:weixin_42154650
  1. petastorm:Petastorm库可对Apache Parquet格式的数据集进行单机或分布式培训以及对深度学习模型的评估。 它支持Tensorflow,Pytorch和PySpark等ML框架,并且可以从纯Python代码中使用-源

  2. petastorm:Petastorm库可对Apache Parquet格式的数据集进行单机或分布式培训以及对深度学习模型的评估。 它支持Tensorflow,Pytorch和PySpark等ML框架,并且可以从纯Python代码中使用
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:3145728
    • 提供者:weixin_42116701
  1. Parquet格式:Apache Parquet-源码

  2. 木地板 Parquet是一种支持嵌套数据的列式存储格式。 实木复合地板元数据使用Apache Thrift进行编码。 Parquet-format项目包含所有Thrift定义,这些定义对于创建Parquet文件的读取器和写入器是必需的。 动机 我们创建Parquet是为了使Hadoop生态系统中的任何项目都可以使用压缩的,高效的列式数据表示形式。 Parquet是从头开始构建的,考虑到了复杂的嵌套数据结构,并使用了Dremel论文中描述的。 我们相信这种方法优于嵌套名称空间的简单扁平化。
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:573440
    • 提供者:weixin_42181545
  1. parquet-mr:Apache Parquet-源码

  2. 实木复合地板 Parquet-MR包含的java实现。 Parquet是Hadoop一种列式存储格式; 它提供了有效的数据存储和编码。 Parquet使用Dremel论文中描述的来表示嵌套结构。 您可以在我们的找到有关格式和预期用例的一些详细信息 建造 Parquet-MR使用Maven构建并依赖于节俭的编译器(协议现在由maven插件管理)。 安装Thrift 要构建并安装节俭的编译器,请运行: wget -nv http://archive.apache.org/dist/thrif
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:2097152
    • 提供者:weixin_42108948