您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. orc:Apache ORC-用于Hadoop工作负载的最小,最快的列式存储-源码

  2. ORC是一种专为Hadoop工作负载设计的自描述类型感知列式文件格式。 它针对大型流读取进行了优化,但具有集成支持,可快速查找所需的行。 以列格式存储数据使阅读器仅可以读取,解压缩和处理当前查询所需的值。 由于ORC文件可识别类型,因此编写器为该类型选择最合适的编码,并在写入文件时建立内部索引。 谓词下推使用这些索引来确定特定查询需要读取文件中的哪些条带,并且行索引可以将搜索范围缩小到特定的10,000行集合。 ORC支持Hive中的完整类型集,包括复杂类型:结构,列表,映射和联合。 ORC文件
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:15728640
    • 提供者:weixin_42132359