数据百科

Hive

...

  • 导入数据到hive的三种方式

    导入数据到hive的三种方式

    首先我们在hive中要建好一个表,这里用比较难的方式来假设,假设是外部表并且是分区表stg.test,按bus_date(string)分区。方式一:上传数据后修复首先上传数据到HDFS中:hadoop fs -mkd

  • Hive元数据管理

    Hive元数据管理

    众所周知,hive表中的数据是HDFS上的文件,可是hive怎么知道这些文件的内容都对应哪个字段,对应哪个分区呢?就是hive的元数据管理着这一切。通常在hive-site.xml中的元数据库配置

  • HIVE的体系结构

    HIVE的体系结构

    Hive体系结构,主要分为以下几个部分:



    用户接口
    用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是 CLI,Cli 启动的时候,会同时启动一个 Hive 副本。Client 是 Hive 的客户

  • HIVE数据存储

    HIVE数据存储

    首先,Hive 没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织 Hive 中的表,只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数

  • HIVE有哪些模式

    HIVE有哪些模式

    单用户数据库模式
    单用户数据库模式:通过网络连接到一个数据库中,是最经常使用到的模式。


    单用户Derby模式
    单用户Derby模式:此模式连接到一个In-memory 的数据库Derby,一般

  • HIVE的执行流程

    HIVE的执行流程

    •编译器将一个Hive QL转换操作符
    •操作符是Hive的最小的处理单元
    •每个操作符代表HDFS的一个操作或者一道MapReduce作业
    Operator
    •Operator都是hive定

  • 什么是HIVE?HIVE有什么用?

    什么是HIVE?HIVE有什么用?

    Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hi