Hive介绍研发技术分享21Hive简介22结构与功能介绍43适用场景114部署与简单操作32目录5问题指南42Hive简介3Hive起源于Facebook,它使得针对Hadoop进行SQL查询成为可能,从而非程序员也可以方便地使用
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务运行
4Hive是建立在Hadoop上的数据仓库基础构架
它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制
Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据
同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作
Hive是一种以SQL风格进行任何大小数据分析的工具,其特点是采取类似关系数据库的SQL命令
其特点是通过SQL处理Hadoop的大数据,数据规模可以伸缩扩展到100PB+,数据形式可以是结构或非结构数据
5目录1Hive简介22结构与功能介绍43适用场景114部署与简单操作325问题指南426Hive的技术架构Hive系统元数据存储(Metastore)驱动(Driver)查询编译器(QueryCompiler)执行引擎(ExecutionEngine)服务器(HiveServer)客户端组件可扩展接口部分7服务端组件Driver组件:该组件包括Complier、Optimizer和Executor,它的作用是将我们写的HiveQL(类SQL)语句进行解析、编译优化,生成执行计划,然后调用底层的mapreduce计算框架
Metastore组件:元数据服务组件,这