HiveHiveHive基本概念Hive是基于 Hadoop 的数据仓库工具,将结构化数据文件映射为数据库表,提供类 SQL 查询功能,本质是将 SQL 转换为 MapReduce 任务运算,底层由 HDFS 存储数据。支持集群规模扩展与用户自定义函数,具有良好容错性,适用于海量数据离线批量统计分析,与传统数据库应用场景不同。 推荐阅读 PDF Hadoop 51 Spark Kafka Hive基本概念