SqoopSqoopSqoop 数据迁移 概述Sqoop是Apache开发的跨系统数据传输工具,核心功能是在Hadoop(HDFS/Hive/HBase)与关系数据库(MySQL/Oracle等)间双向迁移数据,通过将命令转化为MapReduce作业实现,需定制InputFormat和OutputFormat。包含Sqoop1(架构简单)和Sqoop2(支持Web服务与REST API)两个版本,是ETL流程中连接结构化数据与大数据平台的关键组件。 推荐阅读 Sqoop 数据迁移 概述 Hadoop Hive Azkaban Flume Zookeeper