本阶段主要讲解如何搭建 Hadoop,内容包括 Hadoop 单节点,集群和高可用的安装部署和管理。
Hadoop 自带一个称为 HDFS 的分布式文件系统,即 Hadoop Distributed FileSystem。有时候也称为 DFS,本阶段主要讲解如何和通过 Java 来完成 HDFS 文件的上传、下载和删除等功能。
本章节将带你学习 Yarn 的基本架构,运行原理以及作业提交体验。
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是 Hadoop 和 Hbase 的重要组件。本阶段主要讲解 Zookeeper的搭建与使用。
本节主要介绍MapReduce的基本概念以及MapReduce对数据的清洗流程。
本章节讲解如何使用 Sqoop工具将数据转移。