
Apache Hadoop 主页
Hadoop由Apache基金会开发的分布式系统基础架构,是利用集群对大量数据进行分布式处理和存储的软件框架。用户可以轻松地在Hadoop集群上开发和运行处理海量数据的应用程序。Hadoop有高可靠,高扩展,高效性,高容错等优点。Hadoop 框架最核心的设计就是HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。此外,Hadoop还包括了Hive,Hbase,ZooKeeper,Pig,Avro,Sqoop,Flume,Mahout等项目。
下方🔧《动手学Apache Hadoop》教程可在线互动学习Apache Hadoop,使用帮助
🔧动手学Apache Hadoop
0.如何学习 Hadoop ?
1.Hadoop 简介
2.Hadoop 环境安装及配置
3.Hadoop MapReduce
4.Hadoop MapReduce示例1:求各个部门的总工资
5.Hadoop MapReduce示例2:求各个部门的人数和平均工资
6.Hadoop MapReduce示例3:求每个部门最早入职员工的姓名
7.Hadoop MapReduce示例4:求各个城市的员工的总工资
8.Hadoop MapReduce示例5:求各个城市的员工的总工资
9.Hadoop MapReduce示例6:列出工资比公司平均工资要高的员工姓名及其工资
10.Hadoop MapReduce示例7:列出名字以 J 开头的员工姓名及其所属部门名称
11.Hadoop MapReduce示例8:列出名字以 J 开头的员工姓名及其所属部门名称
12.Hadoop MapReduce示例9:将全体员工按照总收入(工资 + 提成)从高到低排列
13.Hadoop MapReduce示例10:求任何两名员工信息传递所需要经过的中间节点数
14.Hadoop Streaming
15.Hadoop YARN配置及提交任务示例
16.Hadoop Yarn
17.Hadoop HDFS Shell操作
18.Hadoop HDFS
19.Hadoop HDFS示例1:读取 HDFS文件内容
20.Hadoop HDFS示例2:写入内容至HDFS文件