第 1 章 简介

最后更新于:2022-04-01 20:42:42

Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点 特别适合写一次,读多次的场景 ## 适合 - 大规模数据 - 流式数据(写一次,读多次) - 商用硬件(一般硬件) ## 不适合 - 低延时的数据访问 - 大量的小文件 - 频繁修改文件(基本就是写1次) ## Hadoop架构 ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-07-23_55b03fb494c1d.png) - **HDFS:** 分布式文件存储 - **YARN:** 分布式资源管理 - **MapReduce:** 分布式计算 - **Others:** 利用YARN的资源管理功能实现其他的数据处理方式 内部各个节点基本都是采用Master-Woker架构
';