文件系统:存放的数据都能够找到
元数据: 描述数据的数据
MapReduce分布式文件计算系统:
jobtracker:主节点,接收用户请求,分配任务给taskTracker去执行
taskTracker:从节点,主要用于接受jobTracker分配的任务
namenode高可用:
namenode active状态:处于活跃的主节点,处理用户请求,维护元数据信息
namenode stand状态:处于备份的节点,活跃的主节点死了之后,备份的节点,马上切换为活跃的主节点对外提供服务
注意:如果namenode高可用,那么一定要保证namenode的元数据信息同步一致,如果不一致,就会出现脑裂的问题
所以为了解决元数据共享的问题,引入journal node的机制,专门用于同步元数据信息
zkfc:namenode的守护进程,主要用于监听namenode什么时候死掉,死掉之后,马上通知另外一个namenode切换为主节点