impala:
是一个SQL查询工具
组件:
主节点:
impala-statestore:状态存储区,主要存储SQL执行的状态、进度等信息;
impala-catalog:存储impala的元数据信息
从节点:
impala-server:主要负责任务的计算
基本使用:
不进入impala-shell的一些常见参数
impala-shell -q “select * from xxx”
impala-shell -f 执行xxx.sql脚本
impala-shell -f 全量刷新元数据信息,不推荐使用
进入impala-shell的一些常见信息
refresh dbname.tablename
刷新某张表的元数据信息,适用于表已经存在的情况,例如分区信息改变
invalidate metadata
刷新元数据信息,全量刷新元数据信息,适用于hive当中新建数据库或者数据库表的情况
hive当中新建的数据库或者数据库表,需要刷新元数据信息,impala当中新建等等数据库与数据库表不需要刷新元数据信息,主要通过catalog来实现
hue:hadoop user experience
主要用于与其他框架集成,做到可视化,允许我们通过浏览器界面操作其他框架