redis:内存数据库,存取速度都比较快
数据类型:
string
hash
list
set
zset
运行模式
单机版
主从模式
哨兵模式
redis集群
数据持久化:
RDB:每隔多长时间有多少个key发送变化,就将数据dump到磁盘里面保存,默认开启
AOF:记录操作日志,将客户端操作的日志都记录下来,默认关闭
实际工作两种方式都打开
缓存雪崩:redis数据全部失效
缓存击穿:没有命中缓存当中数据
HBASE nosql数据库
大数据领域里面一个分布式的nosql数据库
rowkey
列族
列
时间戳
多版本
一张HBASE表,有多个region
一个region由两部分组成:一个Hlog+多个store模块
一个store模块:一个memoryStore+多个StoreFile
flush:数据从memoryStory到storeFile
compact:数据从storeFile到Hfile
split:大的Hfile达到10GB的时候,就会进行分裂,region也会一分为二
HBASE的数据读写流程:元数据记录表,HBASE:meta表
ELK:elasticse全文检索框架,也是类似于一个数据库
index
type
document
field
shard
replicat
mappings
settings
聚合查询
kafka:消息队列
作用:解耦,异步,并行
一般用于数据的统一的管理平台
软件框架之间的依赖关系
1.zookeeper依赖jdk
2.hadoop
ha模式:依赖zk
3.hive:依赖hadoop和MySQL
4.flume没有依赖
5.sqoop没有依赖
6.azkaban没有依赖
7.impala依赖hive,必须启动hive,Metastore服务
8.oozie依赖于hadoop
9.hue没有依赖
10.redis依赖C程序,yum -y install gcc-c++
11.HBASE依赖于zookeeper和hadoop
12.elk没有依赖
13.kafka依赖zookeeper