自由式学习
21人加入学习
(0人评价)
大数据___Kafka
价格 免费
承诺服务

redis:内存数据库,存取速度都比较快

数据类型:

string

hash

list

set

zset

运行模式

单机版

主从模式

哨兵模式

redis集群

数据持久化:

RDB:每隔多长时间有多少个key发送变化,就将数据dump到磁盘里面保存,默认开启

AOF:记录操作日志,将客户端操作的日志都记录下来,默认关闭

实际工作两种方式都打开

 

缓存雪崩:redis数据全部失效

缓存击穿:没有命中缓存当中数据

 

HBASE  nosql数据库

大数据领域里面一个分布式的nosql数据库

rowkey

列族

时间戳

多版本

一张HBASE表,有多个region

一个region由两部分组成:一个Hlog+多个store模块

一个store模块:一个memoryStore+多个StoreFile

flush:数据从memoryStory到storeFile

compact:数据从storeFile到Hfile

split:大的Hfile达到10GB的时候,就会进行分裂,region也会一分为二

HBASE的数据读写流程:元数据记录表,HBASE:meta表

 

ELK:elasticse全文检索框架,也是类似于一个数据库

index

type

document

field

shard 

replicat

mappings

settings

聚合查询

 

kafka:消息队列

作用:解耦,异步,并行

一般用于数据的统一的管理平台

软件框架之间的依赖关系

1.zookeeper依赖jdk

2.hadoop

ha模式:依赖zk

3.hive:依赖hadoop和MySQL

4.flume没有依赖

5.sqoop没有依赖

6.azkaban没有依赖

7.impala依赖hive,必须启动hive,Metastore服务

8.oozie依赖于hadoop

9.hue没有依赖

10.redis依赖C程序,yum -y install gcc-c++

11.HBASE依赖于zookeeper和hadoop

12.elk没有依赖

13.kafka依赖zookeeper

 

 

[展开全文]

授课教师

高级算法工程师
老师

课程特色

考试(5)
图文(1)
视频(24)