小白大数据学习笔记 ⭐
模块 | Blog |
---|---|
Zookeeper概述 | Zookeeper是个什么东西? |
安装部署 | Zookeeper 分布式安装部署 |
如何操作? | Zookeeper 客户端命令行与API操作 |
案例实操 | Zookeeper 案例:服务器动态上下线监听 |
模块 | Blog |
---|---|
Hive概述 | Hive的基本概念 |
安装部署 | Hive安装部署并替换derby为MySQL |
Hive操作数据 | Hive数据类型 |
HiveSQL DDL数据定义 | |
Hive 导入与导出数据 | |
HiveSQL DML数据查询 | |
Hive 分区表与分桶表 | |
Hive 常用函数汇总以及练习 | |
Hive 如何自定义函数 | |
Hive 压缩和存储 | |
调优 | Hive企业级调优 |
实战 | Hive 实战!分析视频网站TopN数据 |
模块 | Blog |
---|---|
Flume概述 | Flume 是什么?都由什么组成? |
安装部署以及入门案例 | Flume 分布式安装部署以及入门案例 |
内部原理 | Flume中的事务、Agent内部原理、拓扑结构及对应案例 |
自定义组件 | Flume自定义Interceptor、Source与Sink |
模块 | Blog |
---|---|
Kafka极速入门 | Kafka 是个什么东西? |
Kafka 分布式安装部署 | |
Kafka 常用命令行操作 | |
Kafka Producer | Producer 生产者消息发送原理 |
Producer 异步与同步以及分区API操作 | |
Producer 生产者的生产经验 | |
Kafka Broker | Broker 工作流程以及节点服役和退役 |
Broker 副本机制详解 | |
Broker 文件存储、清理机制以及高效读写数据 | |
Kafka Consumer | Consumer 消费者工作原理 |
Consumer 消费者API操作 | |
Consumer 消费者组分区的分配以及再平衡 | |
Offset位移详解 | |
大屏监控Kafka | Kafka Eagle(EFAK)监控安装部署 |
Kafka-Kraft | Kafka-Kraft 模式的安装与部署 |
Kafka 与外部系统集成 | Kafka集成Flume |
Kafka集成Spark,留坑 | |
Kafka集成Flink,留坑 | |
Kafka集成Spring Boot,留坑 |
模块 | Blog |
---|---|
概述 | 关于HBase你应该知道这些! |
上手操作HBase | 搭建HBase分布式环境 |
HBase Shell操作快速入门! | |
HBase DDL API操作 | |
HBase DML API操作 | |
在更! |
模块 | Blog |
---|---|
用户行为数据采集平台 | 项目需求及架构设计 |
模拟生成用户行为日志数据 | |
打通行为日志采集通道! | |
业务数据采集平台 | 模拟生成用户业务数据 |
全量同步?增量同步?都是什么? | |
数据全量同步工具DataX | |
数据增量同步工具Maxwell | |
打通全量数据同步通道! |