Azkaban Flow 1.0 的使用
Azkaban Flow 2.0的使用
Azkaban简介
Flink Sink
Flink Data Source
Flink Transformation
Flink Windows
Flink 开发环境搭建
Flink 核心概念综述
Flink 状态管理
Flume 整合 Kafka
Flume 简介及基本使用
HDFS Java API
HDFS 常用 shell 命令
Hadoop分布式文件系统——HDFS
分布式计算框架——MapReduce
集群资源管理器——YARN
HBase Java API 的基本使用
Hbase 常用 Shell 命令
Hbase 协处理器
Hbase容灾与备份
Hbase的SQL中间层——Phoenix
HBase简介
Hbase系统架构及数据结构
Hbase 过滤器详解
Hive CLI和Beeline命令行的基本使用
Hive分区表和分桶表
Hive常用DDL操作
Hive 常用DML操作
Hive数据查询详解
Hive简介及核心概念
Hive 视图和索引
Kafka消费者详解
深入理解Kafka副本机制
Kafka生产者详解
Kafka简介
函数和闭包
List & Set
Scala基本数据类型和运算符
Scala 数组相关操作
Map & Tuple
Scala模式匹配
流程控制语句
Scala简介及开发环境配置
类和对象
类型参数
继承和特质
隐式转换和隐式参数
集合
DataFrame和Dataset简介
Spark SQL 外部数据源
聚合函数Aggregations
Spark SQL JOIN
弹性式数据集RDDs
Spark Streaming与流处理
Spark Streaming 基本操作
Spark Streaming 整合 Flume
Spark Streaming 整合 Kafka
Structured API基本使用
Transformation 和 Action 常用算子
Spark简介
Spark 累加器与广播变量
Spark部署模式与作业提交
Spring/Spring Boot 整合 Mybatis + Phoenix
Sqoop基本使用
Sqoop 简介与安装
Storm三种打包方式对比分析
Storm和流处理简介
Storm 核心概念详解
Storm 编程模型
Storm集成HDFS和HBase
Storm集成Kafka
Storm 集成 Redis 详解
Zookeeper ACL
Zookeeper Java 客户端 ——Apache Curator
Zookeeper常用Shell命令
Zookeeper简介及核心概念
Azkaban 3.x 编译及部署
Flink Standalone Cluster
HBase基本环境搭建
HBase集群环境配置
Hadoop单机版环境搭建
Hadoop集群环境搭建
Linux下Flume的安装
Linux下JDK的安装
Linux下Python安装
Linux环境下Hive的安装
Spark开发环境搭建
基于ZooKeeper搭建Spark高可用集群
Storm单机版本环境搭建
Storm集群环境搭建
Zookeeper单机环境和集群环境搭建
基于ZooKeeper搭建Hadoop高可用集群
基于Zookeeper搭建Kafka高可用集群
虚拟机静态IP及多IP配置
大数据学习路线
大数据常用软件安装指南
大数据应用常用打包方式
大数据技术栈思维导图
:book: 经典书籍