大数据学习指南
  • README
  • Storm
    • Storm和流处理简介
    • Storm集成Kakfa
    • Storm集群环境搭建
    • Storm编程模型详解
    • Storm核心概念详解
    • Storm三种打包方式对比分析
    • Storm集成Redis详解
    • Storm集成HBase和HDFS
    • Storm单机环境搭建
  • HBase
    • HBase过滤器详解
    • HBase的 SQL 中间层Phoenix
    • HBase常用 Shell 命令
    • HBase系统架构及数据结构
    • HBase集群环境搭建
    • HBase容灾与备份
    • HBase Java API
    • HBase协处理器详解
    • Spring Boot 整合 Mybatis + Phoenix
    • HBase简介
    • HBase单机环境搭建
  • Flink
    • Flink 窗口模型
    • Flink 状态管理与检查点机制
    • Flink核心概念综述
    • Flink开发环境搭建
    • Flink Sink
    • Flink Data Source
    • Flink 中使用 RocksDB 状态后端
    • Flink Transformation
    • Flink Standalone 集群部署
  • Spark
    • Spark SQL
      • Spark SQL JOIN操作
      • DataFrame和Dataset简介
      • Spark SQL 常用聚合函数
      • Structured API基本使用
      • Spark SQL 外部数据源
    • Spark Streaming
      • Spark Streaming 基本操作
      • Spark Streaming 整合 Flume
      • Spark Streaming 整合 Kafka
      • Spark Streaming 简介
    • Spark Core
      • Transformation 和 Action 常用算子
      • Spark累加器与广播变量
      • 基于ZooKeeper搭建Spark高可用集群
      • Spark运行模式与作业提交
      • Spark开发环境搭建
      • 弹性式数据集RDD
      • Spark简介
  • Scala
    • 类和对象
    • 集合类型
    • 隐式转换和隐式参数
    • 流程控制语句
    • 继承和特质
    • 函数 & 闭包 & 柯里化
    • Scala数组
    • Scala基本数据类型和运算符
    • 模式匹配
    • Scala List & Set
    • Scala简介及开发环境配置
    • 类型参数
    • Scala Map & Tuple
  • Hive
    • Hive实现WordCount详解
    • Hive常用DDL操作
    • Hive视图和索引
    • Linux环境下Hive的安装部署
    • HiveCLI和Beeline命令行的基本使用
    • Hive常用DML操作
    • Hive分区表和分桶表
    • Hive简介及核心概念
    • Hive数据查询详解
    • Hive SQL的编译过程
  • Hadoop
    • 分布式计算框架—MapReduce
    • HDFS Java API 的使用
    • Hadoop单机环境搭建
    • HDFS常用Shell命令
    • Hadoop极简入门
    • MapReduce编程模型和计算框架架构原理
    • 基于Zookeeper搭建Hadoop高可用集群
    • Hadoop集群环境搭建
    • 集群资源管理器—YARN
    • Hadoop分布式文件系统—HDFS
  • 前言
    • 大数据框架对比:Hadoop、Storm、Samza、Spark和Flink
由 GitBook 提供支持
在本页
  • 0. 前言
  • 1. Hadoop
  • 2. Hive
  • 3. Spark
  • 3.1 Spark Core
  • 3.2 Spark SQL
  • 3.3 Spark Streaming
  • 4. HBase
  • 5. Storm
  • 6. Flink
  • 7. Scala

这有帮助吗?

README

下一页Storm

最后更新于4年前

这有帮助吗?

本文高度引用了的文章,并综合其他资料整理修改。

0. 前言

1. Hadoop

2. Hive

3. Spark

3.1 Spark Core

3.2 Spark SQL

3.3 Spark Streaming

4. HBase

5. Storm

6. Flink

7. Scala

BigData-Notes
大数据框架对比:Hadoop、Storm、Samza、Spark和Flink
分布式文件存储系统 — HDFS
分布式计算框架 — MapReduce
集群资源管理器 — YARN
Hadoop 单机伪集群环境搭建
Hadoop 集群环境搭建
HDFS 常用 Shell 命令
HDFS Java API 的使用
基于 Zookeeper 搭建 Hadoop 高可用集群
Hadoop级简入门
MapReduce编程模型和计算框架架构原理
Hive 简介及核心概念
Linux 环境下 Hive 的安装部署
Hive CLI 和 Beeline 命令行的基本使用
Hive 常用 DDL 操作
Hive 分区表和分桶表
Hive 视图和索引
Hive 常用 DML 操作
Hive 数据查询详解
Hive实现WordCount详解
Hive SQL的编译过程
Spark 简介
Spark 开发环境搭建
弹性式数据集 RDD
RDD 常用算子详解
Spark 运行模式与作业提交
Spark 累加器与广播变量
基于 Zookeeper 搭建 Spark 高可用集群
DateFrame 和 DataSet
Structured API 的基本使用
Spark SQL 外部数据源
Spark SQL 常用聚合函数
Spark SQL JOIN 操作
Spark Streaming 简介
Spark Streaming 基本操作
Spark Streaming 整合 Flume
Spark Streaming 整合 Kafka
Hbase 简介
HBase 系统架构及数据结构
HBase 基本环境搭建
HBase 集群环境搭建
HBase 常用 Shell 命令
HBase Java API
Hbase 过滤器详解
HBase 协处理器详解
HBase 容灾与备份
HBase的 SQL 中间层 —— Phoenix
Spring/Spring Boot 整合 Mybatis + Phoenix
Storm 和流处理简介
Storm 核心概念详解
Storm 单机环境搭建
Storm 集群环境搭建
Storm 编程模型详解
Storm 项目三种打包方式对比分析
Storm 集成 Redis 详解
Storm 集成 HDFS/HBase
Storm 集成 Kafka
Flink 核心概念综述
Flink 开发环境搭建
Flink Data Source
Flink Data Transformation
Flink Data Sink
Flink 窗口模型
Flink 状态管理与检查点机制
Flink Standalone 集群部署
Scala 简介及开发环境配置
基本数据类型和运算符
流程控制语句
数组 —— Array
集合类型综述
常用集合类型之 —— List & Set
常用集合类型之 —— Map & Tuple
类和对象
继承和特质
函数 & 闭包 & 柯里化
模式匹配
类型参数
隐式转换和隐式参数