Spark Streaming 整合 Kafka
1. 版本说明
2. 项目依赖
<properties>
<scala.version>2.12</scala.version>
</properties>
<dependencies>
<!-- Spark Streaming-->
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-streaming_${scala.version}</artifactId>
<version>${spark.version}</version>
</dependency>
<!-- Spark Streaming 整合 Kafka 依赖-->
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-streaming-kafka-0-10_${scala.version}</artifactId>
<version>2.4.3</version>
</dependency>
</dependencies>3. 整合Kafka
3.1 ConsumerRecord
3.2 生产者属性
3.2.1 fetch.min.byte
3.2.2 fetch.max.wait.ms
3.2.3 max.partition.fetch.bytes
3.2.4 session.timeout.ms
3.2.5 auto.offset.reset
3.2.6 enable.auto.commit
3.2.7 client.id
3.2.8 max.poll.records
3.2.9 receive.buffer.bytes 和 send.buffer.byte
3.3 位置策略
3.4 订阅方式
3.5 提交偏移量
4. 启动测试
4.1 创建主题
1. 启动Kakfa
2. 创建topic
3. 创建生产者
4.2 本地模式测试

5. 参考资料
最后更新于