Storm 累加拓扑示例

创建Spout发送递增数字数列 创建Bolt负责计算累加结果 本地运行 本地运行完整代码 保证数据可靠处理 Spout在使用nextTuple()方法发送数据时需要传入消息ID Bolt中execute()方法中标记tuple是否处理成功 处理成功 collector.ack(input) 处理失败collector.fail(input) 注意: ack和fail方法需要锚定到发射过来的tuple上. Spout中对处理失败的元组触发回调 这里把处... ... [查看更多]

Views: 206

Kafka伪集群环境搭建

创建Zookeeper集群(3个) 前提是已经装好Java JDK8+并配置好环境变量。 建议Kafka集群使用专有的Zookeeper集群进行协调管理。 也可以使用Kafka内置的bin/zookeeper命令启动集群, 默认配置是config/zookeeper.properties 创建3个zk配置文件 修改配置文件内容如下 根据配置创建对应的dataDir以及dataLogDir,并在dataDir下创建myid文件。 修改Kafka集群配置 vi server-1... ... [查看更多]

Views: 366

Kafka集群部署的讨论

只有单台机器构成的 Kafka 伪集群只能用于日常测试之用,根本无法满足实际的线上生产需求。而真正的线上环境需要仔细地考量各种因素,结合自身的业务需求而制定。下面我就分别从操作系统、磁盘、磁盘容量和带宽等方面来讨论一下。 操作系统 首先我们先看看要把 Kafka 安装到什么操作系统上。 目前常见的操作系统有 3 种: Linux Windows macOS。 如果考虑操作系统与 Kafka 的适配性,Linux 系统显然要比其他两个特别是 Windows 系统更加适合部署 Kaf... ... [查看更多]

Views: 282

Linux有关路径和环境变量的常见问题

绝对路径 总是从根路径开始的路径 /.... 家目录~也可以认为是绝对路径 缺点: 有时候会写很长 优点: 不受当前位置显示, 可以在任何位置使用相同的绝对路径找到相同的文件. 相对路径 基于当前位置: 以./或者../开始的路径(其中./可以省略) . 表示当前目录 .. 表示上级目录 使用相对路径好处是, 当我们当前位置和目标路径近时,可以大大简化路径书写 坏处就是: 相对路径是基于当前位置和目标路径的相对位置的, 如果相对位置发生变化则路径会失效. 环境变量 在Lin... ... [查看更多]

Views: 143

关于Kafka的版本号

这个内容实在是太重要了,甚至是你能否用好 Kafka 的关键。 Kafka 流行的几种 Kafka 发行版本质上都内嵌了最核心的 Apache Kafka,也就是社区版 Kafka,那今天我们就来说说 Apache Kafka 版本号的问题。 那么现在你可能会有这样的疑问:我为什么需要关心版本号的问题呢?直接使用最新版本不就好了吗?当然了,这的确是一种有效的选择版本的策略,但我想强调的是这种策略并非在任何场景下都适用。如果你不了解各个版本之间的差异和功能变化,你怎么能够准确地评判某 ... ... [查看更多]

Views: 152