Kafka MetaQ Beanstalkd 的内部实现 - - ITeye博客

`

primernd

浏览: 75406 次

最近访客更多访客>>

Peak_

随枫而弑

ganxueyun

无赖木乃伊

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Kafka MetaQ Beanstalkd 的内部实现

博客分类：

kafka

阅读更多

Kafka 内部实现:

Kafka 官方说明了 Kafka 的各种优点,包含:

FileTransfer 的 zero copy 的 IO 实现;
直接写磁盘, 而不做复杂的内存和文件系统之间的转换;
磁盘顺序读写带来的高吞吐;
直接用系统的 page cache 做文件缓存管理, 程序本身不进行缓存管理;
实现了复制高可用;
依赖 Zookeeper 实现客户端的协调和状态存储;

但是这些简化设计是否是“优点”,是仁者见仁的。Broker 本身简单的设计带来的是客户端的复杂性。依赖 Zookeeper 也需要额外维护 Zookeeper 。

存储格式:

每个队列存储在一组序号自增、大小有上限的文件中。

数据持久化：

依赖操作系统的 pdflush 来做 pagecache 中的数据落地无法保证数据的可靠存储，所以 Kafka 提供了一个配置参数，可有由 Kafka 本身调用 fsync 强制落地。其实写文件不强制 fsync 系统也会用 pagecache 缓存这部分数据。

关于 pdflush 的原理可以看 http://www.westnet.com/~gsmith/content/linux-pdflush.htm

可配置参数:

/proc/sys/vm/nr_pdflush_threads
/proc/sys/vm/dirty_writeback_centisecs
/proc/sys/vm/dirty_expire_centiseconds
/proc/sys/vm/dirty_background_ratio

更多关于 Linux IO 调度的内容:
http://www.linuxjournal.com/article/6931

顺序写盘:
——————-
Linux 文件系统中当打开文件的时候是顺序写盘模式；当都是顺序写入的时候也是顺序写盘。
MMAP 会由系统优化尽量顺序读写盘。

Kafka 相关代码:

new RandomAccessFile(file, “rw”).getChannel()

https://github.com/apache/kafka/blob/a984f2fe5e3370163fb53586a04611ebd878c5ae/core/src/main/scala/kafka/utils/Utils.scala#L324

http://www.ericrochester.com/pages/code/parallel-io-with-mmap/

Zero-copy IO 优化:
——————-
Linux 系统底层调用为 sendfile

Java 提供 API:

public void transferTo(long position, long count, WritableByteChannel target);
channel.force(true); = fsync
channel.force(false); = fdatasync

更多参考和 Kafka 中的实现:

http://docs.oracle.com/javase/7/docs/api/java/nio/channels/FileChannel.html
https://github.com/apache/kafka/blob/0.7/core/src/main/scala/kafka/message/FileMessageSet.scala#L102
https://github.com/apache/kafka/blob/0.7/core/src/main/scala/kafka/message/FileMessageSet.scala#L169

Zero copy 避免了应用级别的复制，减少几次调用，提高了效率。

https://www.ibm.com/developerworks/library/j-zerocopy/

灾难恢复:
———–
由于每个 message 都存储了对应的 CRC ，恢复的时候遍历文件中的数据并且校验数据就可以得到可恢复的位置。Kafka 中的实现为:

https://github.com/apache/kafka/blob/a984f2fe5e3370163fb53586a04611ebd878c5ae/core/src/main/scala/kafka/message/FileMessageSet.scala#L189

客户端负载均衡:
—————
所有 broker 节点和生产者、消费者注册到 Zookeeper 。节点变化触发相关客户端的平衡操作。节点都尝试自平衡直到达成一致。

MetaQ:

原理和 Kafka 非常类似，但是接口和数据存储方式有些差异。

MMAP 文件的实现:
https://github.com/alibaba/metaq/blob/8a954248091d21636dd48468be65704aecd435dd/metaq-store/src/main/java/com/taobao/metaq/store/MapedFile.java#L71

我在这里实现了 MetaQ 的 PHP 客户端，需要的可以使用：

https://github.com/doubaokun/metaq-php

Beanstalkd:

简单的单线程应用，读写都使用内存，为了可以停机和恢复数据，写数据的时候会同时写 binlog 文件，binlog 文件的刷盘时间间隔可配置。

最新版本的实现已经将 fsync(2) 更换为 fdatasync 避免 2 次写盘 (即更新文件数据，又更新文件 meta 信息)，新建文件为固定大小的文件。

目前实现:
————
只用内存存储，容量上限为内存大小。
通过 binlog 实现数据加载恢复。
将 binlog 周期 fsync 强制写入磁盘。
注意这里的 binlog 并不是 MySQL 类似的 oplog。

分享到：

memcached for linux安装 | Kafka之海量数据处理

2014-04-24 11:24
浏览 1417
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Kafka技术内幕：图文详解Kafka源码设计与实现+书签.pdf+源码: Kafka技术内幕：图文详解Kafka源码设计与实现有书签有源码

Kafka技术内幕：图文详解Kafka源码设计与实现 PD: Kafka技术内幕：图文详解Kafka源码设计与实现 PDF 下载 Kafka技术内幕：图文详解Kafka源码设计与实现 PDF 下载

使用KafkaStreams和SpringBoot实现微服务Saga分布式事务-Piotr.pdf: 使用KafkaStreams和SpringBoot实现微服务Saga分布式事务-Piotr.pdf使用KafkaStreams和SpringBoot实现微服务Saga分布式事务-Piotr.pdf使用KafkaStreams和SpringBoot实现微服务Saga分布式事务-Piotr.pdf使用Kafka...

Kafka技术内幕：图文详解Kafka源码设计与实现: Kafka技术内幕：图文详解Kafka源码设计与实现

Kafka技术内幕-图文详解Kafka源码设计与实现: Kafka自LinkedIn开源以来就以高性能、高吞吐量、分布式的特性著称，本书以0.10版本的源码为基础，深入分析了Kafka的设计与实现，包括生产者和消费者的消息处理流程，新旧消费者不同的设计方式，存储层的实现，协调者...

Kafka技术内幕：图文详解Kafka源码设计与实现(完整版): Kafka自LinkedIn开源以来就以高性能、高吞吐量、分布式的特性著称，本书以0.10版本的源码为基础，深入分析了Kafka的设计与实现，包括生产者和消费者的消息处理流程，新旧消费者不同的设计方式，存储层的实现，协调者...

Kafka技术内幕：图文详解Kafka源码设计与实现.郑奇煌(2017.11).pdf: Kafka技术内幕：图文详解Kafka源码设计与实现.郑奇煌(2017.11).pdfKafka技术内幕：图文详解Kafka源码设计与实现.郑奇煌(2017.11).pdf

kafka 技术内幕图文详解Kafka源码设计与实现: kafka 技术内幕图文详解Kafka源码设计与实现 kafka 源码

Kafka高可用性实现原理: Kafka高可用性实现原理

妳那伊抹微笑_Kafka之自定义Encoder实现Class级别的数据传送以及解析的Eclipse工程_201407181.rar: 妳那伊抹微笑_Kafka之自定义Encoder实现Class级别的数据传送以及解析的Eclipse工程_201407181.rar 该文档与教程http://blog.csdn.net/u012185296/article/details/37924353 配套使用的，主要讲的是Kafka之自定义...

高清完整版 Kafka技术内幕：图文详解Kafka源码设计与实现: Kafka技术内幕：图文详解Kafka源码设计与实现.郑奇煌

Kafka技术内幕图文详解源码设计与实现: Kafka自LinkedIn开源以来就以高性能、高吞吐量、分布式的特性著称，本书以0.10版本的源码为基础，深入分析了Kafka的设计与实现，包括生产者和消费者的消息处理流程，新旧消费者不同的设计方式，存储层的实现，协调者...

使用netty实现TCP长链接消息写入kafka以及kafka批量消费数据: 使用netty实现TCP长链接消息写入kafka以及kafka批量消费数据，数据可以批量进行操作

TimingWheel:Kafka时轮的Java实现: 计时轮Kafka时轮的Java实现

kafka介绍(内部培训).pptx: kafka介绍，介绍kafka的原理，使用，案例和引用库调用，基于大数量的场景下的消息队列切换，作为内部资料培训现在拿出来分享

Kafka技术内幕：图文详解Kafka源码设计与实现高清带书签: 图文详解kafka的内部原理、设计、与实现，全面分析以kafa为中心的分布式流平台。

Kafka技术内幕（图文详解Kafka源码设计与实现）【图灵最新版】: Kafka自LinkedIn开源以来就以高性能、高吞吐量、分布式的特性著称，本书以0.10版本的源码为基础，深入分析了Kafka的设计与实现，包括生产者和消费者的消息处理流程，新旧消费者不同的设计方式，存储层的实现，协调者...

Kafka技术内幕：图文详解Kafka源码设计与实现@www.java1234.com.pdf: 超清中文版 kafka技术内幕，源码剖析kafka,经典书籍！

Global site tag (gtag.js) - Google Analytics