一文彻底掌握RocketMQ的存储模型 |
||
+ 目录
RocketMQ简介RocketMQ有Producer、Consumer、NameSrv、Broker四个部分。其中Broker用于存储消息,维护消息队列和订阅关系,是RocketMQ四个部分中最重要的一个部分,并且RocketMQ的高性能就是依赖于Broker模块的底层存储模型实现的。所以搞清楚Broker的存储模型是学习RocketMQ最重要的一步。 RocketMQ 优异的性能表现,必然绕不开其优秀的存储模型 。 这篇文章,笔者按照自己的理解 , 尝试分析 RocketMQ 的存储模型,希望对大家有所启发。
1 整体概览首先温习下 RocketMQ 架构。
整体架构中包含四种角色 :
本文的重点在于分析 BrokerServer 的消息存储模型。我们先进入 broker 的文件存储目录 。
消息存储和下面三个文件关系非常紧密:
消息主体以及元数据的存储主体 ;
消息消费队列,引入的目的主要是提高消息消费的性能 ;
索引文件,提供了一种可以通过 key 或时间区间来查询消息。 RocketMQ 采用的是混合型的存储结构,Broker 单个实例下所有的队列共用一个数据文件(commitlog)来存储。 生产者发送消息至 Broker 端,然后 Broker 端使用同步或者异步的方式对消息刷盘持久化,保存至 commitlog 文件中。只要消息被刷盘持久化至磁盘文件 commitlog 中,那么生产者发送的消息就不会丢失。 Broker 端的后台服务线程会不停地分发请求并异步构建 consumequeue(消费文件)和 indexFile(索引文件)。
2 数据文件RocketMQ 的消息数据都会写入到数据文件中, 我们称之为 commitlog 。 所有的消息都会顺序写入数据文件,当文件写满了,会写入下一个文件。
如上图所示,单个文件大小默认 1G , 文件名长度为 20 位,左边补零,剩余为起始偏移量,比如 00000000000000000000 代表了第一个文件,起始偏移量为 0 ,文件大小为1 G = 1073741824。 当第一个文件写满了,第二个文件为 00000000001073741824,起始偏移量为 1073741824,以此类推。
从上图中,我们可以看到消息是一条一条写入到文件,每条消息的格式是固定的。 这样设计有三点优势:
磁盘的存取速度相对内存来讲并不快,一次磁盘 IO 的耗时主要取决于:寻道时间和盘片旋转时间,提高磁盘 IO 性能最有效的方法就是:减少随机 IO,增加顺序 IO 。
《 The Pathologies of Big Data 》这篇文章指出:内存随机读写的速度远远低于磁盘顺序读写的速度。磁盘顺序写入速度可以达到几百兆/s,而随机写入速度只有几百 KB /s,相差上千倍。
因为消息是一条一条写入到 commitlog 文件 ,写入完成后,我们可以得到这条消息的物理偏移量。 每条消息的物理偏移量是唯一的, commitlog 文件名是递增的,可以根据消息的物理偏移量通过二分查找,定位消息位于那个文件中,并获取到消息实体数据。
消息 offsetMsgId 是由 Broker 服务端在写入消息时生成的 ,该消息包含两个部分:
我们可以通过消息 offsetMsgId ,定位到 Broker 的 ip 地址 + 端口 ,传递物理偏移量参数 ,即可定位该消息实体数据。
3 消费文件在介绍 consumequeue 文件之前, 我们先温习下消息队列的传输模型-发布订阅模型 , 这也是 RocketMQ 当前的传输模型。
发布订阅模型具有如下特点:
因此,rocketmq 的文件设计必须满足发布订阅模型的需求。 那么仅仅 commitlog 文件是否可以满足需求吗 ? 假如有一个 consumerGroup 消费者,订阅主题 my-mac-topic ,因为 commitlog 包含所有的消息数据,查询该主题下的消息数据,需要遍历数据文件 commitlog , 这样的效率是极其低下的。 进入 rocketmq 存储目录,显示见下图:
每个 consumequeue 包含 30 万个条目,每个条目大小是 20 个字节,每个文件的大小是 30 万 * 20 = 60万字节,每个文件大小约5.72M 。和 commitlog 文件类似,consumequeue 文件的名称也是以偏移量来命名的,可以通过消息的逻辑偏移量定位消息位于哪一个文件里。 消费文件按照主题-队列来保存 ,这种方式特别适配发布订阅模型。 消费者从 broker 获取订阅消息数据时,不用遍历整个 commitlog 文件,只需要根据逻辑偏移量从 consumequeue 文件查询消息偏移量 , 最后通过定位到 commitlog 文件, 获取真正的消息数据。 这样就可以简化消费查询逻辑,同时因为同一主题下,消费者可以订阅不同的队列或者 tag ,同时提高了系统的可扩展性。
4 索引文件每个消息在业务层面的唯一标识码要设置到 keys 字段,方便将来定位消息丢失问题。服务器会为每个消息创建索引(哈希索引),应用可以通过 topic、key 来查询这条消息内容,以及消息被谁消费。 由于是哈希索引,请务必保证key尽可能唯一,这样可以避免潜在的哈希冲突。
?
从开源的控制台中根据主题和 key 查询消息列表:
进入索引文件目录 ,如下图所以:
索引文件名 fileName 是以创建时的时间戳命名的,固定的单个 IndexFile 文件大小约为 400 M 。 IndexFile 的文件逻辑结构类似于 JDK 的 HashMap 的数组加链表结构。
索引文件主要由 Header、Slot Table (默认 500 万个条目)、Index Linked List(默认最多包含 2000万个条目)三部分组成 。
假如订单系统发送两条消息 A 和 B , 他们的 key 都是 1234567890 ,我们依次存储消息 A , 消息 B 。 因为这两个消息的 key 的 hash 值相同,它们对应的哈希槽(深)也会相同,哈希槽会保存的最新的消息 B 的索引条目序号 , 序号值是 4 ,也就是第二个深绿色条目。 而消息 B 的索引条目信息的最后 4 个字节会保存上一条消息对应的索引条目序号,索引序号值是 3 , 也就是消息 A 。
5 写到最后Databases are specializing – the “one size fits all” approach no longer applies ------ MongoDB设计哲学 RocketMQ 存储模型设计得非常精巧,笔者觉得每种设计都有其底层思考,这里总结了三点 :
到此这篇关于终于弄明白了 RocketMQ 的存储模型的文章就介绍到这了,更多相关 RocketMQ 存储模型内容请搜索陆零网络以前的文章或继续浏览下面的相关文章希望大家以后多多支持陆零网络! |