【Java面试】消息队列

By | 2026 年 3 月 17 日

RabbitMQ

RabbitMQ 的使用场景有哪些?

  • 抢购活动,削峰填谷,防止系统崩塌。
  • 延迟信息处理,比如 10 分钟之后给下单未付款的用户发送邮件提醒。
  • 解耦系统,对于新增的功能可以单独写模块扩展,比如用户确认评价之后,新增了给用户返积分的功能,这个时候不用在业务代码里添加新增积分的功能,只需要把新增积分的接口订阅确认评价的消息队列即可,后面再添加任何功能只需要订阅对应的消息队列即可。

RabbitMQ 有哪些重要的角色?

RabbitMQ 中重要的角色有:生产者、消费者和代理:

  • 生产者:消息的创建者,负责创建和推送数据到消息服务器;
  • 消费者:消息的接收方,用于处理数据和确认消息;
  • 代理:就是 RabbitMQ 本身,用于扮演“快递”的角色,本身不生产消息,只是扮演“快递”的角色。

RabbitMQ 有哪些重要的组件?

  • ConnectionFactory(连接管理器):应用程序与Rabbit之间建立连接的管理器,程序代码中使用。
  • Channel(信道):消息推送使用的通道。
  • Exchange(交换器):用于接受、分配消息。
  • Queue(队列):用于存储生产者的消息。
  • RoutingKey(路由键):用于把生成者的数据分配到交换器上。
  • BindingKey(绑定键):用于把交换器的消息绑定到队列上。

RabbitMQ 中 vhost 的作用是什么?

vhost:每个 RabbitMQ 都能创建很多 vhost,我们称之为虚拟主机,每个虚拟主机其实都是 mini 版的RabbitMQ,它拥有自己的队列,交换器和绑定,拥有自己的权限机制。

RabbitMQ 的消息是怎么发送的?

首先客户端必须连接到 RabbitMQ 服务器才能发布和消费消息,客户端和 rabbit server 之间会创建一个 tcp 连接,一旦 tcp 打开并通过了认证(认证就是你发送给 rabbit 服务器的用户名和密码),你的客户端和 RabbitMQ 就创建了一条 amqp 信道(channel),信道是创建在“真实” tcp 上的虚拟连接,amqp 命令都是通过信道发送出去的,每个信道都会有一个唯一的 id,不论是发布消息,订阅队列都是通过这个信道完成的。

RabbitMQ 怎么保证消息的稳定性?

  • 提供了事务的功能。
  • 通过将 channel 设置为 confirm(确认)模式。

RabbitMQ 怎么避免消息丢失?

  • 把消息持久化磁盘,保证服务器重启消息不丢失。
  • 每个集群中至少有一个物理磁盘,保证消息落入磁盘。

要保证消息持久化成功的条件有哪些?

  • 声明队列必须设置持久化 durable 设置为 true.
  • 消息推送投递模式必须设置持久化,deliveryMode 设置为 2(持久)。
  • 消息已经到达持久化交换器。
  • 消息已经到达持久化队列。

以上四个条件都满足才能保证消息持久化成功。

RabbitMQ 持久化有什么缺点?

持久化的缺地就是降低了服务器的吞吐量,因为使用的是磁盘而非内存存储,从而降低了吞吐量。可尽量使用 ssd 硬盘来缓解吞吐量的问题。

RabbitMQ 有几种广播类型?

  • direct(默认方式):最基础最简单的模式,发送方把消息发送给订阅方,如果有多个订阅者,默认采取轮询的方式进行消息发送。
  • headers:与 direct 类似,只是性能很差,此类型几乎用不到。
  • fanout:分发模式,把消费分发给所有订阅者。
  • topic:匹配订阅模式,使用正则匹配到消息队列,能匹配到的都能接收到。

RabbitMQ 怎么实现延迟消息队列?

延迟队列的实现有两种方式:

  • 通过消息过期后进入死信交换器,再由交换器转发到延迟消费队列,实现延迟功能;
  • 使用 RabbitMQ-delayed-message-exchange 插件实现延迟功能。

RabbitMQ 集群有什么用?

集群主要有以下两个用途:

  • 高可用:某个服务器出现问题,整个 RabbitMQ 还可以继续使用;
  • 高容量:集群可以承载更多的消息量。

RabbitMQ 节点的类型有哪些?

  • 磁盘节点:消息会存储到磁盘。
  • 内存节点:消息都存储在内存中,重启服务器消息丢失,性能高于磁盘类型。

RabbitMQ 集群搭建需要注意哪些问题?

  • 各节点之间使用“–link”连接,此属性不能忽略。
  • 各节点使用的 erlang cookie 值必须相同,此值相当于“秘钥”的功能,用于各节点的认证。
  • 整个集群中必须包含一个磁盘节点。

RabbitMQ 每个节点是其他节点的完整拷贝吗?为什么?

不是,原因有以下两个:

  • 存储空间的考虑:如果每个节点都拥有所有队列的完全拷贝,这样新增节点不但没有新增存储空间,反而增加了更多的冗余数据;
  • 性能的考虑:如果每条消息都需要完整拷贝到每一个集群节点,那新增节点并没有提升处理消息的能力,最多是保持和单节点相同的性能甚至是更糟。

RabbitMQ 集群中唯一一个磁盘节点崩溃了会发生什么情况?

如果唯一磁盘的磁盘节点崩溃了,不能进行以下操作:

  • 不能创建队列
  • 不能创建交换器
  • 不能创建绑定
  • 不能添加用户
  • 不能更改权限
  • 不能添加和删除集群节点

唯一磁盘节点崩溃了,集群是可以保持运行的,但你不能更改任何东西。

RabbitMQ 对集群节点停止顺序有要求吗?

RabbitMQ 对集群的停止的顺序是有要求的,应该先关闭内存节点,最后再关闭磁盘节点。如果顺序恰好相反的话,可能会造成消息的丢失。

如何保证消息不丢失(可靠性)?

保证消息的可靠传输需要从三个环节入手

  • 生产者 -> RabbitMQ:开启发布确认(Publisher Confirm)机制。生产者发送消息后,RabbitMQ 会异步返回一个 ack(成功)或 nack(失败),生产者可根据结果重试
  • RabbitMQ 自身:开启持久化
    1. 队列持久化:创建队列时设置 durable = true
    2. 消息持久化:发送消息时设置 deliveryMode = 2
  • RabbitMQ -> 消费者:关闭自动 ack,改为手动确认(Manual Ack)。消费者处理完业务逻辑后再手动确认,防止消费者宕机导致消息丢失

如何解决消息的重复消费问题(保证幂等性)?

消息重复通常是因为网络波动,消费者已消费但确认 (ack) 未送达 Broker,导致消息被重新投递

  • 核心思路:保证幂等性,即同一条消息执行多次与执行一次的效果相同
  • 解决方案:消息体中带一个全局唯一的业务 ID(如订单号、支付 ID)
    • 方案一(数据库):利用数据库主键唯一约束去重。消费前先根据业务 ID 查询,若记录已存在则直接返回。
    • 方案二(Redis):用业务 ID 作为 Redis 的 key,通过 setNx 操作来判断是否处理过。

什么是死信队列(DLX)?它有什么用?

死信队列是一种消息补偿机制。当消息成为死信时,会被重新发送到指定的交换机(称为死信交换机 DLX),进而进入绑定的死信队列

  • 消息成为死信的条件
    1. 消息被消费者拒绝且未重新入队(basic.reject 或 basic.nack 且 requeue = false)。
    2. 消息TTL(存活时间) 过期。
    3. 队列达到最大长度,无法再添加消息。
  • 作用:可以监听死信队列,对失败的消息进行延迟处理、异常监控或人工干预

如何实现延迟队列?

RabbitMQ 本身没有直接提供延迟队列,通常通过死信队列 + TTL 机制模拟

  1. 创建一个队列,不设置消费者,并为其消息设置 TTL
  2. 为该队列指定死信交换机(DLX)
  3. 消息超时无人消费后,自动转发到死信交换机,再路由到绑定的死信队列。
  4. 消费者监听死信队列即可获取到“延迟”的消息。

如何处理消息堆积?

  • 临时扩容增加消费者数量(前提是队列能支撑并行消费),或为消费者开启多线程处理。
  • 队列优化:对于大量消息积压,可以使用 RabbitMQ 的惰性队列,它会将消息直接存入磁盘,减少内存压力,但吞吐量会下降
  • 紧急修复:如果消费者程序有 Bug,先暂停消费者,修复 Bug 后,再启动消费能力更强的程序来追赶进度。

Kafka

kafka 可以脱离 zookeeper 单独使用吗?为什么?

kafka 不能脱离 zookeeper 单独使用,因为 kafka 使用 zookeeper 管理和协调 kafka 的节点服务器。

kafka 有几种数据保留的策略?

kafka 有两种数据保存策略:按照过期时间保留和按照存储的消息大小保留。

kafka 同时设置了 7 天和 10G 清除数据,到第五天的时候消息达到了 10G,这个时候 kafka 将如何处理?

这个时候 kafka 会执行数据清除工作,时间和大小不论那个满足条件,都会清空数据。

什么情况会导致 kafka 运行变慢?

  • cpu 性能瓶颈
  • 磁盘读写瓶颈
  • 网络瓶颈

使用 kafka 集群需要注意什么?

  • 集群的数量不是越多越好,最好不要超过 7 个,因为节点越多,消息复制需要的时间就越长,整个群组的吞吐量就越低。
  • 集群数量最好是单数,因为超过一半故障集群就不能用了,设置为单数容错率更高。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注