guaoran

消息中间件-Kafka 安装集群、消息分发策略、消息的消费原理、java api 操作代码

文章目录

Kafka

总览
应用场景
Kafka 本身架构
Kafka 安装部署

安装
启动、停止 kafka
安装集群环境

Kafka Java API 的使用
kafka 原理分析

topic 和 partition

topic
partition
topic 和 partition 存储

消息分发

kafka 消息分发策略

消息默认的分发机制
消费端消费指定的分区

消息的消费原理

分区分配策略

Range strategy 范围分区
RoundRobin strategy 轮询分区

触发分区分配策略的条件

谁来执行Rebalance 以及管理 consumer 的group ？

如果确定 coordinator
JoinGroup 的过程
Synchronizing GroupGroup StateState 阶段

保存消费端的消费位置 Offset

消息的存储

零拷贝
消息的文件存储机制

LogSegment
segment 中 index 和 log 的对应关系
在 partition 中如何通过 offset 查找 message
日志清除策略以及压缩策略

日志清除策略
日志压缩策略

partition 的高可用副本机制

副本分配算法（没有证明出来）？？？？？不过这个算法到感觉是获得broker上的有哪些partition

Kafka

Kafka 是一款分布式消息发布和订阅系统，具有高性能、高吞吐量的特点而被广泛应用与大数据传输场景。

总览

kafka 是一个分布式消息发布和订阅系统，具有高性能和高吞吐量。

通过kafka可以实现日志收集、行为跟踪、消息的通信。

当produce 生产者发送数据到 broker上的topic 时，会通过 zk的 watcher事件通知给监听的consumer ，此时consumer 可以主动去pull 拉去broker 的消息，这块跟其他mq是不同的。

kafka支持分区（partition），在集群环境下我们通过将消息进行分区来减少此磁盘的压力。

消息分发策略：默认的消息分发策略是基于key 的hash一致性，当producer 生产消息到broker上时，会根据分发策略存储到不同的分区上。

分区分配策略：默认是范围分区是基于partition进行排序，当多个consumer 同时去消费topic时，会根据分区分配策略去选择对应的partition 进行消费，来减少服务器上的压力。

当真正消费消息，如果增加或减少consumer 或者partition 发生了变化，此时会重新进行分区分配策略，即rebanlance 。在进行Rebalance时，kafka会通过coordinator 来进行管理consumer 下group，当第一个consumer进行启动时，会去跟kafka server 确认coordinator，kafka server会选择broker节点最小的作为coordinator，之后所有的consumer会跟coordinator 进行通信。

应用场景

由于 kafka 具有较好的吞吐量、内置分区、冗余及容错性的优点（可以每秒处理几十万消息），让 kafka 成为了一个很好的大规模消息处理应用的解决方案。在企业级应用上，主要会应用于以下几个方面

行为跟踪：kafka 可以用于跟踪用户浏览页面、搜索及其他行为。通过发布-订阅模式实时记录到对应的topic 中，通过后端大数据平台接入处理分析，并做更进一步的实时处理和监控
日志收集：日志聚合表示从服务器上收集日志文件，然后放到一个集中的平台（文件服务器）进行处理。在实际应用开发中，我们应用程序的log 都会输出到本地的磁盘上，排查问题的话通过linux 命令来搞定，如果应用程序组成了负载均衡集群，并且集群的机器有几十台以上，那么想通过日志快速定位到问题，就是很麻烦的事情了。所以一般都会做一个日志统一收集平台管理log 日志用来快速查询重要应用的问题。所以很多公司的套路都是把应用日志几种到kafka 上，然后分别导入到es 和hdfs 上，用来做实时检索分析和离线统计数据备份等。而另一方面，kafka 本身又提供了很好的api 来集成日志并且做日志收集

Kafka 本身架构

kafka 集群包含若干个 Producer（可以是应用节点产生的消息，也可以是通过Flume 收集日志产生的事件），若干个Broker（kafka 支持水平扩展）、若干个ConsumerGroup，以及一个zookeeper 集群。

kafka 通过zookeeper 管理集群配置及服务协同。Producer 使用push 模式将消息发布到broker，consumer 通过监听使用pull 模式从broker 订阅并消费消息。多个broker 协同工作，producer 和consumer 部署在各个业务逻辑中。三者通过zookeeper 管理协调请求和转发。这样就组成了一个高性能的分布式消息发布和订阅系统。

有一个细节是和其他 mq 中间件不同的点，producer 发送消息到broker的过程是push，而consumer 从broker 消费消息的过程是pull，主动去拉数据。而不是broker 把数据主动发送给consumer

Kafka 安装部署

安装

wget https://archive.apache.org/dist/kafka/1.1.0/kafka_2.11-1.1.0.tgz
tar -zxvf kafka_2.11-1.1.0.tgz

启动、停止 kafka

启动 kafka 时需要安装并启动 zookeeper ，(如果没有搭建 zookeeper 环境，可以直接运行 kafka 内嵌的 zookeeper )

启动 zookeeper 和 kafka

cd /guaoran/zookeeper/zookeeper-3.4.10/bin/
sh zkServer.sh start
cd /guaoran/kafka/kafka_2.11-1.1.0/bin
sh kafka-server-start.sh -daemon ./../config/server.properties

停止 kafka

sh kafka-server-stop.sh

kafka 基本操作

安装集群环境

修改server.properties 文件

# 修改对应的服务器 节点 三台 分别是 0,1,2 类似zookeeper 的myid
broker.id=0
# 监听修改成本机ip ,ifconfig的ip地址
listeners=PLAINTEXT://192.168.45.135:9092
## 对外的ip地址
advertised.listeners=PLAINTEXT://192.168.45.135:9092
# advertised.host.name=192.168.45.135
# advertised.port=9092
# 修改 kafka 日志 目录，可以采用默认，不过会丢失
log.dirs=/guaoran/kafka/logs
# 配置zookeeper 的集群地址
zookeeper.connect=192.168.45.131:2181,192.168.45.134:2181,192.168.45.135:2181

Kafka Java API 的使用

生产者消息发送

/**
 * @author : guaoran
 * @Description : 

 *  生产者消息发送
 * @date :2018/11/9 16:00
 */
public class KafkaProducerDemo extends Thread {
    private final static String CONNECT_URL =
            "192.168.45.131:9092,192.168.45.134:9092,192.168.45.135:9092";
    private final KafkaProducer<Integer,String> producer;
    private final boolean isAysnc;
    private final String topic;
    public KafkaProducerDemo(String topic,boolean isAysnc){
        this.isAysnc = isAysnc;
        this.topic = topic;
        Properties properties = new Properties();
        //连接地址
        properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,CONNECT_URL);
        properties.put(ProducerConfig.CLIENT_ID_CONFIG,"KafkaProducerDemo");
        // producer 发送消息到 broker 上以后的确认值
        // 0 :表示 producer 不需要等待 broker 的消息确认，如果server 宕机 ，数据会丢失
        // 1 :表示 producer 只需要获得 kafka 集群中的 leader 节点确认即可
        // all(-1) :表示 producer 需要ISR中所有的Replica接受确认，速度较慢，安全性最高，如果只有一个Replica时，并不能一定能避免数据丢失。
        properties.put(ProducerConfig.ACKS_CONFIG,"-1");
        properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG,
                "org.apache.kafka.common.serialization.IntegerSerializer");
        properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,
                "org.apache.kafka.common.serialization.StringSerializer");

        /*
           batch.size
           生产者发送多个消息到broker上的同一个分区时，为了减少网络请求带来的性能开销，通过批量的方式来提交消息，
           可以通过这个参数来控制批量提交的字节数大小，默认是16kb，意味着当一批消息大小达到指定的 batch.size 时会统一发送。

           linger.ms
            producer 默认会把两次发送时间间隔内收集到的所有 request 进行一次聚合，然后再发送，以提高吞吐量。
            而linger.ms 就是为每次发送到broker 的请求增加一些 delay，以此来聚合更多的message请求。

           batch.size 和 linger.ms 这两个参数是 kafka 的性能优化的关键参数，如果两个都配置，只要满足其中一个要求，就会发送消息到broker

           max.request.size
            设置请求的数据的最大字节数，为了防止发生较大的数据包影响到吞吐量，默认是1MB
         */
        producer = new KafkaProducer<Integer, String>(properties);


    }

    @Override
    public void run() {
        int num = 0;
        while(num<50){
            String message = "message_"+num;
            System.out.println("begin...send..."+message);
            if(isAysnc){//异步发送
                producer.send(new ProducerRecord<Integer, String>(topic,message),new Callback(){
                    @Override
                    public void onCompletion(RecordMetadata recordMetadata, Exception e) {
                        if(recordMetadata != null){
                            System.out.println("async-offset:"+recordMetadata.offset()+
                                    "->partition:"+recordMetadata.partition());
                        }
                    }
                });
            }else{//同步发送
                try {
                    RecordMetadata recordMetadata = producer.send(new ProducerRecord<Integer, String>(topic,message)).get();
                    System.out.println("sync-offset:"+recordMetadata.offset()+
                            "->partition:"+recordMetadata.partition());
                } catch (InterruptedException e) {
                    e.printStackTrace();
                } catch (ExecutionException e) {
                    e.printStackTrace();
                }
            }
            num++;
            try {
                Thread.sleep(1000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }

    public static void main(String[] args) {
        new KafkaProducerDemo("test",false).start();
    }
}

消费者消费消息

/**
 * @author : guaoran
 * @Description : 

 *  消费端消息接受
 * @date :2018/11/9 16:00
 */
public class  KafkaConsumerDemo extends Thread {
    private final static String CONNECT_URL =
            "192.168.45.131:9092,192.168.45.134:9092,192.168.45.135:9092";
    private final KafkaConsumer<Integer,String> consumer;
    public KafkaConsumerDemo(String topic){
        Properties properties = new Properties();
        properties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,CONNECT_URL);
        //分组id
        properties.put(ConsumerConfig.GROUP_ID_CONFIG,"KafkaConsumerDemo1");
        // enable.auto.commit 消费者消费消息以后自动提交，只有当消息提交以后，该消息才不会被再次接收到
        // 还可以配合 auto.commit.interval.ms 控制自动提交的频率。
        properties.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG,"true");
        properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG,
                "org.apache.kafka.common.serialization.IntegerDeserializer");
        properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG,
                "org.apache.kafka.common.serialization.StringDeserializer");
        //auto.offset.reset
        //这个参数是针对新的 groupid中的消费者而言的，当有新的groupid的消费者来消费指定的topic时，对于该参数的配置，会有不同的语义
        // 当 kafka 没有初始偏移量或服务器上当前偏移量不再存在时
        // latest：自动将偏移重置为最新偏移
        // earliest：自动将偏移量重置为最早的偏移量
        // none：如果没有找到消费者组的先前偏移，则向用户抛出异常
        properties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG,"earliest");

        /*
           max.poll.records
            此设置限制每次调用poll 返回的消息数，这样可以更容易的预测每次 poll 间隔要处理的最大值，通过调整此值，可以减少poll 间隔

         */
        consumer = new KafkaConsumer<Integer, String>(properties);
        consumer.subscribe(Collections.singletonList(topic));
    }

    @Override
    public void run() {
        while(true){
            ConsumerRecords<Integer,String> consumerRecords = consumer.poll(1000);
            for (ConsumerRecord r :consumerRecords) {
                System.out.println("consumer...receive.."+r.value());
            }
        }
    }

    public static void main(String[] args) {
        new KafkaConsumerDemo("test").start();
    }
}

kafka 原理分析

topic 和 partition

topic

在kafka 中，topic是一个存储消息的逻辑概念，可以认为是一个消息的集合。每条消息发送到 kafka 集群的消息都有一个类别。每个topic可以有多个生产者向他发送消息，也可以有多个消费者去消费消息

partition

每个topic 可以划分多个分区（每个topic至少有一个分区），同一个topic下的不同分区包含的消息是不同的。每个消息在被添加到分区时，都会被分配一个offset，它是消息再此分区中的唯一编号，kafka通过offset保证消息在分区内的顺序，offset 的顺序不跨分区，即kafka只保证在同一个分区内的消息是有序的。

topic 和 partition 存储

partition 是以文件的形式存储在文件系统中，比如创建一个名为 demo 的topic ，其中有三个partition ，那么在kafka 的数据目录中，就有3三目录，demo-0~2，命名规则：topicname-partitionid

kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 3 --topic demo

消息分发

kafka 消息分发策略

消息是kafka 中最基本的数据单元，在kafka中，一条消息有 key 、value 两部分组成，在发送一条消息时，我们可以指定这个 key，那么 producer 会根据 key 和partition 机制来判断当前这条消息应该发送并存储到哪个partition中；我们可以根据需要进行扩展producer 的partition 机制

/**
 * @author : guaoran
 * @Description : 

 *  自定义消息分区算法
 * @date :2019/1/15 13:35
 */
public class TopicPartitionDemo implements Partitioner {
    private final Random random = new Random();
    @Override
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        List<PartitionInfo> partitionInfoList = cluster.partitionsForTopic(topic);
        //指定发送的分区值
        int partitionNum = 0;
        if(key==null){
            // 随机分区
            partitionNum = random.nextInt(partitionInfoList.size());
        }else{
            Math.abs((key.hashCode())%partitionInfoList.size());
        }
        System.err.println("topic="+topic+",key="+key+",value="+value+",partitionNum="+partitionNum);
        return partitionNum;
    }
}

消息默认的分发机制

默认情况下，kafka 采用的是hash 取模的分区算法。如果key 为null，则会随机分配一个分区。这个随机是在参数”metadata.max.age.ms” 的时间范围内随机选择一个。对于这个时间段内，如果key为null，则只会发送到唯一的分区。这个值默认情况下是10分钟更新一次。

消费端消费指定的分区

//消费指定分区的时候，不需要再订阅 
//consumer.subscribe(Collections.singletonList(topic));
// todo 只消费分区 0 的消息
TopicPartition partitionDemo = new TopicPartition(topic,0);
consumer.assign(Arrays.asList(partitionDemo));

消息的消费原理

在实际生产过程中，每个topic都会有多个partition，多个partition的好处在于，一方面能够对broker上的数据进行分片有效减少消息的容量从而提升io性能。另一方面，为了提高消费端的消费能力，一般会通过多个consumer 去消费同一个topic，也就是消费端的负载均衡机制。

在group.id相同的consumer进行消费同一个topic时，一个consumer消费过得数据在另一consumer中不会被消费到，那么同一个consumer group 里面的consumer 去消费数据的时候，会根据分片进行分配消费分区的数据。如果有三个partition ，同时启动三个group.id 相同的consumer去同时消费同一个topic，最终的结果是三个consumer 会分别消费一个partition 的数据。

分区分配策略

在kafka中存在两种分区分配策略，一种是Range（默认），一种是RoundRobin（轮询）。通过partition.assignment.strategy 参数来设置。

Range strategy 范围分区

Range 策略是对每个主题而言的，首先对同一个主题里面的分区按照序号进行排序。并对消费者按照字母顺序进行排序。假设有10个分区，3个消费者，排完序的分区将会是0-9;消费者线程排完序是C0-0,C1-1,C2-2 。然后将partitions的个数除于消费者线程的总数来决定每个消费者线程将会消费几个分区。如果除不尽，则前面的消费者会多消费一个分区。所以最终结果是：C0消费 0-3分区，C1消费4-6分区，C2消费7-9分区。

如果同时消费两个主题的话，分区数相同，消费者相同，此时，C0消费者比其他消费者线程多消费2个分区，这就是Range Strategy 的一个弊端。最好是分区数是消费者的整数倍。

RoundRobin strategy 轮询分区

轮询分区策略是把所有的partition 和所有consumer 都列出来，然后按照hashcode进行排序。最后通过轮询算法分配partition给消费者。如果所有consumer实例的订阅都是相同的，那么partition会均匀分布。

使用轮询分区策略必须满足两个条件

每个主题的消费者实例具有相同数量的流
每个消费者订阅的主题必须是相同的。

触发分区分配策略的条件

当出现以下几种情况时，kafka会进行一次分区分配操作，即 kafka consumer 的rebalance

同一个consumer group 内新增了消费者
消费者离开当前的consumer group ，如：主动停机或宕机
topic 分区数量发生了变化

谁来执行Rebalance 以及管理 consumer 的group ？

kafka 提供了一个角色：coordinator 来执行对于consumer group的管理，当consumer group 的第一个 consumer 启动的时候，它会去跟 kafka server 确定谁是他们组的 coordinator 。之后该group 内所有成员都会和该coordinator 进行协调通信。

如果确定 coordinator

消费者向kafka 集群中的任意一个broker 发送一个 GroupCoordinatorRequest请求，服务端会返回一个负载最小的broker 节点的id，并将 broker 设置为 coordinator

JoinGroup 的过程

在rebalance 之前，需要保证 coordinator是已经确定好了的，整个Rebalance 的过程分为两个步骤，join 和 sync 。

join：表示加入到consumer group 中，在这一步中，所有成员都会想 coordinator 发送joinGroup的请求。一旦所有成员都发送了joinGroup请求，那么 coordinator会选择一个consumer 担任leader 角色，并把组成员信息和订阅信息发送消费者。

protocol_metadata：序列化后的消费者的订阅信息

leader_id:消费组中的消费者，coordinator会选择一个作为leader，对应是就是member_id

member_metadata ：对应消费者的订阅信息

members：consumer group 中全部的消费者的订阅信息

generation_id：年代信息，类似 zk的epoch，对于每轮Rebalance 都会递增该值

Synchronizing GroupGroup StateState 阶段

完成分区分配后，就进入该阶段，主要逻辑是向GroupCoordinator 发送SyncGroupRequest请求，并且处理SyncGroupResponse响应，简单来说，就是leader将消费者对应的partition分配方案同步给consumer group中的所有consumer。

consumer group 的分区分配方案是在客户端执行的。

保存消费端的消费位置 Offset

offset 即每个消息针对每个consumer group 的偏移量，记录该consumer group 消费到了具体的位置。

在kafka 中，体用了一个__consumer_offsets-* 的一个topic ，把offset 信息写入到这个topic中。默认有50个分区。

查看groupid的offset存储在哪个分区中，计算公式为

(“分组id”.hashCode())%__consumer_offsets的分区总数)

System.out.println(Math.abs(("KafkaConsumerDemo1".hashCode())%50));

查看当前consumer group 的offset 信息

bin/kafka-simple-consumer-shell.sh --topic __consumer_offsets  --partition 4 --broker-list 192.168.45.135:9092,192.168.45.131:9092,192.168.45.134:9092 --formatter "kafka.coordinator.group.GroupMetadataManager\$OffsetsMessageFormatter"

[groupid,topic,partition]::[OffsetMetadata[offset,..]....]
[KafkaConsumerDemo1,demo,0]::[OffsetMetadata[165,NO_METADATA],CommitTime 1547543212536,ExpirationTime 1547629612536]

消息的存储

为了规避随机读写带来的时间消耗，kafka采用顺序写的方式存储数据。即使是这样，但是I/O操作仍然会造成磁盘的性能瓶颈，所以kafka还有一个性能策略。

零拷贝

一般应用程序有一个buffer空间在用户空间中，来自于网络或者磁盘，无论来自网络或者磁盘，都需要通过内核，也就是说内核中也要有buffer。

1)磁盘到内核 --> 2)内核到应用程序buffer 写数据时 --> 3)应用程序buffer写到内核buffer --> 4）内核buffer写到磁盘

这个过程多了两次拷贝，kafka本身因为不处理数据，所以没有必要把数据放入应用程序的buffer中。所以搞了个基于内核的数据存储和传输,使用sendfile机制，直接基于内核kernel处理。

push和pull的模式
无论有多少producer，都往kafka进行push数据，kafka可以不关心producer的具体位置。consumer是从kafka pull数据，无论有多少消费数据，对kafka基本没有压力。
采用zookeeper来管理brokers和consumers
zookeeper主要存放元数据信息，这是一种积木式创新的体现。
在consumer端实现消息的一致性
kafka本身可以保存consumer已经消费过数据的offset，所以如果consumer出错的话，重新启动consumer，就可以从最近的数据开始。

消息的文件存储机制

一个topic 可以有多个partition 在物理磁盘上进行保存，进入到logs目录中，可以找到对应partition下的日志内容

cd /guaoran/kafka/logs/guaoran-0/
ls
00000000000000000000.index  00000000000000000000.log  00000000000000000000.timeindex  leader-epoch-checkpoint

kafka 是通过分段的方式将log分为多个LogSegment，LogSegment是一个逻辑上的概念，一个LogSegment对应磁盘上的一个日志文件和一个索引文件，其中（.log)日志文件是用来记录消息的，(.index)索引文件时用来保存消息的索引。

LogSegment

当kafka producer 不断发送消息，必然会引起partition文件的五险扩张，这样对于消息文件的维护以及被消费的消息的清理都会带来非常大的挑战，所以kafka 以segment 为单位又把partition进行细分。每个partition相当于一个巨型文件被平均分配到多个大小相等的segment数据文件中（每个segment文件中的消息不一定相等），这种特性方便已经被消费的消息的清理，提高磁盘的利用率。

server.properties 中有以下几个配置

# 分段文件的大小
log.segment.bytes=107370
## 消息清理
# 日志消息默认存储7天
log.retention.hours=168 
# 消息的大小，超过这个大小，会清理
log.retention.bytes=1073741824

为了看到明显的效果，将分段文件大小改小了，并进行发送多个消息到 guaoran 的topic中，再次查看

segment 文件由三部分组成，分别是.index , .log , .timeindex 后缀，

segment 文件命令规则：partition全局的第一个segment从0开始，后续每个segment文件名为上一个segment文件最后一天消息的offset值进行递增。

采用以下命令对 .index 文件进行查看

/guaoran/kafka/kafka_2.11-1.1.0/bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.index --print-data-log

结果如下：

offset: 53 position: 4124
offset: 106 position: 8264
...
offset: 1302 position: 103050
offset: 1354 position: 107210

采用以下命令对 .log文件进行查看

/guaoran/kafka/kafka_2.11-1.1.0/bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.log --print-data-log

结果如下：

offset: 1301 position: 102970 CreateTime: 1547557716588 payload: message_1301
offset: 1302 position: 103050 CreateTime: 1547557716601 payload: message_1302
offset: 1303 position: 103130 CreateTime: 1547557716612 payload: message_1303
offset: 1304 position: 103210 CreateTime: 1547557716624 payload: message_1304
...
offset: 1353 position: 107130 CreateTime: 1547557717167 payload: message_1353
offset: 1354 position: 107210 CreateTime: 1547557717179 payload: message_1354
offset: 1355 position: 107290 CreateTime: 1547557717183 payload: message_1355

第一个log文件的最后一个offset为1355，所以下一个segment的文件命名为00000000000000001356.log

segment 中 index 和 log 的对应关系

如上面所看查看的index 和log 的文件内容，进行分析

为了提高查找消息的性能，为每一个日志文件添加2个索引，索引文件：offsetIndex 和 TimeIndex ，分别对应 .index 和 .timeindex

.index 文件中存储了索引以及物理偏移量。.log 文件中存储了消息的内容。索引文件的元数据执行对应数据文件中message 的物理偏移地址。以【1302,103050】为例， log文件中，对应的是滴1302条记录，物理偏移量（position）为103050，position 是ByteBuffer 的指针位置。

在 partition 中如何通过 offset 查找 message

根据offset 的值，查找 segment 段中的 index 索引文件。由于索引文件命名是以上一个文件的最后一个offset进行命令的，所以，使用二分查找算法能够根据offset快速定位到指定的索引文件。
找到索引文件后，根据offset进行定位，找到索引文件中的复合范围的索引。（kafka 采用稀疏索引的方式来提高查找性能）
得到position以后，在到对应的log文件中，从position处开始查找offset对应的消息，将每条消息的offset与目标offset进行比较，知道找到消息

比如找 offset=1303的消息，那么会先找到000.index 文件，找到【1302，103050】这个索引，在到log文件中，根据 103050 这个position 开始查找offset = 1303的消息，当确定对应的消息后进行返回。

日志清除策略以及压缩策略

日志清除策略

日志是分段存储的，一方面能够减少单个文件内容的大小，另一方面，方便kafka 进行日志清理。日志的清理策略有两个：

根据消息的保留时间，当消息在kafka中保存的时间超过了指定的时间，就会触发清理过程 log.retention.hours=168 默认7天
根据topic存储的数据大小，当topic所占的日志文件大小大于一定的阈值，则开始删除最久的消息。kafka会启动一个后台线程，定期检查是否存在可以删除的消息。log.retention.bytes=1073741824 默认1G

通过上面这两个参数来设置，当其中任意一个达到要求，都会执行删除。

日志压缩策略

kafka 还提供了日志压缩功能，通过这个功能可以有效的减少日志文件的大小，缓解磁盘紧张的情况，在很多实际场景中，消息的key和value的值之间的对应关系是不断变化的，就像数据库中的数据会不断被修改一样消费者只关心key对应的最新value值。因此，我们可以开启kafka的日志压缩功能，服务端会在后台启动Cleaner 线程池，定期将相同的key进行合并，只保留最新的value值。

默认情况下启动日志清理程序，要在特定主题上启用日志清理，您可以添加特定于日志的属性 log.cleanup.policy=compact ,日志清理程序可以配置为保留最小量的日志的未压缩“头”。通过设置压缩时间延迟来启用此功能。 log.cleaner.min.compaction.lag.ms .

日志压缩的原理

partition 的高可用副本机制

kafka 的每个topic 都可以分为多个partition ，并且多个partition 会均匀分布在集群的各个节点下。虽然这种方式能够有效的对数据进行分片，但是杜宇每个partition 来说，都是单点的，当其中一个partition 不可用的时候，那么这部分的消息就没办法进行消费。所以kafka为了提高partition的可靠性而提供了副本的概念（replica），通过副本机制类似实现冗余备份。
每个分区可以有多个副本，并且在副本集合中会存在一个 leader 的副本，所有的读写请求都是由leader 副本来进行处理。剩余的其他副本都做为follower 副本，follower 副本会从leader 副本同步消息日志，仅仅是同步消息。这个有点类似zookeeper 中leader 和follower 的概念，但是follower不会去处理请求，具体的实现方式还是有比较大的差异。所以我们可以认为，副本集会存在一主多从的关系。
一般情况下，同一个分区的多个副本会被均匀分配到集群中的不同broker 上，当leader 副本所在的broker 出现故
障后，可以重新选举新的leader 副本继续对外提供服务。通过这样的副本机制来提高kafka 集群的可用性。

副本分配算法（没有证明出来）？？？？？不过这个算法到感觉是获得broker上的有哪些partition

~~将所有 n 个 Broker 和待分配的 Partition 排序~~
~~将第 i 个partition分配到第（i%n）的 broker上，作为优先副本~~
~~将第 i 个partition 的第 j 个replica分配到第（（i+j）%n）个broker 上~~

~~假设集群中共有4个brokers，存在 topic 为partitionReplication ,有4个partition，每个partition有三个replica。~~

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 4 --topic partitionReplication

~~四个partitions是partitionReplication-0,partitionReplication-1,partitionReplication-2,partitionReplication-3~~

~~四个brokers是broker-0，broker-1，broker-2，broker-3~~

~~当第 0 个 partition 进行分配 (0%4)=0 ，即broker-0 上存放partitionReplication-0 作为优先副本~~

~~当第 0 个 partition 的第 1个replica 进行分配 ((0+1)%4)=1，即broker-1 上存放partitionReplication-0的一个副本~~

~~当第 0 个 partition 的第 2个replica 进行分配 ((0+2)%4)=2，即broker-2 上存放partitionReplication-0的一个副本~~

~~即：isr:[0,1,2]~~

get /brokers/topics/partitionReplication/partitions/0/state
{"controller_epoch":1,"leader":0,"version":1,"leader_epoch":0,"isr":[0,2,3]}

~~获得partitionReplication主题的partition的第0个副本的存储位置，其中leader副本存储在broker-0 中~~

~~当第 1 个 partition 进行分配 (1%4)=1 ，即broker-1 上存放partitionReplication-1 作为优先副本~~

~~当第 1 个 partition 的第 1个replica 进行分配 ((1+1)%4)=2，即broker-2 上存放partitionReplication-1的一个副本~~

~~当第 1 个 partition 的第 2个replica 进行分配 ((1+2)%4)=3，即broker-3 上存放partitionReplication-1的一个副本~~

~~即：isr:[1,2,3]~~

get /brokers/topics/partitionReplication/partitions/1/state
{"controller_epoch":1,"leader":1,"version":1,"leader_epoch":0,"isr":[1,3,0]}

~~当第 2 个 partition 进行分配 (2%4)=2 ，即broker-2 上存放partitionReplication-2 作为优先副本~~

~~当第 2 个 partition 的第 1个replica 进行分配 ((2+1)%4)=3，即broker-3 上存放partitionReplication-2的一个副本~~

~~当第 2 个 partition 的第 2个replica 进行分配 ((2+2)%4)=0，即broker-0 上存放partitionReplication-2的一个副本~~

~~即：isr:[2,3,0]~~

get /brokers/topics/partitionReplication/partitions/2/state
{"controller_epoch":1,"leader":2,"version":1,"leader_epoch":0,"isr":[2,0,1]}

~~当第 3 个 partition 进行分配 (3%4)=3 ，即broker-3 上存放partitionReplication-3 作为优先副本~~

~~当第 3 个 partition 的第 1个replica 进行分配 ((3+1)%4)=0，即broker-0 上存放partitionReplication-1的一个副本~~

~~当第 3 个 partition 的第 2个replica 进行分配 ((3+2)%4)=1，即broker-1 上存放partitionReplication-1的一个副本~~

~~即：isr:[3,0,1]~~

get /brokers/topics/partitionReplication/partitions/3/state
{"controller_epoch":1,"leader":3,"version":1,"leader_epoch":0,"isr":[3,1,2]}

按照上面的算法来看，理论上的结果和实际的结果存在严重的不同，可是能看出 isr数组中，除了leader所在的broker 外，其他的两个副本的跟推测的除了leader所在broker外两个副本好像顺序存在区别，我画个表格对比看下：

~~partition~~	~~理论ISR~~	~~实际ISR~~
0	~~[0,1,2]~~	~~[0,2,3]~~
1	~~[1,2,3]~~	~~[1,3,0]~~
2	~~[2,3,0]~~	~~[2,0,1]~~
3	~~[3,0,1]~~	~~[3,1,2]~~

于是可以很明显的看出

~~当 partition=0 时，理论的副本集与 partition=3 的实际副本集相同，~~
~~当 partition=1 时，理论的副本集与 partition=0 的实际副本集相同~~
~~当 partition=2 时，理论的副本集与 partition=1 的实际副本集相同~~
~~当 partition=3 时，理论的副本集与 partition=1 的实际副本集相同~~

于是在网上查找，说是 kafka是先随机挑选一个broker放置分区0，然后再按顺序放置其他分区。

~~于是我又测试一遍，创建两个topic，都是4个partition，3个replica~~

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 4 --topic partitionReplication2
bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 4 --topic wozaiceshiyibian

~~结果如下：~~

~~partition~~	~~partitionReplication2的ISR~~	~~wozaiceshiyibian的ISR~~
0	~~[2,0,1]~~	~~[3,2,0]~~
1	~~[3,1,2]~~	~~[0,3,1]~~
2	~~[0,2,3]~~	~~[1,0,2]~~
3	~~[1,3,0]~~	~~[2,1,3]~~

你可能感兴趣的:(消息中间件)

设计模式（八）结构型：桥接模式详解蝸牛酱系统架构设计师设计模式设计模式桥接模式 java 系统架构软考高级
设计模式（八）结构型：桥接模式详解桥接模式（BridgePattern）是GoF23种设计模式中的结构型模式之一，其核心价值在于将抽象部分与实现部分分离，使它们可以独立变化。它通过“组合”而非“继承”来解耦两个或多个维度的扩展，解决了传统继承体系中类爆炸（ClassExplosion）的问题。桥接模式是实现“开闭原则”的典范，广泛应用于图形渲染系统、数据库驱动、跨平台UI框架、消息中间件等需要多维
Kafka——两种集群搭建详解 k8s Michaelwubo kafka 分布式
1、简介Kafka是一个能够支持高并发以及流式消息处理的消息中间件，并且Kafka天生就是支持集群的，今天就主要来介绍一下如何搭建Kafka集群。Kafka目前支持使用Zookeeper模式搭建集群以及KRaft模式（即无Zookeeper）模式这两种模式搭建集群，这两种模式各有各的好处，今天就来分别介绍一下这两种方式1.1、Kafka集群中的节点类型一个Kafka集群是由下列几种类型的节点构成的
[AI8051U入门第九步]W5500实现MQTT协议（前期准备工程）-EMQX在Windows下使用教程单片有机机 windows
学习目标：1、学习如何在Windows下使用EMQX软件一、EMQX介绍EMQX是一款高性能、可扩展的开源MQTT消息中间件，专为物联网（IoT）场景设计，支持海量设备连接和实时消息处理。以下是关于EMQX的详细介绍：1、核心功能MQTT协议支持：完整支持MQTT3.1、3.1.1和5.0协议，兼容各类IoT设备。高并发连接：单节点可支持百万级设备连接（依赖硬件配置），集群模式下可横向扩展。低延迟
消息队列 2.RabbitMQ的基本概念与使用
RabbitMQ是一款基于AMQP（AdvancedMessageQueuingProtocol）协议的开源消息中间件，主要用于实现分布式系统中的消息传递，支持异步通信、系统解耦、流量削峰等场景。在Java生态中，RabbitMQ被广泛应用，其Java客户端提供了简洁的API，方便开发者快速集成。AMQP协议核心概念1.消息模型AMQP采用生产者-消费者模型，但引入了更复杂的路由机制：生产者（Pr
Rabbitmq中的死信队列你我约定有三 RabbitMQ rabbitmq 分布式 java
背景RabbitMQ死信队列俗称，备胎队列；消息中间件因为某种原因拒收该消息后，可以转移到死信队列中存放，死信队列也可以有交换机和路由key等。原理死信队列和普通队列区别不是很大普通与死信队列都有自己独立的交换机和路由key、队列和消费者。区别：1.生产者投递消息先投递到我们普通交换机中，普通交换机在将该消息投到普通队列中缓存起来，普通队列对应有自己独立普通消费者。2.如果生产者投递消息到普通队列
ActiveMQ、RabbitMQ、RocketMQ、Kafka四种消息中间件分析介绍马小屑 Kafka kafka
ActiveMQ、RabbitMQ、RocketMQ、Kafka四种消息中间件分析介绍我们从四种消息中间件的介绍到基本使用，以及高可用，消息重复性，消息丢失，消息顺序性能方面进行分析介绍！一、消息中间件的使用场景消息中间件的使用场景总结就是六个字：解耦、异步、削峰1.解耦如果我方系统A要与三方B系统进行数据对接，推送系统人员信息，通常我们会使用接口开发来进行。但是如果运维期间B系统进行了调整，或者
Kafka、RabbitMQ 与 RocketMQ 高可靠消息保障方案对比分析浅沫云归后端技术栈小结 Kafka RabbitMQ RocketMQ
Kafka、RabbitMQ与RocketMQ高可靠消息保障方案对比分析在分布式系统中，消息队列承担着异步解耦、流量削峰、削峰填谷等重要职责。为了保证应用的数据一致性和业务可靠性，各大消息中间件都提供了多种高可靠消息保障机制。本文以Kafka、RabbitMQ和RocketMQ为例，深入对比三者在消息持久化、重复消费防护、事务消息及死信机制等方面的方案，帮助后端开发者在不同场景下做出最优选型。一、
Redis入门教程（一）：基本数据类型
一、Redis是什么？为什么你需要它？Redis（RemoteDictionaryServer）是一个开源的内存数据结构存储系统，它可以用作数据库、缓存和消息中间件。与传统的关系型数据库不同，Redis将数据存储在内存中，使其读写速度达到惊人的11万次读/秒和8.1万次写/秒。同时支持数据持久化，重启后数据不丢失，完美平衡了速度与可靠性。Redis的五大核心优势：丰富的数据结构：支持字符串（Str
消息队列的秘密第四章：门派之争空中湖消息队列的秘密消息队列 java kafka rabbitmq rocketmq
第四章：门派之争技术峰会完成了在天猫和京东的实战任务后，林消息回到了消息队列派总部。队列老祖告诉他，数据江湖即将举行一年一度的"消息中间件技术峰会"，各大消息队列门派的代表将齐聚一堂，交流技术心得，展示最新成果。"这是一个难得的学习机会，"队列老祖对林消息说，“你已经掌握了消息队列的基本理论和实战应用，现在是时候了解不同消息队列技术之间的差异和各自的优势了。”林消息对此充满期待，“弟子一定认真学习
阿里云 RabbitMQ 可观测性最佳实践观测云阿里云 rabbitmq 云计算
阿里云RabbitMQ阿里云RabbitMQ是一款高性能、高可靠的消息中间件，支持多种消息协议和丰富的功能特性。它提供消息队列功能，能够实现应用间的消息解耦和异步通信，提升系统扩展性和稳定性。其支持多种消息持久化策略，确保消息不丢失；具备灵活的路由和负载均衡能力，可高效分发消息；还提供丰富的管理功能，如队列监控、消息追踪和权限管理等，帮助用户轻松管理和优化消息队列，广泛应用于分布式系统、微服务架构
Redis 深度解析：从核心原理到生产实践 Pasregret 缓存 redis 数据库缓存
Redis深度解析：从核心原理到生产实践一、Redis核心定位与数据结构1.核心能力矩阵深度解析Redis作为高性能内存数据库，核心能力覆盖缓存、数据存储、消息中间件等场景，其设计哲学围绕速度优先、内存高效、功能丰富展开：内存存储特性纯内存操作：基于内存寻址的O(1)复杂度数据操作，单节点QPS可达10万+持久化方案：RDB（快照）与AOF（日志）双模式，支持数据持久化与故障恢复单线程模型：基于事
消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
Spring Boot 整合 RabbitMQ 蹦跑的蜗牛 Springboot spring boot rabbitmq
SpringBoot整合RabbitMQ一、概述：RabbitMQ是什么？你可以把RabbitMQ想象成一个「快递中转站」。比如你在网上买了一本书，卖家（生产者）把包裹（消息）交给快递站（RabbitMQ），快递站根据包裹上的地址（规则）把包裹分给不同的快递员（消费者），最后送到你家（业务系统）。RabbitMQ是一个专门用来「传递消息」的软件（专业叫「消息中间件」），它能让不同的程序、不同的电脑
rdkafka线程过多_我是如何处理大并发量订单处理的 KafKa部署总结 weixin_39574928 rdkafka线程过多
今天要介绍的是消息中间件KafKa，应该说是一个很牛的中间件吧，背靠Apache与很多有名的中间件搭配起来用效果更好哦，为什么不用RabbitMQ，因为公司需要它。网上已经有很多怎么用和用到哪的内容，但结果很多人都倒在了入门第一步环境都搭不起来，可谓是从了解到放弃，所以在此特记录如何在linux环境搭建，windows中配置一样，只是启动运行bat文件。想要用它就先必须了解它能做什么及能做到什么程
面试必问的线程池原理与实战：从源码到应用全解析混进IT圈 Java 线程池面试多线程并发编程 Tomcat Netty
摘要：本文结合JDK官方文档、《Java并发编程实战》等权威资料，深入剖析线程池的核心原理，并通过电商、消息中间件等真实场景演示选型策略。全文包含20+代码示例、5大避坑指南，帮你轻松应对面试中的高频考点。一、线程池核心原理：从JDK源码到Tomcat扩展1.1JDK原生线程池的工作机制（附源码）JDK线程池的核心是ThreadPoolExecutor，其工作流程可概括为：//核心执行逻辑（简化版
WebLogic 作用，以及漏洞原理，流量特征与防御 Bigliuzi@ 进阶漏洞进阶漏洞 weblogic 安全
WebLogic的核心作用：企业级别的应用服务器，相当于一个高性能的java环境主要功能：应用部署，事务管理，集群与负载均衡，安全控制，资源池化，消息中间件典型的使用场景：银行核心系统，电信计费平台，电商大促平台主要漏洞：T3反序列化，IIop反序列化，xml反序列化，未授权访问流量特征：T3协议攻击特征，未授权访问特征，.反序列化攻击特征危害：远程代码执行完全控制服务器（删库、安装后门）数据泄露
vivo Pulsar 万亿级消息处理实践（3）-KoP指标异常修复
作者：vivo互联网大数据团队-ChenJianbo本文是《vivoPulsar万亿级消息处理实践》系列文章第3篇。Pulsar是Apache基金会的开源分布式流处理平台和消息中间件，它实现了Kafka的协议，可以让使用KafkaAPI的应用直接迁移至Pulsar，这使得Pulsar在Kafka生态系统中更加容易被接受和使用。KoP提供了从Kafka到Pulsar的无缝转换，用户可以使用Kafka
1-Kafka介绍及常见应用场景 sql2008help kafka 分布式
Kafka介绍ApacheKafka是一个开源的分布式流处理平台，最初由LinkedIn开发，后捐赠给Apache软件基金会。它被设计用于高吞吐量、低延迟、可水平扩展地处理实时数据流。官网地址是：https://kafka.apache.org/以下是Kafka的核心介绍：核心概念消息系统(MessagingSystem)Kafka充当生产者和消费者之间的消息中间件，解耦系统，确保可靠的数据传递。
Springboot和Python之间通过RabbitMQ进行双向异步消息交互demo示例同心圆码农后端 java-rabbitmq spring boot python
SpringBoot后端和Python算法之间解耦设计，采用通过消息总线RabbitMQ进行双向异步交互，以下是一个demo样例，罗列出了实现该功能需要做的工作，包括软件安装、RabbitMQ基本介绍、Springboot后端demo代码、Pythondemo代码、运行流程以及调试遇到问题软件安装Win10本地需要安装RabbitMQ，作为Springboot后端和Python模块通讯的消息中间件
Kafka 小熊哥^--^ kafka 分布式
一、什么是Kafka？Kafka的主要用途？Kafka是一个分布式流处理平台，是Apache的一个顶级项目，它被设计用于高吞吐量，分布式、持久性的数据流处理。Kafka实现了一套非常高效的一种发布订阅模型，应用场景非常广泛，比如日志聚合（收集日志）、数据流处理、数据仓库集成（传输数据到数据仓库）、应用程序集成（作为消息中间件来实现异步通信）、流媒体处理（列如实时监控，事件驱动的应用程序）二、top
RabbitMQ 高可用集群设计与消息幂等性实战指南浅沫云归后端技术栈小结 RabbitMQ High Availability Idempotency
RabbitMQ高可用集群设计与消息幂等性实战指南在电商秒杀、支付、库存同步等高并发业务场景中，消息中间件既要保证高可靠、高可用，又要防止重复消息对业务造成副作用。本文结合真实生产环境，分享RabbitMQ集群搭建、HA策略、PublisherConfirms与幂等消费方案的实战经验。一、业务场景描述秒杀大促期间，每秒产生数千~万级消息推送订单、库存扣减与支付回调。要求消息不丢失、可快速恢复，系统
SpringCloud系列（45）--SpringCloud Bus简介 Ken_1115 spring cloud spring cloud
1、什么是SpringCloudBusSpringCloudBus是用来将分布式系统的节点与轻量级消息系统链接起来的框架，它整合了Java的事件处理机制和消息中间件的功能，SpringCloudBus目前支持RabbitMQ和Kafka。SpringCloudBus配合SpringCloudConfig使用可以实现配置的动态刷新。2、SpringCloudBus能做什么SpringCloudBus
Docker：快速搭建 RabbitMQ 集群的技术指南拾荒的小海螺 DevOps docker rabbitmq 容器
1、简述RabbitMQ是目前最流行的开源消息中间件之一，广泛应用于解耦、异步通信、削峰填谷等场景。本篇博客将带你通过Docker快速搭建RabbitMQ集群，并展示SpringBoot集成的实践案例，助你高效入门RabbitMQ分布式消息系统。样例代码：https://gitee.com/lhdxhl/springboot-example.git2、搭建2.1准备工作首先安装Docker和Doc
Spring Cloud Bus 和 Spring Cloud Stream 中国lanwp springboot
SpringCloudBus和SpringCloudStream都是SpringCloud生态中的消息通信组件，但它们的定位和使用场景有显著区别：1.SpringCloudBus核心定位：分布式系统的消息广播（配置刷新、事件传播）。典型场景：通过消息中间件（如RabbitMQ、Kafka）广播配置变更事件，实现所有微服务配置的集中刷新（如结合/actuator/refresh或/actuator/
什么是RibbitMQ 肘击鸣的百k路 spring cloud
根据多个权威技术资料分析，RibbitMQ（实际应为RabbitMQ）是一个开源的、基于高级消息队列协议（AMQP）的消息代理（MessageBroker）软件，专为分布式系统提供异步通信、应用解耦和流量削峰等核心能力。以下是其详细解析：一、基本定义与背景核心定位RabbitMQ是一个消息中间件（MessageQueue,MQ），作为生产者（Producer）和消费者（Consumer）之间的消息
限流系列之五：TDMQ RabbitMQ Serverless 版限流机制深度解析与实践指南腾讯云中间件消息队列腾讯云 rabbitmq serverless
导语分布式集群限流是保障云服务高可用性的核心技术手段，其意义不仅在于防止系统过载，更是构建弹性架构、优化资源效率、实现业务可持续性的关键策略。未来，随着边缘计算和Serverless的普及，限流技术将进一步与底层基础设施深度融合，成为构建下一代高可用架构的核心基石。腾讯云TDMQRabbitMQServerless版作为一款极致弹性、高性能且高可靠的消息中间件，通过提供稳定低延迟的消息服务，助力企
后端开发的新选择：Spring Cloud 事件驱动架构大厂资深架构师 Spring Boot 开发实战 spring cloud 架构 spring ai
后端开发的新选择：SpringCloud事件驱动架构关键词：事件驱动架构、SpringCloudStream、微服务解耦、消息中间件、异步通信摘要：传统微服务架构中，服务间的直接调用常导致紧耦合和扩展性瓶颈。本文将以“快递物流”为类比，从事件驱动架构（EDA）的核心概念出发，结合SpringCloudStream等工具，详细讲解如何用SpringCloud构建松耦合、高弹性的事件驱动系统。涵盖概念
EventBus之Reactor实战太阳伞下的阿呆 reactor event bus 观察者模式
如果你想要使用一个轻量级的消息中间件，不需要分布式支持，那么可以选择RxJava或者Reactor，本文将讲述如何入门使用该框架，以及常用的一些功能生产者广播多消费者模式Sinks.Many:创建一个允许我们将数据推送到一个Flux的sink。我们使用Sinks.many().multicast().onBackpressureBuffer()来创建一个支持背压的多播Sink（广播模式）。Flux
大数据领域数据工程的消息中间件选型大数据洞察大数据与AI人工智能大数据 ai
大数据领域数据工程的消息中间件选型关键词：消息中间件、数据工程、大数据处理、选型标准、分布式系统、实时数据流、可靠性保障摘要：在大数据领域的数据工程实践中，消息中间件是构建高可靠、高可扩展数据管道的核心组件。本文从技术架构、功能需求、应用场景等维度，系统解析消息中间件选型的关键要素。通过对比Kafka、Pulsar、RabbitMQ、RocketMQ等主流中间件的技术特性，结合数学模型分析吞吐量、
在Spring Boot中集成RabbitMQ的完整指南超级小忍 SpringBoot java-rabbitmq spring boot rabbitmq
前言在现代微服务架构中，消息队列（MessageQueue）是实现异步通信、解耦系统组件的重要工具。RabbitMQ是一个流行的消息中间件，支持多种消息协议，具有高可靠性和可扩展性。本博客将详细介绍如何在SpringBoot项目中集成RabbitMQ，包括配置、发送和接收消息的基本流程，并介绍如何通过两种方式定义交换机（Exchange）与队列（Queue）：一种是在生产者端手动声明，另一种是在消
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&