- Apache Kafka를 구성하는 Broker, Producer, Consumer, Zookeeper를 통합 모니터링하기 위한 방안 검토
- Producer -> Kafka Clustr & Zookeeper Cluster -> Consumer
- conf/zoo.cfg
conf/java.env 수정
export JVMFLAGS="-Xmx2048m"
- bin/zkServer.sh 수정
ZOOMAIN="-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=9998 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false org.apache.zookeeper.server.quorum.QuorumPeerMain"
> bin/zkServer.sh start
> env JMX_PORT=9998 bin/zookeeper-server-start.sh config/zookeeper.properties
> echo ruok | nc localhost 2181
imok (정상)
- conf/server.properties
> env JMX_PORT=9999 bin/kafka-server-start.sh config/server.properties
> bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
- file에서 메시지를 읽어와서, kafka topic으로 전송한다.
- 모니터링이 가능하도록 jmx port 설정을 추가하여 실행한다.
> vi bin/logstash.lib.sh
-- 아래 JAVA_OPTS 항목을 추가
if [ "$LS_JAVA_OPTS" ] ; then
# The client set the variable LS_JAVA_OPTS, choosing his own
# set of java opts.
JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote"
JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.port=9010"
JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.local.only=false"
JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.authenticate=false"
JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.ssl=false"
- 또는 export를 이용
> export LS_JAVA_OPTS=" -Dcom.sun.management.jmxremote.authenticate=false \
-Dcom.sun.management.jmxremote.port=9010 \
-Dcom.sun.management.jmxremote.ssl=false \
- 또는 jmxremote.port를 제외한 값은 logstash.lib.sh에 추가하고,
- jmxremote.port 만 export로 실행
- logstash를 하나의 서버에서
> export LS_JAVA_OPTS=" -Dcom.sun.management.jmxremote.port=9881 "
- file을 읽어와서 kafka topic으로 메시지를 전송한다.
- config/logstash_producer.yml
input {
file {
path => ["$1/F1.dat"]
start_position => "beginning"
output {
kafka {
codec => plain { format => "%{message}" }
bootstrap_servers => "broker06:9092"
topic_id => "F1"
acks => "all"
retries => 20
batch_size => 49152
linger_ms => 2000
> logstash -f config/logstash_producer.conf
- logstash의 경우 여러개 process를 구동하면 서버의 자원을 너무 많이 소모한다.
- 따라서 성능 테스트와 같이 여러개의 producer를 구동해야 할 경우에는 filebeat과 같은 경량화된 도구를 사용하는 것이 효과적이다
- filebeat_producer.yml
- input_type: log
document_type: F1
- /home/poc/data/F1.dat
- input_type: log
document_type: test2
- /home/poc/data/F2.dat
# The Logstash hosts
hosts: ["broker06:9092","broker07:9092","broker08:9092"]
topic: '%{[type]}'
string: '%{[message]}'
required_acks: -1
max_retries: 3
bulk_max_size: 2048
> filebeat -c conf/filebeat_producer.yml -d "publish" &
- filebeat와 logstash의 경우 lz4 압축 옵션을 지원하지 못한다.
- 따라서 해당 압축 옵션을 이용하여 성능을 측정하는 경우 직접 producer를 구현하거나, kafka에서 제공하는 tool을 활용한다.
> kafka-console-producer.sh —broker-list broker06:9092,broker07:9092,broker08:9092 —topic F1 —sync —compression-codec 'lz4' < F1.dat
- Kafka Producer와 마찬가지로 jmx 설정
- logstash_consumer.conf
input {
kafka {
type => "F1"
bootstrap_servers => "broker06:9092,broker07:9092,broker08:9092"
topics => "F1"
group_id => "logstash"
max_poll_records => "5"
receive_buffer_bytes => "10240"
output {
file {
path => "F1.dat"
codec => line { format => "%{message}" }
> logstash -f config/logstash_consumer.conf
- link
echo 1 > /proc/sys/vm/drop_caches
> bin/logstash -e "input { stdin {} } output { kafka { bootstrap_servers => '<broker_ip>:9092' topic_id => 'test' } }"
- path.data 옵션은 동일한 directory에서 logstash를 실행하면,
- logstash instance별로 사용하는 data directory를 별도로 지정해야 함
> bin/logstash --path.data data1 -f config/kafka_consumer.yml
> bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning
- compression: none 으로 압축을 하지 않고, 3,000 byte 메세지를 보낼때
- filebeat log에서 해당 오류가 발생함.
- 특이한 부분은 이 오류가 발생하면 retry를 시도하지 않고, 메세지가 유실됨.
- 한번에 보내는 메세지 크기를 제한하는 Kafka Broker의 "message.max.bytes=1,000,000"을 초과하는 경우
- 1개 메시지 크기는 3,000 byte인데,
- 1,000,000 byte(1M)를 넘을 수 있을까?
- 그렇다면 1개 메시지의 크기가 아니라 어떤 크기를 의미할까?
아래 3개 설정 값을 함꼐 수정해야 정상적으로 메시지 처리가 가능하다.
Broker (server.properties)
message.max.bytes=10000000 (10배 증가)
replica.fetch.max.bytes (이 부분은 변경하지 않았는데, 정상 동작)
- Producer
- Consumer
- producer의 설정은 변경하지 않고, 1,000,000으로 유지하고,
- broker, consumer의 설정 값만 변경하였다.
- 그런데 메시지가 정상적으로 처리되었다는 것은..
- 결국 보낼때는 1,000,000 이하로 보내는데,
- Broker에서 1,000,000 이상으로 인식한다는 의미가 되는데...
- 음.... filebeat kafka output의 버그인가? (이상하다...)
- 부터 max.message.bytes의 의미가 batch에 포함된 전체 메시지 사이즈로 변경됨!!!
- https://kafka.apache.org/documentation/#upgrade_1100_notable
- The broker configuration max.message.bytes now applies to the total size of a batch of messages
5. Kafka Error (Error: Executing consumer group command failed due to The consumer group command timed out while waiting for group to initialize)
> /bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic __consumer_offsets
Error: Executing consumer group command failed due to The consumer group command timed out while waiting for group to initialize:
ConsumerGroupCommand throws GroupCoordinatorNotAvailableException when describing a non-existent group before the offset topic is created
http://mail-archives.apache.org/mod_mbox/kafka-dev/201606.mbox/%[email protected]%3E
The offsets.topic.replication.factor broker config is now enforced upon auto topic creation. Internal auto topic creation will fail with a GROUP_COORDINATOR_NOT_AVAILABLE error until the cluster size meets this replication factor requirement.
- 카프카 내부 토픽(consumer_offsets)을 여러 노드에 복제하도록 리밸런싱을 실행한다.
- http://www.chidoo.me/index.php/2017/05/30/kafka-monitoring-and-administration
- http://blog.leedohyun.pe.kr/2016/08/kafka-topic-replication-factor.html 참고
> sudo pip install kafka-tools
> /bin/kafka-assigner -z localhost:2181 --tools-path /home/poc/kafka/bin -e set-replication-factor --topic __consumer_offsets --replication-factor 3
/home/poc/zookeeper-3.4.10/bin/zkServer.sh stop
/home/poc/zookeeper-3.4.10/bin/zkServer.sh start
env JMX_PORT=9999 /home/poc/kafka/bin/kafka-server-start.sh config/server.properties &
- 7/18 09:44
- producer가 1대의 서버에서 구동되어 자원 부족현항으로 인하어 데이터 전송 속도가 늦음 (이로 인한 처리 건수가 낮아짐.)
- 이후 producer를 3개의 다른서버에서 구동하면, 300,000건 /초 성능이 나올 것임.
>bin/kafka-console-producer.sh —broker-list broker01:9092,broker02:9092,broker03:9092 —topic DDD —sync —compression-codec 'lz4' < 100m.dat