Kafka 6

Message Broker 2023. 9. 25. 20:41

공부한 개념을 한 문장씩 쭉 세워본다. 멱등성 프로듀서.. 멱등성 프로듀서는 동일한 데이터를 여러번 전송하더라도 카프카 클러스터에 한번만 저장됨을 보장하는 프로듀서이다. 기본 프로듀서는 적어도 한번 전달됨을 보장한다. (At least once) 그래서 카프카 클러스터에 중복 적재될 수 있다는 말이다. 예를 들면, 프로듀서가 send 를 통해 데이터를 브로커로 전달하고, 브로커는 정상 적재를 하였으나.. 모종의 이유로 브로커가 프로듀서로, 적재 완료 응답메시지가 정상 전달되지 않아서 프로듀서는 데이터를 재전송하게되는 상황이 있다. 하지만, 이러한 상황은 극히 드문 상황이므로 두려워하지 않아도 된다. 멱등성 프로듀서 동작 방식.. 멱등성 프로듀서는 데이터를 브로커로 전달할 때 프로듀서의 고유 ID(PID)..

Kafka 5

Message Broker 2023. 8. 27. 22:21

공부한 개념을 한 문장씩 쭉 세워본다. 컨슈머는 카프카에 적재된 데이터를 가져가서 필요한 처리를 한다. 컨슈머는 토픽 기준으로 데이터를 소비한다. 카프카 공식 오픈 라이브러리 (Java) 기준으로.. Fetcher 객체는 리더 파티션으로부터 레코드들을 가져오는 책임을 가진다. (배치로 묶어서 가져온다.) KafkaConsumer 의 poll 메서드는 Fetcher 에 있는 레코드들을 리턴해준다. ConsumerRecords 객체는 poll 메서드의 리턴 타입으로 처리가 필요한 레코드들(ConsumerRecord)이 담겨 있다. ConsumerRecord 객체에는 오프셋이 포함되어있다. 컨슈머 그룹은 컨슈머를 각 컨슈머 그룹으로 부터 격리된 환경에서 안전하게 운영할 수 있도록 도와준다. 컨슈머 그룹으로 묶..

Article Thumbnail
Kafka 4

Message Broker 2023. 8. 27. 22:06

공부한 개념을 한 문장씩 쭉 세워본다. 카프카에서 데이터의 시작점은 프로듀서이다. 프로듀서는 데이터를 전송할 때 리더 파티션을 가지고 있는 카프카 브로커와 직접 통신한다. 카프카 공식 오픈 라이브러리 (Java) 기준으로.. ProducerRecord 를 KafkaProducer 의 send 메서드로 보낼 수 있다. KafkaProducer 의 send 메서드를 호출 하면, 프로듀서 내부적으로 Partitioner, Accumulator, Sender 가 동작하고 실질적으로 데이터가 리더 파티션을 가진 카프카 브로커로 전송된다. ProducerRecord 객체는 프로듀서에서 생성하는 레코드이다. (오프셋은 미포함) KafkaProducer 의 send 메서드는 레코드를 전송하기 위한 요청 메서드이다. P..

Kafka 3

Message Broker 2023. 8. 18. 20:11

공부한 개념을 한 문장씩 쭉 세워본다. 토픽은 카프카에서 데이터를 구분하기 위해 사용하는 단위이다. (RDBMS 의 Table) 토픽은 1개 이상의 파티션을 가진다. 파티션에는 프로듀서가 보낸 데이터들이 저장된다. 해당 데이터를 레코드(record) 라 부른다. 파티션은 큐(Queue) 자료구조와 비슷하게 FIFO 로 동작된다. 큐에서는 데이터를 가져가면(pop) 삭제 하지만, 카프카에서는 삭제하지 않는다. 따라서, 동일한 레코드에 대해 여러 컨슈머 그룹이 가져갈 수 있는 환경이다. 위 그림은.. 브로커 3개에 파티션이 5개인 1개의 토픽을 생성한 그림이다. 팔로워 파티션은 없으므로 replication factor 는 1 이다. 위 그림처럼 파티션이 5개인 1개의 토픽을 생성하면.. round-robi..

Article Thumbnail
Kafka 2

Message Broker 2023. 8. 16. 02:21

공부한 개념을 한 문장씩 쭉 세워본다. 카프카 브로커는 카프카를 이용하는 모든 Application 과 데이터를 주고받기 위해 사용하는 주체이다. 우리가 개념적으로 카프카라 생각하는 그것. 하나의 서버에는 한 개의 카프카 브로커 프로세스가 실행된다. 카프카는 보통 데이터를 안전하게 보관하고 처리하기 위해 3대 이상의 브로커 서버를 1개의 클러스터로 묶어서 운영한다. 클러스터 형태의 카프카의 브로커들은... Producer 가 보낸 데이터를 안전하게 분산 저장하고 복제하는 역할을 수행한다. 따라서, 급작스런 브로커의 장애에도 안전하게 사용할 수 있다. 카프카 클러스터를 실행하기 위해서는 주키퍼가 필요하다. 카프카 3.0 부터는 주키퍼가 없어도 클러스터 형태로 운용할 수 있게 되었다. 하나의 주키퍼 앙상블로..

Article Thumbnail
Kafka 1

Message Broker 2023. 8. 16. 02:02

공부한 개념을 한 문장씩 쭉 세워본다. 카프카는 각각의 Application 끼리 연결하여 데이터를 처리하는 것이 아니라.. 연결하고 싶은 수많은 두개의 Application 쌍 사이에서 동작하는 하나의 데이터 처리기이다. (중앙 집중화) 연결하고 싶은 두개의 Application 에서.. 메시지를 보내는 쪽은 Producer, 메시지를 받는 쪽은 Consumer 이다. 카프카의 토픽은 RDBMS 의 Table 개념이다. 하나의 토픽에는 여러 파티션이 존재한다. 파티션 내부 구조는 메시지 큐와 동일한 FIFO 구조이다. 하나의 메시지는 파티션 한개에 보내지게 된다. Application 에서는 Kafka 토픽만 신경 써주면 된다. 파티션은 신경 안써도 카프카가 알아서 처리해준다. 많은 양의 데이터를 송수..