Kafka Là Gì? Ứng Dụng Kafka Cơ Bản Cho Hệ Thống Message | TopDev

Có thể bạn quan tâm

Tìm việc IT
Tạo CV Online
CÔNG TY TUYỂN DỤNG IT
Lập Trình
- AI – Machine Learning
- Frontend
- Backend
- Fullstack
- Mobile
- Product
- Devops
- Java
- PHP
- Python
- Xu hướng công nghệ
- Tổng quan ngành IT
  - Báo cáo thị trường IT
  - Con đường sự nghiệp IT
  - Chuyên gia nói
  - Sự kiện IT
- Developer Resources
  - Sách lập trình
  - Tài liệu lập trình
  - Source Code
KỸ NĂNG TÌM VIỆC
- Kinh nghiệm phỏng vấn
- Chuẩn hóa CV IT
- Đàm phán lương thưởng
- Cẩm nang tuyển dụng
  - Tìm kiếm nhân tài
  - Nghệ thuật quản trị

Search Sign in Welcome! Log into your account your username your password Forgot your password? Get help Password recovery Recover your password your email A password will be e-mailed to you.

TopDev

Tìm việc IT
Tạo CV Online
CÔNG TY TUYỂN DỤNG IT
Lập Trình
- AI – Machine Learning
- Frontend
- Backend
- Fullstack
- Mobile
- Product
- Devops
- Java
- PHP
- Python
- Xu hướng công nghệ
- Tổng quan ngành IT
  - Báo cáo thị trường IT
  - Con đường sự nghiệp IT
  - Chuyên gia nói
  - Sự kiện IT
- Developer Resources
  - Sách lập trình
  - Tài liệu lập trình
  - Source Code
KỸ NĂNG TÌM VIỆC
- Kinh nghiệm phỏng vấn
- Chuẩn hóa CV IT
- Đàm phán lương thưởng
- Cẩm nang tuyển dụng
  - Tìm kiếm nhân tài
  - Nghệ thuật quản trị

Home Lập Trình Kafka là gì? Ứng dụng Kafka cơ bản cho hệ thống message

Lập Trình

FacebookLinkedinTelegram

Kafka là gì? Nếu lần đầu bạn nghe đến Kafka thì đừng lo, trong bài viết dưới đây TopDev sẽ giúp bạn cập nhật các kiến thức mới nhất về Kafka và các ứng dụng tuyệt vời của nó. Cùng chúng tôi tìm hiểu ngay nhé!

Kafka là gì?

Kafka với tên gọi đầy đủ là Apache Kafka là hệ thống message pub/sub phân tán mã nguồn mở (distributed messaging system) được phát triển bởi Apache Software Foundation và được viết bằng Java và Scala.

Bên pulbic dữ liệu được gọi là producer, bên subscribe nhận dữ liệu theo topic được gọi là consumer. Kafka có khả năng truyền một lượng lớn message theo thời gian thực, trong trường hợp bên nhận chưa nhận message vẫn được lưu trữ sao lưu trên một hàng đợi và cả trên ổ đĩa bảo đảm an toàn. Đồng thời nó cũng được replicate trong cluster giúp phòng tránh mất dữ liệu.

kafka là gì — Một cấu trúc Apache Kafka đơn giản

Các khái niệm cơ bản

Bạn có thể xem thêm giải thích Message Broker là gì?

Kafka là gì? – Có thể hiểu là một hệ thống logging để lưu lại các trạng thái của hệ thống đề phòng tránh mất thông tin.

Định nghĩa trên được giải thích bằng các khái niệm sau:

PRODUCER: Kafka lưu, phân loại message theo topic, sử dụng producer để publish message vào các topic. Dữ liệu được gửi đển partition của topic lưu trữ trên Broker.
CONSUMER: Kafka sử dụng consumer để subscribe vào topic, các consumer được định danh bằng các group name. Nhiều consumer có thể cùng đọc một topic.
TOPIC: Dữ liệu truyền trong Kafka theo topic, khi cần truyền dữ liệu cho các ứng dụng khác nhau thì sẽ tạo ra cá topic khác nhau.
PARTITION: Đây là nơi dữ liệu cho một topic được lưu trữ. Một topic có thể có một hay nhiều partition. Trên mỗi partition thì dữ liệu lưu trữ cố định và được gán cho một ID gọi là offset. Trong một Kafka cluster thì một partition có thể replicate (sao chép) ra nhiều bản. Trong đó có một bản leader chịu trách nhiệm đọc ghi dữ liệu và các bản còn lại gọi là follower. Khi bản leader bị lỗi thì sẽ có một bản follower lên làm leader thay thế. Nếu muốn dùng nhiều consumer đọc song song dữ liệu của một topic thì topic đó cần phải có nhiều partition.
BROKER: Kafka cluster là một set các server, mỗi một set này được gọi là 1 broker
ZOOKEEPER: được dùng để quản lý và bố trí các broker.

Tại sao nên sử dụng Apache Kafka?

Kafka là dự án opensoure, đã được đóng gói hoàn chỉnh, khả năng chịu lỗi cao, hiệu năng rất tốt và dễ dàng mở rộng mà không cần dừng hệ thống.

Kafka thật sự đáng tin cậy, có khả năng lưu trữ lượng dữ liệu lớn nên nó đang dần được thay thế cho hệ thống message truyền thống.

Một vài use case cho kafka:

Sử dụng như một hệ thống message queue thay thế cho ActiveMQ hay RabbitMQ
Website Activity Monitoring: theo dõi hoạt động của website
Stream Processing: Kafka là một hệ thống rất thích hợp cho việc xử lý dòng dữ liệu trong thời gian thực. Khi dữ liệu của một topic được thêm mới ngay lập tức được ghi vào hệ thống và truyền đến cho bên nhận. Ngoài ra Kafka còn là một hệ thống có đặc tính duribility dữ liệu có thể được lưu trữ an toàn cho đến khi bên nhận sẵn sàng nhận nó.
Log Aggregation: tổng hợp log
Metrics Collection: thu thập dữ liệu, tracking hành động người dùng như các thông số như page view, search action của user sẽ được publish vào một topic và sẽ được xử lý sau
Event-Sourcing: Lưu lại trạng thái của hệ thống để có thể tái hiện trong trường hợp system bị down.

Use case Kafka cho thương mại điện tử

Một hệ thống thương mại điện tử có nhiều server thực hiện các tác vụ khác nhau. Tất cả các server này đều sẽ giao tiếp với database server để đọc ghi dữ liệu.

Vì vậy sẽ có rất nhiều data pipeline kết nối từ rất nhiều server khác đến database server này. Cơ cấu như sau:

lập trình web — Credit: Nitin Rawat From Quora

Nhìn đơn giản vậy thôi chứ đây là hệ thống nhỏ, đối với hệ thống lớn hơn thì nó sẽ như vầy:

Lúc này data pipeline sẽ phức tạp khủng khiếp do gia tăng lượng hệ thống server. Lúc này nếu ta sử dụng Kafka tách rời các data pipeline giữa các hệ thống để làm cho việc giao tiếp giữa các hệ thống trở nên đơn giản hơn và dễ quản lý hơn.

Tổng kết lại, Apache Kafka là một hệ thống hoàn hảo để xử lý các khối dữ liệu khổng lồ và phức tạp. Hi vọng bài viết trên của đội ngũ TopDev có thể giúp bạn hiểu rõ khái niệm cũng như các tính năng nổi bật của Kafka, từ đó ứng dụng vào mô hình triển khai một cách phù hợp nhất.

Để sử dụng kafka, tải ở đây và làm theo hướng dẫn.

Có thể bạn quan tâm:

Cách thức hoạt động của các hệ thống stream processing
Hàng đợi thông điệp Apache Kafka
Cách tạo ứng dụng OCR sử dụng Machine Learing

Xem thêm Top Việc làm it trên TopDev

ĐỪNG BỎ LỠ

Prolog là gì? Ứng dụng của ngôn ngữ lập trình logic trong AI và xử lý ngôn ngữ tự nhiên
Gamification – Ứng Dụng Đa Lĩnh Vực và Xu Hướng Tương Lai
So sánh Apache Kafka và RabbitMQ: Nên chọn message queue nào?
Vòng lặp trong C++ là gì? 3 loại vòng lặp phổ biến trong C++
C++ là gì? Tổng hợp kiến thức và ứng dụng của C++

VIỆC LÀM IT LƯƠNG CAO

Việc làm PHP
Việc làm JavaScript
Việc làm Java
Việc làm Front-end
Việc làm Back-end
Việc làm .NET
Việc làm Python
Việc làm Golang
Việc làm iOS
Việc làm Android
Việc làm Flutter
Việc làm Tester
Việc làm Node.js

ABOUT USTopDev is a recruitment network and ecosystem in Mobile & IT fields. We are top leading recruitment network in Mobile & IT fields, in Vietnam, offering Tech talent solution which meets your needs. Our networks cover 95% of Tech communities in Vietnam and our clients come from both Vietnam and South East Asia. Hotline: 0888 1555 00

Từ khóa » Kafka Connect Là Gì

Kafka Là Gì? Ứng Dụng Kafka Cơ Bản Cho Hệ Thống Message | TopDev

Kafka là gì?

Các khái niệm cơ bản

Tại sao nên sử dụng Apache Kafka?

Một vài use case cho kafka:

Use case Kafka cho thương mại điện tử

ĐỪNG BỎ LỠ

VIỆC LÀM IT LƯƠNG CAO

010: Apache Kafka Connect Concept - Viblo

Sự Ra đời Của Kafka Connect | Facebook

Kafka Connect - Phần 1: Getting Started | Facebook

Cách Sử Dụng Kafka Connect Trên Heroku để Kết Nối Hai Nguồn Dữ Liệu

Hướng Dẫn Cài đặt Và ứng Dụng Kafka Connect - VTS Engineering

Kafka Connect - Free As A Bird. It's The Next Best Thing To Be….

Kafka Connect | Tuyen Nguyen

Connect Là Gì Cụm Từ Kafka Connect Là Gì - Bình Dương

Ứng Dụng Của Kafka Và Kafka Connect Trong Xây Dựng Kiến Trúc ...

Kafka Connect - Confluent Documentation

Kafka Là Gì Cụm Từ Kafka Stream Là Gì - Bình Dương

Apache Kafka Là Gì? Tất Cả Mọi Thứ Bạn Cần Biết - VSUDO Blog

Apache Kafka được Quản Lý Hoàn Toàn – Amazon MSK

Liên Hệ