Khi Nào Nên Sử Dụng Hadoop, Hbase, Hive Và Pig
Có thể bạn quan tâm
Hbase là giải pháp lưu trữ dữ liệu lớn (Big Data), linh hoạt và hoàn toàn miễn phí được rất nhiều tập đoàn công nghệ ưa chuộng. Vậy Hbase là gì? Các tính năng đặc biệt nhất của Hbase?
Để giúp các bạn trẻ mới bắt đầu tìm hiểu về Big Data có thể hiểu hơn về công nghệ Hbase, hãy cùng tham khảo qua bài viết sau của ITNavi. Cùng bắt đầu nhé!
Mục Lục
- Giới thiệu về Hbase là gì
- Cách thức lưu trữ và tìm kiếm của Hbase
- Hướng dẫn cài đặt Hbase ở chế độ Distributed
Giới thiệu về Hbase là gì
Cấu trúc HBase
Kiến trúc HBase bao gồm 4 thành phần cơ bản:
HMaster: chính là thành phần trung tâm trong kiến trúc của Hbase, nó giám sát tất cả các RegionServer. Những thay đổi liên quan đến metadata đều được thực hiện thông quan HMaster.HRegionserver: chịu trách nhiệm quản lý trực tiếp các regionHregions: là thành phần kiến trúc cơ sở của Hbase cluster, nó bao gồm 2 thành phần chính là Memstore và HfileZookeeper: là trung tâm giám sát và lưu trữ thông tin các cấu hình.
Bạn đang xem: Hbase là gì
Bài viết có liên quan
Mapreduce, những ưu điểm và cách thức hoạt động của nền tảng này
Microsoft Azure – Giải pháp điện toán đám mây tối ưu nhất cho doanh nghiệp chuyển đổi số
Cách thức lưu trữ và tìm kiếm của Hbase
Cách thức lưu trữ
Hbase lưu trữ các row nằm trong các table, mỗi table có thể định nghĩa nhiều column families (cf). Mỗi row phải được quản lý bởi một khóa chính duy nhất.
Xem thêm: Hộ Khẩu Thường Trú Tiếng Anh Là Gì, Hộ Khẩu Thường Trú Dịch
Có thể xem lịch sử lưu dữ liệu trên mỗi row, được quản lý bởi các timestamp
Chúng ta có thể giới hạn history lưu tối đa là bao nhiêu lần (giúp tiết kiệm dung lượng dữ liệu sau một thời gian sử dụng, mỗi lần update dữ liệu thì history cũ hơn sẽ bị xóa)
Cách thức tìm kiếm
Phương pháp phổ biến nhất để tìm kiếm dữ liệu trong Hbase là dùng thrift, bình thường thrift không được khởi động khi chạy Hbase nên sẽ cần khởi động bằng lệnh “./bin/hbase thrift start”
Thrift cung cấp 4 comparator để lọc dữ liệu đó là: “binary, binary prefix, regexstring, substring”
Một cách khác để dễ dàng sử dụng truy vấn dữ liệu trong Hbase hơn là dùng câu lệnh sql để truy vấn, để làm được điều này, bạn cần phải cài đặt thêm Hive. Sau khi cài đặt xong, thì mọi thao tác xử lý dữ liệu đều có thể dùng thông qua câu lệnh sql, trong đó hỗ trợ cả join.
Xem thêm: Tải Game Bắn Cá – Download Game Bắn Cá
Hướng dẫn cài đặt Hbase ở chế độ Distributed
Bạn có thể download bộ cài Hbase tại đây: http://www-us.apache.org/dist/hbase/.Hoặc bạn có thể vào google, gõ Hbase free để tìm kiếm nhiều nguồn khác nhau.
Tiến hành giải nén Hbase vào thư mục /opt/: $ tar -xzf hbase-0.98.18-hadoop2-bin.tar.gz
Thêm biến môi trường vào tập tin ~/.bash_profile với nội dung sau:
export HBASE_HOME=”/opt/hbase”
export PATH=”$HBASE_HOME/bin:$PATH”
Kiểm tra xem đã cài đặt thành công chưa bằng lệnh: hbase version
Sửa nội dung tập tin /opt/hbase/conf/hbase-env.sh với nội dung sau:
export JAVA_HOME=/usr/java/default
export HBASE_MANAGES_ZK=true
export HBASE_PID_DIR=/opt/hbase/var
Tiếp tục sửa nội dung tập tin /opt/hbase/conf/hbase-site.xml và thêm vào nội dung sau;
hbase.master
sglamp.edumall.co.th:60000
hbase.master.info.port
60010
hbase.rootdir
hdfs://sglamp.edumall.co.th:9000/hbase
hbase.cluster.distributed
true
hbase.zookeeper.property.dataDir
hdfs://sglamp.edumall.co.th:9000/zookeeper
hbase.zookeeper.quorum
sglamp2.edumall.co.th
hbase.zookeeper.property.clientPort
2181
hbase.zookeeper.property.maxClientCnxns
1000
Để khởi động Hbase ta chạy lệnh sau: /opt/hbase/bin/shServer.sh start
Để tắt Hbase ta chạy lệnh sau: /opt/hbase/bin/shServer.sh stop
Hbase là giải pháp lưu trữ dữ liệu lớn (Big Data), linh hoạt và hoàn toàn miễn phí. Điều quan trọng là dự án của bạn có thực sử đủ lớn để dùng Hbase hay không mà thôi. Và một khi đã dùng Hbase, bạn phải xác định trước cấu trúc dữ liệu, xác định các column family và primary key cho các row ở các table một cách thích hợp. Chúc các bạn thành công với quyết định của mình nhé !
Chuyên mục: Hỏi Đáp
Từ khóa » Cài đặt Hbase
-
Hbase Là Gì? Hướng Dẫn Cài đặt Và Sử Dụng Hbase - ITNavi
-
Cài đặt Hadoop + HBase + Apache Phoenix - BlogDogy
-
Hướng Dẫn Cài đặt Hbase ở Chế độ Distributed - Technology - Tips
-
Tổng Quan Về Hbase Là Gì ? Hướng Dẫn Cài Đặt Và Sử Dụng Hbase
-
Dữ Liệu Lớn: Hbase Là Gì ? Hướng Dẫn Cài Đặt Và Sử Dụng Hbase
-
Cài đặt Hbase Trên Ubuntu - YouTube
-
Hbase Là Gì
-
Learn - HBase Database Cho Máy Tính PC Windows - AppChoPC
-
Hadoop HBase Tutorials Cho Máy Tính PC Windows - AppChoPC
-
HBase Performance Tuning | Ways For HBase Optimization - فيسبوك
-
Hbase Là Gì? Hướng Dẫn Cài đặt Và Sử Dụng Hbase
-
Install Apache Hadoop / HBase On Ubuntu 20.04
-
Cài đặt HBase ở Chế độ Phân Tán Giả Trên Ubuntu 13.4
-
Quickstart: Apache HBase & Apache Phoenix - Azure HDInsight