Hadoop 101 - Quỳnh Lập Trình C/C++

Note:Bài viết theo cảm hứng từ khoá Hadoop 101 trên bigdatauniversity.com. Tôi viết lại cho tôi để tôi tự học là chính.

hadoop

Thông tin khoá học:

  • Khoá học là miễn phí
  • Nó là tự biên, tự diễn.
  • Bạn có thể đọc nó bất cứ khi nào muốn.
  • Bạn có thể đọc nó 1 triệu lần.
  • Chỉ có một cơ hội qua khoá học, nhưng có thể nổ lực trả lời hết các câu hỏi.

Điều kiện tiên quyết cho khoá học:

  • Không cần bạn phải đẹp trai hay xinh gái, mọi người đều có thể tham gia.

Điều kiện khuyến nghị:

  • Bạn đã từng đọc qua, nghiên cứu qua về Big data là gì thì tốt.
  • Hiểu về hệ điều hành nhân linux, biết gõ lệnh trên terminal là 1 lợi thế.

Module 1: Cơ bản về Hadoop

1 . Mục tiêu học tập:

Trong bài này bạn sẽ tìm hiểu về:

  • Khái niệm về Big data
  • Hadoop là cái méo gì
  • Phần mềm mã nguồn mở liên quan tới Hadoop
  • Giải pháp Big data làm việc trên cloud

2. Nội dung bài học

Nếu có link nghĩa là tôi đã viết, nếu chưa có thì các bạn ráng đợi  tôi viết tiếp:

Bài 1: Thế méo nào là Hadoop?(Part 1)

Bài 2: Thế méo nào là Hadoop?(Part 2)

Bài 3: Lab – Cài đặt(cloud)

Bài 4: Lab – Cài đặt(VM – optional)

Bài 5: Review Questions

Module 2: Hadoop Architecture & HDFS

  1. Mục tiêu học tập

Trong bài này bạn sẽ tìm hiểu về:

  • Các thành phần chính của Hadoop
  • Cách HDFS làm việc
  • Mô hình truy cập dữ liệu mà HDFS thiết kế
  • Cách dữ liệu lưu tại 1 cụm HDFS

2. Nội dung bài học

Bài 1: Kiến trúc Hadoop (part 1)

Bài 2: Kiến trúc Hadoop (part 2)

Bài 3: HDFS Command line

Bài 4: Lab – Kiến trúc Hadoop(cloud)

Bài 5: Lab – Kiến trúc Hadoop(VM – Optional)

Bài 6: Review Questions

Module 3: Hadoop Administration

1.  Mục tiêu học tập

Trong bài này bạn sẽ tìm hiểu về:

  • Thêm và loại bỏ các nút(nodes) từ một cụm(cluster)
  • Cách xác định trạng thái của 1 cụm
  • Cách start và stop các thành phần của 1 cụm
  • Sửa đổi các tham số cấu hình cho Hadoop
  • Thiết lập 1 rack topology(chả biết dịch nó là gì)

2. Nội dung bài học

Bài 1: Hadoop Administration

Bài 2: Lab – Hadoop Administration(VM – optional)

Bài 3: Review Questions

Module 4: Thành phần của Hadoop

1.  Mục tiêu học tập

Trong bài này bạn sẽ tìm hiểu về:

  • Triết lý mapReduce
  • Cách sử dụng pig and Hive trong môi trường Hadoop
  • Di chuyển dữ liệu vào Hadoop sử dụng Flume và Sqoop
  • Lập lịch và điều khiển thực thi Hadoop sử dụng Oozie

2. Nội dung bài học

Bài 1: Thành phần của Hadoop: Mapreduce (phần 1)

Bài 2:Thành phần của Hadoop: Pig and Hive(phần 2)

Bài 3:Thành phần của Hadoop: Flume, Sqoop và oozie(phần 3)

Bài 4: Review Questions

Kỳ thi khoá học

Hướng dẫn thi:

  • Kỳ thi này đánh giá điểm cho 60% cho khoá học
  • Nó ảnh hưởng tới điểm tổng bla bla.
  • Thời gian thi:  1hours
  • Cách thi: Đánh tra lời true / false cho mỗi câu hỏi.
  • vân vân mây mây… =))

Lấy giấy chứng nhận

Vào đây để thi và lấy giấy chứng nhận:

<<>>

Share this:

  • Twitter
  • Facebook
Like Loading...

Từ khóa » Bài Tập Hdfs