Tổng Hợp 128 Câu Hỏi Trắc Nghiệm (có đáp án) Môn Học Big Data

Đây là kiến thức tổng hợp từ các bài giảng môn học dữ liệu lớn của các trường đại học Đảm bảo đầy đủ kiến thức, chính xác, uy tín cho các bạn họ môn big data được dê đàng hơn

Trang 1

TRẮC NGHIỆM

Câu 1: Trong NameNode, lượng bộ nhớ cần thiết là

A Tương tự như của node chính

B Phải có ít nhất một nửa node chính

C Phải gấp đôi node chính

D Chỉ phụ thuộc vào số lượng node dữ liệu mà nó sẽ xử lý

Câu 2: Khi một node dự phòng được sử dụng trong một cụm thì không cần

A Node kiểm tra (Check point node)

B Node tên phụ (Secondary name node)

C DataNode phụ (Secondary data node)

D Nhận thức về giá đỡ (Rack awareness)

Câu 3: Nhận thức về giá trong NameNode có nghĩa là (Rack awareness in name node means)

A Nó biết có bao nhiêu giá đỡ có sẵn trong cụm

B Nó nhận thức được ánh xạ giữa nút và giá đỡ

C Nó nhận biết được số lượng nút trong mỗi rack

D Nó biết những DataNode nào không có sẵn trong cụm

Câu 4: Khi một máy được khai báo là datanode, dung lượng ổ đĩa trong đó (When a machine is declared as a datanode, the disk space in it)

A Chỉ có thể được sử dụng cho lưu trữ HDFS

B Có thể được sử dụng cho cả lưu trữ HDFS và không phải HDFs

C Không thể truy cập bằng các lệnh không phải hadoop

D không thể lưu trữ các tệp văn bản

Câu 5: Mục đích của nút checkpoint trong cụm Hadoop là (The purpose of checkpoint node in a Hadoop cluster is to)

A Kiểm tra xem NameNode có hoạt động không

B Kiểm tra xem tệp hình ảnh có đồng bộ giữa NodeName và NameNode phụ hay không

C Hợp nhất hình ảnh và chỉnh sửa nhật ký và tải nó trở lại NameNode đang hoạt động

D Kiểm tra xem các DataNode nào không thể truy cập được

Câu 6: Khi một tệp trong HDFS bị người dùng xóa (When a file in HDFS is deleted by a user)

A nó đã mất vĩnh viễn

B Nó sẽ đi vào thùng rác nếu được định cấu hình

Trang 2

C Nó bị ẩn khỏi người dùng nhưng vẫn ở trong hệ thống tệp

D File sin HDFS không thể bị xóa

Câu 7: Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là (The source of HDFS architecture in Hadoop originated as)

A Hệ thống tệp phân phối của Google

B Hệ thống tệp phân tán của Yahoo

C Hệ thống tệp phân tán của Facebook

C Unstructured (Không có cấu trúc)

D All of the above (Tất cả những điều trên)

Câu 10: YARN là viết tắt của

A Yahoo’s another resource name

B Yet another resource negotiator

C Yahoo’s archived Resource names

D Yet another resource need

Câu 11: Chế độ cài đặt phân phối hoàn toàn (không ảo hóa) cần tối thiểu (The fully distributed mode of installation(without virtualization) needs a minimum of)

A 2 Máy vật lý

Trang 3

B 3 Máy vật lý

C 4 Máy vật lý

D 1 Máy vật lý

Câu 12: Chạy Start-dfs.sh kết quả là

A Bắt đầu NameNode và DataNode

B Chỉ NameNode bắt đầu

C Chỉ bắt đầu datanode

D Khởi động NameNode và trình quản lý tài nguyên

Câu 13: Điều nào sau đây không phải là mục tiêu của HDFS?

A Phát hiện lỗi và khôi phục

B Xử lý tập dữ liệu khổng lồ

C Ngăn chặn việc xóa dữ liệu

D Cung cấp băng thông mạng cao để di chuyển dữ liệu

Câu 14: Lệnh "hadoop fs -test -z URI" cho kết quả 0 nếu

A nếu đường dẫn là một thư mục

Câu 16: hadoop fs –expunge

A Cung cấp danh sách các DataNode

B Được sử dụng để xóa một tệp

C Được sử dụng để trao đổi một tệp giữa hai DataNode

D Dọn sạch thùng rác

Trang 4

Câu 17: Tất cả các tệp trong một thư mục trong HDFS có thể được hợp nhất với nhau bằng cách sử dụng

Trang 5

C Cp

D Cphar

Câu 22: Dữ liệu từ một cụm hadoop từ xa có thể

A không được đọc bởi một cụm hadoop khác

B được đọc bằng http

C được đọc bằng hhtp

D được đọc suing hftp

Câu 23: Mục đích của việc khởi động NameNode trong chế độ khôi phục là để

A Khôi phục NameNode không thành công

B Khôi phục một DataNode bị lỗi

C Khôi phục dữ liệu từ một trong những vị trí lưu trữ siêu dữ liệu

D Khôi phục dữ liệu khi chỉ có một vị trí lưu trữ siêu dữ liệu

Câu 24: Khi bạn tăng số lượng tệp được lưu trữ trong HDFS, Bộ nhớ được yêu cầu bởi NameNode

A Tăng

B Giảm

C Vẫn không thay đổi

D Có thể tăng hoặc giảm

Câu 25: Nếu chúng tôi tăng kích thước tệp được lưu trữ trong HDFS mà không tăng số tệp, thì bộ nhớ được yêu cầu bởi NameNode

A Tăng

B Giảm

C Vẫn không thay đổi

D Có thể tăng hoặc giảm

Câu 26: Yếu tố giới hạn hiện tại đối với kích thước của một cụm hadoop là

A Nhiệt lượng dư thừa tạo ra trong trung tâm dữ liệu

B Giới hạn trên của băng thông mạng

Trang 6

C Giới hạn trên của RAM trong NameNode

D Giải nén toàn bộ cụm Hadoop

Câu 28: Bạn có thể dự trữ lượng sử dụng đĩa trong một DataNode bằng cách định cấu hình dfs.datanode.du.reserved trong tệp nào sau đây

D Không thể đoán trước được

Câu 31: Một công việc đang chạy trong lon hadoop

A Bị giết bằng lệnh

Trang 7

B Không bao giờ có thể bị giết bằng một lệnh

C Chỉ có thể bị giết bằng cách tắt NameNode

D Được tạm dừng và chạy lại

Câu 32: Số lượng nhiệm vụ mà trình theo dõi tác vụ có thể chấp nhận phụ thuộc vào

A Bộ nhớ tối đa có sẵn trong nút

B Không giới hạn

C Số lượng khe cắm được định cấu hình trong đó

D Theo quyết định của jobTracker

33 Khái niệm sử dụng nhiều máy để xử lý dữ liệu được lưu trữ trong hệ thống phân tán không phải là mới

Máy tính hiệu suất cao (HPC) sử dụng nhiều máy tính để xử lý khối lượng lớn dữ liệu được lưu trữ trong mạng vùng lưu trữ (SAN) So với HPC, Hadoop

A Có thể xử lý khối lượng dữ liệu lớn hơn

B Có thể chạy trên một số lượng máy lớn hơn HPC cluster

C Có thể xử lý dữ liệu nhanh hơn với cùng băng thông mạng so với HPC

D Không thể chạy các công việc tính toán chuyên sâu

34 Hadoop khác với máy tính tình nguyện ở chỗ

A Tình nguyện viên đóng góp thời gian CPU chứ không phải băng thông mạng

B Tình nguyện viên đóng góp băng thông mạng chứ không phải thời gian CPU

C Hadoop không thể tìm kiếm các số nguyên tố lớn

D Chỉ Hadoop mới có thể sử dụng mapreduce

35 So với RDBMS, Hadoop

A Có tính toàn vẹn dữ liệu cao hơn

B Có giao dịch ACID không

C IS thích hợp để đọc và viết nhiều lần

D Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc

36 Vấn đề chính gặp phải khi đọc và ghi dữ liệu song song từ nhiều đĩa là gì?

A - Xử lý khối lượng lớn dữ liệu nhanh hơn

B - Kết hợp dữ liệu từ nhiều đĩa

C - Phần mềm cần thiết để thực hiện nhiệm vụ này là cực kỳ tốn kém

D - Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém

Trang 8

37 Điều nào sau đây đúng với ổ đĩa trong một khoảng thời gian?

A - Thời gian tìm kiếm dữ liệu đang cải thiện nhanh hơn tốc độ truyền dữ liệu

B - Thời gian tìm kiếm dữ liệu đang cải thiện chậm hơn tốc độ truyền dữ liệu

C - Thời gian tìm kiếm dữ liệu và tốc độ truyền dữ liệu đều đang tăng tương ứng

D - Chỉ tăng dung lượng lưu trữ mà không tăng tốc độ truyền dữ liệu

38 Tính năng định vị dữ liệu trong Hadoop có nghĩa là

A - lưu trữ cùng một dữ liệu trên nhiều nút

B - chuyển vị trí dữ liệu từ nút này sang nút khác

C - đồng định vị dữ liệu với các nút tính toán

D - Phân phối dữ liệu trên nhiều nút

39 Cái nào trong số này cung cấp hệ thống xử lý Luồng được sử dụng trong hệ sinh thái Hadoop?

A - Solr

B - Tez

C - Tia lửa

D - Hive

40 Các tệp HDFS được thiết kế cho

A - Nhiều người viết và sửa đổi ở các hiệu số tùy ý

B - Chỉ nối vào cuối tệp

C - Chỉ ghi thành tệp một lần

D - Truy cập dữ liệu có độ trễ thấp

41 Tệp HDFS nhỏ hơn kích thước một khối

A - Không thể lưu trữ trong HDFS

Trang 9

B - Chiếm toàn bộ kích thước của khối

C - Chỉ chiếm kích thước mà nó cần chứ không phải toàn khối

D - Có thể trải dài trên nhiều khối

42 Kích thước khối HDFS lớn hơn so với kích thước của các khối đĩa để

A - Chỉ các tệp HDFS có thể được lưu trữ trong đĩa được sử dụng

B - Thời gian tìm kiếm là tối đa

C - Không thể chuyển một tệp lớn được tạo từ nhiều khối đĩa

D - Một tệp duy nhất lớn hơn kích thước đĩa có thể được lưu trữ trên nhiều đĩa trong cụm

43 Trong một cụm Hadoop, điều gì đúng với khối HDFS không còn khả dụng do hỏng đĩa hoặc lỗi máy?

A - Nó bị mất vĩnh viễn

B - Nó có thể được sao chép ở các vị trí thay thế của nó cho các máy sống khác

C - NameNode cho phép yêu cầu của khách hàng mới tiếp tục cố gắng đọc nó

D - Tiến trình công việc Mapreduce chạy bỏ qua khối và dữ liệu được lưu trữ trong đó

44 Tiện ích nào được sử dụng để kiểm tra tình trạng của hệ thống tệp HDFS?

Trang 10

D - Hình ảnh không gian tên, chỉnh sửa vị trí nhật ký và chặn

48 Khi khách hàng giao tiếp với hệ thống tệp HDFS, nó cần giao tiếp với

A - Sao lưu siêu dữ liệu hệ thống tệp vào đĩa cục bộ và gắn kết NFS từ xa

B - Lưu trữ siêu dữ liệu hệ thống tệp trên đám mây

C - Sử dụng máy có ít nhất 12 CPU

D - Sử dụng phần cứng đắt tiền và đáng tin cậy

50 Vai trò chính của NameNode phụ là

A - Sao chép siêu dữ liệu hệ thống tệp từ NameNode chính

Trang 11

B - Sao chép siêu dữ liệu hệ thống tệp từ NFS được lưu trữ bởi NameNode chính

C - Theo dõi xem NameNode chính có đang hoạt động hay không

D - Định kỳ hợp nhất hình ảnh vùng tên với nhật ký chỉnh sửa

51 Đối với các tệp HDFS được truy cập thường xuyên, các khối được lưu vào bộ nhớ đệm

A - thêm tên tệp bộ đệm vào nhóm bộ đệm

B - thêm cấu hình bộ đệm vào nhóm bộ đệm

C - thêm chỉ thị bộ nhớ cache vào nhóm bộ nhớ cache

D - chuyển tên tệp làm tham số cho nhóm bộ nhớ cache

53 Trong Hadoop 2.x, liên kết HDFS phát hành có nghĩa là

A - Cho phép các NameNode giao tiếp với nhau

B - Cho phép một cụm mở rộng quy mô bằng cách thêm nhiều DataNode dưới một NameNode

C - Cho phép một cụm mở rộng quy mô bằng cách thêm nhiều NameNode hơn

D - Thêm nhiều bộ nhớ vật lý hơn cho cả NameNode và DataNode

54 Theo liên kết HDFS

A - Mỗi NameNode quản lý siêu dữ liệu của toàn bộ hệ thống tệp

B - Mỗi NameNode quản lý siêu dữ liệu của một phần hệ thống tệp

Trang 12

C - Lỗi một NameNode làm mất một số tính khả dụng của siêu dữ liệu từ toàn

bộ hệ thống tệp

D - Mỗi DataNode đăng ký với mỗi NameNode

55 Mục tiêu chính của HDFS Tính sẵn sàng cao là

A - Tạo bản sao của NameNode chính nhanh hơn

B - Để giảm thời gian chu kỳ cần thiết để khôi phục lại NameNode chính mới sau khi nút chính hiện có bị lỗi

C - Ngăn chặn việc mất dữ liệu do lỗi của NameNode chính

D - Ngăn chặn biểu mẫu tên chính trở thành điểm lỗi duy nhất

56 Là một phần của tính khả dụng cao HDFS, một cặp NameNode chính được cấu hình Điều gì là đúng với họ?

A - Khi một yêu cầu của khách hàng đến, một trong số họ được chọn ngẫu nhiên sẽ phục vụ yêu cầu đó

B - Một trong số chúng đang hoạt động trong khi cái còn lại vẫn tắt

C - Các DataNode chỉ gửi báo cáo khối đến một trong các NameNode

D - Nút chờ nhận các điểm kiểm tra định kỳ của không gian tên của

NameNode đang hoạt động

57 Zookeeper đảm bảo rằng

A - Tất cả các NameNode đang tích cực phục vụ các yêu cầu của khách hàng

B - Chỉ có một NameNode đang tích cực phục vụ các yêu cầu của khách hàng

C - Chuyển đổi dự phòng được kích hoạt khi bất kỳ DataNode nào bị lỗi

D - Quản trị viên hadoop không thể bắt đầu chuyển đổi dự phòng

58 Theo Tính khả dụng cao của Hadoop, nghĩa là Hàng rào

A - Ngăn NameNode hoạt động trước đó bắt đầu chạy lại

B - Ngăn chặn việc bắt đầu chuyển đổi dự phòng trong trường hợp mạng bị lỗi với NameNode hoạt động

Trang 13

C - Ngăn chặn sự cố sập nguồn đối với NameNode đã hoạt động trước đó

D - Ngăn không cho NameNode đã hoạt động trước đó ghi vào nhật ký chỉnh sửa

59 Cơ chế nào sau đây không phải là cơ chế hàng rào cho NameNode đã hoạt động trước đó?

A - Tắt cổng mạng của nó thông qua lệnh quản lý từ xa

B - Thu hồi quyền truy cập của nó vào thư mục lưu trữ được chia sẻ

Trang 14

A - giống như RF của các tệp trong thư mục đó

65 HDFS có thể được truy cập qua HTTP bằng cách sử dụng

A - lược đồ URI viewfs

B - lược đồ URI webhdfs

Lược đồ URI C - wasb

C - Bạn có thể chỉnh sửa bản ghi hiện có trong tệp HDFS đã được gắn kết bằng NFS

D - Bạn không thể thêm vào tệp HDFS được gắn bằng NFS

67 Máy khách đọc dữ liệu từ hệ thống tệp HDFS trong Hadoop

A - lấy dữ liệu từ NameNode

B - lấy vị trí khối từ datanode

C - chỉ lấy các vị trí khối tạo thành NameNode

D - lấy cả dữ liệu và vị trí khối từ NameNode

Trang 15

68 Kịch bản nào yêu cầu băng thông cao nhất để truyền dữ liệu giữa các nút trong Hadoop?

A - Các nút khác nhau trên cùng một giá đỡ

B - Các nút trên các giá đỡ khác nhau trong cùng một trung tâm dữ liệu

C - Các mã trong các trung tâm dữ liệu khác nhau

D - Dữ liệu trên cùng một nút

69 Vị trí khối hiện tại của HDFS nơi dữ liệu đang được ghi vào,

A - hiển thị cho khách hàng yêu cầu nó

B - Vị trí khối không bao giờ hiển thị đối với các yêu cầu của khách hàng

C - Người đọc có thể nhìn thấy hoặc không

D - chỉ hiển thị sau khi dữ liệu được lưu trong bộ đệm được cam kết

70 Tùy chọn nào trong số này không phải là tùy chọn lập lịch có sẵn với YARN?

A - Bộ lập lịch tối ưu

B - Bộ lập lịch FIFO

C - Bộ lập lịch dung lượng

D - Bộ lập lịch công bằng

71 Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?

A - Chế độ phân phối giả

B - Chế độ phân phối toàn cầu

C - Chế độ độc lập

D - Chế độ phân phối hoàn toàn

72 Sự khác biệt giữa chế độ độc lập và giả phân phối là

A - Đứng một mình không thể sử dụng bản đồ giảm

B - Đứng riêng có một quy trình java duy nhất chạy trong đó

Trang 16

C - Chế độ phân tán giả không sử dụng HDFS

D - Chế độ phân tán giả cần hai hoặc nhiều máy vật lý

73 Công việc khung hadoop được viết bằng

D - Sao chép tệp hoặc thư mục từ HDFS sang hệ thống tệp cục bộ

76 Sao chép thiếu trong HDFS có nghĩa là-

A - Không có sự sao chép nào diễn ra trong các DataNode

B - Quá trình sao chép rất chậm trong các DataNode

C - Tần suất sao chép trong các DataNode rất thấp

D - Số lượng bản sao được tái tạo ít hơn so với quy định của hệ số sao chép

77 Khi NameNode nhận thấy rằng một số khối được sao chép quá mức, nó

A - Dừng công việc sao chép trong toàn bộ hệ thống tệp hdfs

B - Nó làm chậm quá trình nhân bản cho các khối đó

Trang 17

C - Nó xóa các khối thừa

D - Nó để lại các khối thừa như nó vốn có

78 Thuộc tính nào dưới đây được định cấu hình trên core-site.xml?

A - Yếu tố nhân rộng

B - Tên thư mục để lưu trữ tệp hdfs

C - Máy chủ và cổng nơi tác vụ MapReduce chạy

D - Các biến môi trường Java

79 Thuộc tính nào dưới đây được định cấu hình trên hdfs-site.xml?

A - Yếu tố nhân rộng

B - Tên thư mục để lưu trữ tệp hdfs

C - Máy chủ và cổng nơi tác vụ MapReduce chạy

D - Các biến môi trường Java

80 Thuộc tính nào dưới đây được định cấu hình trên mapred-site.xml?

A - Yếu tố nhân rộng

B - Tên thư mục để lưu trữ tệp hdfs

C - Máy chủ và cổng nơi tác vụ MapReduce chạy

D - Các biến môi trường Java

81 Thuộc tính nào dưới đây được định cấu hình trên hadoop-env.sh?

A - Yếu tố nhân rộng

B - Tên thư mục để lưu trữ tệp hdfs

C - Máy chủ và cổng nơi tác vụ MapReduce chạy

D - Các biến môi trường Java

82 Lệnh để kiểm tra xem Hadoop có hoạt động hay không là:

A - Jsp

B - Jps

Trang 18

86 Bản chất của phần cứng cho NameNode phải là

A - Cao cấp hơn loại hàng hóa

B - Loại hàng hóa

C - Không thành vấn đề

D - Chỉ cần có nhiều Ram hơn mỗi DataNode

87 Trong Hadoop, Snappy và LZO là những ví dụ về

A - Cơ chế vận chuyển tệp giữa các DataNode

B - Cơ chế nén dữ liệu

C - Cơ chế sao chép dữ liệu

Trang 19

D - Cơ chế đồng bộ hóa dữ liệu

88 Hệ thống apache nào dưới đây giải quyết việc nhập dữ liệu phát trực tuyến vào hadoop

A - Ozie

B - Kafka

C - Flume

D - Hive

89 Sự phân chia đầu vào được sử dụng trong MapReduce cho biết

A - Kích thước trung bình của các khối dữ liệu được sử dụng làm đầu vào cho chương trình

B - Chi tiết vị trí nơi bắt đầu của toàn bộ bản ghi đầu tiên trong một khối và toàn

bộ bản ghi cuối cùng trong khối kết thúc

C - Tách dữ liệu đầu vào cho chương trình MapReduce thành kích thước đã được định cấu hình trong mapred-site.xml

D - Không có

90 Đầu ra của một nhiệm vụ ánh xạ là

A - Cặp khóa-giá trị của tất cả các bản ghi của tập dữ liệu

B - Cặp khóa-giá trị của tất cả các bản ghi từ phần tách đầu vào được trình ánh

xạ xử lý

C - Chỉ các phím được sắp xếp từ phần tách đầu vào

D - Số hàng được xử lý bởi tác vụ ánh xạ

91 Vai trò của nút Nhật ký là

A - Báo cáo vị trí của các khối trong một DataNode

B - Báo cáo thông tin nhật ký chỉnh sửa của các khối trong DataNode

C - Báo cáo lịch trình khi công việc sẽ chạy

D - Báo cáo hoạt động của các thành phần khác nhau do người quản lý tài nguyên xử

Từ khóa » Bài Tập Hdfs