Thuật Toán Tăng Cường Là Gì? - Amazon AWS

Để giúp bạn nắm được cách hoạt động của thuật toán tăng cường, chúng tôi sẽ mô tả cách thức mô hình máy học đưa ra quyết định. Dù có nhiều sai số trong quá trình triển khai, các nhà khoa học dữ liệu vẫn thường sử dụng thuật toán tăng cường với các thuật toán cây quyết định:

Cây quyết định

Cây quyết định là cấu trúc dữ liệu trong máy học, hoạt động bằng cách chia tập dữ liệu thành các tập con nhỏ hơn dựa trên tính năng của chúng. Về cơ bản, cây quyết định sẽ chia dữ liệu liên tục đến khi chỉ còn lại một lớp. Ví dụ: cây có thể đặt ra một chuỗi các câu hỏi có hoặc không và chia dữ liệu thành các danh mục theo từng bước.

Phương pháp tập hợp thuật toán tăng cường

Thuật toán tăng cường tạo một mô hình tập hợp bằng cách kết hợp một số cây quyết định yếu theo trình tự. Thuật toán này chỉ định trọng số cho đầu ra của từng cây. Sau đó, thuật toán này sẽ áp dụng một trọng số cao hơn cho các phân loại sai từ cây quyết định đầu tiên và đầu vào cho cây tiếp theo. Sau nhiều chu kỳ, phương pháp thuật toán tăng cường kết hợp những quy tắc yếu này thành một quy tắc dự đoán mạnh.

Thuật toán tăng cường so với thuật toán đóng bao

Thuật toán tăng cường và thuật toán đóng bao là 2 phương pháp tập hợp phổ biến, giúp cải thiện độ chính xác trong việc dự đoán. Điểm khác biệt chính giữa các phương pháp học này là phương pháp đào tạo. Với thuật toán đóng bao, các nhà khoa học dữ liệu cải thiện độ chính xác của máy học yếu bằng cách đào tạo một số máy học này cùng một lúc trên nhiều tập dữ liệu. Ngược lại, thuật toán tăng cường đào tạo lần lượt các máy học yếu.

Từ khóa » Xgboost Là Gì