Bài Toán Hồi Quy Và Mô Hình Hồi Quy Tuyến Tính - Viblo
Có thể bạn quan tâm
c. Thuật toán tối ưu Loss Function (Optimization Algorithms)
- Normal Equation
Một liên tưởng đơn giản, như chúng ta học từ cấp 3, cách đơn giản nhất để tìm giá trị nhỏ nhất của một hàm số (cực tiểu), ta sẽ cho đạo hàm bằng 0 và tìm .
-
Công thức toán học
Tìm đạo hàm của
Một chút biến đổi:
Chúng ta đơn giản hàm bằng cách bỏ đi vì cuối cùng chúng ta cũng cho đạo hàm bằng 0.
Chú ý vì và đều là vector nên khi chúng ta nhân chúng lại với nhau, vị trí của chúng trong tích không quan trọng nữa. Cho nên:
Cho nên:
Tiến hành đạo hàm:
Tương đương:
Giả sử có thể nghịch đảo, chuyển vế ta có:
- Điểm mạnh: Công thức đơn giản và chỉ cần đổ data vào tính toán
- Điểm yếu: Tài nguyên để tính toán ma trận nghịch đảo với lượng data lớn là rất tốn kém nên trong thực tế các bài toán hồi quy tuyến tính rất ít khi sử dụng phương pháp này
-
Gradient Descent
Thay vì sử dụng công thức ăn liền Normal Equation, thì trong thực tế chúng ta sẽ sử dụng thuật toán Gradient Descent. Giải thích một cách đơn giản, chúng ta sẽ cho tăng và giảm một khoảng nhất định, sao cho giá trị của hàm Loss function giảm dần đến giá trị cực tiểu.
Như bạn có thể thấy trên hình: Lúc ban đầu hàm có giá trị lớn nên hàm ban đầu cần tìm dự đoán chưa chính xác các dữ liệu, nhưng khi hàmm giảm dần, hàm ban đầu dự đoán chính xác hơn rất nhiều.
-
Công thức toán học
- Diễn giải công thức toán:
Tương đương với:
Nếu bạn đã từng lập trình thì có thể tinh tế nhận ra cách tính toán này. Chúng ta sẽ tạo ra một vòng lặp và qua mỗi vòng lặp đó ta sẽ gán giá trị mới cho .
-
Chú ý: được gọi là một hyper hyper parameters. Nó sẽ được đặt bởi một giá trị cho trước. Ví dụ mình hay đặt sử dụng 0.01 hoặc 0.0001. Ý nghĩa của nó là một tham số quyết định tốc độ học nhanh hay chậm của mô hình.
-
Nếu quá lớn: Hàm không thể hội tụ và giá trị của nó sẽ nhảy đến vô cùng. Khi lập trình bạn có thể sẽ hay gặp (nan) trong Python.
-
Nếu quá nhỏ: Mô hình hội tụ quá lâu, tốn kém thời gian.
-
-
Điểm mạnh
Tính toán nhẹ nhàng hơn rất nhiều so với phương pháp ban đầu. Về sau chúng ta sẽ tìm hiểu các phương thức khác kết hợp với Gradient Descent để giảm nhẹ khối lượng tính toán.
-
Điểm yếu
Kết quả thường không chính xác 100%, nhiều vấn đề liên quan xảy ra ví dụ như giá trị của hàm Loss không thể giảm thêm mà bị mắc kẹt tại một điểm local nào đó. (Như hình mình họa bên trên)
Có rất nhiều phương pháp để giải quyết vấn đề này, tôi sẽ trình bày ở các bài tiếp theo.
-
Từ khóa » Thống Kê 6 45 Bảng Phương Pháp Hồi Quy
-
Phân Tích Vietlott Cơ Sở 5 - Phân Tích Hồi Qui Vietlott 6/45
-
Phân Tích Thống Kê Phương Pháp Hồi Qui | Vietlott Mega 6/45
-
Thống Kê Phân Tích Kết Quả Xổ Số Mega 6/45 VIP
-
Thống Kê 6 55 Bảng Phương Pháp Hồi Quy
-
Thống Kê Xổ Số Mega 6/45 Vietlott Hôm Nay
-
Mẹo Thống Kê 6 55 Bảng Phương Pháp Hồi Quy Mới Nhất
-
[PDF] PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
-
Thống Kê Kết Quả Vietlott Mega 645 Chính Xác Nhất
-
Phương Trình Hồi Quy - SlideShare
-
[PDF] Hồi Quy Và Tương Quan - Ctump
-
Vietlott Power 6/55 Các Lần Quay Trước
-
[PDF] BÀI 8: TƯƠNG QUAN VÀ HỒI QUY
-
[PDF] LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNG
-
[PDF] ƯỚC LƯỢNG KHOẢNG VÀ KIỂM ÐỊNH GIẢ THIẾT