Model Assessment Discriminatory | Credit Risk Modeling
Có thể bạn quan tâm
Mục lục
- Kiểm định tính phân biệt
- Đánh giá thứ tự bad rate
- Đường cong ROC và hệ số Gini
- Hệ số K-S
Kiểm định tính phân biệt
Kiểm định tính phân biệt được sử dụng ở hầu hết các mô hình dự báo. Một mô hình là tốt nếu quan sát A “xấu” hơn quan sát B thì mô hình phải dự báo được rằng A “xấu” hơn B. Mục đích của kiểm định tính phân biệt là kiểm tra điều này. Một số kiểm định sau đây thường được áp dụng để kiếm tra tính phân biệt của mô hình.
Đánh giá thứ tự bad rate
Kiểm định này thường được thực hiện như sau:
- Chia các dữ liệu thành các nhóm dựa trên kết quả đầu ra của mô hình. Cách chia thường dùng là đảm bảo số quan sát ở mỗi nhóm bằng nhau (quatile binning).
- Sắp xếp theo thứ tự các nhóm từ xấu đến tốt theo kết quả đầu ra và tính số lượng good, bad trong mỗi nhóm. Từ đó tính được bad rate của mỗi nhóm.
- Vẽ đồ thị thể hiện Bad rate trong từng nhóm.
Ví dụ được cho trong hình sau:
Đường cong ROC và hệ số Gini
Từ kết quả tính toán good và bad trong mỗi nhóm, ta tính toán tỷ lệ luỹ kế good (%Cum Good) và tỷ lệ luỹ kế bad (%Cum Bad). Minh hoạ được cho ở bảng sau:
Group | #Good | #Bad | %CumB/Total Bad | %CumG/Total Good |
---|---|---|---|---|
B01 | 4616 | 2247 | 30.98 | 8.32 |
B02 | 5904 | 1303 | 48.95 | 18.96 |
B03 | 6427 | 1369 | 67.82 | 30.55 |
B04 | 5648 | 685 | 77.26 | 40.73 |
B05 | 5231 | 451 | 83.48 | 50.16 |
B06 | 5000 | 369 | 88.57 | 59.17 |
B07 | 5200 | 288 | 92.54 | 68.54 |
B08 | 5467 | 251 | 96 | 78.4 |
B09 | 5721 | 171 | 98.36 | 88.71 |
B10 | 6265 | 119 | 100 | 100 |
Đường cong roc (Receiver operating characteristic) được tạo bởi hai cột, cột x là %Cum Good và cột y là %Cum Bad.
Hệ số Gini được tính là hai lần phần diện tích được giới hạn bởi Roc curve của model và đường chéo nối điểm \((0;0)\) và \((1;1)\). Công thức tính Gini như sau:
\[Gini=1-\sum_{i=0}^{n-1} \left(\%CumBad_{i+1} + \%CumBad_i\right)\left(\%CumGood_{i+1} - \%CumGood_i\right)\]
Với \(\%CumBad_0=\%CumGood_0=0\).
Hệ số Gini nằm trong khoảng giá trị \([−1;1]\). Nhìn chung, hệ số Gini càng lớn thì mô hình càng tốt. Một hệ số khác tương tự hệ số Gini là Sommers’D được tính như sau:
\[Sommers’D=\frac{n_c-n_d}{t}\]
Trong đó:
- \(n_c\) (số lượng concordant) là số lượng các cặp \((\widehat{y_i}, y_i)\) và \((\widehat{y_j}, y_j)\) mà \(\widehat{y_i}> \widehat{y_j}\) và \(y_i>y_j\) hoặc \(\widehat{y_i}< \widehat{y_j}\) và \(y_i<y_j\).
- \(n_d\) (số lượng discordant) là số lượng các cặp \((\widehat{y_i}, y_i)\) và \((\widehat{y_j}, y_j)\) mà \(\widehat{y_i}> \widehat{y_j}\) và \(y_i<y_j\) hoặc \(\widehat{y_i}< \widehat{y_j}\) và \(y_i>y_j\).
- \(t\) là số lượng các cặp \(y_i\) và \(y_j\) mà \(y_i \not= y_j\).
Hệ số K-S
Hệ số K-S đo lường sự khác biệt lớn nhất giữa phân phối tích luỹ của quan sát good và bad. Công thức tính K-S như sau:
\[K-S=max(\%CumBad_i - \%CumGood_i)\]
Từ khóa » Chỉ Số Ks
-
TIÊU CHUẨN QUỐC GIA TCVN 9206 : 2012
-
Hệ Số KS đánh Giá độ Chính Xác Của Mô Hình | By Toàn LH | Medium
-
Các Chỉ Số Quan Trọng Trong Hoạt động Kinh Doanh Khách Sạn (phần 1)
-
Công Thức Tính 3 Chỉ Số KPI đo Lường Giá Bán Phòng Khách Sạn
-
Tìm Hiểu 6 Thuật Ngữ đánh Giá KPI Trong Quản Trị Doanh Thu Khách Sạn
-
Mô Hình Scorecard - Khoa Học Dữ Liệu - Khanh's Blog
-
Phân Biệt Và Lựa Chọn Hệ Số Sử Dụng Ku, Hệ Số đồng Thời Ks, Hệ Số ...
-
Chỉ Số đo Lường Hiệu Suất Cốt Yếu Trong Các Doanh Nghiệp ... - VAA
-
Chỉ Số RevPAR Và Những điều Cần Biết Trong Ngành Kinh Doanh ...
-
5 KPI Quan Trọng Nhất Trong Lĩnh Vực Quản Trị Khách Sạn - EzCloud
-
Cách Tính Các Chỉ Số Bán Phòng Trong Báo Cáo Doanh Thu Khách Sạn
-
Hiểu đúng Về Công Suất Phòng Khi Làm Khách Sạn
-
KPI đánh Giá Việc Kinh Doanh Của Khách Sạn - day