[Thống Kê]Tìm Hiểu Về Scatter Plot Và Pie Chart - DragonNguyen

Pie chart

Định nghĩa: Pie chart  là biểu đồ dạng hình tròn thể hiện mối quan hệ theo phần trăm giữa các phần so với tổng thể.

The Most Popular Browsers

https://www.w3schools.com/Browsers/default.asp

Ví dụ biểu đồ tròn về mức độ phổ biến của browsers theo số liệu thống kê trên w3school tháng 8. Chorme dùng phố biến và chiếm 77.3% so với tổng thể và kém phổ biến nhất là opera chiếm 1.2% so với tổng thể.

Cân nhắc sử dụng biểu đồ hình tròn khi

  • Không giá trị nào trong dữ liệu của bạn mang giá trị âm hoặc bằng 0.
  • Biểu đồ tròn không hiệu quả khi sử dụng quá nhiều phần trong 1 hình tròn. Ví dụ như 50 phần mỗi phần chiếm 1% mà sử dụng biểu đồ tròn là bất hợp lý.Hoặc là các phần này quá nhỏ để so sánh.

Scatter plot

Định nghĩa: Scatter plot là biểu đồ với những điểm thể hiện mối quan hệ giữa hai tham số.

Ví dụ đồ thị thể hiện tương quan giữa hai tham số nhiệt độ và doanh thu bán kem. Kết luận quan sát qua các điểm: nhiệt độ càng cao thì danh thu bán kem càng cao.

Đồ thị thể hiện tương quan giữa 2 tham số cân nặng và chiều cao. Kết luận quan sát qua các điểm: Chiều cao càng cao thì cân nặng càng lớn.

Pattern của scatter plot

Hình 1, 2, 3 quan hệ positive corelation là tương quan tích cực theo chiều khi tham số x tăng thì tham số y tăng theo.

Hình 5,6 ,7 quan hệ nagative correlation hay là tương quan tiêu cực khi tham số x tăng thì tham số y giảm.

Nếu các điểm trên đồ thì nằm sát nhau và gần như trên 1 dường thẳng thì mối tương quan quan giữa hai tham số mạnh. Ngược lại nằm rải rác thì mối tương quan giữa hai tham số yếu.

Hình 4 thể hiện hai tham số không có quan hệ gì với nhau. Các điểm trên đồ thị nằm phân bố rải rác và không có quy luật.

Outlier

Trong quá trình phân tích thu thập dữ liệu ta thường gặp dữ liệu mà quan sát nó khác biệt so với các giá trị còn lại. Ta gọi là giá trị ngoại lai hay giá trị bất thường.

Outlier có thể là giá trị đơn lẻ hoặc cũng có thể từ hai hay nhiều.

Phát hiện outlier có nhiều ý nghĩa và ứng dụng trong nhiều lĩnh vực như phát hiện gian lận tài chính, phân tích hành vi khách hàng tiêu dùng, phát hiện bệnh tật(các bất thường được quan tâm trong y học vì khả năng xảy ra bệnh cao)

Qua việc hiểu được corelation và outlier của scatter plot chart.

Phân tích mối quan hệ giữa hai tham số. Tích cực hay tiêu cực mạnh yếu ra sao.

Tìm ra nhân tố chính thật sự gây ra lỗi trong phát hiện xử lý vấn đề.

Độ mạnh của quan hệ từ đố biết được nhân tố quan trọng và không quan trọng.

Biết được các giá trị ngoại lai và bất thường.

Share this:

  • Twitter
  • Facebook
Like Loading...

Related

Từ khóa » Cách Nhận Xét Biểu đồ Scatter Plot