Biểu đồ Hộp | Nguyenvantien0405

Sau đây là một số nguyên tắc chung để vẽ một biểu đồ hộp:

  1. Vẽ một trục ngang thể hiện giá trị của dữ liệu.
  2. Trên trục này, vẽ một hình chữ nhật với phía trái hộp là phân vị thứ nhất q1 và phía phải hộp là phân vị thứ ba  q3.
  3. Vẽ một đường thẳng đứng nối cạnh trên và cạnh dưới của hộp tại điểm trung vị m.
  4. Để vẽ râu bên trái, ta vẽ một đường nằm ngang từ giá trị nhỏ nhất đến điểm giữa cạnh bên trái của hộp.
  5. Để vẽ râu bên phải, ta vẽ một đường ngang nối từ điểm giữa cạnh phải của hộp đến giá trị lớn nhất của hộp.
  6. Sau khi vẽ như vậy, ta có biểu đồ hộp chia dữ liệu một cách hình ảnh thành 4 phần. Chú ý rằng, đường ngang chiều dài hộp là khoảng tứ phân vị IQR, râu bên trái thể hiện phần tư thứ nhất, và râu bên phải thể hiện phần tư cuối cùng của dữ liệu.IQ TestVí dụ. Ta quay lại ví dụ về chỉ số IQ của 64 người được chọn ngẫu nhiên. Sau đây là kết quả của họ:

64 IQs

Ở phần trước ta đã xác định rằng phân vị thứ nhất là 91; trung vị là 99,5 và phân vị thứ ba là 107. Khoảng tứ phân vị là 16. Sử dụng những giá trị này kết hợp với giá trị lớn nhất 141; giá trị nhỏ nhất 68 ta có biểu đồ hộp về dữ liệu ở trên như sau:

Giải. Theo các hướng dẫn ở trên, ta vẽ nháp biểu đồ hộp như sau

Boxplot of IQs

Nếu sử dụng phần mềm Minitab để vẽ ta có dạng sau:

Box Plot of IQs

Đồ thị của Minitab có hơi khác so với bản vẽ nháp của chúng ta. Theo mặc định, Minitab sẽ vẽ ra biểu đồ hộp mà có hiệu chỉnh đôi chút. Phần hộp vẫn vẽ như bình thường nhưng râu nhìn hơi khác. Phần râu là các đường thẳng kéo dài từ trái hoặc phải hộp đến các giá trị liền kề (adjacent values). Các giá trị liền kề được xác định bởi giá trị lớn nhất, nhỏ nhất của các quan sát với điều kiện vẫn nằm trong khoảng giới hạn sau:

  • Giới hạn dưới: Q1 − 1.5 × IQR
  • Giới hạn trên: Q3 + 1.5 × IQR

Trong ví dụ này ta dễ dàng tính được giới hạn dưới là Q1 − 1.5 × IQR = 91−1.5(16) = 67. Do đó, trong trường hợp này giá trị liền kề dưới chính là giá trị nhỏ nhất bởi vì 68 là quan sát nhỏ nhất vẫn nằm trong miền có cận dưới 67. Một cách tương tự, giá trị liền kề phía trên là 128 vì đây là giá trị quan sát lớn nhất nằm trong miền có cận trên là 131.

Nói chung, những giá trị nằm ngoài khoảng các giá trị liền kề ta gọi là giá trị ngoại lai, cá biệt (outliers). Trong trường hợp đang xét, các chỉ số IQ 136 và 141 đều lớn hơn giá trị liền kề trên, nên chúng là các outliers. Trong đồ thị hộp của Minitab, các outliers được biểu diễn bởi các dấu hoa thị.

Calcium supplementsVí dụ.

Hãy quay trả lại ví dụ khi ta chọn ngẫu nhiên 20 mẫu về hàm lượng Canxi Cacbonat trong 1 lít nước.

Calcium Carbonate Concentrations

Dễ dàng tìm được 5 giá trị cần nhớ đối với tập dữ liệu trên:

  • Nhỏ nhất: 127.8
  • Phân vị thứ nhất: 130.12
  • Trung vị: 131.45
  • Phan vị thứ ba: 132.70
  • Lớn nhất: 134.8

Hãy tạo biểu đồ hộp của mẫu dữ liệu trên?

Giải. Theo các hướng dẫn trên ta có bản vẽ tay về đồ thị hộp như sau:

Box plot of calcium concentrations

Trong ví dụ này, khoảng tứ phân vị là IQR 132.7 − 130.12 = 2.58. Do đó, giới hạn dưới là  Q1 − 1.5 × IQR = 130.12−1.5(2.58) = 126.25. Dễ thấy giá trị liền kề dưới cũng là giá trị nhỏ nhất vì 127,8 là quan sát nhỏ nhất nhưng vẫn nằm trong miền có cận dưới là 126,25.

Giới hạn trên là  Q3 + 1.5 × IQR = 132.7+1.5(2.58) = 136.57. Do đó giá trị liền kề trên cũng là giá trị lớn nhất 134,8 (vì 134,8<136,57). Do các giá trị liền kề trên, dưới cũng chính là giá trị lớn nhất và nhỏ nhất nên sẽ không có điểm outlier nào và đồ thị hộp của ta có dạng như sau:

Box Plot of Calcium Carbonate Concentrations

Từ khóa » Cách Nhận Xét Biểu đồ Hộp Râu