1. Độ Lệch Chuẩn Là Gì? Khái Niệm Và Công Thức Tính

1. Độ lệch chuẩn là gì? Khái niệm và công thức tính

1.1. Hiểu đúng về độ lệch chuẩn

Trong Thống kê mô tả, độ lệch chuẩn được sử dụng để đo lường mức độ phân tán của một hay nhiều tập dữ liệu. Người ta sẽ tiến hành đo phương sai của mức độ phân tán dữ liệu bằng cách xác định độ lệch của mỗi điểm dữ liệu so với giá trị trung bình, sau đó lấy căn bậc hai của phương sai để làm độ lệch chuẩn.

Hiểu đúng về độ lệch chuẩn
Hiểu đúng về độ lệch chuẩn

Các điểm dữ liệu có độ lệch chuẩn càng cao thì càng xa giá trị trung bình. Hay nói cách khác, dữ liệu càng trải rộng thì độ lệch chuẩn càng cao.

Độ lệch chuẩn nếu biểu diễn trên biểu đồ sẽ có dạng đường cong với đỉnh cao nhất ở giữa và đối xứng đều ở hai bên. Trên biểu đồ, giá trị trung bình sẽ được biểu diễn ở chính giữa và mỗi phân đoạn ở hai bên thể hiện một độ lệch chuẩn so với giá trị trung bình đó.

Hình ảnh biểu diễn độ lệch chuẩn trên biểu đồ
Hình ảnh biểu diễn độ lệch chuẩn trên biểu đồ

Trong tài chính, độ lệch chuẩn được sử dụng như một phép đo thống kê giúp làm rõ biến động của một khoản đầu tư bằng cách đo lường tỷ suất lợi nhuận hàng năm của khoản đầu tư đó.

Người ta cũng sử dụng độ lệch chuẩn để tính toán biến động của tỷ giá cổ phiếu. Độ lệch chuẩn càng lớn chứng tỏ phương sai giữa giá cổ phiếu tại một thời điểm so với giá trị trung bình của nó càng nhiều. Hay nói cách khác là khoảng giá của cổ phiếu phụ thuộc vào độ lệch chuẩn. Cổ phiếu dễ biến động có độ lệch chuẩn cao nhất, trong khi đó giá trị của cổ phiếu blue-chip ổn định và thường có độ lệch chuẩn khá thấp.

1.2. Độ lệch chuẩn được tính như thế nào?

1.2.1. Công thức tính độ lệch chuẩn

Công thức tính độ lệch chuẩn được minh họa trong hình ảnh sau đây:

Công thức tính độ lệch chuẩn
Công thức tính độ lệch chuẩn

- Trước tiên cộng tất cả các điểm dữ liệu và chia đều cho số điểm dữ liệu để tính giá trị trung bình.

- Sau đó tính phương sai cho mỗi điểm dữ liệu bằng cách lấy giá trị của điểm dữ liệu đó trừ đi giá trị trung bình đã tính ở bước trên. Tiếp theo, tính tổng tất cả các phương sai sau khi đã bình phương mỗi phương sai. Lấy tổng vừa tính chia cho n – 1 trong đó n là số điểm dữ liệu. - Cuối cùng, lấy căn bậc hai của kết của phép chia vừa tìm ra ở bước trên ta sẽ tính được độ lệch chuẩn.

Ví dụ: Tính độ lệch chuẩn của tệp dữ liệu bao gồm 9 điểm dữ liệu sau đây:

{12, 15, 17, 20, 30, 31, 43, 44, 54}

+ Bước 1: Tính tổng các điểm dữ liệu

12 + 15 + 17 + 20 + 30 + 31 + 43 + 44 + 54 = 266

+ Bước 2: Tính bình phương của tổng trên

266^2 = 70756

+ Bước 3: Lấy kết quả chia cho tổng số điểm dữ liệu

70756 / 9 = 7861,777

+ Bước 4: Bình phương giá trị của mỗi điểm dữ liệu, sau đó cộng tổng lại

12^2 + 1562 + 17^2 + 20^2 + 30^2 + 31^2 + 43^2 + 44^2 + 54^2 = 9620

+ Bước 5: Lấy kết quả ở bước 4 trừ đi kết quả ở bước 3

9620 – 7861.777 = 1758,223

+ Bước 6: Chia kết quả ở bước 5 cho n – 1, trong đó n là tổng số điểm dữ liệu

1758,223 / 8 = 219,778

+ Bước 7: Khai căn kết quả ở bước 6 để tính độ lệch chuẩn

√(219,778) = 14,825

1.2.2. Tính độ lệch chuẩn trong Excel

Excel nổi tiếng với các hàm tính giúp bạn tính toán nhanh một giá trị mà không cần phải tính thủ công hay ghi nhớ những công thức phức tạp. Trong số các hàm tính được sử dụng trong Excel, có một hàm tính được sử dụng khi tính độ lệch chuẩn đó là hàm STDEV.

Tính độ lệch chuẩn trong Excel bằng hàm STDEV
Tính độ lệch chuẩn trong Excel bằng hàm STDEV

Cú pháp hàm STDEV như sau:

=STDEV(Number1,[Number2],...)

Trong công thức trên, Number1 là con số bắt buộc phải nhập vào, còn Number 2 có thể nhập vào hoặc không.

2. Sai số chuẩn là gì?

Độ lệch chuẩn được ứng dụng rất phổ biến trong thống kê và phân tích dữ liệu. Nó cho biết mức độ trải rộng của dữ liệu. Thống kê cho thấy có khoảng 95% giá trị của các điểm dữ liệu sẽ nằm trong 2 độ lệch chuẩn so với giá trị trung bình.

Độ lệch chuẩn liên quan đến một giá trị mang tính ứng dụng rất cao đó là sai số chuẩn. Sai số chuẩn được hiểu là độ lệch chuẩn gần đúng của một hay nhiều điểm giá trị. Độ lệch chuẩn được dùng để đánh giá mức độ chính xác của một mẫu đại diện cho toàn bộ dữ liệu.

Sai số chuẩn được tính bằng cách lấy độ lệch chuẩn chia cho căn bậc hai của số cỡ mẫu.

Trong nhiều trường hợp, nếu không tinh ý bạn sẽ rất dễ nhầm lẫn giữa sai số chuẩn và độ lệch chuẩn, bởi lẽ cả sai số chuẩn và độ lệch chuẩn đều là thước đo cho sự trải rộng của dữ liệu. Nhìn chung, hai khái niệm này hầu như tương đồng với nhau. Điểm khác biệt duy nhất đó là độ lệch chuẩn được tính toán từ các tham số, trong khi đó sai số chuẩn được tính toán từ dữ liệu thống kê.

Sai số chuẩn được xác định thông qua độ lệch chuẩn
Sai số chuẩn được xác định thông qua độ lệch chuẩn

Sai số chuẩn biểu thị mức độ sai lệch của mẫu thống kê so với dữ liệu trong thực tế. Nhìn chung, kích thước mẫu mà bạn sử dụng càng lớn thì sai số chuẩn của bạn sẽ càng nhỏ.

3. Độ lệch chuẩn có sự khác biệt như thế nào so với sai số chuẩn?

Độ lệch chuẩn sử dụng để đo mức độ phân tán dữ liệu của một tập dữ liệu. Nhìn vào biểu đồ biểu diễn độ lệch chuẩn, ta sẽ hiểu được số lượng biến thể tiêu chuẩn và mức độ trải rộng của dữ liệu so với giá trị trung bình. Sai số chuẩn xác định dựa trên độ lệch chuẩn và kích thước của mẫu thống kê. Sai số chuẩn biểu thị cho độ chính xác của một mẫu thống kê so với số liệu thực tế. Trong khi độ lệch chuẩn được tính bằng cách khai căn bậc hai của giá trị phương sai, thì sai số chuẩn lại được tính bằng cách lấy độ lệch chuẩn chia cho căn bậc hai của số lượng quan sát trong tập dữ liệu.

Nói tóm lại, khi nhìn vào độ lệch chuẩn, ta sẽ biết được mức độ biến đổi của các điểm dữ liệu trong một tập dữ liệu, trong khi đó, khi nhìn vào sai số chuẩn ta sẽ biết được độ chính xác của ước tính so với thực tế.

Sai số chuẩn biểu thị độ chính xác và đáng tin cậy của một ước tính
Sai số chuẩn biểu thị độ chính xác và đáng tin cậy của một ước tính

Bên cạnh đó, khi tăng kích thước của mẫu quan sát hoặc phân tích sẽ làm giảm sai số chuẩn, trong khi đó độ lệch chuẩn không hề giảm hay tăng mà chỉ dễ dàng tính toán hơn.

Như vậy, qua những thông tin được tổng hợp và chia sẻ trong bài viết, bạn đã hiểu được độ lệch chuẩn là gì, sai số chuẩn là gì và mỗi giá trị trên biểu thị cho điều gì. Độ lệch chuẩn được ứng dụng rất phổ biến để kiểm soát mức độ phân tán của các điểm dữ liệu so với giá trị trung bình của một tập dữ liệu. Sai số chuẩn lại chủ yếu được sử dụng để đánh giá mức độ chính xác và mức độ đáng tin cậy của ước tính. Sai số chuẩn càng nhỏ biểu thị độ chính xác của ước tính càng cao.

Từ khóa » Khái Niệm độ Lệch Chuẩn