Ý Nghĩa Của Sai Số Chuẩn Tương đối

Trong lý thuyết xác suất và thống kê, hệ số biến thiên (CV), cũng được biết tới như là độ lệch chuẩn tương đối (Relative Standard Deviation) (RSD), là một phép đo chuẩn cho sự phân tán của phân phối xác suất hoặc phân phối tần suất.

Nội dung chính Show
  • 1. Sai số chuẩn – Standard error
  • 2. Ý nghĩa của độ lệch chuẩn (SD) và sai số chuẩn (SE)
  • Video liên quan

Độ lệch chuẩn tương đối, RSD được định nghĩa và cho bởi hàm xác suất sau:

Công thức

\({100 \times \frac{s}{\bar x}}\)

Với –

  • \({s}\) = độ lệch chuẩn mẫu
  • \({\bar x}\) =giá trị trung bình mẫu

Ví dụ

Câu hỏi:

Tìm RSD cho tập các số sau: 49, 51.3, 52.7, 55.8 với độ lệch chuẩn là 2.8437065.

Lời giải:

Bước 1 – Độ lệch chuẩn của mẫu: 2.8437065 (hoặc 2.84, làm tròn tới 2 chữ số sau thập phân).

Bước 2 – Nhân bước 1 với 100. Tạm giữ nguyên giá trị này để dùng sau.

\({2.84 \times 100 = 284}\)

Bước 3 – Tìm trung bình mẫu, \({\bar x}\). Trung bình mẫu bằng:

\({\frac{(49 + 51.3 + 52.7 + 55.8)}{4} = \frac{208.8}{4} = 52.2.}\)

Bước 4 – Chia giá trị có được từ bước 2 cho giá trị tuyệt đối từ bước 3.

\({\frac{284}{|52.2|} = 5.44.} \)

RSD sẽ là:

\({52.2 \pm 5.4}\)

Lưu ý rằng RSD được diễn giải dưới dạng phần trăm.

Ý nghĩa của sai số tuyệt đốiMặt khác không thể dùng sai số tuyệt đối để so sánh độchính xác của các phân tích mà kết quả được biểu diễnvới các đơn vị đo khác nhau.VD3: Mẫu phân tích 1 có x1= 40 mg, dx = 0,1 mgMẫu phân tích 2 có x2 = 20,00%, dx = 0,05%Vì vậy để đánh giá tốt hơn độ chính xác và để có thể sosánh các kết quả phân tích biểu diễn bằng các đơn vịkhác nhau ta dùng sai số tương đối. Biểu diễn kết quả phân tích và sai sốSai số tương đối: e%e% = (dx/µ ). 100%hoặc e% = (dx/ x ). 100%µ : giá trị thựcx : giá trị trung bình.Sai số tương đối phản ánh độ chính xác của các phép phân tích cácchỉ tiêu khác nhau, bằng các phương pháp khác nhau.VD2: Khi xác định mẫu chứa 60% SiO2 và 1 mẫu khác chúa 0,1% Asđều mắc sai số tuyệt đối dx=0,05%. Ở đây không thể coi việc xácđịnh As và SiO2 có độ chính xác như nhau.Sai số tương đối xác định SiO2 là: e% =(0,05/60)*100 = 0,083%Sai số tương đối xác định As là:e% =(0,05/0,1)*100 = 50 %Như vậy: việc phân tích SiO2 có độ chính xác cao hơn rất nhiều so với 2. Lí thuyết về sai số:-Khi phân tích một chỉ tiêu có thể tiến hành nhiều công đoạn,mỗi công đoạn đều mắc sai số, kết quả phân tích cuối cùngmang sai số của các công đoạn đó.-Tùy hàm quan hệ giữa các kết quả phân tích của từng côngđoạn với kết quả cuối cùng ( tổng, tích, mũ…) sẽ có biểuthức tính dx, e% tương ứng. 2. Lí thuyết về sai số:- Ví dụ: Khi cân một mẫu, trước tiên cân bì(x1)rồi cân bì+ mẫu (x2)khối lượng của mẫu y =x2 – x1.Nếu sai số của cân là dx thì mỗi lần cân có thể sai dx (g).Vì kết quả cuối cùng là hàm tổng y = x2 - x1 nên+ sai số tyệt đối dy = dx1 + dx2+ và sai số tương đối ey% = (dy/y)*100.Sai số của từng lần cân chính là sai số của cân dx nên:dy = dx + dx =2dxvà→e % = [2dx/(x –x )]. 100% Bài toán tính sai số cân và tính khối lượng cân tối thiểua. Cân 0,5 gam mẫu bằng cân phân tích có sai số dx=0,1 mg.Tính sai số của phép cân.+ Với phép cân trừ bì sẽ mắc hai lần sai số, tức dy=2dxVậy sai số của phép cân là:ey% = [2dx/µ]. 100% = [2*0,1*10-3/0,5]*100% = 0,04%.b. Tính lượng cân tối thiểu của mẫu khi cân bằng cân phân tíchcó sai số 0,1 mg để sai số phép cân không vượt quá sai sốcho phép 0,1%.+ e% ≤ 0,1 ; dx = 0,1 mg tức sai số phép cân là dy=2dxe% = (2dx/µ)*100⇒ µ = 2dx*100/e = 2*0,1*10-3*100/0,1 = 0,2 gam. 3. Độ hội tụ, độ đúng, độ tin cậy- Độ hội tụ (độ lặp lại): phân tích một chỉ tiêu bằng mộtphương pháp nhiều lần nhắc lại, kết quả từng lần nhắclại giao động xung quanh giá trị trung bình một khoảngnhỏ → độ hội tụ cao- Khoảng giá trị mà các kết quả phân tích xi phân bố gọi làđộ hội tụ của phép phân tích, khoảng này càng nhỏ, độhội tụ càng cao.-Độ đúng: là sự sai lệch giữa giá trị thực nghiệm (kết quảPT) với giá trị thực.-Sai lệch càng nhỏ độ đúng càng cao. 3. Độ hội tụ, độ đúng, độ tin cậy- Độ tin cậy: là chỉ tiêu kết hợp độ hội tụ và độ đúngTrong phân tích mẫu, hầu hết các mẫu không có trướcgiá trị thực, nên chưa khẳng định được kết quả phân tíchcó đạt độ đúng cao hay không. Vì vậy thường chọnphương pháp có độ hội tụ cao mặc dù độ đúng có thểchưa cao. 4. Tính toán sai số hệ thống do phương pháp- Sai số do phản ứng không hoàn toànKhi phản ứng xảy ra đạt trạng thái cân bằng làm cho phảnứng không hoàn toàn :[AB]A+BABKcb =[A].[B]Trong dung dịch còn lại lượng nhỏ chất cần xác định chưap.ứng hết gây ra sai:e% =[A].VcbCoA.Vo*100(CoA và [A] là nồng độ ban đầu và tại trạng thái cân bằng của A)Sai số càng nhỏ khi [A] càng nhỏ tức Kcb càng lớn. Vậy khi phản ứnghoàn toàn, sai số hệ thống càng nhỏ. 4. Tính toán sai số hệ thống do phương pháp- Sai số do chỉ thị đổi mầu không đúng điểm tươngđươngChỉ thị đổi màu không đúng điểm tương đương làm cho phépchuẩn độ bị dừng trước hoặc sau điểm tương đương gâysai số hệ thống.+ Sai số âm: Nếu thiếu dung dịch tiêu chuẩn (dư dung dịchphân tích)+ Sai số dương: Nếu dư dung dịch tiêu chuẩn .Biểu thức tính sai số do chỉ thị gây nên:e% = {(Vkt – Vtd) / Vtd}.100% Bài tậpBài 1: Chuẩn độ 10 ml dd NaOH 0,1N bằng dd tiêuchuẩn HCl 1N bằng chỉ thị metyl dacam (pH chuyểnmàu là 4). Tính sai số của phép chuẩn độ.Bài 2: Cân 0,87 g mẫu bằng cân phân tích có sai sốdx=0,1mg. Vẫn lượng mẫu đó cân bằng cân kĩ thuậtcó sai số dx=1mg. Tính sai số của các phép cân.Bài 3: Sai số cho phép trong phân tích là ≤ 0,1%. Đểcân 0,22 gam mẫu thì nên dùng cân nào? Bài tậpBài 1: Chuẩn độ 10 ml dd NaOH 0,1N bằng dd tiêuchuẩn HCl 1N bằng chỉ thị metyl dacam (pH chuyểnmàu là 4). Tính sai số của phép chuẩn độ.Bài 2: Cân 0,87 g mẫu bằng cân phân tích có sai sốdx=0,1mg. Vẫn lượng mẫu đó cân bằng cân kĩ thuậtcó sai số dx=1mg. Tính sai số của các phép cân.Bài 3: Sai số cho phép trong phân tích là ≤ 0,1%. Đểcân 0,22 gam mẫu thì nên dùng cân nào?

Trong các tạp chí khoa học, chúng ta thường thấy những kí hiệu dạng x ± y, trong đó x là số trung bình, còn y thì có khi là độ lệch chuẩn (standard deviation – SD), đôi khi là sai số chuẩn (standard error – SE) hoặc SEM (standard error of the mean). Cách trình bày này thông dụng đến nỗi một số chuyên gia và các ban biên tập phải lên tiếng khuyến cáo (đưa ra quy ước chung). Theo đó:

  • Nếu biến tuân theo luật phân phối chuẩn các nhà nghiên cứu nên theo cách trình bày số trung bình và kèm độ lệch chuẩn (không phải sai số chuẩn;
  • Ngược lại, nếu biến không tuân theo luật phân phối chuẩn, nên trình bày số trung vị và số ở vị trí 25% và 75% (tức là interquartile range).

Để hiểu qui ước này, chúng ta cần phải tìm hiểu ý nghĩa của độ lệch chuẩn và sai số chuẩn. Đây là điều cần thiết, bởi hầu hết sách giáo khoa thống kê đều không giải rõ những khác biệt về ý nghĩa của hai chỉ số thống kê này.

1. Sai số chuẩn – Standard error

Công thức tính sai số chuẩn (kí hiệu bằng SE – viết tắt từ standard error) rất đơn giản: lấy độ lệch chuẩn chia cho căn số bậc hai của số cỡ mẫu (n), \(SE = \frac{s}{{\sqrt n }}\)

Nguyên lí và mục đích đằng sau của thống kê học là ước tính những thông số của một quần thể (population). Trong thực tế chúng ta không biết các thông số này, mà chỉ dựa vào những ước tính từ một hay nhiều mẫu để suy luận cho giá trị của quần thể mà các mẫu được chọn. Chẳng hạn như chúng ta không biết chiều cao của người Việt là bao nhiêu (bởi vì đâu có ai đo lường chiều cao của gần 90 triệu dân); chúng ta phải chọn một mẫu gồm n đối tượng để tính trị số trung bình của mẫu này, và dùng trị số trung bình của mẫu để suy luận cho toàn dân số.

Nhưng chọn mẫu phải ngẫu nhiên thì mới mang tính đại diện cao. Cứ mỗi lần chọn mẫu, chúng ta có một nhóm đối tượng khác. Và, cứ mỗi mẫu, chúng ta có một số trung bình mới. Câu hỏi đặt ra là: nếu chọn mẫu nhiều lần (“nhiều” ở đây có nghĩa là hàng triệu hay tỉ lần) thì các số trung bình này dao động cỡ nào.

Nếu chúng ta chọn mẫu N lần, mỗi lần với n đối tượng thì chúng ta sẽ có N số trung bình. Độ lệch chuẩn của N số trung bình này chính là sai số chuẩn. Lưu ý, N ở đây là hàng triệu hay tỉ lần. Do đó, sai số chuẩn phản ảnh độ dao động hay biến thiên của các số trung bình mẫu (sample averages).

Tuy nhiên, không có cái gọi là “standard error of the mean”, mà chỉ có “standard deviation of the means”. Chữ means có “s” là số nhiều vì tính từ nhiều số trung bình. Thay vì gọi dài dòng là standard deviation of the means, người ta gọi ngắn gọn bằng một thuật ngữ mới: standard error.

2. Ý nghĩa của độ lệch chuẩn (SD) và sai số chuẩn (SE)

Gọi thông số trung bình của một quần thể là \(\mu \) (chúng ta không biết giá trị thật của \(\mu \)). Chúng ta có thể ước lượng gián tiếp \(\mu \) qua số trung bình của mẫu là \({\bar x}\) và độ lệch chuẩn của mẫu là s. Theo lí thuyết xác suất của phân phối chuẩn (dựa theo độ lệch chuẩn – SD), chúng ta có thể phát biểu rằng:

  • 68% quan sát trong tổng thể đó có giá trị từ \({\bar x}\) ─ s đến \({\bar x}\) + s;
  • 95% quan sát trong tổng thể đó có giá trị từ \({\bar x}\) ─ 1.96*s đến \({\bar x}\) + 1.96*s ;
  • 99% quan sát trong tổng thể đó có giá trị từ \({\bar x}\) ─ 3*s đến \({\bar x}\) + 3*s.

Nếu gọi theo sai số chuẩn – SE, chúng ta có thể phát biểu rằng:

  • 68% số trung bình từ mẫu có giá trị từ \({\bar x}\) ─ SE đến \({\bar x}\) + SE;
  • 95% số trung bình từ mẫu có giá trị từ \({\bar x}\) ─ 1.96*SE đến \({\bar x}\) + 1.96*SE ;
  • 99% số trung bình từ mẫu có giá trị từ \({\bar x}\) ─ 3*SE đến \({\bar x}\) + 3*SE.

KẾT LUẬN VỀ ĐỘ LỆCH CHUẨN vs SAI SỐ CHUẨN

  • Độ lệch chuẩn – SD phản ánh độ biến thiên của các quan sát trong một tổng thể.
  • Sai số chuẩn – SE phản ánh độ dao động của các số trung bình mẫu được chọn từ tổng thể.
  • Sai số chuẩn – SE không cung cấp thông tin về độ biến thiên của một tổng thể mà chỉ mô tả dự dao động của các số trung bình mẫu.
  • Sai số chuẩn – SE thấp hơn độ lệch chuẩn, bởi vì nó chính bằng độ lệch chuẩn chia cho căn bậc 2 của cở mẫu.

Bài viết này được tổng hợp từ bài viết “Độ lệch chuẩn hay sai số chuẩn?” của Nguyễn Văn Tuấn trong chuyên đề Lâm sàng thống kê tại: ykhoa.net

Bài liên quan

Từ khóa » Cách Tính Sd Và Rsd