Các đại Lượng đo Lường Khuynh Hướng Tập Trung Ppsx - Tài Liệu Text
Có thể bạn quan tâm
- Trang chủ >>
- Giáo Dục - Đào Tạo >>
- Cao đẳng - Đại học
Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (576.69 KB, 12 trang )
1Chương 4. TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNGTHỐNG KÊ MÔ TẢ4.1. Các đại lượng đo lường khuynh hướng tập trung1. Trung bình cộnga. Trường hợp dữ liệu nhận các giá trị rời rạcTrung bình cộng được xác định bằng cách cộng giá trị của các quan sát, sau đó đem chia chotổng số quan sát. Trung bình tổng thểMột tổng thể có quan sát, trung bình cộng được xét theo công thức:=∑Trong đó là trung bình tổng thể;là giá trị quan sát thứ ;là tổng số quan sát (kích thước của tổng thể).Ví dụ: Số liệu tỷ lệ lãi trên vốn (%) của một công ty ghi nhận qua 10 năm như sau:5.26.03.84.57.45.05.26.56.26.4Tỷ lệ lãi vốn trung bình của công ty trong thời kỳ 10 năm được xác định như sau:=5.2+6.0+ +6.410= 5.62(%)Công thức tính trung bình trên trong trường hợp khảo sát cả tổng thể. Trong thực tế, thường takhông thể hoặc không cần nghiên cứu cả tổng thể. Trung bình mẫuMột mẫu có quan sát, trung bình mẫu được tính theo công thức=∑Trong đó là trung bình mẫu;là giá trị quan sát thứ ;là tổng số quan sát (cỡ mẫu hay kích thước của mẫu).Ví dụ: Số ngày nghỉ trong một năm của một mẫu gồm 16 người được chọn ra từ số nhân viêntrong một công ty lớn được ghi nhận như sau:10111215151861014827410612Trung bình mẫu được xác định như sau:2=10+11+ +1216= 10(ngày) Trung bình có trọng sốTrung bình có trọng số là trường hợp đặc biệt của trung bình cộng, khi mỗi giá trị xuấthiện nhiều lần. Khi đó trung bình có trọng số được xác định theo công thức:=∑∗∑Trong đó là trung bình có trọng số;là giá trị quan sát thứ ;là trọng số thứ ,∑= .Ví dụ: Số sản phẩm đạt tiêu chuẩn kỹ thuật trong 60 ngày ở một xưởng ghi nhận được như sau:Sản phẩm đạt tiêu chuẩn kỹ thuật450500600Số ngày202812Sản phẩm đạt tiêu chuẩn kỹ thuật trung bình được xác định theo công thức:=450+500+60020+28+12= 503.3(ngày)b. Trường hợp dữ liệu là các khoảngTrong trường hợp này trung bình cộng được tính một cách xấp xỉ theo công thức=∑∗∑Trong đó là trung bình;là trị số giữa (điểm giữa) của nhóm thứ , được tính bằng cận trên và cậndưới của khoảng đó cộng lại chia 2;là tần số của nhóm thứ ,∑= .Ví dụ: Trong một đợt sản xuất, người ta chọn ngẫu nhiên 50 sản phẩm và ghi nhận trọng lượng.Sản phẩm được phân nhóm theo trọng lượng như sau:Trọng lượng (gam)Trị số giữaSố sản phẩm484-4904875490-49649310496-50249915502-50850513508-5145117Tổng50Trung bình mẫu xác định theo công thức3=487∗5+493∗10+ +511∗750= 499.84( gam)Nhận xét: Trung bình cộng thường rất nhạy cảm với các giá trị đột biến (giá trị quá lớn hoặc quánhỏ), do đó giá trị trung bình sẽ kém tiêu biểu khi dãy số xuất hiện các giá trị đột biến. Tuynhiên, trung bình cộng có thể được sử dụng để so sánh hai hay nhiều tổng thể, như so sánh mứclượng ngày của nhân viên giữa các công ty, so sánh tuổi thọ một loại sản phẩm giữa các nhãnhiệu.2. Trung vị (Median)a. Trường hợp dữ liệu nhận các giá trị rời rạcTrung vị là giá trị đứng ở vị trí giữa trong một dãy số đã được sắp xếp có thứ tự. Trung vị chiadãy số ra thành hai phần bằng nhau: trước và sau trị số trung vị sẽ có 50% quan sát, ký hiệu.Xác định trung vị: Trường hợp lẻ: trước hết giá trị của các quan sát sẽ được sắp xếp theo thứ tự lớn dần,trung vị sẽ là giá trị ở vị trí thứ → =( ). Trường hợp chẵn: trường hợp này trung vị rơi vào giữa hai giá trị và , trungvị quy ước là trung bình cộng của hai giá trị đó = .b. Trường hợp dữ liệu là các khoảngVới dữ liệu đã phân nhóm, trung vị được xác định một cách xấp xỉ qua các bước sau:B1. Tính tần số tích lũy.B2. Xác định nhóm chứa , đó là nhóm có tần số tích lũy ≥ .B3. Áp dụng công thức =( )+ ∗Trong đó( )là giới hạn dưới của nhóm chứa ;là trị số khoảng cách nhóm chứa ;là tần số tích lũy của nhóm đứng trước nhóm chứa ;là tần số của nhóm chứa .Ví dụ: Sử dụng kết quả ví dụ trên ta có4Trọng lượng (gam)Số sản phẩmTần số tích lũy484-49055490-4961015496-5021530502-5081343508-514750Tổng50Nhóm chứa là nhóm (496-502), vì nhóm đó có tần số tích lũy bằng 30 > (50+1)/2Áp dụng công thức ta có= 496+6∗502−1515= 500(gam )Nhận xét: Trung vị là trị số duy nhất có thể được xác định trong một dãy số, là đặc trưng đolường khuynh hướng tập trung không bị ảnh hưởng bởi các giá trị đột biến. Trung vị có thể tínhcho các dữ liệu sử dụng các thang đo tỷ lệ, thang đo khoảng và thang đo thứ bậc.3. Các tứ phân vị, thập phân vịa. Trường hợp dữ liệu nhận các giá trị rời rạcTrong một dãy số đã sắp xếp có thứ tự, các trị số của tứ phân vị sẽ chia dãy số thành bốn phầnbằng nhau.Với mẫu có quan sát, gọi , , lần lượt là tứ phân vị đầu tiên, tứ phân vị thứ hai và tứphân vị thứ ba. Cách xác định các trị số như sau:là giá trị ở vị trí thứ : =( )/;chính là số trung vị;là giá trị ở vị trí thứ( ): =( )/.Ví dụ: Tỷ lệ lãi của các doanh nghiệp sắp xếp từ nhỏ đến lớn(%)8.599.51010.51212.5Ví dụ: Chúng ta có tập dữ liệu với 8 quan sát như sau1112141516171821Xác định giá trị của các tứ phân vịlà giá trị ở vị trí thứ = = 2.25 → phải là một giá trị nằm giữa quan sát thứ 2 vàquan sát thứ 3 theo tọa độ lệch ¼ gần về phía quan sát thứ hai nên ta xác định giá trị như sau:5= 12+0.25∗(14−12)= 12.5là giá trị ở vị trí thứ = =4.5 → phải là một giá trị nằm giữa quan sát thứ 4 vàquan sát thứ 5 nên ta xác định giá trị như sau:=15+162= 15.5là giá trị ở vị trí thứ( )=( )= 6.75 → phải là một giá trị nằm giữa quan sát thứ 6và quan sát thứ 7 theo tọa độ lệch 3/4 gần về phía quan sát thứ sáu nên ta xác định giá trị nhưsau:= 17+0.75∗(18−17)= 17.75b. Trường hợp dữ liệu là các khoảngTứ phân vị thứ nhất =( )+ ∗Trong đó( )là giới hạn dưới của nhóm chứa ;là trị số khoảng cách nhóm chứa ;là tần số tích lũy của nhóm đứng trước nhóm chứa ;là tần số của nhóm chứa .Tứ phân vị thứ ba =( )+ ∗Trong đó( )là giới hạn dưới của nhóm chứa ;là trị số khoảng cách nhóm chứa ;là tần số tích lũy của nhóm đứng trước nhóm chứa ;là tần số của nhóm chứa .Đồ thị hình hộp là phương pháp mô tả và tổng hợp các số liệu mẫu bằng đồ thị, trên đó phảnánh được cùng một lúc cả các đặc trưng về xu hướng trung tâm cũng như độ phân tán của các giátrị mẫu.Để xây dựng đồ thị hình hộp người ta thường sử dụng các thống kê đặc trưng mẫu là trung vị,các tứ phân vị , và các giá trị và của phân phối mẫu. Nó có dạng như hình sau6Đặc biệt khi có nhiều mẫu rút ra từ các tổng thể nghiên cứu mà chúng lại có các thống kê đặctrưng khác nhau thì việc vẽ đồng thời đồ thị hình hộp của các mẫu đó lên cùng một mặt phẳng sẽcho phép so sánh trực quan các mẫu, từ đó có được có được những nhận xét sơ bộ về sự khácbiệt của các tổng thể nghiên cứu tương ứng.Ví dụ: Bảng số liệu về doanh thuDoanh thu(triệu đồng)Cửa hàng ( )Tần số tích lũy200-40088400-5001220500-6002545600-8002570800-1000979Tổng79Tứ phân vị thứ nhất chứa trong tổ có tần số tích lũy bằng = = 20= 400+100∗794−812= 497.92(triệuđồng)Tứ phân vị thứ ba chứa trong tổ có tần số tích lũy bằng( )=( )= 60= 600+200∗3∗794−4525= 714(triệuđồng)Thập phân vị: trong thực tế đôi khi người ta cũng có nhu cầu chia các đơn vị trong dãy số lượngbiến thành 10 phần đều nhau và ta có thập phân vị. Cách tính thập phân vị cũng tương tự nhưcách tính tứ phân vị. Ta có công thức=( )+ ∗10−=( )+ ∗2∗10−…Tứ phân vị, thập phân vị được sử dụng trong thực tế khi người ta muốn biết mức đạt cao nhất1/10 hay ¼ số đơn vị xếp từ thấp lên hoặc mức đạt thấp nhất của 1/10 hay ¼ số đơn vị xếp từ caoxuống.74. Số yếu vị (mode)a. Trường hợp dữ liệu nhận các giá trị rời rạcMode là giá trị xuất hiện nhiều nhất trong một dãy số, ký hiệu là .Ví dụ: Chọn ngẫu nhiên 50 trang của một quyển sách giáo khoa, số lỗi ghi nhận được trên cáctrang như sauSố lỗi01234Số trang1218875Căn cứ vào định nghĩa ta có = 1.b. Trường hợp dữ liệu là các khoảng Trường hợp số liệu phân nhóm có khoảng cách bằng nhau, trị số của Mode được xácđịnh một cách gần đúng theo công thức=( )+ ∗−(−)+(−)Trong đó( )là giới hạn dưới của nhóm chứa ;là trị số khoảng cách nhóm chứa ;, , lần lượt là tần số của nhóm đứng trước, nhóm chứa và nhómđứng sau nhóm chứa .Ví dụ: Theo ví dụ trên ta cóTrọng lượng (gam)Số sản phẩm484-4905490-49610496-50215502-50813508-5147Tổng50Nhóm chứa Mode là nhóm (496-502) do có tần số lớn nhất, nên được xác định theo côngthức= 496+6∗15−10(15−10)+(15−13)= 500.3(gam) Trường hợp số liệu phân nhóm có khoảng cách không đều nhau, trị số Mode được xácđịnh vẫn theo công thức ở trên, nhưng việc xác định tổ chứa Mode không căn cứ vào tầnsố mà căn cứ vào mật độ phân phối (tỷ số giữa các tần số với khoảng cách tổ tương ứng).8Ví dụ: Có tài liệu về doanh thu của 79 cửa hàng tháng 5/ 2009 như sau:Doanh thu(triệu đồng)Cửa hàng ( )Khoảng cách tổ ( )Mật độ phân phối tổ( = / )200-40082000.04400-500121000.12500-600251000.25600-800252000.125800-100092000.045Tổng79Theo tài liệu bảng trên, ta xác định Mode ở vào tổ (500-600) vì có mật độ phân phối tổ lớn nhất= 500+100∗0.25−0.12(0.25−0.12)+(0.25−0.125)= 550.9( triệuđồng)Như vậy đa số các cửa hàng có mức doanh thu trong tháng 5/2009 khoảng 550.9 triệu đồng.Nhận xét: Mode có ưu điểm là không chịu ảnh hưởng của các lượng biến đột xuất, nhưng cũngchính điều này làm cho Mode kém nhạy bén với sự biến thiên của dữ liệu. Trong thực tế, Modecó ứng dụng rõ ràng nhất là để nghiên cứu nhu cầu của thị trường về một loại kích cỡ sản phẩmnào đó như giày dép, nón mũ, quần áo…Mode là giá trị đo lường độ tập trung không bị ảnh hưởng bởi các giá trị đột biến. Mode có thểxác định cho dữ liệu sử dụng các thang đo khác nhau như thang đo định danh, thang đo thứ bậc.Khác với trung bình và trung vị, một tập dữ liệu có thể không xác định được trị số Mode vìkhông có giá trị nào xuất hiện nhiều nhất; ngược lại, trong một số trường hợp sẽ có hiện tượngnhiều Mode nếu số quan sát có khuynh hướng tập trung vào một vài giá trị.4.2. Các đặc trưng đo lường khuynh hướng phân tán1. Khoảng biến thiênKhoảng biến thiên là sai biệt giữa giá trị lớn nhất và giá trị nhỏ nhất= −Trong đó là khoảng biến thiên;là giá trị lớn nhất;là giá trị nhỏ nhất.Khoảng biến thiên tính toán một cách dễ đàng. Tuy nhiên, nhược điểm của số đo này chỉ tùythuộc vào hai giá trị và vì vậy khoảng biến thiên chưa phản ánh một cách đầy đủ độphân tán của tất cả các quan sát.9Ví dụ: Có hai tổ công nhân, mỗi tố có 5 người với các mức năng suất lao động như sau (Kg)Tổ 1: 200; 250; 300; 350; 400.Tổ 2: 280; 290; 300; 310; 320.Năng suất lao động trung bình của mỗi tổ đều là 300 Kg. Tuy nhiên các mức năng suất lao độngtrong tổ 1 chênh lệch nhiều hơn so với tổ hai, nên số trung bình của tổ 1 kém đại diện hơn so vớitổ hai.Ta có khoảng biến thiên về năng suất lao động= 400−200 = 200(Kg); = 320−280 = 40( Kg)> có nghĩa là các mức năng suất lao động trong tổ 1 biến thiên nhiều hơn trong tổ 2, do đósố trung bình trong tổ 2 đại diện tốt hơn so với tổ 1.2. Độ trải giữaĐộ trải giữa là sai biệt giữa tứ phân vị thứ ba và tứ phân vị đầu tiên, thể hiện độ phân tán của50% dữ liệu ở giữa của dãy số= −Ví dụ: Có tài liệu về tiền lương của hai tổ công nhân, mỗi tổ có 11 người được cho trong bảngsau (triệu đồng)Tổ 10.91.21.51.82.12.42.73.03.33.63.9Tổ 21.92.02.12.22.32.42.52.62.72.82.9Tổ 1 có = 3.3−1.5 = 1.8(triệu đồng)Tổ 2 có = 2.7−2.1 = 0.6 (triệu đồng)Độ trải giữa của tổ 1 lớn hơn độ trải giữa của tổ 2, nghĩa là các mức lương trong tổ 1 biến thiênnhiều hơn trong tổ 2.3. Phương saiPhương sai là số trung bình của bình phương các độ lệch giữa các lượng biến và số trung bìnhcủa các lượng biến đó.Phương sai mẫu hiệu chỉnh được sử dụng nhiều nhất trong thống kê suy diễn như ước lượng vàkiểm định giả thuyết… Do đó, trong các chương sau khi nói đến phương sai mẫu là ta đề cập đếnphương sai mẫu hiệu chỉnh.10=∑( − ̅)−1Hoặc=∑( − ̅) ∗∑−14. Độ lệch chuẩnĐộ lệch tiêu chuẩn là căn bậc hai của phương sai, thể hiện độ lệch trung bình của tất cả các quansát so với giá trị trung bình. Đặc trưng này có thể được sử dụng để so sánh độ phân tán của haihay nhiều tổng thể, trong trường hợp đơn vị tính là giống nhau hoặc giá trị trung bình là bằngnhau.4.3. Sử dụng kết hợp trung bình và độ lệch tiêu chuẩn1. Hệ số biến thiênNếu hai tập dữ liệu có cùng giá trị trung bình, tập dữ liệu nào có độ lệch chuẩn lớn hơn sẽ biếnthiên nhiều hơn. Tuy nhiên, nếu hai tập dữ liệu có trị trung bình khác nhau thì không thể kết luậnđược điều này bằng cách so sánh trực tiếp hai độ lệch chuẩn. Lúc đó hệ số biến thiên được sửdụng để đo lường mức độ biến động tương đối của những tập dữ liệu có trị trung bình khác nhau.Hệ số biến thiên đo lường độ phân tán của dãy số tính một cách tương đối, được xác định bằngcách so sánh độ lệch chuẩn với trung bình số học.Hệ số biến thiên được xác định theo công thức = ∗100%Ví dụ: Trong ngành tài chính, hệ số biến thiên hay được sử dụng để đo mức độ rủi ro tương đốicủa các danh mục vốn đầu tư.Chẳng hạn, một nhà kinh doanh trên thị trường chứng khoán xem xét hai danh mục đầu tư. Danhmục A bao gồm các khoản đầu tư có lợi nhuận trung bình 16% với độ lệch chuẩn là 4%. Danhmục B bao gồm các khoản đầu tư có lợi nhuận trung bình 9% với độ lệch chuẩn là 3%.Chúng ta có thể tính giá trị cho mỗi danh mục đầu tư như sau=416∗100% = 25%; =39∗100% = 33%.Mặc dù, danh mục đầu tư B có độ lệch chuẩn bé hơn (khiến ta có cảm giác lợi nhuận ít bị biếnđộng hơn), nhưng thực ra xem xét giá trị lại cho kết luận danh mục B biến thiên nhiều hơndanh mục A.11Ngoài ra, hệ số biến thiên cũng hữu dụng khi so sánh hai tập dữ liệu có đơn vị khác nhau vì hệ sốbiến thiên độc lập với đơn vị đo lường và được tính bằng %.2. Quy tắc thực nghiệmNếu dữ liệu có phân phối hình chuông cân đối, thì có một quy tắc thực nghiệm như sau: Có khoảng 68% số quan sát của tổng thể hoặc mẫu sẽ tập trung trong phạm vi 1 so vớitrị trung bình. Có khoảng 95% số quan sát của tổng thể hoặc mẫu sẽ tập trung trong phạm vi 2 so vớitrị trung bình. Có khoảng 99.7% số quan sát của tổng thể hoặc mẫu sẽ tập trung trong phạm vi 3 sovới trị trung bình.Chú ý là với những tập dữ liệu mà phân phối không phải là hình chuông cân đối chúng ta khôngsử dụng quy tắc thực nghiệm này.3. Chuẩn hóa dữ liệuKhi làm việc với dữ liệu số lượng, sẽ có lúc bạn cần biến đổi chúng thành dữ liệu ở một thang đochuẩn, chẳng hạn nếu bạn muốn so sánh các đối tượng được đo lường bằng những phương phápđo hay đơn vị đo khác nhau, việc làm này gọi là chuẩn hóa dữ liệu.Giá trị dữ liệu đã chuẩn hóa sẽ cho biết một giá trị quan sát trong tập dữ liệu gốc, lệch khỏi trungbình của nó mấy lần độ lệch chuẩn. Điều này thể hiện theo công thức sau đây: Công thức tính giá trị chuẩn hóa cho dữ liệu tổng thể =Trong đó là giá trị dữ liệu gốc;là trung bình tổng thể;là độ lệch chuẩn của tổng thể;là điểm số chuẩn hóa cho biết cách xa trung bình một khoảng bằng mấy lầnđộ lệch chuẩn. Công thức tính giá trị chuẩn hóa cho dữ liệu mẫu =̅Trong đó là giá trị dữ liệu gốc;̅ là trung bình mẫu;là độ lệch chuẩn của mẫu;là điểm số chuẩn hóa cho biết cách xa trung bình một khoảng bằng mấy lầnđộ lệch chuẩn.Một giá trị tiến gần đến 0 có nghĩa là quan sát đó ở vị trí rất gần trung bình. Một giá trị bằng-1 có nghĩa là quan sát thực tế đó ở vị trí lệch một độ lệch chuẩn so với trung bình về phía trái;và bằng +1 có nghĩa là quan sát thực tế đó ở vị trí lệch một độ lệch chuẩn so với trung bình vềphía phải.124.4. Khảo sát hình dạng phân phối của tập dữ liệuDựa vào số trung bình, trung vị và Mode, ta có thể biết được hình dáng phân phối của dãy số.1. Phân phối cân đốiPhân phối đối xứng khi = =2. Phân phối lệchPhân phối lệch phải khi > > .Phân phối lệch trái khi < < .
Tài liệu liên quan
- LƯU Ý VỀ TÍNH CHẤT HỮU HƯỚNG CỦA CÁC ĐẠI LƯỢNG VẬT LÝ KHI GIẢNG DẠY VÀ BỒI DƯỠNG HỌC SINH GIỎI.
- 11
- 942
- 6
- Sai số của phép đo các đại lượng vật lí 2
- 18
- 967
- 6
- H2A.VL10_Sai so cua cac phep do cac dai luong VL
- 14
- 504
- 0
- Bài tập trắc nghiệm xác định các đại lượng đặc trưng của sóng
- 8
- 1
- 3
- Luận văn thực trạng hoạt động giết mổ gia súc, gia cầm và đề xuất giải pháp quản lý, quy hoạch các cơ sở giết mổ theo hướng tập trung trên địa bàn thành phố thanh hoá, tỉnh thanh hoá
- 108
- 3
- 23
- Tài liệu Câu hỏi ôn tập chương 9: Đo các đại lượng vật lý khác pdf
- 27
- 951
- 0
- Tài liệu Đo và ghi các đại lượng biến thiên_chương 14 pdf
- 13
- 290
- 0
- Tài liệu Đo các đại lượng cơ học_chương 16 doc
- 32
- 352
- 1
- Tài liệu CHƯƠNG 9: ĐO CÁC ĐẠI LƯỢNG VẬT LÝ KHÁC pdf
- 27
- 536
- 2
- Chương 11: Đo các đại lượng cơ học - Kỹ thuật đo lường
- 77
- 757
- 0
Tài liệu bạn tìm kiếm đã sẵn sàng tải về
(576.69 KB - 12 trang) - Các đại lượng đo lường khuynh hướng tập trung ppsx Tải bản đầy đủ ngay ×Từ khóa » đại Lượng Rất Nhạy Với Các Giá Trị Quá Lớn Hoặc Quá Nhỏ
-
Chương 1. THHNG KÊ MÔ T
-
Top 14 đại Lượng Rất Nhạy Với Các Giá Trị Quá Lớn Hoặc Quá Nhỏ Trong ...
-
Top 15 đại Lượng Rất Nhạy Với Các Giá Trị Quá Lớn Hoặc Quá Nhỏ
-
Thống Kê ứng Dụng Chương 1 - SlideShare
-
Thống Kê Mô Tả Trong Nghiên Cứu – Các đại Lượng Về độ Phân Tán
-
Câu Hỏi đúng Sai Nguyên Lý Thống Kê - Tiêu Thức Thay Phiên Chỉ Có Thể ...
-
[PDF] LÝ THUYẾT THỐNG KÊ - Trường Đại Học Kinh Tế Quốc Dân
-
Số Bình Quân – Wikipedia Tiếng Việt
-
[PDF] CHƯƠNG 4
-
[PDF] BÀI 2 MÔ TẢ DỮ LIỆU THỐNG KÊ - Topica
-
[PDF] BÀI 3: NGHIÊN CỨU THỐNG KÊ CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG ...
-
Khái Niệm Cơ Bản Về Đo Lường - Cal-group
-
[PDF] MÔ TẢ CÁC TẬP DỮ LIỆU
-
[PDF] ThS. Phan Ngọc Bảo Anh - BỘ MÔN LUẬT