Phương Pháp Chọn Mẫu Và Xác định Cỡ Mẫu - Tài Liệu Text - 123doc

Tải bản đầy đủ (.pdf) (27 trang)
  1. Trang chủ
  2. >>
  3. Luận Văn - Báo Cáo
  4. >>
  5. Thạc sĩ - Cao học
Phương pháp chọn mẫu và xác định cỡ mẫu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 27 trang )

Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Bài 6. Phương pháp chọn mẫu và xác định cỡ mẫuGiới thiệu chươngChương này tập trung vào chủ đề chọn mẫu và xác định cỡ mẫu cho nghiên cứu. Nộidung đầu tiên được thảo luận là bản chất của việc chọn mẫu và lý do mà ta phải chọn mẫutrong quá trình nghiên cứu và các tính chất mà một mẫu tốt cần có. Nội dung kế tiếp trìnhbày về các đặc điểm thể hiện tính đúng đắn và tính chính xác để đo lường mức độ hiệulực của mẫu. Sau đó, chương hướng dẫn các nguyên tắc cần thiết khi phát triển một kếhoạch chọn mẫu, chỉ ra hai nhóm kỹ thuật chọn mẫu và các phương pháp cụ thể. Phầncuối của chương tập trung vào hai phương pháp xác định cỡ mẫu là xác định theo giá trịtrung bình và theo giá trị tỷ lệ.1. BẢN CHẤT CỦA VIỆC CHỌN MẪUChọn mẫu (sampling) là việc chọn lấy một số phần tử của một dân số (population), và từđó, có thể rút ra các kết luận về chính dân số đó. Điều này có nghĩa là khi nghiên cứu mộtdân số mục tiêu nào đó, ta không nghiên cứu toàn bộ dân số mà chỉ một bộ phận của dânsố, và cách thức mà ta chọn ra bộ phận đó, chính là chọn mẫu.Mẫu sẽ bao gồm một số phần tử của dân số. Một phần tử của dân số (population element)là một cá thể của đối tượng nghiên cứu hoặc một cá nhân người tham gia nghiên cứu mànhà nghiên cứu sẽ tiến hành các đo lường. Đây chính là đơn vị nghiên cứu (unit of study).Như vậy, nói ngược lại, một dân số bao gồm tất cả các phần tử của dân số mà ta muốnnghiên cứu.Thông thường ta không thực hiện nghiên cứu trên toàn bộ phần tử của dân số. Tuy nhiên,ở cấp độ quốc gia, đôi khi các nhà nghiên cứu vẫn tiến hành điều tra tổng thể. Một điềutra tổng thể (census) là một nghiên cứu thực hiện trên tất cả mọi phần tử của dân số.Khi chọn mẫu, thường ta phải dựa vào khung mẫu. Khung mẫu (sample frame) là mộtdanh sách chưa đựng các thông tin cơ bản của tất cả các đơn vị nghiên cứu (phần tử củadân số) mà dựa vào đó chúng ta rút ra mẫu. Khi chuẩn bị chọn mẫu nghiên cứu ta cầnluôn lưu ý là có thể tìm được khung mẫu hay không.1.1 Tại sao phải lấy mẫu?Khi thực hiện nghiên cứu, chúng ta rất hiếm khi điều tra tổng thể, vì lý do cơ bản là hếtsức tốn kém và tốn rất nhiều thời gian, công sức. Trong khi đó, nếu chúng ta chỉ điều tramẫu, thì có nhiều lợi thế. Thứ nhất, dĩ nhiên là chi phí nghiên cứu thấp. Thứ hai, ta có thểđạt tốc độ thu thập dữ liệu nhanh mà vẫn đạt được mức chính xác cần có của kết quả.Cuối cùng là ta có thể dễ dàng có được các đơn vị nghiên cứu sẵn có cho nghiên cứu.1Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Chọn mẫu cho phép có chi phí nghiên cứu thấp. Rõ ràng là điều tra nghiên cứu trên mộtmẫu nào đó của dân số sẽ có lợi thế về chi phí nhiều hơn là điều tra tổng thể. Điều này làhiển nhiên.Chọn mẫu đúng cách vẫn cho phép ta đạt được mức chính xác cần có của kết quả. Thậmchí chất lượng của một nghiên cứu thực hiện điều tra chọn mẫu hoặc nghiên cứu trên mẫuvẫn thường đạt kết quả tốt hơn so với thực hiện điều tra tổng thể hoặc nghiên cứu tổng thểvì nhà nghiên cứu có thể phỏng vấn tốt hơn, điều tra nhiều hơn, sâu hơn về các thông tinnghi ngờ, sai sót và xử lý thông tin tốt hơn. Chỉ khi nào dân số nghiên cứu quá nhỏ, dễtiếp cận, và biến động nhiều thì điều tra tổng thể mới có thể đạt độ chính xác cao hơn điềutra mẫu.Chọn mẫu cho phép ta đạt tốc độ thu thập dữ liệu cao hơn. Tốc độ thực hiện nhanh giúplàm giảm thời gian giữa giai đoạn chuẩn bị các thông tin cần thiết và giai đoạn thu thậpthông tin. Tốc độ thu thập dữ liệu cao cũng có nghĩa là ta có thể hoàn thành việc nghiêncứu sớm trong phạm vi giới hạn thời gian cho trước.Tính sẵn có của các phần tử dân số cũng là lợi thế của chọn mẫu. Thông thường, một sốphần tử dân số luôn có sẵn, và chúng ta có thể chọn lựa để thực hiện lấy mẫu để điều tra,nghiên cứu.Nếu phải so sánh hiệu quả giữa nghiên cứu chọn mẫu và điều tra tổng thể, ta thấy lợi thếcủa điều tra mẫu so với điều tra tổng thể sẽ mất đi nếu dân số nhỏ và có tính biến độngcao. Có hai điều kiện làm cho việc nghiên cứu tổng thể phù hợp hơn: (1) có tính khả thikhi dân số nhỏ và (2) cần thiết khi mà mỗi cá thể đều rất khác biệt nhau.1.2 Thế nào là một mẫu tốt?Nghiên cứu dựa trên mẫu đòi hỏi cách chọn mẫu phải hết sức cẩn trọng để chọn ra đượcmẫu tốt. Một mẫu được coi là tốt khi nó có thể đại diện cho các tính chất của dân số mànó được rút ra. Nói theo thuật ngữ đo lường, nó phải có tính hiệu lực (validity). Tính hiệulực của mẫu tùy thuộc vào hai tính chất: tính đúng đắn (accuracy) và tính chính xác(precision).Tính đúng đắn (accuracy) của mẫu là mức độ mà mẫu tránh được các thiên lệch (bias).Khi mẫu được rút ra đúng cách, thì các các tính chất của một số phần tử nào đó của dânsố sẽ được thể hiện ít hơn mức độ thực có của chúng. Ngược lại, sẽ có một số phần tửkhác sẽ được thể hiện nhiều hơn mức độ thực có của chúng. Kết quả là, các biến số nàycủa các phần tử sẽ bù trù lẫn nhau, và dẫn đến việc giá trị của mẫu sẽ gần với giá trị củadân số.Tuy nhiên, để hiệu quả bù trừ này xảy ra, mẫu của chúng ta phải có đủ số lượng các phầntử, và chúng phải được rút ra từ dân số một cách đúng đắn để không gây ra sự thiên lệch.Một mẫu đúng (không thiên lệch) là một mẫu mà các sai số được đánh giá quá cao hayquá thấp bù trừ lẫn nhau. Và do đó, phương sai hệ thống (systematic variance) được định2Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)nghĩa như là biến động trong đo lường do các ảnh hưởng biết được hay không biết đượcgây ra làm cho các điểm số bị thiên lệch về một phía nào đó.Tăng cỡ mẫu (sample size) có thể làm giảm được phương sai hệ thống như là một nguồnsai số. Tuy nhiên, dù có tăng cỡ mẫu thì phương sai hệ thống vẫn có thể xảy ra nếu khungmẫu mà ta dựa vào để rút mẫu đã bị thiên lệch.Tiêu chuẩn thứ hai để thiết kế một mẫu tốt là tính chính xác (precision) của các ướclượng. Các nhà nghiên cứu đồng ý với nhau là không có mẫu nào có thể đại diện mộtcách đầy đủ dân số của nó ở mọi phương diện, mọi khía cạnh. Tuy nhiên, để diễn giải cácphát hiện của nghiên cứu, chúng ta cần phải đo lường coi mẫu thể hiện được dân số chínhxác tới mức nào. Các biến số mô tả mẫu có thể khác với dân số do sai số ngẫu nhiên sinhra trong quá trình chọn mẫu. Sai số này được gọi là sai số chọn mẫu (sampling error) haylà sai số chọn mẫu ngẫu nhiên (random sampling error), và nó phản ảnh ảnh hưởng của cơhội rút ra các thành viên của mẫu.Tính chính xác được đo lường bằng sai số chuẩn của ước lượng. Sai số chuẩn càng nhỏ cónghĩa là độ chính xác càng cao, và ngược lại. Một thiết kế chọn mẫu được coi là lý tưởngkhi nó tạo ra sai số chuẩn của ước lượng nhỏ. Tuy nhiên, không phải là tất cả các kiểuthiết kế mẫu đều tạo ra các ước lượng cho mức độ chính xác, và các mẫu có cỡ mẫu bằngnhau có thể sinh ra các mức độ sai số khác nhau.1.3 Các kiểu thiết kế chọn mẫuKhi thiết kế chọn mẫu (hay là chọn lựa các chọn mẫu - types of sample design), các nhànghiên cứu phải trả lời nhiều vấn đề (Hình 6.1). Quá trình ra quyết định chọn mẫu phụthuộc vào nhiều yếu tố. Có thể kế đến như bản chất của câu hỏi quản lý và các câu hỏiđiều tra cụ thể được rút ra từ các câu hỏi nghiên cứu. Ngoài ra, các yếu tố khác ảnh hưởngđến thiết kế mẫu còn là các yêu cầu của dự án nghiên cứu và mục tiêu của nó, mức độ rủiro mà các nhà nghiên cứu chấp nhận, ngân sách nghiên cứu, quỹ thời gian, các nguồn lựccó thể có và văn hóa vùng miền, dân tộc.Các phần tử trong một mẫu được chọn ra theo một trong hai kiểu chọn mẫu cơ bả: xácsuất hay phi xác suất. Chọn mẫu phi xác suất (non-probability sampling) có tính chất làtùy ý và có mục tiêu. Khi chúng ta chọn mẫu có mục tiêu, chúng ta thường chọn mẫu theomột kế hoạch định trước, và mỗi đơn vị nghiên cứu được rút ra từ dân số không có cơ hộiđược chọn ngang bằng nhau.Sự khác biệt căn bản giữa chọn mẫu phi xác suất và chọn mẫu xác suất là tính chất xácsuất. Chọn mẫu xác suất (probability sampling) dựa trên các phần tử được chọn với cơhội lựa chọn cho trước khác không. Chọn mẫu xác suất cho phép chúng ta xác định đượccác ước lượng về mức chính xác, và cho chúng ta cơ hội để tổng quát hóa các phát hiệncho các dân số nghiên cứu dựa trên dân số mẫu. Trong khi các nghiên cứu khám phákhông đòi hỏi nhiều về việc này, nhưng các nghiên cứu giải thích, mô tả và nhân quả lại3Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)đòi hỏi điều này. Trong khi đó, với chọn mẫu phi xác suất, ta không biết trước xác suất đểchọn một phần tử nào đó vào mẫu, đơn giản là vì ta không cần quan tâm đến xác suất này.Chọn phần tử của dân số để đưa vào mẫu là một việc đòi hỏi có sự chuẩn bị và lựa chọnnghiêm túc để bảo đảm tính đúng đắn của mẫu. Các phần tử của mẫu được chọn theotừng cá thể và trực tiếp từ dân số.Thang bậc câu hỏiquản lý – câu hỏinghiên cứuChọn kiểu chọn mẫuXác suấtPhi xác suấtXác định dân sốliên quanChọn kỹ thuậtlấy mẫuXác định các khung mẫuhiện cóKhông chấp nhậnĐánh giá khung mẫuChỉnh sửa hoặcxây dựng lạikhung mẫuChấpnhậnChọn khung mẫuRút ramẫuHình 6.1 Thiết kế chọn mẫu trong phạm vi quá trình nghiên cứuCó nhiều kiểu thiết kế chọn mẫu khác nhau, và thuộc vào hai nhóm là chọn mẫu xác suấtvà chọn mẫu phi xác suất (hình 6.2). Các kiểu chọn mẫu xác suất bao gồm các kiểu chọnmẫu ngẫu nhiên đơn giản (simple random sampling), chọn mẫu hệ thống (systematicsampling), chọn mẫu phân tầng (stratified sampling), chọn mẫu phân nhóm (clustersampling), và chọn mẫu nhiều giai đoạn (multistage sampling). Các kiểu chọn mẫu phixác suất bao gồm chọn mẫu thuận tiện (convienience sampling), chọn mẫu theo phánđoán (judment sampling), chọn mẫu hạn ngạch (quota sampling), và chọn mẫu quả cầutuyết (snowball).4Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Ở hai kiểu chọn mẫu phân tầng và hạn ngạch, mỗi kiểu lại có hai kiểu phụ là chọn mẫutheo tỷ lệ (propotionate sampling) và không theo tỷ lệ (dispropotionate sampling).Các kiểu chọn mẫu(Types of sampling design)Chọn mẫu phi xác suất(non-probability sampling)Chọn mẫu xác suất(probability sampling)Chọn mẫu thuận tiện(convienience sampling)Chọn mẫu ngẫu nhiên đơn giản(simple random sampling)Chọn mẫu phán đoán(judment sampling)Chọn mẫu hệ thống(systematic sampling)Chọn mẫu hạn ngạch(quota sampling)Chọn mẫu phân tầng(stratified sampling)Chọn mẫu hạn ngạch theo tỷ lệ(propotionate quota sampling)Chọn mẫu phân tầng theo tỷ lệ(propotionate stratified sampling)Chọn mẫu hạn ngạch không tỷ lệ(dispropotionate quota sampling)Chọn mẫu phân tầng không tỷ lệ(dispropotionate stratifiedsampling)Chọn mẫu quả cầu tuyết(snowball sampling)Chọn mẫu phân nhóm(cluster sampling)Chọn mẫu nhiều giai đoạn(multistage sampling)Hình 6.2 Các thiết kế chọn mẫu xác suất và phi xác suất2. CÁC BƯỚC THIẾT KẾ CHỌN MẪUKhi lựa chọn cách chọn mẫu phù hợp nhất cho nghiên cứu, chúng ta phải trả lời một sốcâu hỏi đặt ra. Các câu hỏi này cũng chính là các nguyên tắc, hay là các bước mà chúng taphải theo. Các câu hỏi đi theo một trình tự nhất định. Tuy nhiên, để trả lời tốt một câuhỏi, ta phải xem xét lại câu hỏi và câu trả lời trước đó.1. Dân số mục tiêu là gì?2. Các chỉ tiêu (parameters) cần quan tâm là gì?5Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)3. Khung mẫu của ta là gì ?4. Phương pháp chọn mẫu nào là phù hợp?5. Cần cỡ mẫu bao nhiêu?2.1 Dân số mục tiêu là gì?Thông thường, khi chúng ta xác định vấn đề nghiên cứu và đặt ra câu hỏi nghiên cứu thìchúng ta đã dân số mục tiêu là gì rồi. Tuy nhiên, cũng có khi chúng ta vẫn chưa rõ ràngvề dân số mục tiêu. Nếu chúng ta không biết rõ mục tiêu thì rất khó chọn mẫu phù hợp.Trong nghiên cứu kinh tế, đối tượng quan sát chủ yếu là con người. Tuy nhiên, chủ thểnày cũng có thể bao gồm cá nhân hoặc các tổ chức của con người. Vì vậy, nếu chúng tavẫn nhầm lẫn hoặc không biết chắc chắn là dân số bao gồm các cá nhân, hộ gia đình, giađình hoặc là kết hợp các loại này thì khó có thể quan sát đúng đối tượng. Rõ ràng là đốivới một nghiên cứu kinh tế thì việc xác định phần tử là một cá nhân hay là một hộ giađình hay là một tổ chức dạng khác sẽ đưa đến các kết quả hoàn toàn khác nhau. Vì vậy,cần chú ý là ta phải xác định rõ khung phân tích, và khung hành động để chọn lựa đúngdân số liên quan.Ví dụ 6.1 Khi nghiên cứu về vấn đề nghèo đói, ta phải hiểu dân số mục tiêu của ta là gì.Nếu nghiên cứu theo góc độ vùng địa giới hành chính, dân số mục tiêu có thể bao gồmcác vùng hành chính như tỉnh, quận huyện, xã phường. Nếu ta nghiên cứu theo góc độhộ gia đình thì dân số nghiên cứu lại bao gồm các hộ gia đình. Trên thực tế, các phần tửcơ bản của dân số mục tiêu này chính là hộ gia đình được phân bố theo các vùng địagiới hành chính. Vì vậy, các phần tử mà ta phải chọn lựa bao gồm cả vùng địa giới hànhchính và hộ gia đình.Ví dụ 6.2 Ở ví dụ 2.5 (chương 2), ta quan tâm đến vấn đề cải thiện môi trường đầu tưđể tăng cường thu hút đầu tư trực tiếp nước ngoài (FDI) của các tỉnh thành ở Việt Nam.Hãy xem dân số mục tiêu của ta là gì? Thứ nhất, chắc chắn dân số mục tiêu phải baogồm tất cả các tỉnh và thành phố trực thuộc trung ương của Việt Nam. Tuy nhiên, ởtừng tỉnh và thành phố, ta phải chọn các phần tử nào cho nghiên cứu? Liệu ta nên chọncác cá nhân là quan chức quản l{ của địa phương đó hay là chọn các doanh nghiệp nướcngoài hay các doanh nghiệp trong nước đang đầu tư sản xuất kinh doanh tại tỉnh? Rõràng là việc chọn lựa này không dễ dàng chút nào.2.2 Các chỉ tiêu cần quan tâm là gì?Các chỉ số thể hiện cho dân số là các chỉ tiêu mô tả tổng hợp (ví dụ giá trị trung bình,phương sai, v.v.) của các biến số của dân số mà chúng ta quan tâm.Các chỉ số thống kê mẫu (sample statistics) là các chỉ tiêu mô tả cùng các biến số trên,nhưng không phải của dân số mà là của mẫu. Các chỉ số thống kê mẫu được dùng để ướclượng các chỉ số thống kê của dân số. Các chỉ số thống kê mẫu chính là cơ sở để chúng tatham chiếu cho các chỉ số thống kê của dân số.6Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Tùy thuộc vào cách mà chúng ta đặt ra câu hỏi đo lường như thế nào (xem lại Hình 2.1,Chương 2), mỗi câu lại có thể thu thập dữ liệu ở các mức độ khác nhau. Mỗi mức độ khácbiệt của dữ liệu lại sinh ra sự khác biệt về thống kê mẫu. Vì vậy, việc chọn lựa các chỉtiêu cần quan sát sẽ thực tế quyết định kiểu chọn mẫu và cỡ mẫu.Khi các biến số được đo lường với kiểu dữ liệu khoảng hay tỷ số, chúng ta sẽ sử dụng giátrị trung bình mẫu để ước lượng trung bình dân số, và độ lệch chuẩn của mẫu để ướclượng độ lệch chuẩn của dân số.Khi các biến số được đo lường ở dạng thang đo danh nghĩa hoặc thứ bậc, chúng ta sẽ sửdụng các tỷ lệ của mẫu để ước lượng các tỷ lệ của dân số, và dùng chỉ số pq để ước lượngphương sai của dân số. Trong trường hợp này, tỷ lệ của dân số sẽ bằng số lượng phần tửcó trong dân số thuộc về một loại nào đó chia cho tổng số phần tử của dân số. Các đolường tỷ lệ như thế này rất cần thiết cho dữ liệu danh nghĩa và được sử dụng rộng rãi chocác đo lường khác nữa.2.3 Khung mẫu của ta là gì?Khung mẫu có liên quan rất gần với dân số. Đó chính là danh sách của tất cả các phần tửcó trong dân số mà từ đó chúng ta sẽ rút mẫu ra. Một khung mẫu lý tưởng chính là mộtdanh sách hoàn thiện, đầy đủ và đúng tất cả các thành viên của dân số.Tuy nhiên, trên thực tế, khung mẫu thường rất khác biệt với dân số lý thuyết.Thường là chúng ta chấp nhận một khung mẫu bao gồm cả các người hoặc các trườnghợp mà chúng ta không quan tâm. Nhưng chúng ta có thể giải quyết vấn đề này dễ dàngbằng cách rút một mẫu từ một dân số lớn hơn, và rồi sử dụng một quy trình lọc để loại bỏcác trường hợp mà chúng ta không quan tâm, hoặc không phải là thành viên của nhóm màchúng ta muốn nghiên cứu.Khả năng tìm kiếm được khung mẫu hay không là vấn đề phải tính đến khi chuẩn bị chọnmẫu. Có những dân số mục tiêu mà khung mẫu là sẵn có, ví dụ dân số sinh viên của mộttrường đại học, cư dân của một vùng hành chính nào đó, các doanh nghiệp vừa và nhỏcủa một thành phố nào đó. Tuy nhiên, có những dân số mục tiêu mà các phần tử của nó làkhông xác định, do đó ta không thể nào có được khung mẫu. Ví dụ như dân số nhữngngười ưa thích chính sách A và không ưa thích chính sách B, dân số những người đang sửdụng diện thoại di động nhãn hiệu Nokia, dân số những người buôn bán nhỏ không đăngký chẳng hạn. Ngoài ra, còn có những dân số mục tiêu xác định về nguyên tắc, và có tồntại khung mẫu, nhưng vì những lý do đặc biệt nào đó mà ta không thể có được khungmẫu, ví dụ như dân số những người nhiễm HIV-AIDS, dân số những người đang sử dụngxe máy thuộc một thương hiệu nào đó. Ta không thể hoặc rất khó có danh sách khungmẫu của các dân số này vì các vấn đề quản lý hành chính (danh sách người đăng ký xemáy tại cơ quan quản lý phương tiện giao thông) hoặc tính chất nhạy cảm của dân số(danh sách người bị nhiễm HIV-AIDS).7Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)2.4 Phương pháp chọn mẫu nào là phù hợp?Nhà nghiên cứu phải đối mặt với một lựa chọn căn bản: chọn mẫu xác xuất hay phi xácsuất. Với cách chọn mẫu xác suất, nhà nghiên cứu có thể đạt được các ước lượng chonhiều chỉ tiêu nghiên cứu khác nhau dựa trên sự tin cậy về xác suất. Trong khi đó, chọnmẫu phi xác suất không cho được điều này.Tuy nhiên, chọn mẫu xác suất có một vài hệ quả. Nhà nghiên cứu buộc phải theo các quytrình phù hợp mà phỏng vấn viên, điều tra viên không thể chỉnh sửa sự chọn lựa đã có.Khi chọn mẫu, chỉ có các phần tử được chọn từ khung mẫu gốc mới được tính tới. Trongquá trình chọn mẫu để thu thập thông tin, ta không thể thay thế phần tử này bằng phần tửkhác ngoại trừ khi có các chỉ dẫn cụ thể theo các nguyên tắc định trước.Ngược lại, chọn mẫu phi xác suất dù không có tính đại diện cao cho dân số, nhưng lại dễdàng áp dụng trong thực tế vì hầu hết các trường hợp ta không thể có được khung mẫu.Đồng thời, nhiều nghiên cứu có mục đích chuyên biệt, không cần thiết phải đại diện chotoàn bộ dân số mục tiêu.Ở phần 3 và 4, ta sẽ hiểu thêm sự khác biệt giữa hai nhóm thiết kế chọn mẫu này.2.5 Cần cỡ mẫu bao nhiêu là vừa?Cỡ mẫu chính là số đơn vị nghiên cứu mà ta cần có trong một mẫu khi rút ra từ dân sốmục tiêu. Thông thường, nhiều người có nhiều quan niệm không chính xác về cỡ mẫu. Họthường cho rằng, thứ nhất, một mẫu phải đủ lớn, nếu không nó sẽ không đại diện cho dânsố. Thứ hai là một mẫu phải tương ứng với một tỷ lệ nào đó so với kích cỡ của dân số mànó được rút ra. Trên thực tế, cả hai câu chuyện này đều không chính xác.Với mẫu phi xác suất, các nhà nghiên cứu khẳng định là số lượng nhóm phụ, các nguyêntắc lựa chọn và hạn chế về ngân sách là các yếu tố quyết định cỡ mẫu. Với cách chọn mẫuxác suất, cỡ mẫu phụ thuộc vào sự biến thiên của các chỉ số thống kê của dân số và mứcđộ chính xác của kết quả mà ta muốn có.Một số nguyên tắc ảnh hưởng đến việc xác định cỡ mẫu là:-Dân số càng biến thiên nhiều thì cỡ mẫu phải càng lớn để đạt tính chính xác.-Độ chính xác mong muốn càng tăng thì cỡ mẫu phải càng lớn.-Phạm vi sai số càng nhỏ thì cỡ mẫu phải càng lớn.-Mức độ tin cậy của ước lượng càng cao thì cỡ mẫu càng phải lớn.-Khi dân số có nhiều nhóm phụ, thì cỡ mẫu phải lớn để cỡ mẫu của từng nhóm phụphải đạt yêu cầu tối thiểuCác hạn chế về ngân sách cũng ảnh hưởng đến cỡ mẫu, cách chọn mẫu và phương phápthu thập dữ liệu. Hầu hết các nghiên cứu đều bị giới hạn ngân sách, và điều này thúc đẩycác nhà nghiên cứu áp dụng các phương pháp chọn mẫu phi xác suất.8Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)3. CHỌN MẪU XÁC SUẤTMột mẫu được coi là có hiệu quả hơn về phương diện thống kê là một mẫu mà nó có thểcho kích cỡ mẫu nhỏ hơn với một mức độ chính xác cho trước (dựa trên sai số chuẩn củatrung bình hoặc của tỷ lệ). Một mẫu được coi là có hiệu quả về phương diện kinh tế làmột mẫu có thể đạt được một mức độ chính xác cho trước với chi phí thấp. Ở các phầndưới đây, ta sẽ thảo luận về thiết kế chọn mẫu ngẫu nhiên đơn giản, và sau đó bốn cách thứcchọn mẫu xác suất phức tạp (complex probability sampling) có khả năng thay thế nhau là: (1)chọn mẫu hệ thống; (2) chọn mẫu phân tầng; (3) chọn mẫu theo nhóm hoặc phân tổ; và (4)chọn mẫu nhiều giai đoạn.3.1 Chọn mẫu xác suất ngẫu nhiên đơn giảnLà một phương pháp chọn mẫu không hạn chế, phương pháp chọn mẫu xác suất ngẫunhiên đơn giản (simple random sampling) là hình thức đơn giản nhất, thuần nhất của cáchchọn mẫu xác suất. Khi mà tất cả các mẫu xác suất đều phải chọn lựa từng cá thể (đơn vịnghiên cứu) với một xác suất khác không cho trước thì phương pháp chọn mẫu ngẫunhiên đơn giản được coi là một trường hợp đặc biệt vì mỗi một cá thể đều được lựa chọnvới một xác suât biết trước và hoàn toàn ngang bằng nhau.Xác suất chọn lựa = cỡ mẫu ÷ kích cỡ của dân số (%)Để thực hiện chọn mẫu ngẫu nhiên đơn giản, việc đầu tiên là chúng ta phải có khungmẫu, hay chính là danh sách tất cả các cá thể (thành viên) của dân số mục tiêu. Dựa trêndanh sách này, làm sao có thể rút mẫu ra mà vẫn bảo đảm xác suất rút mẫu hoàn toànbằng nhau? Giả sử ta chọn mẫu với cỡ mẫu là 200 từ một dân số mục tiêu chứa 2.500 cáthể. Điều này có nghĩa là xác suất rút mẫu phải bảo đảm bằng 200/2.500, tức là 8%. Xácsuất ra rút mẫu lần đầu tiên sẽ là 1/2.500. Xác suất rút mẫu lần thứ hai sẽ là 1/2.499, vàsau đó, xác suất rút mẫu sẽ thay đổi tương tự như vậy. Hiển nhiên là bằng cách này, takhông bảo đảm xác suất rút mẫu là bằng nhau và bằng với xác suất dự định ban đầu. Đâylà hệ quả của cách chọn mẫu không có thay thế (sampling without replacement). Nếu thaythế phần tử đã được chọn bằng một phần tử khác trong dân số, ta có thể giữ cho xác suấtrút mẫu không thay đổi (sampling with replacement).Khi rút mẫu, ta sẽ đánh số và sử dụng bảng ngẫu nhiên để chọn lựa ra các cá thể (rút mẫu)để bảo đảm mọi cá thể đều có xác suất được chọn như nhau. Ta cũng có thể dùng cácphần mềm máy tính hỗ trợ để xác định mẫu với một xác suất cho trước nào đó. Với phầnmềm Excel, một công cụ bảng tính phổ biến, ta có thể sử dụng lệnh Randbetween.Ví dụ 6.3Giả sử ta xác định cỡ mẫu cần có cho một nghiên cứu là n = 200. Với danh sách khungmẫu cho trước, ta biết dân số có N = 2.500 cá thể. Như vậy, xác suất chọn mẫu là 8%. Dĩnhiên là ta phải lập danh sách khung mẫu, và mỗi cá thể của dân số được đánh số thứtự từ 1 đến 2.500. Với phần mềm Excel, ta dùng lệnh Randbetween(1;2500), ta sẽ cóđược một giá trị ngẫu nhiên được chọn ra từ danh sách chứa 2.500 cá thể. Ta chọn copy9Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)công thức bằng cách kéo chuột (drag) ô tính toán đi để có đúng 200 ô. Kết quả là ta sẽcó một danh sách chứa 250 cá thể được chọn một cách ngẫu nhiên và với xác suất chọnlựa hoàn toàn bằng nhau là 8%.Ta cũng có thể dùng cách này để lập một vài danh sách dự phòng. Khi bị mất một cá thểquan sát bất kỳ trong danh sách chuẩn đầu tiên, ta có thể lựa chọn một cá thể bất kỳ trongdanh sách dự phòng để thay thế mà vẫn bảo đảm tính chất ngẫu nhiên và với xác suấthoàn toàn bằng nhau.3.2 Chọn mẫu hệ thốngVớ thiết kế chọn mẫu hệ thống, ta chọn lấy các phần tử thứ k th trong dân số, bắt đầu vớimột con số khởi điểm ngẫu nhiên trong phạm vi từ 1 đến k. Phần tử thứ kth , còn gọi làbước nhảy (skip interval), được tính bằng cách chia cỡ mẫu cho kích cỡ của dân số.k = bước nhảy = dân số ÷ cỡ mẫuChúng ta cũng phải có khung mẫu chính xác và hoàn thiện.Thủ tục để tiến hành chọn mẫu hệ thống theo các bước sau:-Xác định, lập danh sách và đánh số các cá thể của dân số-Xác định bước nhảy (k)-Xác định con số khởi đầu một cách ngẫu nhiên-Rút mẫu bằng cách chọn tất cả các cá thể theo các bước nhảy kth.Ví dụ 6.4 Ta có dân số bao gồm 2.000 phần tử đã đánh số thứ tự. Với cỡ mẫu 70, bướcnhảy k bằng 28,57, làm tròn là 29. Giả sử ta chọn điểm khởi đầu là phần tử có số thứ tự12, phần tử được chọn kế tiếp sẽ là 41 (12+29). Tương tự như vậy, ta sẽ chọn các phầntử 70, 99, 128, 157, 186, 215, 244, 273, 302, 331, v.v.Phương pháp chọn mẫu hệ thống có ưu điểm là đơn giản và mềm dẻo. Tuy vậy, phươngpháp này cũng có thể sinh ra các thiên lệch khó thấy. Đầu tiên là tính chất chu kỳ của dânsố có thể xảy ra song song với tỷ lệ mẫu (bước nhảy). Ngoài ra, các cá thể của dân số cóthể đã được sắp xếp theo một trật tự đơn chiều nào đó. Trong nghiên cứu kinh tế, các dânsố thường được sắp xếp theo trật tự sẵn có. Ví dụ, ta có danh sách các cá nhân, hoặc hộgia đình sắp xếp từ nghèo đến giàu, hoặc ngược lại; hoặc danh sách các hộ nông nghiệpsắp xếp theo quy mô tăng dần về diện tích đất canh tác, v.v. Chính vì vậy, khi chọn cáthể, ta có thể bị thiên lệch về một phía nào đó của dãy số liệu.Để tránh tình trạng thiên lệch như vậy, ta nên:-Sắp xếp ngẫu nhiên dân số trước khi chọn mẫu-Chọn con số khởi điểm một cách ngẫu nhiên vài lần khi bắt đầu chọn mẫu-Lặp lại cách chọn mẫu như vậy cho các mẫu khác.10Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Nếu thực hiện tốt, phương pháp này cho hiệu quả thống kê cao hơn phương pháp ngẫunhiên đơn giản.3.3 Chọn mẫu phân tầngHầu hết các dân số đều bao gồm các nhóm cá thể khác nhau. Các nhóm như vậy chính làcác nhóm dân số phụ (subpopulation), hay là các tầng (strata). Quá trình chọn mẫu mà cáccá thể được chọn lựa theo từng nhóm như vậy được gọi là chọn mẫu ngẫu nhiên phântầng (stratified random sampling). Phương pháp chọn mẫu phân tầng có hiệu quả thốngkê cao hơn phương pháp chọn mẫu ngẫu nhiên đơn giản. Lý do rất rõ ràng là ta có thểtăng cường tính đại diện của mẫu đối với dân số mục tiêu nếu tất cả các nhóm phụ củadân số đều có những đại diện của chúng trong mẫu.Tại sao chúng ta chọn phương pháp chọn mẫu phân tầng này? Phương pháp này chochúng ta nhiều lợi ích như:(1) Tăng hiệu quả thống kê của mẫu;(2) Cung cấp dữ liệu phù hợp để phân tích từng nhóm dân số phụ hay từng tầng, và(3) Cho phép sử dụng các phương pháp nghiên cứu và phân tích khác nhau cho cánhóm dân số phụ khác nhau.Nếu phân tầng một cách lý tưởng, ta sẽ có sự đồng nhất trong nội bộ từng nhóm và có sựdị biệt giữa các nhóm. Nếu phân tầng càng nhiều thì ta càng có thể tối đa hóa sự khác biệtgiữa các nhóm và tối thiểu hóa sự biến thiên trong nội bộ từng nhóm.Dân sốDân số phụMẫuCCHình 6.3 Minh họa về thiết kế chọn mẫu phân tầngTuy nhiên, chi phí cũng là một yếu tố đáng quan tâm. Nếu tăng số nhóm nghiên cứu lên(số tầng) thì chi phí cũng tăng theo vì chi phí đi đôi với mức độ chọn mẫu chi tiết. Ngoàira, cũng phải chú ý đến các yếu tố sau: (1) kích cỡ tổng mẫu cần có và (2) tổng mẫu được11Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)phân bổ như thế nào giữa các tầng. Hai vấn đề này quan trọng vì chúng quyết định số cáthể cần có ở từng tầng.Giả sử ta có hạn chế ngân sách nên chỉ có thể chọn cỡ mẫu tối đa là 250. Nếu ta chọncách chia dân số làm 5 nhóm dân số phụ khác nhau, với tỷ lệ tương đương nhau, thì sốlượng cá thể cần quan sát của mỗi mẫu phụ (tương ứng với mỗi nhóm dân số phụ, hay làtừng tầng) là 50, tương đương với tỷ lệ 20% tổng mẫu. Số lượng 50 cá thể này có thể bảođảm mức độ tin cậy về phân tích thống kê. Nhưng nếu chúng ta muốn chia dân số làm 10nhóm dân số phụ, thì kích cỡ của mẫu phụ chỉ là 25. Số lượng đơn vị nghiên cứu có trong1 mẫu phụ này có thể không bảo đảm tin cậy về phân tích thống kê.Đối với cách phân bố mẫu cho các nhóm phụ (tầng) khác nhau, có hai cách là theo tỷ lệ(proportionate) và không theo tỷ lệ (disproportionate).Đối với cách chọn mẫu phân tầng theo tỷ lệ (proportionate stratified sampling), cỡ mẫucủa mỗi mẫu phụ (tầng) theo đúng tỷ lệ của các phần tử có trong từng dân số phụ so vớitổng dân số. Cách chọn mẫu phân tầng theo tỷ lệ phổ biến nhiều hơn bất kỳ cách chọnmẫu phân tầng nào khác, bởi vì:-có hiệu quả thống kê cao hơn phương pháp ngẫu nhiên đơn giản-dễ thực hiện hơn các phương pháp phân tầng khác-cung cấp một mẫu tự định trọng số (self-weighting sample); giá trị trung bình tổngthể hoặc tỷ lệ tổng thể có thể được ước lượng một cách dễ dàng.Quy trình chọn mẫu phân tầng bao gồm các bước sau đây:Bước 1. Quyết định các biến số dùng để phân tầng. Trong nghiên cứu kinh tế - xã hội, cácbiến định tính thường được dùng để phân chia dân số thành các dân số phụ. Thôngthường là các biến nhân khẩu học (ví dụ độ tuổi, giới tính, nghề nghiệp, học vấn, v.v)hoặc các biến thể hiện sự khác biệt về vị thế kinh tế (ví dụ nghèo, cận nghèo, trung bình,khá, giàu). Cần chú ý là ta phải xem xét liệu các biến định tính được dùng để phân chiadân số thành các dân số phụ có ý nghĩa gì đối với mục tiêu nghiên cứu của ta, có tác độnggì đến biến số quan trọng nhất mà ta cần đo lường.Ví dụ 6.5 Khi nghiên cứu về thu nhập của người lao động, ta xem xét liệu các biến địnhtính nào có thể dùng để chia dân số mục tiêu thành những nhóm phụ có thu nhậpchênh lệch nhau. Liệu giới tính có thể dẫn đến sự khác biệt về thu nhập hay không? Liệutrình độ học vấn có dẫn đến sự khác biệt hay không? Liệu ngành nghề hay các hình thứctổ chức của doanh nghiệp (ví dụ sở hữu nhà nước, tư nhân, liên doanh, nước ngoài), cóảnh hưởng đến thu nhập hay không?Ví dụ 6.6 Khi nghiên cứu về nhu cầu sử dụng máy tính xách tay của sinh viên, ta cần xácđịnh xem có các yếu tố nào ảnh hưởng đến nhu cầu này. Liệu giới tính của sinh viên hayngành học quan trọng hơn? Liệu sinh viên ở các năm học khác nhau có nhu cầu khácnhau hay không? Nếu ta cho rằng ngành học là một yếu tố quan trọng ảnh hưởng đến12Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)nhu cầu này (giả sử như là sinh viên ngành toán cần sử dụng máy tính thường xuyênhơn sinh viên ngành ngữ văn), và sinh viên các năm cuối phải sử dụng thường xuyênhơn sinh viên năm thứ nhất thì ta có thể lựa cho hai biến định tính này để phân tầng,thay vì dùng biến giới tính.Bước 2. Xác định tỷ lệ của từng nhóm dân số phụ so với dân số chung. Để làm được việcnày, rõ ràng là chúng ta phải có được khung mẫu của dân số tổng thể, và các khung mẫucủa các dân số phụ dựa trên các biến danh nghĩa mà chúng ta dùng để phân chia.Bước 3. Ta chọn lựa cách phân tầng theo tỷ lệ hoặc không theo tỷ lệ tùy theo nhu cầuthông tin nghiên cứu và các rủi ro có thể xảy ra.Bước 4. Thiết lập các khung mẫu của các dân số phụ. Mỗi khung mẫu (phụ) thể hiện mộttầng (nhóm dân số phụ).Bước 5. Trộn các phần tử trong khung mẫu. Để bảo đảm tốt hơn tính chất ngẫu nhiên,không thiên lệch khi chọn mẫu, ta nên trộn ngẫu nhiên các phần tử (cá thể, đơn vị nghiêncứu) trong từng khung mẫu của từng tầng.Bước 6. Rút mẫu cho các tầng bằng cách rút mẫu ngẫu nhiên hoặc hệ thống.xxxxxxxxxxxxxxxxxxxxx∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆ooooooooooooooooooooox x xx x xx x x∆ ∆ ∆∆ ∆ ∆∆ ∆ ∆o o oo o oo o oHình 6.4 Minh họa về cách rút mẫu từ dân số đối với chọn mẫu phân tầngVí dụ 6.7 Minh họa chọn mẫu phân tầng để có mẫu nghiên cứu về nhu cầu sử dụng máytính xách tay của sinh viên.Bước 1. Chọn biến ngành để phân tầng. Dân số sinh viên sẽ được chia làm nhiều dân sốphụ khác nhau theo ngành học.Bước 2. Xác định tỷ lệ sinh viên từng ngành học so với tổng số sinh viên. Ta quyết địnháp dụng chọn mẫu theo tỷ lệ để bảo đảm cấu trúc mẫu phản ảnh đúng như cấu trúc củadân số mục tiêu.Bước 3. Thiết lập các khung mẫu cho sinh viên của từng ngành học khác nhau. Trên thựctế, khung mẫu này chính là danh sách sinh viên của từng ngành học. Ta có thể nhập dữliệu cơ bản của danh sách này vào một file Excel để làm cơ sở rút mẫu.Bước 4. Ta trộn danh sách khung mẫu nhiều lần để bảo đảm phá vỡ mọi quy tắc sắp xếpđã có của danh sách này.13Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Bước 5. Rút mẫu ở từng khung mẫu theo tỷ lệ so với cỡ mẫu đã định sẵn. Dùng lệnhRandbetween của Excel để rút mẫu theo cách ngẫu nhiên đơn giản hoặc dùng phươngpháp hệ thống để rút mẫu theo bước nhảy k. Kết quả là ta có các mẫu phụ, mỗi mẫuphụ tương ứng với một dân số phụ. Nếu gộp tất cả các mẫu phụ lại với nhau, ta có mẫunghiên cứu, bao gồm nhiều mẫu phụ, theo tỷ lệ biết trước.3.4 Chọn mẫu theo nhómTrong một mẫu ngẫu nhiên, mỗi phần tử của dân số được chọn lựa theo từng cá thể. Dânsố cũng có thể được chia thành nhiều nhóm chứa đựng các phần tử cá thể mà có thể, mộtsố nhóm như vậy được chọn ngẫu nhiên cho nghiên cứu. Đó chính là nguyên tắc củaphương pháp chọn mẫu theo nhóm.Ta có thể hình dung sự khác biệt giữa chọn mẫu phân tầng và chọn mẫu theo nhóm nhưsau. Giả sử hai dân số 1 và 2 đều chứa đựng các cá thể khác biệt, nhưng có thể chia làmba nhóm chính, thể hiện bằng các ký tự x, ∆ và o (Hình 6.5).Dựa trên tính chất khác biệt này, chúng ta có thể chọn mẫu theo hai cách khác biệt nhau.Cách thứ nhất là chúng ta chia dân số thành 3 nhóm dân số phụ theo các đặc tính x, ∆ vào.Điều này cho phép chúng ta có 3 nhóm dân số phụ (còn gọi là tầng - stratum) bảo đảm sựđồng nhất trong nội bộ từng nhóm và có sự dị biệt giữa các nhóm. Ngược lại, chúng tacũng có thể chia dân số thành 3 nhóm dân số phụ mà mỗi nhóm đều có các phần tử cá thểđa dạng với các đặc tính x, ∆ và o. Kết quả là, ta có 3 nhóm dân số phụ (clusters) và cóthể bảo đảm sự đa dạng hay dị biệt trong nội bộ từng nhóm và có sự đồng nhất giữa cácnhóm.Cách thứ nhất chính là chọn mẫu phân tầng. Cách thứ hai là chọn mẫu theo nhóm.xxxxxxxxxxxxxxxxxxxxx∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆oooooooooooooooooooooDân số 1 được chia thành cácnhóm dân số phụ (tầng) dị biệtnhau dựa trên các đặc tính riêngbiệt của các cá thể (chia nhómx, ∆ và o riêng biệt).x∆ox∆oxx∆ox∆oxx∆ox∆ox∆xo∆xo∆∆xo∆xo∆∆xo∆xo∆ox∆ox∆oox∆ox∆oox∆ox∆oDân số 2 được chia thành cácnhóm dân số phụ (nhóm) baogồm các cá thể có tính đa dạngnhư nhau (x, ∆ và o đều có mặttrong từng nhóm).Hình 6.5 Minh họa sự khác biệt giữa chọn mẫu phân tầng và theo nhóm14Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Hiệu quả thống kê của chọn mẫu theo nhóm thường thấp hơn chọn mẫu ngẫu nhiên đơngiản vì thông thường, các nhóm lại không có sự khác biệt cần thiết, mà lại có sự đồngnhất.Bảng 6.1 So sánh hai phương pháp chọn mẫu phân tầng và theo nhómChọn mẫu phân tầng - Stratified SamplingChọn mẫu theo nhóm - Cluster Sampling1. Ta chia dân số thành một số ít nhóm phụ1. Ta chia dân số thành nhiều nhóm phụ-Mỗi nhóm phụ chứa rất nhiều phần tử.-Mỗi nhóm phụ chứa rất ít phần tử.-Các nhóm phụ được chọn lựa theo cáctiêu chí liên quan đến các biến số nghiêncứu.-Các nhóm phụ được chọn lựa theo cáctiêu chí đễ dàng hoặc có tính sẵn có đểthu thập dữ liệu dễ hơn.2. Ta cố gắng bảo đảm tính đồng nhất(homogeneity) trong nội bộ từng nhóm phụ.2. Ta cố gắng bảo đảm tính dị biệt(heterogeneity) trong nội bộ từng nhóm phụ.3. Ta cố gắng bảo đảm tính dị biệt(heterogeneity) giữa các nhóm phụ.3. Ta cố gắng bảo đảm tính đồng nhất(homogeneity) giữa các nhóm phụ.4. Ta chọn lựa ngẫu nhiên các phần tử trongtừng nhóm phụ.4. Ta chọn lựa ngẫu nhiên một số nhóm phụ đểchúng ta nghiên cứu sâu.Hầu hết các nghiên cứu kinh tế đều liên quan đến các dân số mà chúng có thể chia theocác vùng địa lý. Ví dụ khi nghiên cứu tình trạng nghèo đói, ta có thể thấy ở bất kỳ quốcgia nào (trên thế giới) hoặc ở bất kỳ vùng, miền, tỉnh nào (trong phạm vi một quốc gia)đều có người nghèo, giàu khác nhau. Như vậy, khi nghiên cứu, ta có thể chọn lựa một vàivùng miền nào đó thuận tiện cho nghiên cứu, và khi nghiên cứu ở các vùng như trên, tavẫn bảo đảm có được các cá thể giàu, nghèo khác biệt nhau.Khi ta có thể chia dân số theo vùng địa lý như vậy thì rõ ràng ta có thể sử dụng phươngpháp chọn mẫu theo nhóm. Cách thức chọn mẫu như vậy còn được gọi là chọn mẫu theovùng (area sampling), và có thể áp dụng ở mức độ quốc gia, vùng miền, thậm chí các đơnvị theo địa giới hành chính ở quy mô nhỏ hơn.Khi áp dụng thiết kế chọn mẫu theo nhóm, kể cả chọn mẫu theo vùng, chúng ta cần trả lờicác câu hỏi sau đây:1. Các nhóm đồng nhất với nhau như thế nào?2. Chúng ta tìm các nhóm có kích cỡ bằng nhau hay khác nhau?3. Chúng ta sẽ chọn nhóm có kích cỡ bao nhiêu?4. Chúng ta sẽ áp dụng phân nhóm một giai đoạn (single-stage cluster) hay nhiều giaiđoạn (multi-stage cluster)?5. Kích cỡ của mẫu bao nhiêu là vừa?15Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Ví dụ 6.8 Minh họa chọn mẫu theo nhómTa muốn nghiên cứu về hoạt động của các doanh nghiệp vừa và nhỏ (SMEs) trên phạmvi cả nước. Vì không đủ nguồn lực để nghiên cứu ở từng tỉnh thành, ta chỉ có thể chọnmẫu đại diện, và quyết định chọn mẫu phân nhóm theo vùng địa l{. Đầu tiên, ta chọnmột số tỉnh, thành phố đại diện cho bảy vùng kinh tế - xã hội là Đồng bằng sông Hồng,Miền núi và trung du Bắc bộ, Bắc Trung bộ, Duyên hải Nam Trung bộ , Tây Nguyên, ĐôngNam bộ và Đồng bằng sông Cửu Long. Ta chắc chắn rằng ở mỗi tỉnh, thành phố đại diệnđều có đầy đủ các dạng, loại hình SMEs.Ta cũng biết rằng ta không thể điều tra toàn bộ các SMEs có trên địa bàn hành chính củatỉnh, thành đã chọn. Vì vậy, ta tiếp tục chọn một số đơn vị hành chính đại diện cho vùngthành thị và nông thôn của từng tỉnh thành, ví dụ mỗi tỉnh thành chọn một huyện (đạidiện vùng nông thôn) và một thành phố/thị xã (đại diện cho vùng thành thị).3.5 Chọn mẫu nhiều giai đoạnTrong nghiên cứu thực tế, người ta thường áp dụng phương chọn mẫu nhiều giai đoạn(double sampling, sequential sampling, multiphase sampling, multistage sampling).Phương pháp này cho phép chúng ta sử dụng các thông tin có được từ các cuộc nghiêncứu ban đầu để làm cơ sở cho việc chọn mẫu ở các bước tiếp theo.Trong nghiên cứu kinh tế, đôi khi chúng ta tiến hành nghiên cứu theo nhiều giai đoạn.Giai đoạn đầu tiên là nghiên cứu khám phá, là giai đoạn mà ta cần tìm hiểu các thông tincơ bản của dân số mục tiêu thông qua mẫu. Dựa trên các thông tin cơ bản này, ta có thểhiểu về cấu trúc của dân số, và có thể phát hiện sự dị biệt cũng như tương đồng trong nộibộ dân số thông qua các chỉ tiêu thống kê ghi nhận được. Từ đó, chúng ta có thể tiếp tụcrút ra các mẫu phụ từ mẫu mà chúng ta đã có để tiếp tục nghiên cứu ở các giai đoạn sau(nghiên cứu sâu).Loại hình chọn mẫu nhiều giai đoạn thường được áp dụng trong nghiên cứu kinh tế - xãhội. Ở giai đoạn đầu, người ta thường chọn mẫu có cỡ mẫu lớn, thiết kế nội dung nghiêncứu đơn giản nhằm tìm hiểu các thông tin cơ bản của dân số mục tiêu. Sau đó, tùy theomục tiêu nghiên cứu, người ta thiết kế các nghiên cứu sâu với các nội dung rất chi tiết,nhưng cần số đơn vị nghiên cứu ít hơn. Kết quả nghiên cứu trước cho phép rút ra các tiêuchí phân nhóm phù hợp cũng như bảo đảm khả năng rút các mẫu phụ chứa đựng các đơnvị nghiên cứu phù hợp từ mẫu đã nghiên cứu.Thông thường, phương pháp chọn mẫu nhiều giai đoạn kết hợp nhiều phương pháp chọnmẫu khác nhau, ví dụ như chọn mẫu phân tầng, chọn mẫu theo nhóm, chọn mẫu hệ thống.Ta hãy xem xét một ví dụ minh họa về chọn mẫu nhiều giai đoạn, áp dụng cho mộtnghiên cứu về hoạt động của doanh nghiệp vừa và nhỏ ở Việt Nam.16Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Ví dụ 6.9 Minh họa về chọn mẫu nhiều giai đoạnNghiên cứu:Hoạt động của các doanh nghiệp vừa và nhỏ (SMEs) thuộc cácngành da giày – dệt may, cơ khí, và điện tửPhạm vi nghiên cứu:Việt NamNghiên cứu sơ khởi:Áp dụng phương pháp chọn mẫu theo vùng (area sampling,một dạng của cluster sampling):chọn ra 1-2 hai thành phố đại diện cho các thành phốlớn ở Việt Namchọn ra 7 tỉnh đại diện cho 7 vùng miền kinh tế ở ViệtNamỞ mỗi tỉnh, thành phố, chọn doanh nghiệp SME để phỏng vấnsơ khởi. Có thể áp dụng kết hợp xác suất như chọn mẫu ngẫunhiên đơn giản hay chọn mẫu hệ thống dựa trên danh sách(khung mẫu) do cơ quan Sở Công Thương hoặc Chi nhánhPhòng Công nghiệp & Thương mại Việt Nam cung cấp.Nghiên cứu sâu:Dựa trên các thông tin ghi nhận được từ người tiêu dùng trongphỏng vấn sơ khởi và sự sẵn lòng của họ, tiến hành nghiên cứusâu.Áp dụng phương pháp chọn mẫu phân tầng (stratifiedsampling) theo tỷ lệ hoặc không theo tỷ lệ dựa trên các đặcđiểm khác biệt về ngành sản xuất ở từng tỉnh, thành phố đãchọn.Rút mẫu từ mẫu nghiên cứu đã có.Với ví dụ trên, ta thấy nhà nghiên cứu có thể lựa chọn và áp dụng nhiều phương phápchọn mẫu khác nhau cho các giai đoạn nghiên cứu khác nhau. Tất nhiên là các phương ánchọn lựa còn tùy thuộc rất nhiều vào mục tiêu nghiên cứu, dân số mục tiêu, các chỉ tiêucần thu thập, khả năng có được khung mẫu, sự dễ dàng, thuận tiện trong nghiên cứu, vàkhả năng tài chính đáp ứng cho nghiên cứu.Như vậy, có nhiều phương pháp chọn mẫu xác suất khác nhau, với các ưu điểm và hạnchế của chúng. Bảng 6.2 giúp tóm tắt đặc điểm chính, ưu điểm và hạn chế của từngphương pháp.17Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Bảng 6.2 So sánh các phương pháp chọn mẫu xác suấtKiểuMô tảƯu điểmHạn chếNgẫu nhiên đơn giảnSimple RandomMỗi phần tử của dân sốđều có cơ hội được lựchọn ngang bằng nhau.Dễ áp dụng, nhất là vớicách phỏng vấn quanđiện thoại do máyquay số ngẫu nhiên. Cóthể áp dụng hệ thốngtrả lời tự động.Đòi hỏi danh sách khungmẫu.Chi phí: CaoÁp dụng: Trung bìnhHệ thốngSystematicChi phí: Trung bìnhÁp dụng: Trung bìnhPhân tầngStratifiedChi phí: CaoÁp dụng: Trung bìnhMẫu được rút ra bằngcách sử dụng bảng sốngẫu nhiên hoặc phầnmềm tạo bảng số ngẫunhiên.Chọn ra một phần tử dânsố khởi đầu một cáchngẫu nhiên, dùng bướcthnhảy k để chọn cácphần tử khác.Cần cỡ mẫu lớn.Tạo ra nhiều sai số.Thiết kế đơn giản.Dễ áp dụng hơn chọnmẫu ngẫu nhiên đơngiản.Dễ tính toán phân bốmẫu của giá trị trungbình hoặc tỷ lệ.Chia dân số thành cácdân số phụ (tầng) vàáp dụng chọn mẫungẫu nhiên đơn giảncho từng tầng. Kết quảcó thể tính theo trọngsố và kết hợp được.Tốn nhiều thời gian đểthực hiện.Tính chu kz của dân số cóthể làm méo, sai lệchmẫu và kết quả.Nếu dân số có xu hướngtrật tự đơn chiều, cóthể sinh ra kết quảthiên lệch.Nhà nghiên cứu kiểmsoát cỡ mẫu trong cáctầng.Tăng sai số nếu các nhómphụ được chọn ở cáctỷ lệ khác nhau.Tăng hiệu quả thống kê.Đắt đỏ nếu phải tạo ranhiều tầng khác nhau.Cung cấp dữ liệu đại diệnvà phân tích nhómphụ.Cho phép sử dụng nhiềuphương pháp phântích khác nhau chotừng tầng.Theo nhómClusterChi phí: Trung bìnhÁp dụng: CaoDân số được chia làmnhiều nhóm phụ dịbiệt trong nội bộ. Chọnngẫu nhiên một sốnhóm để nghiên cứusâu.Cung cấp các ước lượngkhông thiên lệch nếuđược thực hiện đúngcách.Hiệu quả kinh tế cao hơnchọn mẫu ngẫu nhiênđơn giản.Thường có hiệu quảthống kê thấp do cácnhóm phụ có xu hướngđồng nhất hơn là dịbiệt.Chi phí thấp nhất, đặcbiệt khi chia nhómtheo vùng địa l{.Dễ làm, không cần danhsách khung mẫu.Nhiều giai đoạn(Double, sequential ormultiphase)Chi phí: Trung bìnhÁp dụng: Trung bìnhQuá trình bao gồm việcthu thập dữ liệu từmột mẫu đã được xácđịnh trước. Dựa trêncác thông tin có được,chọn ra mẫu phụ chocác nghiên cứu tiếp.Có thể làm giảm chi phínếu kết quả giai đoạnđầu cho đầy đủ dữ liệuđể phân tầng hoặc chianhóm dân số.Tăng chi phí nếu được ápdụng không phân biệt.18Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)4. CHỌN MẪU PHI XÁC SUẤTVới cách tiếp cận có mục đích như chọn mẫu phi xác suất, ta sẽ không biết được xác suấtlựa chọn các đơn vị nghiên cứu (phần tử của dân số). Có nhiều cách để chọn lựa các cánhân hoặc các trường hợp quan sát có trong mẫu. Thường chúng ta hay cho phép cácphỏng vấn viên lựa chọn người cần phỏng vấn. Khi điều này xảy ra, rõ ràng là các thiênlệch có thể phát sinh ra và làm méo mó kết quả nghiên cứu. Tuy nhiên, có những lý dothực tiễn mà người ta lựa chọn các phương pháp kém chính xác hơn như vậy.Chúng ta có thể sử dụng các thủ tục chọn mẫu phi xác suất vì các lý do sau:-Chúng có thể thỏa yêu cầu chọn mẫu có mục tiêu.-Nếu không có mong muốn hoặc không cần thiết phải tổng quát hóa các kết quảnghiên cứu cho dân số tổng thể thì ta không quan tâm lắm đến việc liệu là mẫu cóđại diện đầy đủ cho dân số hay không. Điều này đúng với các nghiên cứu khámphá khi mà chúng ta có thể chỉ muốn gặp những cá nhân, những trường hợp khôngđiển hình, không ai giống ai.-Chọn mẫu phi xác suất ít tốn kém chi phí và thời gian so với chọn mẫu xác suất.-Trong khi chọn mẫu xác suất có vẻ lý tưởng và rất tốt về lý thuyết, thì khi áp dụngvào thực tiễn, lại có nhiều thất bại. Ngay cả khi chúng ta áp dụng cẩn thận cácbước chọn mẫu ngẫu nhiên đơn giản thì chất lượng nghiên cứu vẫn còn tùy thuộcvào mức độ áp dụng cẩn thận hay không cẩn thận của các người liên quan. Vì vậy,các phương pháp chọn mẫu xác suất lý tưởng lại chỉ có thể thành công một phần vìlỗi con người.-Chọn mẫu phi xác suất có thể là cách thay thế duy nhất. Trong nhiều trường hợptrường hợp, có thể ta không biết dân số tổng thể cho nghiên cứu, hoặc ta không thểcó được khung mẫu vì nhiều lý do khác nhau. Và vì vậy, ta không thể có khungmẫu hoặc có cơ sở để chọn mẫu xác suất.-Theo một nghĩa khác, chính những người tham gia nghiên cứu (đối tượng nghiêncứu) có thể tự chọn chính mình để tham gia. Điều này cũng có nghĩa là nhà nghiêncứu không thể bảo đảm sự ngang bằng về cơ hội chọn lựa các đơn vị nghiên cứu.Thông thường, có một số kiểu thiết kế chọn mẫu phi xác suất được áp dụng rộng rãi, kểcả cho nghiên cứu định tính lẫn nghiên cứu định lượng. Đó là chọn mẫu thuận tiện, chọnmẫu theo phán đoán, chọn mẫu hạn ngạch và chọn mẫu quả cầu tuyết. Phần kế tiếp trìnhbày về các thiết kế chọn mẫu này.4.1 Chọn mẫu thuận tiệnChọn mẫu thuận tiện có đặc trưng là nhà nghiên cứu đựa trên sự thuận tiện cho chính họđể tiếp cận đến dân số mục tiêu. Lý do chính là các nhà nghiên cứu hoặc các điều tra viên,có quyền tự do chọn lựa bất kỳ ai họ muốn, vì thế được gọi là “thuận tiện”. Đây là cácmẫu có mức tin cậy ít nhất, nhưng thường là rẻ nhất và dễ tiến hành nhất. Phương pháp19Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)chọn mẫu này khá phổ biến trong nghiên cứu thị trường. Các nghiên cứu thị trườngthường sử dụng cách chọn mẫu thuận tiện này. Các cuộc thăm dò ý kiến khách hàng hầuhết được thực hiện một cách thuận tiện.Trong khi chọn mẫu thuận tiện không có kiểm soát như thế có thể không bảo đảm tínhchính xác, nhưng vẫn là một phương pháp hữu ích. Thường thì ta có thể áp dụng một mẫunhư vậy để kiểm tra các ý tưởng hoặc để có được các ý tưởng về đối tượng nghiên cứu. Ởcác giai đoạn đầu của nghiên cứu khám phá, khi ta tìm kiếm hướng đi, ta có thể áp dụngcách tiếp cận này. Các kết quả có thể rõ ràng đến mức không cần thiết phải áp dụng cácphương pháp chọn mẫu phức tạp.Ví dụ 6.10 Chọn mẫu thuận tiệnTa thường thấy các nhóm giới thiệu sản phẩm thực phẩm, nhất là bánh kẹo hay thứcuống có ga thường tổ chức giới thiệu sản phẩm và phỏng vấn nhanh { kiến người dùngthử tại cửa các siêu thị lớn. Vì sao? Rõ ràng là ở đó, họ có thể dễ dàng tìm gặp nhómkhách hàng tiềm năng của từng loại sản phẩm. Ngoài ra, số lượng lớn khách hàng đếnsiêu thị hàng ngày cũng giúp cho họ đạt được cỡ mẫu nghiên cứu đủ lớn theo { muốn.Một yếu tố khác là các nhóm cũng không phải tốn kém quá nhiều chi phí để tổ chức gặpkhách hàng, vì trong trường hợp này, khách hàng tự đến với họ.4.2 Chọn mẫu theo phán đoánChọn mẫu có mục đích (purposive sampling) là hình thức chọn mẫu phi xác suất mà nhànghiên cứu muốn theo những tiêu chí nào đó. Có hai phương pháp chọn mẫu có mục đíchlà chọn mẫu theo kinh nghiệm (judgment sampling) và chọn mẫu theo hạn ngạch (quotasampling).Chọn mẫu theo phán đoán xảy ra khi nhà nghiên cứu chọn các đơn vị nghiên cứu theo cáctiêu chuẩn nào đó. Thông thường, các nhà nghiên cứu chọn mẫu phán đoán là họ nên tiếpcận với nhóm người nào có thông tin tốt nhất để đạt mục tiêu nghiên cứu. Nhà nghiên cứuchỉ tiếp xúc với những người này để có thông tin cần thiết. Phương pháp này phù hợp khiđược sử dụng vào các giai đoạn đầu của nghiên cứu khám phá. Khi ta muốn chọn mộtnhóm thiên lệch nào đó nhằm mục tiêu thanh lọc dữ liệu thì chọn mẫu theo kinh nghiệmcũng là một phương pháp tốt.Ví dụ 6.11 Chọn mẫu theo phán đoánMột công ty chọn nhân viên của chính họ để đánh giá những sản phẩm mới trước khiđưa ra thị trường. Nếu thất bại, thì các sản phẩm này khó có triển vọng đưa vào thịtrường.Một trường hợp khác, ta muốn nghiên cứu về thị trường xe ô tô gia đình ở Việt Nam. Dĩnhiên là chúng ta phải chọn các đối tượng nghiên cứu là người ở tầng lớp trung lưu trởlên, và phải là người có kinh nghiệm sử dụng xe ô tô gia đình.Một nhóm nghiên cứu thị trường muốn nghiên cứu về việc chọn mua sữa bột dành chotrẻ em dưới 3 tuổi. Nhóm nghiên cứu biết rằng thường chính là các bà mẹ đang nuôi trẻ20Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)là người mua sữa và thông hiểu nhất về l{ do tại sao mà họ chọn lựa loại sản phẩm nàychứ không phải là loại sản phẩm khác. Nhóm quyết định chỉ tiếp cận đối tượng nghiêncứu này.4.3 Chọn mẫu hạn ngạchChọn mẫu hạn ngạch1 (quota sampling) cũng là một là kiểu chọn mẫu có mục đích.Chúng ta áp dụng để cải thiện tính đại diện. Lý do chủ yếu là dân số có thể có vài chiềukích và chọn mẫu theo hạn ngạch có thể mô tả được các chiều kích này.Trong chọn mẫu hạn ngạch, nhà nghiên cứu phải chỉ ra nhiều hơn một hướng kiểm soát.Mỗi hướng phải thỏa mãn hai điều kiện: (1) có một phân phối trong dân số để chúng ta cóthể ước lượng và (2) thích hợp với chủ đề nghiên cứu. Để minh họa, ta quan sát cáctrường hợp sau:Giới tính: hai nhóm thuộc tính – nam, nữ.Trình độ học vấn: hai nhóm thuộc tính: đại học – trung học.Khoa ngành trong trường đại học.Tôn giáo: bốn nhóm thuộc tính – Phật giáo, Thiên chúa giáo, Tin lành, khác.Thành viên hiệp hội: hai nhóm thuộc tính – thành viên, không phải thành viên.Tấng lớp kinh tế - xã hội: ba nhóm thuộc tính: giàu, trung bình, nghèo.Tương tự như chọn mẫu phân tầng, chọn mẫu hạn ngạch có thể theo tỷ lệ hoặc khôngtheo tỷ lệ.Chọn mẫu hạn ngạch có vài hạn chế. Thứ nhất, không có gì bảo đảm mẫu sẽ đại diện chocác biến cần nghiên cứu. Thứ hai, việc chọn lựa đơn vị nghiên cứu tùy thuộc vào điều traviên, và tùy thuộc vào kinh nghiệm của chính họ. Vì vậy, họ có thể chọn những ngườithân thiết, ban bè quen thuộc để dễ thực hiện công việc.Tuy vậy, nhìn chung là chọn mẫu hạn ngạch có ít rủi ro về thiên lệch hệ thống, và thườngthỏa mãn được các yêu cầu dự đoán nói chung.Ví dụ 6.12 Chọn mẫu hạn ngạchMột công ty nghiên cứu thị trường muốn tìm hiểu hành vi lựa chọn xe gắn máy củangười tiêu dùng ở thành phố Hồ Chí Minh. Với nguồn thống kê thương mại, họ biết rằngthị phần trung bình của xe Honda là 50%, Yamaha là 30%, SYM là 15% và các nhãn hiệukhác là 5%. Với cỡ mẫu nghiên cứu dự tính là 200 cá nhân người tiêu dùng, công tyquyết định phân bố mẫu theo tỷ lệ thị phần trên. Như vậy, mẫu bao gồm 100 ngườidùng xe Honda, 60 người dùng xe Yamaha, 30 người dùng xe SYM và 10 người dùng xecác nhãn hiệu khác.1Một số tài liệu khác có thể dùng thuật ngữ “Chọn mẫu định mức” để chỉ phương pháp này.21Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)4.4 Chọn mẫu quả cầu tuyếtKiểu chọn mẫu quả cầu tuyết (snowball sampling) còn được gọi là chọn mẫu mở rộng.Phương pháp này được áp dụng khi ta khó xác định các người trả lời và khó tiếp cận đượchọ. Cách này rất phù hợp cho các nghiên cứu định tính và đối với các nhóm người đặcthù, có những tính chất nào đó mà ta khó tiếp cận.Nguyên tắc là, ở giai đoạn đầu tiên, ta cần phải phát hiện một vài cá nhân cần tìm hiểu vàthu thập thông tin từ họ. Rồi sau đó ta yêu cầu các cá nhân này chỉ cho ta những ngườikhác có các đặc điểm tương tự như họ hoặc là những thành viên khác. Ta sẽ tiếp tục tiếpcận, thu thập thông tin rồi lại hỏi các thành viên khác. Cứ tiếp tục như thế, nhà nghiêncứu sẽ được các người trả lời chỉ cho những người khác và mở rộng mẫu nghiên cứu chođến lúc đạt được cỡ mẫu cần thiết.Phương pháp này khá phù hợp cho những nghiên cứu mà đối tượng là những nhóm ngườiđặc thù, ví dụ như cộng đồng các doanh nhân trong một ngành nào đó, cộng đồng cácnghệ sĩ nổi tiếng, hoặc đối tượng là những nhóm người thuộc cộng đồng xã hội có tínhnhạy cảm nào đó, như cộng đồng người nghiện ma túy chẳng hạn.5. XÁC ĐỊNH CỠ MẪU5.1 Các khái niện căn bản liên quan đến chọn mẫu và xác định cỡ mẫuGiá trị trung bình ( ) của mẫu rút ra từ một dân số cho trước là một giá trị ước lượngđiểm và là thông số tốt nhất dùng để ước lượng giá trị trung bình chưa biết của dân số, µ.Chúng ta không thể coi trung bình mẫu là trung bình dân số. Tuy nhiên, chúng ta có thểước lượng khoảng tin cậy mà trung bình dân số µ rơi vào. Ta có thể áp dụng công thứctính sai số chuẩn (standard error of the mean) - σ hay là se.X nvớiσ = sai số chuẩn của giá trị trung bình hay là độ lệch chuẩn của tất cả giá trị trung bìnhs có thể có.σ = độ lệch chuẩn của dân sốn = cỡ mẫuĐộ lệch chuẩn của mẫu được sử dụng như là ước lượng không chệch cho độ lệch chuẩncủa dân số.x snvới22Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)s = độ lệch chuẩn của mẫu nGiả sử ta có:n1 = 10,1= 3,0 và s1 = 1,15x sn=1.1510= 0,36Giá trị trung bình của dân số, µ, có thể được ước lượng theo công thức sau:µ=σBởi vì chúng ta không điều tra tổng thể nên ta chưa biết giá trị µ và σ. Tuy nhiên, ta cóthể áp dụng công thức µ =σ . Theo ví dụ trên, µ = ± σ . = 3,0 ± 0,36Tuy nhiên, vì sai số chuẩn có tính chất như các thông số thống kê khác, ta chỉ có thể cómức tin cậy 68% về giá trị ước lượng này. Điều này có nghĩa là một sai số chuẩn chỉ chứađựng ± 1Z hay là 68% diện tích dưới đường phân phối chuẩn.Ta sẽ sử dụng chỉ số thống kê khoảng tin cậy (confidence interval). Để tăng độ tin cậy lên95%, ta phải nhân sai số chuẩn với ± 1,96 (Z), khi 1,96 (Z) bao phủ 95% diện tích dướiđường phân phối chuẩn. Tương tự như vậy, để nâng độ tin cậy lên 99%, ta phải nhân saisố chuẩn với ± 3,0 (Z), khi 3,0 (Z) bao phủ 99% diện tích dưới đường phân phối chuẩn.Do đó, khoảng tin cậy của giá trị trung bình dân số, µ sẽ là:Ở mức tin cậy 68%: 2,64 – 3,36 (µ = 3,0 ± 0,36)Ở mức tin cậy 95%: 2,29 – 3,71 (µ = 3,0 ± 0,71)Ở mức tin cậy 99%: 1,92 – 4,08 (µ = 3,0 ± 1,08)5.2 Xác định cỡ mẫu theo giá trị trung bìnhTrước khi tính cỡ mẫu mong muốn, chúng ta hãy coi lại các thông tin cần thiết:1. Mức chính xác mong muốn và làm thế nào để lượng hóa nó:a. Mức tin cậy (confidence level) mà ta muốn đạt được.b. Độ lớn của khoảng tin cậy (size of the interval estimate), hay nói cách kháclà độ lớn của sai số mà ta muốn đạt được.2. Độ biến thiên kỳ vọng của dân số.Ta phải xác định rõ mức chính xác mong muốn. Thường thì mức tin cậy 95% được ápdụng rộng rãi, tuy nhiên chúng ta vẫn có thể tăng hay giảm mức tin cậy mong muốn tùytheo từng nghiên cứu cụ thể. Khi đã xác định được mức tin cậy có nghĩa là ta xác địnhđược hệ số Z cần tính ở mức tương ứng.23Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Tương tự như vậy, ta cũng cần xác định độ lớn của sai số mà ta muốn có nhằm tiên đoáncác chỉ số của dân số dựa trên dữ liệu rút ra từ mẫu.Yếu tố kế tiếp ảnh hưởng đến cỡ mẫu với mức tin cậy cho trước là mức độ biến thiên củadân số. Mức độ biến thiên càng nhỏ thì cỡ mẫu ta cần cũng càng nhỏ. Ngược lại, mức độbiến thiên càng lớn thì cỡ mẫu sẽ phải càng lớn. Tuy nhiên, không phải lúc nào ta cũng cócác chỉ số thể hiện mức độ biến thiên của dân số như phương sai hay độ lệch chuẩn. Tuynhiên, ta có thể biết được mức độ biến thiên của dân số nhờ vào:-Sử dụng kết quả tính phương sai hay độ lệch chuẩn từ các nghiên cứu trước đâytrên cùng chủ đề.-Tính phương sai và độ lệch chuẩn dựa trên kết quả khảo sát thử nghiệm (pilotsurvey) trên một mẫu nhỏ rút ra từ dân số.-Trong trường hợp không áp dụng được cả hai cách trên, ta có thể áp dụng mộtphỏng đoán như sau: giả sử các quan sát tuân theo quy luật phân phối chuẩn, thìđộ lêch chuẩn bằng khoảng 1/6 khoảng dao động của dữ liệu (tối thiểu - tối đa) vớiđộ tin cậy 99.73%.Sau khi có được cả ba thông số cần thiết (mức tin cậy, độ lớn của sai số, phương sai hayđộ lệch chuẩn), ta có thể tính được cỡ mẫu theo công thức (6.3) dưới đây:snx (6.1)sx(6.2)s2n 2x(6.3)nVí dụ 6.13 Tính cỡ mẫu cho nghiên cứu thu nhập của sinh viên (đơn vị tính: triệuđồng/tháng)Bước 1. Chọn mức độ chính xác mong muốn:-Mức tin cậy (confidence level): 95% (Z=1,96)-Độ lớn của khoảng tin cậy, hay là mức sai số của giá trị thu nhập mà ta muốn đạtđược qua nghiên cứu: ± 0,25 (tr.đồng/tháng) = Z*se, suy ra s.e = 0,25/ZBước 2. Xác định độ biến thiên kz vọng trong dân số (expected dispersion in thepopulation): dựa trên các kết quả nghiên cứu gần đây về thu nhập của sinh viên, ta cógiá trị độ lệch chuẩn tham khảo = 0,7 (tr.đồng/tháng)Bước 3. Phỏng định sai số chuẩn: se = 0,25/Z = 0,25/1,96 = 0,127Bước 4. Xác định cỡ mẫu n = s2/ x 2 = 0,72/0,1272 = 30,38 = 3024Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011)Nếu ta muốn nâng mức độ chính xác mong muốn từ 95% lên 99%, thì Z thay đổi từ 1,96đến 3,0. Áp dụng vào công thức tính ta có:-Phỏng định sai số chuẩn: se = 0,25/3,0 = 0.083-Cỡ mẫu n = 0,72/0,0832 = 71,02 = 71Như vậy, khi tăng mức tin cậy từ 95% lên 99%, trong trường hợp này, chúng ta phảităng cỡ mẫu lên 2,4 lần.Nếu ta muốn giảm độ lớn của khoảng tin cậy (tăng mức chính xác của nghiên cứu)xuống còn 0,1 triệu đồng/tháng thay vì 0,25 triệu đồng/tháng, và vẫn giữ mức tin cậy95%. Áp dụng vào công thức tính, ta có:oPhỏng định sai số chuẩn: se = 0,1/1,96 = 0.051oCỡ mẫu n = 0,72/0,0512 = 188,38 = 188Như vậy, khi giảm độ lớn của khoảng tin cậy xuống 2,5 lần, cỡ mẫu phải tăng 6,3 lầntrong trường hợp này.5.3 Xác định cỡ mẫu theo tỷ lệĐối với một số trường hợp nghiên cứu, ta mong muốn biết được tỷ lệ chính xác của mộtdân số phụ trong một dân số có một thuộc tính cho trước thay vì xác định giá trị trungbình của dân số. Giả sử ta muốn nghiên cứu xem tỷ lệ sinh viên của một trường đại họcnào đó sở hữu máy tính xách tay là bao nhiêu phần trăm; tỷ lệ của các doanh nghiệp vừavà nhỏ làm ăn thua lỗ trong năm tài chính vừa qua. Với các trường hợp này, dĩ nhiên mụctiêu của ta không phải là tìm giá trị trung bình về sở hữu máy tính xách tay trong sinhviên hay là giá trị trung bình của các doanh nghiệp bị thua lỗ. Ngoài ra, các khái niệmtrung bình này cũng không tồn tại vì các biến ta cần đo lường là các biến định tính, vớithang do dữ liệu là thang đo danh nghĩa.Với cách xác định cỡ mẫu theo tỷ lệ, ta phải xác định tỷ lệ của dân số mà chúng có mộtthuộc tính cho trước, tỷ lệ này gọi là p. Và thay vì sử dụng độ lệch chuẩn, độ biến thiêncủa dân trong trường hợp này được xác định bằng p x q, trong đó q là tỷ lệ của dân sốkhông có thuộc tính đó, tức là q = (1 – p). Tương tự như vậy, sai số chuẩn của trung bìnhđược thay thế bằng sai số chuẩn của tỷ lệ, σp. Ta có công thức sau:p npqnpq2(6.4)(6.5)pVới pq là chỉ thị của độ biến thiên của mẫu, được dùng như là một ước lượng của độ biếnthiên của dân số; σp là sai số chuẩn của tỷ lệ; và n là cỡ mẫu;25

Tài liệu liên quan

  • Nghiên cứu thống kê hiệu quả sản xuất kinh doanh của Công ty chế tạo dầm thép và xây dựng Thăng Long.doc Nghiên cứu thống kê hiệu quả sản xuất kinh doanh của Công ty chế tạo dầm thép và xây dựng Thăng Long.doc
    • 78
    • 816
    • 7
  • Phương pháp nghiên cứu thống kê nhu cầu hàng hóa trên thị trường Việt Nam - (Môn Thống Kê Thương Mại) SV Nhóm 01 - ĐH Thương Mại.doc Phương pháp nghiên cứu thống kê nhu cầu hàng hóa trên thị trường Việt Nam - (Môn Thống Kê Thương Mại) SV Nhóm 01 - ĐH Thương Mại.doc
    • 19
    • 3
    • 18
  • Nghiên cứu thống kê tình hình XNK Hàng hóa của VN trong giai đoạn 1991-2000 Nghiên cứu thống kê tình hình XNK Hàng hóa của VN trong giai đoạn 1991-2000
    • 113
    • 502
    • 0
  • Nghiên cứu thống kê hiệu quả sản xuất kinh doanh của Công ty chế tạo dầm thép và xây dựng Thăng Long Nghiên cứu thống kê hiệu quả sản xuất kinh doanh của Công ty chế tạo dầm thép và xây dựng Thăng Long
    • 63
    • 649
    • 0
  • Nghiên cứu thống kê hiệu quả sản xuất kinh doanh tại Công ty Cổ phần vận tải và dịch vụ hàng hóa Hà Nội Nghiên cứu thống kê hiệu quả sản xuất kinh doanh tại Công ty Cổ phần vận tải và dịch vụ hàng hóa Hà Nội
    • 64
    • 649
    • 2
  • Nghiên cứu thống kê hiệu quả sản xuất kinh doanh tại Cty Cổ phần vận tải & dịch vụ hàng hóa Hà Nội Nghiên cứu thống kê hiệu quả sản xuất kinh doanh tại Cty Cổ phần vận tải & dịch vụ hàng hóa Hà Nội
    • 73
    • 565
    • 0
  • Nghiên cứu thống kê quy mô, cơ cấu và hiệu quả sử dụng vốn sản xuất kinh doanh của Công ty xây dựng 99 thời kỳ 2000 - 2007 Nghiên cứu thống kê quy mô, cơ cấu và hiệu quả sử dụng vốn sản xuất kinh doanh của Công ty xây dựng 99 thời kỳ 2000 - 2007
    • 114
    • 762
    • 0
  • Nghiên cứu thống kê kết quả hoạt động du lịch ở Việt Nam giai đoạn 1995 - 2002 và dự đoán đến năm 2005 Nghiên cứu thống kê kết quả hoạt động du lịch ở Việt Nam giai đoạn 1995 - 2002 và dự đoán đến năm 2005
    • 145
    • 664
    • 6
  • Nghiên cứu thống kê kết quả sản xuất kinh doanh của Công ty cổ phần thiết bị xăng dầu Petrolimex Nghiên cứu thống kê kết quả sản xuất kinh doanh của Công ty cổ phần thiết bị xăng dầu Petrolimex
    • 98
    • 626
    • 2
  • Nghiên cứu thống kê kết quả hoạt động du lịch ở Việt Nam giai đoạn 1995 – 2002 và dự đoán đến năm 2005 Nghiên cứu thống kê kết quả hoạt động du lịch ở Việt Nam giai đoạn 1995 – 2002 và dự đoán đến năm 2005
    • 114
    • 593
    • 0

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

(1.03 MB - 27 trang) - Phương pháp chọn mẫu và xác định cỡ mẫu Tải bản đầy đủ ngay ×

Từ khóa » Cỡ Mẫu Thuận Tiện