[Dịch Tễ] Chương 4- Phương Pháp Chọn Mẫu - Jainie's Corner

Chương 4

PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU DỊCH TỄ DƯỢC HỌC
MỤC TIÊU

1. Trình bày được công thức tính cỡ mẫu và ứng dụng trong các thiết kế nghiên cứu.

2. Trình bày được các kĩ thuật chọn mẫu và ứng dụng

  1. MỘT SỐ KHÁI NIỆM

– Quần thể (Population): là tập hợp tất cả các cá thể hay thực thể mà chúng ta quan tâm ở một khía cạnh nào đó trong một khoảng thời gian nhất định.

– Mẫu (sample): Là tập hợp nhỏ trong quần thể.

– Khung chọn mẫu : Danh sách hoặc bản đồ các đơn vị lấy mẫu.

– Đơn vị lấy mẫu : Đơn vị cơ bản để thực sự chọn mẫu.

-Đơn vị quan sát : Đối tượng mà chúng ta tiến hành đo lường trên một đặc điểm nào đó

Chú ý : Đơn vị quan sát và đơn vị lấy mẫu có thể trùng hoặc không trùng nhau

Các tham số mẫu và quần thể

Capture10

  1. XÁC ĐỊNH CỠ MẪU NGHIÊN CỨU
  2. Các yếu tố ảnh hưởng đến cỡ mẫu nghiên cứu

Xác định cỡ mẫu hợp lý là vấn đề quan trọng để bắt đầu mọi nghiên cứu. Nếu cỡ mẫu quá lớn sẽ tốn nhân lực, kinh phí, thời gian, có thể mắc sai lầm lãng phí, không kinh tế thậm chí có thể thất bại vì không có khả năng thực hiện. Ngược lại, nếu cỡ mẫu nghiên cứu quá nhỏ, tức là số cá thể đưa vào nghiên cứu quá ít, thường mang lại kết quả kém tin cậy và ít giá trị sử dụng; do đó cũng lãng phí thời gian, nhân lực, tiền của. Vậy, làm thế nào để chọn được cỡ mẫu hợp lý, vừa đảm bảo độ tin cậy về thống kê (tức là mẫu phải thực sự đại diện cho quần thể), vừa phù hợp với nguồn lực hiện có và kinh tế khi thực hiện?

Cỡ mẫu cần xác định thay đổi phụ thuộc vào các yếu tố sau:

  • Loại thiết kế nghiên cứu: Các nghiên cứu dọc (longitudinal) thường yêu cầu  cỡ mẫu cao hơn loại nghiên cứu cắt ngang (cross-sectional study). Cỡ mẫu trong các nghiên cứu thăm dò thường không quan trọng, vì không nhất thiết phải ngoại suy. Các nghiên cứu trường hợp (case study) cũng không nhất thiết phải xác định cỡ mẫu.
  • Phương pháp chọn mẫu: Nhìn chung các thiết kế mẫu chùm yêu cầu cỡ mẫu lớn hơn các thiết kế mẫu khác
  • Tần xuất xuất hiện biến cố nghiên cứu: Sự kiện cần quan tâm càng hiếm gặp, cỡ mẫu cần nghiên cứu càng lớn.
  • Sự biến thiên của sự kiện cần quan tâm: Sự khác nhau của biến số nghiên cứu giữa các cá thể trong quần thể càng lớn thì cỡ mẫu nghiên cứu càng lớn.
  • Mức độ sai lệch cho phép giữa tham số mẫu và tham số quần thể mong muốn: Càng muốn ít sai lệch, cỡ mẫu càng phải lớn.
  • Trường hợp một nghiên cứu khảo sát đồng thời nhiều tham số: Cỡ mẫu xác định độc lập theo từng biến số và lựa chọn cỡ mẫu lớn nhất trong tất cả các biến số.
  • Khả năng thực thi của nghiên cứu thường là những yếu tố rất quan trọng trong việc lựa chọn cỡ mẫu: Kinh phí hiện có, nhân lực (số lượng và chất lượng), thời gian, giao thông, phương tiện đi lại.
  • Sai lầm mà nhà nghiên cứu chấp nhận: Sai lầm loại I và sai lầm loại II
  1. Cách tính cỡ mẫu

Có nhiều cách để tính cỡ mẫu: dùng công thức, tra bảng, dùng biểu đồ, các chương trình, phần mềm máy vi tính… Với khuôn khổ nghiên cứu dịch tễ dược, ở đây chỉ đưa ra công thức tính cỡ mẫu cho 1 số nghiên cứu phổ biến nhất.

Quy trình tổng quát:

12

  1. Quy định phạm vi sai số cho phép

Độ lớn của sai số phải nằm trong dung sai của mục đích nghiên cứu. Lựa chọn độ lớn của sai số (khoảng sai số cho phép) phụ thuộc vào độ nhạy của kết quả. Các nhà nghiên cứu nói chung phải rất thông thạo về mặt này.α

  1. Định rõ độ tin cậy để từ đó xác định hệ số tin cậy

Nếu muốn có kết quả nghiên cứu với mức tin cậy là 100% thì phải tiến hành điều tra toàn bộ cá thể trong quần thể. Song điều này quá tốn kém và không thực tế. Do vậy thường phải chấp nhận mức tin cậy dưới 100%, thường dùng là 99%, 95% và 90%. Trong đó phổ biến nhất là mức tin cậy 95% cho phép kết quả của nghiên cứu sai khác 5% so với giá trị thực của quần thể, và mức sai sót này thường được chấp nhận đối với phần lớn các quyết định trong nghiên cứu y dược, kinh tế, xã hội học. Thông thường trong các nghiên cứu dịch tễ người ta hay nói đến các hệ số tin cậy sau:

Mức tin cậy (1- α) Hệ số tin cậy tương ứng
0.90 1.65
0.95 1.96
0.99 2.58

Cách tra Z

α = 95% à  = 0,9750

Tra bảng  = 1,90 + 0,06 = 1,96

Z 0,00 0,01 0,02 0,06
0,00 0,5000 0,5040 0,5080 0,5239
1,80 0,9641 0,9649 0,9656 0,9686
1,90 0,9713 0,9797 0,9726 0,9750
  1. Ước tính độ lệch chuẩn

– Nếu trước đây đã có nghiên cứu được xem là tương tự với nghiên cứu lần này: Có thể lấy độ lệch chuẩn của lần điều tra trước.

– Tiến hành điều tra thử tính độ lệch chuẩn.

– Có thể ước tính độ lệch chuẩn theo khoảng biến thiên R tùy theo đặc điểm phân phối của sự kiện nghiên cứu. Nếu là phân phối chuẩn thì:

13

  1. Ước tính giá trị tỉ lệ

– Nếu trước đây đã có nghiên cứu và được xem là tương tự với lần này thì có thể gắn P là tỉ lệ ước tính nghiên cứu dựa trên các nghiên cứu trước đó.

– Tiến hành nghiên cứu thử để xác định

– Trường hợp cần thiết có thể gán cho P = 0.5; khi đó P(1-P) sẽ lớn nhất và cỡ mẫu khi đó là tối đa

  1. Các công thức tính cỡ mẫu cần dùng

Tùy thuộc vào thiết kế nghiên cứu và tham số ước lượng mà lựa chọn công thức tính cỡ mẫu.

Trong trường hợp quần thể vô cùng lớn, với mức tin cậy định trước, ta có các công thức sau:

  • Thiết kế nghiên cứu mô tả

Mục đích của nghiên cứu mô tả thường nhằm ước lượng một tham số quần thể. Để xác định cỡ mẫu cần xác định:

-Thông số (biến số) nghiên cứu: Xác định dựa trên mục tiêu nghiên cứu. Ví dụ tỉ lệ khách hàng mua thuốc không có đơn trong quần thể sẽ được ước tính thông qua việc quan sát một mẫu từ quần thể đó, biến số nghiên cứu sẽ là tỉ lệ khách hàng mua thuốc không có đơn trong mẫu.

– Phân bố xác suất của thông tin nghiên cứu: Hầu hết thuộc hai trường hợp: Phân bố nhị thức (khi ước tính một tỉ lệ của một sự kiện nào đó) và phân bố chuẩn (khi ước tính giá trị trung bình)

– Mức độ chính xác mong muốn của kết quả: Về nguyên tắc, mọi nghiên cứu đều mong có một ước tính gần giá trị thực của quần thể nhất. Do đó, cần xem xét đo lường độ chênh lệch giữa giá trị ước tính và giá trị của quần thể. Việc tính toán cỡ mẫu cho quần thể phụ thuộc hai tham số: khoảng tin cậy và hệ số tin cậy.

– Cỡ mẫu cho việc ước tính một giá trị trung bình trong quần thể

14

Như vậy. cỡ mẫu cần thiết cho nghiên cứu này tối thiểu là 408 đơn thuốc. Nếu mỗi nhà thuốc thu thập 10 đơn thì số nhà thuốc cần tiến hành khảo sát là 41.

  • Cỡ mẫu cho việc ước tính một tỉ lệ trong quần thể

Áp dụng công thức sau

15

Như vậy số đơn thuốc cần phải thu thập điều tra là 246.

Ví dụ: Cần tìm hiểu mối liên quan giữa bệnh đường hô hấp (tai mũi họng) với việc tiếp xúc thường xuyên với hóa chất. Giả sử tỷ lệ mắc ít nhất một trong số các bệnh tai mũi họng ở những người có điều kiện tương tự theo các thống kê trước đó là 65%. Chọn α = 0,5, như vậy mức tin cậy là 1 – α = 95%. Hệ số tin cậy  tra bảng bằng 1,96. Tỷ lệ sai lệch mong muốn không quá 5% so với tỷ lệ thực (độ chính xác tuyệt đối). Ta có:

Như vậy số người tối thiểu cần phải khảo sát sẽ là 350 người.

  • Nghiên cứu phân tích

Do mục đích cơ bản của nghiên cứu phân tích là để kiểm định giả thuyết , xác định cỡ mẫu phụ thuộc vào các giới hạn của sai số mà chúng ta sẽ phải chấp nhận khi ta đồng ý hay phủ nhận giả thuyết  (sai số loại I hay sai số loại II).

+ Giả thuyết : Không có sự khác biệt có ý nghĩa thống kê giữa hai nhóm

+Giả thuyết : Có sự khác biệt có ý nghĩa thống kê giữa 2 nhóm. Chấp nhận H1 sẽ có 2 trường hợp:

Có sự khác nhau nhưng không xác định được là lớn hơn hay nhỏ hơn, tức là  (Kiểm định 2 chiều).

Có sự khác nhau nhưng xác định được lớn hơn hay nhỏ hơn, nghĩa là  hoặc  (kiểm định 1 chiều).

Sai lầm loại I (α): Loại bỏ giả thuyết  trong khi  đúng (phủ định nhầm)

Sai lầm loại II (β): Chấp nhận giả thuyết  trong khi  sai (ngộ nhận- khẳng định nhầm)

Thực tế
 đúng  sai
Quyết định Chấp nhận Quyết định đúng (xác suất 1- α) Sai lầm loại II, xác suất β
Bác bỏ Sai lầm loại I (xác suất α) Không có sai lầm, xác suất (1- β)

α: mức ý nghĩa thống kê. Thông thường: α= 0.05, 0,10

1- α: độ tin cậy. Độ tin cậy 90%, 95%.

1- β: lực kiểm định của mẫu. Thông thường: β= 0.2, 0.1, lực kiểm định 80-90%

Cũng giống như nghiên cứu mô tả, người nghiên cứu phải xác định các thông số mẫu cần xem xét (tỉ lệ, giá trị trung bình mẫu, ước tính nguy cơ tương đối hay tỉ suất chênh…) và phân bố mẫu của chúng (trên cơ sở đó quyết định chấp nhận hay phủ nhận giả thuyết ). Bằng việc đặt phương trình giữa hai loại sai số dựa trên phân bố mẫu và các giới hạn cho trước của các sai số này, chúng ta có thể tính được cỡ mẫu.

a, Kiểm định chênh lệch giữa hai giá trị trung bình

16

Ví dụ: Cần phải thu thập bao nhiêu đơn thuốc để tìm sự chênh lệch về số thuốc trung bình trong 1 đơn được thu thập từ các nhà thuốc tư của HN (quần thể A) và nhà thuốc tư của tp.HCM (quần thể B), với mức độ tin cậy 95% và sai số 0,1. Giả sử phương sai quần thể ở hai nhóm này là như nhau và bằng 1,0.

Ta có:

17

Như vậy, số đơn thuốc tối thiểu cần phải thu thập ở mỗi nhóm là 1568 đơn.

B, Kiểm định chênh lệch hai giá trị tỉ lệ

Trong các nghiên cứu dịch tễ, có khi cần tìm hiểu sự chênh lệch về phân bố của một đặc trưng X trên hai quần thể khác nhau hoặc trên cùng quần thể nhưng trong các khoảng thời gian khác nhau. Chẳng hạn, so sánh tỉ lệ đơn thuốc có kê kháng sinh của 2 thành phố; xác định chênh  lệch về tỉ lệ số lần dùng thuốc có hướng dẫn đầy đủ cho người bệnh giai đoạn trước và sau khi thực hiện can thiệp giáo dục các nhà thuốc của một tỉnh hay thành phố; so sánh giá trị trung bình cùng một cơ số thuốc giữa 2 tỉnh khác nhau.

18

. Lưu ý : Trong trường hợp kiểm định một chiều (đòi hỏi kiểm định xem cụ thể có sự tăng lên hay giảm đi của tỉ lệ hay trung bình cộng giữa 2 quần thể không chứ không đơn thuần là có sự khác nhau hay không), thay  ở công thức (3) và (4) thành Z(1-α)

Trong trường hợp quần thể hữu hạn (N <10.000). Người ta phải dùng yếu tố hiệu chỉnh cho cỡ mẫu . Có rất nhiều cách khác nhau để hiệu chỉnh cỡ mẫu trong quần thể hữu hạn, chẳng hạn ta có thể tính n theo công thức sau

19

Trong đó: N là kích thước quần thể hữu hạn, n là cỡ mẫu sẽ được rút ra từ quần thể này, ni  là cỡ mẫu tính được từ quần thể vô hạn theo những công thức đã được tình bày ở trên.

Chú ý: Việc tính toàn cỡ mẫu nghiên cứu như đã nói ở trên là cỡ mẫu tối thiểu vừa đủ. Tuy nhiên trong nhiều trường hợp việc tính toán cỡ mẫu đòi hỏi phải có kiến thức nhất định về toán thống kê. Trong quá trình tính toán mẫu nghiên cứu cần phải chú ý những điểm sau:

  • Khi ước lượng một số trung bình thì cỡ mẫu tối thiểu là 30 trở lên.
  • Khi ước lượng tỷ lệ nằm trong khoảng 10% đến 90% thì cỡ mẫu tối thiểu là 100 trở lên.
  • Trường hợp tỉ lệ với ước lượng tỉ lệ dưới 10% hoặc 90% thì cỡ mẫu bắt buộc phải lớn hơn 100, tỉ lệ ước lượng càng thấp thì cỡ mẫu càng phải lớn. Đối với các tỉ lệ ước lượng quá thấp, dưới 1% cần phải có sự tư vấn của nhà thống kê.

III. KĨ THUẬT CHỌN MẪU NGHIÊN CỨU

  1. Yêu cầu của một mẫu nghiên cứu

Việc xác định quần thể nghiên cứu tùy thuộc vào nhiều vấn đề như : ý tưởng của người làm nghiên cứu, vấn đề cần được nghiên cứu, các thông tin sẵn có cho việc chọn mẫu, sự hiện diện của các nguồn lực phục vụ cho nghiên cứu… Quần thể nghiên cứu cần xác định rõ, phải bao hàm cả về khái niệm không gian và thời gian.

Thiết kế nghiên cứu cần đáp ứng :

-Mẫu đại diện cho quần thể nghiên cứu : mẫu có tất cả các tính chất cơ bản từ quần thể mà từ đó nó được rút ra.

-Cỡ mẫu : Vừa đủ lớn để cho phép khái quát hóa một cách tin cậy cho quần thể nghiên cứu.

-Tính thực tế và tiện lợi : mẫu được chọn sao cho việc thu thập số liệu dễ dàng và thuận tiện.

-Tính kinh tế và hiệu quả : Thông tin thu được là nhiều nhất trong khi chi phí thấp nhất.

20

  • So sánh chọn mẫu xác suất/ không xác suất
Chọn mẫu xác suất Chọn mẫu không xác suất
– Mỗi đối tượng nghiên cứu được chọn vào trong mẫu nghiên cứu với một xác suất khác không.

– Thường sử dụng danh sách mẫu hoặc khung chọn mẫu (sampling forms) để chọn mẫu.

– Các quy trình chọn mẫu thường được xác định rõ ràng, chặt chẽ.

– Đảm bảo tính đại diện cho quần thể

– Chọn mẫu không dựa trên các nguyên lí thống kê học, mà dựa trên các yếu tố như: tính thuận tiện (sẵn có)l theo chỉ tiêu định trước; theo mục đích.

(Do điều kiện không cho phép chọn mẫu ngẫu nhiên)

– Không đảm bảo tính đại diện cho quần thể

  1. Các phương pháp chọn mẫu xác suất

2.1. Kĩ thuật chọn mẫu ngẫu nhiên đơn

  1. Khái niệm

Là cách chọn mẫu mà các cá thể trong quần thể có cơ hội (xác suất) được chọn vào mẫu là như nhau.

  1. Cách tiến hành

+ Lập danh sách tất cả các cá thể trong quần thể (lập 1 khung chọn mẫu), mã hóa bằng số: đánh số thứ tự các cá thể.

+ Xác định cỡ quần thể N, cỡ mẫu n.

+ Sử dụng 1 quá trình ngẫu nhiên chọn ra n cá thể: dùng bảng số ngẫu nhiên, dùng máy tính, tung xu, xúc sắc, bốc thăm.

Chọn mẫu ngẫu nhiên đơn được ứng dụng với nghiên cứu có cỡ mẫu nhỏ

  • Cách dùng bảng số ngẫu nhiên:
  • Xác định điểm bắt đầu trong khung chọn mẫu bằng cách nhắm mắt và chỉ tay vào 1 số ngẫu nhiên trên bảng số.
  • Bắt đầu từ một số sao cho a chữ số cuối của số được chọn nằm trong khoảng chọn mẫu (a là số chữ số của n). Bắt đầu ở vị trí này, theo một chiều tự chọn (ví dụ: từ trái qua phải, từ trên xuống dưới,…) chọn ra 10 số có a chữ số cuối trong khoảng đánh số thứ tự của quần thể cho đến khi đủ n đơn vị.
  • Không chọn lại số đã được chọn. Nếu hết bảng vẫn chưa đủ số n, chọn điểm khởi đầu khác, chọn hướng khác

VD: sgt

  1. Ưu điểm, nhược điểm của kĩ thuật chọn mẫu ngẫu nhiên đơn

– Ưu điểm:

+ Kĩ thuật chọn mẫu đơn giản, tính ngẫu nhiên và tính đại diện cao.

+ Là kĩ thuật chọn mẫu xác suất cơ bản, có thể được áp dụng lồng trong những kĩ thuật chọn mẫu phức tạp hơn, làm cơ sở để thực hiện các kĩ thuật chọn mẫu khác.

-Nhược điểm:

+ Phải lập danh sách (khung chọn mẫu) và đánh số à chỉ ứng dụng khi chọn mẫu nhỏ, khó thực hiện nếu mẫu lớn và không ổn định.

+ Do kĩ thuật này các cá thể có xác suất được chọn vào mẫu là như nhau, cá thể có thể bị phân bố tản mạn về địa lý

+ Với các quần thể nghiên cứu tham số nghiên cứu thay đổi rõ rệt theo cấu trúc quần thể à chọn mẫu ngẫu nhiên khó đem lại sự ước lượng phù hợp.

2.2. Kĩ thuật chọn mẫu ngẫu nhiên hệ thống

  1. Khái niệm:

Trong kĩ thuật chọn mẫu ngẫu nhiên hệ thống , mỗi cá thể trong danh sách được chọn ra bằng cách áp dụng một khoảng hằng định theo sau bởi 1 sự bắt đầu ngẫu nhiên.

  1. Tiến hành

– Lập khung chọn mẫu: Các cá thể được ghi vào danh sách hoặc được trình bày trên bản đồ: đánh số thứ tự đơn vị mẫu.

– Xác định khoảng cách mẫu k: k =N/khoảng , lấy phần nguyên của k. Trong trường hợp cỡ quần thể không xác định, có thể dựa vào cỡ mẫu n để ước lượng k cần lấy.

– Xác định đơn vị mẫu:

+ Chọn đơn vị mẫu bắt đầu trên khoảng k: chọn theo phương pháp ngẫu nhiên 1 số nằm giữa 1 và k (sử dụng bảng số ngẫu nhiên hoặc rút thăm).

+ Chọn đơn vị mẫu tiếp theo bằng cách chọn k với số thứ tự của đơn vị mẫu đầu tiên, tiếp tục như vậy cho đến khi đủ số mẫu.

  1. Ưu nhược điểm

– Ưu điểm:

+ Nhanh, dễ áp dụng

+Nếu danh sách chọn mẫu được xếp ngẫu nhiên thì phương pháp này có đầy đủ những ưu điểm của phương pháp ngẫu nhiên đơn và có thêm các ưu điểm sau:

+Dễ triển khai trên thực địa

+ Sai số chọn ít gặp

+Thu thập được nhiều thông tin hơn

+ Nếu danh sách chọn mẫu được sắp xếp theo thứ tự tầng thì phương pháp này tương tự phương  pháp mẫu tầng có tỷ lệ, tầng có cỡ quần thể lớn hơn sẽ có cỡ mẫu lớn hơn và số cá thể được chọn nhiều hơn.

  • Nhược điểm

+ Khi sắp xếp khung mẫu, nếu có quy luật nào đó trùng với khoảng mẫu k à cá thể chọn ra thiếu tính đại diện.

Ví dụ: lấy số đơn thuốc cho trẻ em: ngày đầu tiên là ngày chủ nhật, nếu lấy k = 7 thì tất cả các ngày trong mẫu đều là chủ nhật, trong khi số đơn thuốc vào ngày chủ nhật sẽ nhiều hơn ngày thường do học sinh được nghỉ học.

2.3. Phương pháp chọn mẫu ngẫu nhiên phân tầng

  1. Khái niệm

Phương pháp chọn mẫu ngẫu nhiên phân tầng là phương pháp là mẫu đạt được bởi sự phân chia của các cá thể trong quần thể nghiên cứu thành các nhóm riêng rẽ gọi là tầng và cách chọn mẫu ngẫu nhiên đơn sẽ được thực hiện trong mỗi tầng.

  1. Tiến hành

+ Xác định tầng: Để phân chia quần thể theo các tầng, phải xác định rõ ràng thế nào là một tầng. Ta dựa trên một vài đặc trưng nào đó như giới tính, tuổi, dân số, vùng địa lý, tầng lớp xã hội, khoa trong bệnh viện. Phải chọn tầng sao cho tầng là một tập con của quần thể và giữa các tầng không có sự chồng chéo.

+ Xác định cỡ mẫu cho từng tầng:

Trong đó: ni là cỡ mẫu cho từng tầng.

Ni  là số lượng cá thể trong từng tầng.

N là tổng số cá thể trong quần thể

Nhận xét : Vì tỉ lệ n/N cố định nên  phụ thuộc vào Ni, tức là cỡ mẫu từng tầng phụ thuộc vào số lượng cá thể trong từng tầng.

Viết lại công thức , nếu các tầng có số đơn vị bằng nhau (phân bố ngang bằng) thì cỡ mẫu bằng nhau,  với  là số tầng của mẫu.

+  Chọn mẫu ngẫu nhiên cho mỗi tầng : tại tầng thứ i, chọn  cá thể bằng phương pháp chọn mẫu ngẫu nhiên đơn hay mẫu ngẫu nhiên hệ thống.

  1. Ưu nhược điểm

– Ưu điểm :

+ Do đã được phân tầng, mẫu được chọn sẽ hạn chế sự chênh lệch giữa các cá thể về các yếu tố (đã được phân tầng), tạo sự ước lượng chính xác hơn chọn mẫu ngẫu nhiên đơn.

+ Dễ tổ chức thực hiện do việc thu thập số liệu dễ dàng hơn. Từ đó có thể giảm thời gian và chi phí.

+ Ngoài việc đánh giá được cả quần thể còn có nhận định riêng cho từng tầng.

  • Nhược điểm :

Cũng như trong kĩ thuật chọn mẫu ngẫu nhiên đơn, việc liệt kê và đánh số cá thể của mỗi tầng thường khó thực hiện.

2.4. Kĩ thuật chọn mẫu chùm

  1. Khái niệm :

Là kĩ thuật chọn mẫu mà mẫu đạt được bởi việc lựa chọn ngẫu nhiên các nhóm cá thể được gọi là chùm từ nhiều chùm trong quần thể nghiên cứu. Trong trường hợp này, đơn vị mẫu là các chùm chứ không phải cá thể.

  1. Cách tiến hành :

+ Xác định chùm : Chùm là một tập hợp các cá thể thuộc một phạm vi khách quan nào đó do nghiên cứu đặt ra. Ví dụ chùm có thể là một làng, xã, huyện hay một hộ gia đình. Các chùm thường khác nhau về kích cỡ.

+ Lựa chọn chùm : Lập danh sách các chùm rồi lựa chọn chùm theo phương pháp ngẫu nhiên đơn hoặc ngẫu nhiên hệ thống.

+ Chọn cá thể trong các chùm:

Cách 1 : Tất cả các cá thể trong chùm  được chọn đều được đưa vào nghiên cứu. Khi đó  chùm là một đơn vị lấy mẫu, còn mỗi cá thể trong chùm là một đơn vị quan sát, mẫu được chọn là mẫu một bậc

Cách 2: Từ những chùm đã chọn, ta lập danh sách, đánh số từng cá thể trong mỗi chùm rồi áp dụng kiểm tra chọn mẫu ngẫu nhiên đơn hoặc ngẫu nhiên hệ thống để chọn ra các cá thể. Khi đó đơn vị quan sát và đơn vị lấy mẫu trùng nhau đều là cá thể, còn mẫu được chọn gọi là mẫu chùm hai bậc.

  1. Ưu nhược điểm

– Ưu điểm

Cách chọn mẫu chùm được áp dụng rộng rãi trên thực tế do:

+ Đơn giản vì không yêu cầu liệt kê tất cả các phần tử chọn mẫu trong tổng thể. Có thể áp dụng khi không có danh sách của tất cả các cá thể của quần thể, chỉ có danh sách cá thể từng chùm.

+Thích hợp với nghiên cứu trên phạm vi dân cư rộng, độ phân tán cao.

+ Đỡ tốn kém về thời gian, chi phí đi lại.

  • ­Nhược điểm

+ Tính đại diện cho quần thể hoặc tính chính xác thường thấp, do vậy, thường phải tăng cỡ mẫu. Có sự tương quan nghịch giữa cỡ của chùm và tính đại diện, cỡ càng nhỏ càng tốt, tuy nhiên chi phí cho điều tra sẽ cao.

+ Việc lựa chọn số chùm vào mẫu cũng khó khăn, nhất là khi cỡ chùm không đều nhau.

2.5. Chọn mẫu nhiều giai đoạn

  1. Định nghĩa:

Cách chọn mẫu sử dụng phối hợp nhiều kĩ thuật chọn mẫu khác nhau trong các giai đoạn khác nhau, thậm chí kết hợp cả mẫu xác suất và không xác suất. Phương pháp này được sử dụng trong những nghiên cứu lớn, phạm vi địa lý rộng.

  1. Tiến hành

-2 giai đoạn:

+ Giai đoạn 1: Quần thể được chia thành các cụm/chùm. Chọn mẫu chùm.

+ Giai đoạn 2: Các cá thể được chọn từ các cụm/chùm đã chọn.

  • Nhiều giai đoạn:

+ Giai đoạn 1: Quần thể được chia thành các cụm/chùm. Chọn mẫu chùm.

+ Giai đoạn 2: Các cụm/chùm được chọn được chia thành các cụm/chùm nhỏ hơn. Chọn mẫu cụm/chùm bậc 2.

+ Giai đoạn 3: Các cá thể được chọn từ các cụm/chùm bậc 2 đã chọn.

Tại các giai đoạn, sử dụng các phương pháp ngẫu nhiên đơn giản, hệ thống hay phân tầng.

Ví dụ: Giai đoạn 1: chọn tỉnh. Giai đoạn 2: chọn huyện. Giai đoạn 3: Chọn xã. Giai đoạn 4: Lập danh sách mẫu tại các xã để chọn hộ gia đình.

  1. Kĩ thuật chọn mẫu không xác suất

3.1. Mẫu thuận tiện

Dựa trên tính sẵn có của só liệu, không quan tâm đến việc lựa chọn có ngẫu nhiên hay không (VD: thu thập tất cả các đơn thuốc trong 1 ngày). Hay được áp dụng trong nghiên cứu lâm sàng.

3.2. Mẫu chỉ tiêu.

Đảm bảo có một số đơn vị mẫu nhất định với những tính chất đặc trưng của quần thể nghiên cứu sẽ được chọn vào mẫu. Cách này gần giống chọn mẫu tầng nhưng không ngẫu nhiên. Người nghiên cứu đặt kế hoạch sẽ chọn  bao nhiêu đối tượng cho mỗi tầng hoặc nhóm đối tượng và sử dụng cách chọn mẫu thuận tiện.

3.3. Mẫu có mục đích

Xác định trước các nhóm quan trọng trong quần thể để thăm dò thu thập số liệu, các nhóm khác nhau có tỉ lệ mẫu khác nhau. Hay dùng trong các điều tra thăm dò, phỏng vấn sâu.

3.4. Ưu nhược điểm của phương pháp chọn mẫu không xác suất

  1. Ưu điểm:

Dễ thực hiện, chi phí thấp. Có thể dùng để thăm dò hoặc tìm hiểu sâu một vấn đề nào đó trong quần thể. Ngoài ra trong một số mẫu thử nghiệm lâm sàng cần sử dụng người tình nguyện, khi đó cách chọn mẫu xác suất không sử dụng được

  1. Nhược điểm:

Không đại diện cho quần thể nghiên cứu, không đủ cơ sở khoa học cho ngoại suy, do đó phải thận trọng khi đưa ra các kết luận.

  1. BÀI TẬP ỨNG DỤNG VÀ CÂU HỎI LƯỢNG GIÁ
  2. Tính cỡ mẫu cho một nghiên cứu ước tính số ngày nằm viện ở bệnh viện X.

Người ta đã tiến hành một nghiên cứu thử và xác định được độ lệch chuẩn  là 10,5. Nếu người điều tra tin tưởng 95% kết quả nghiên cứu của mình chỉ sai lệch so với quần thể là 1 ngày thì cỡ mẫu cần thiết là bao nhiêu?

ĐA: 424 người.

  1. Người ta muốn điều tra tỉ lệ đơn thuốc có số thuốc được kê nhiều hơn 3 thuốc trong 1 đơn tại khoa X, bệnh viện Y.

Tìm trong y văn, người nghiên cứu không tìm thấy bất cứ một nghiên cứu nào có tỉ lệ tương tự.

Người nghiên cứu phải chọn cỡ mẫu là bao nhiêu nếu mong muốn khoảng sai lệch giữa tỉ lệ thu được từ mẫu và quần thể là 1% (sai lệch tuyệt đối), ở mức tin cậy 95%?

ĐA: 1.96^2 x (0,5 x0,5)/0,01^2 = 9 640 (đơn)

  1. Nghiên cứu so sánh hiệu lực của 2 loại thuốc (metaprotenerol và theophyline) trên bệnh nhân hen. Người ta đo thể tích thở ra FEV1 trên 1 giờ uống thuốc.

Một nghiên cứu trước đó đã chỉ ra rằng trung bình FEV1 cho bệnh nhân hen đang được điều trị là 2l, độ lệch chuẩn là 0,5l. Người nghiên cứu giả định rằng cần có sự khác biệt ít nhất là 0,2l giữa trung bình FEV1 của hai nhóm bệnh nhân đang được điều trị bằng 2 loại thuốc trên để có thể kết luận rằng 2 thuốc có hiệu lực khác nhau.

Người nghiên cứu lựa chọn sai số loại I: 0,05, lại 2: 0,2

Z0,975 =1,96. Z0,8 = 0,84.

ĐA: (1,96 +0,84) ^2 x 2 x 0,5^2/0.1^2 =162

  1. Một thử nghiệm lâm sàng đối chứng ngẫu nhiên được thiết kế để đánh giá hiệu quả của một thuốc chống gãy xương sống. Người ta tuyển hai nhóm bệnh nhân. Nhóm 1 dùng thuốc, nhóm 2 dùng placebo.

Các nhà nghiên cứu giả thuyết rằng tỉ lệ gãy xương ở nhóm 2 là 10% và thuốc có thể giảm tỉ lệ này xuống còn khoảng 6%.

Nếu các nhà nghiên cứu muốn thử nghiệm giả thuyết này với sai lầm loai 1 α = 0,1 và sai lầm loại 2 β=0,1 thì cần lựa chọn bao nhiêu bệnh nhân vào nghiên cứu.

ĐA: 21

  1. Để biết thuốc risedronat có hiệu quả hay không trong việc điều trị loãng xương, người ta tiến hành nghiên cứu gồm 2 nhóm bệnh nhân: Nhóm 1 sử dụng risedronat, nhóm 2 sử dụng giả dược. Chúng ta theo dõi và thu thập số liệu gãy xương, ước tính tỉ lệ gãy xương cho từng nhóm và so sánh tỉ lệ bằng một giả thuyết kiểm định thống kê.

Cho biết giả thuyết H1, H0 là gì? Sai lầm loại I, sai lầm loại II?

  1. Tại sao phải tiến hành chọn mẫu?
  2. Đơn vị quan sát và đơn vị chọn mẫu khác nhau như thế nào? Cho ví dụ?
  3. Các yếu tố ảnh hưởng đến cỡ mẫu
  4. Giả thuyết H0, H1 là gì? Cho ví dụ minh họa?
  5. Sai lầm loại I, loại II là gì?
  6. Hiệu ứng thiết kế sử dụng để làm gì ?
  7. Thế nào là kiểm định 1 phía và kiểm định 2 phía ?
  8. Hãy đặt ra một nghiên cứu cụ thể, từ đó lựa chọn :
  9. Quần thể nghiên cứu.
  10. Thiết kế nghiên cứu phù hợp.
  11. Lựa chọn kĩ thuật chọn mẫu và ước lượng cỡ mẫu.

Xem toàn bộ các chương ở đây

Partager :

  • X
  • Facebook
J’aime chargement…

Similaire

Từ khóa » Khái Niệm Cỡ Mẫu