Statistics 1 – Biến Cố Ngẫu Nhiên Và Xác Suất Của Biến Cố

I. Biến cố ngẫu nhiên và xác suất của biến cố

1. Phép thử và biến cố:

Trong tự nhiên và xã hội, mỗi hiện tượng đều gắn liền với một nhóm, các điều kiện cơ bản, và các hiện tượng đó chỉ có thể xảy ra khi nhóm các điều kiện cơ bản trên được thực hiện. Chẳng hạn: nếu muốn quan sát việc xuất hiện mặt sấp hay mặt ngửa của một đồng xu, ta phải tung đồng xu xuống đất; còn để xem xét viên đạn trúng bia hay trượt, ta phải bắn các viên đạn; khi muốn nghiên cứu chất lượng của một lô sản phẩm, ta phải lấy ngẫu nhiên một hoặc một số sản phẩm của lô sản phẩm đó… vv. Việc thực hiện một nhóm các điều kiện cơ bản để quan sát một hiện tượng nào đó có thể xảy ra hay không được gọi là thực hiện một phép thử (hay một thí nghiệm), còn hiện tượng có thể xảy ra trong kết quả của phép thử được gọi là biến cố. VD:

– Tung một con xúc xắc xuống đất là một phép thử, còn việc hiện mặt nào đó trong sáu mặt được gọi là biến cố.

– Bắn một phát súng vào bia. Việc bắn súng là phép thử, còn việc trúng vào một miền nào đó của bia là biến cố.

– Từ một lô sản phẩm gồm chính phẩm và phế phẩm, lấy ngẫu nhiên một sản phẩm. Việc lấy sản phẩm là phép thử, còn việc lấy được chính phẩm hay phế phẩm là biến cố.

Như vậy, ta thấy rằng, một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nó được thực hiện. Trong thực tế có thể xảy ra các loại biến cố sau đây:

a. Biến cố chắc chắn: Là biến cố nhất định sẽ xảy ra khi thực hiện một phép thử.

VD: Tung một con xúc xắc, xét biến cố “Xuất hiện mặt có số chấm nhỏ hơn 7”, giả sử gọi là U. U là biến cố chắc chắn, vì dù hiện mặt nào đi nữa thì số chấm xuất hiện vẫn luôn nhỏ hơn 7, hay U luôn đúng và nhất định sẽ xảy ra.

b. Biến cố không thể có: Là biến cố nhất định không xảy ra khi thực hiện phép thử.

VD: Tung một con xúc xắc, xét biến cố “Xuất hiện mặt có 8 chấm”, giả sử gọi là V. V là biến cố không thể có, vì xúc xắc không hề có mặt nào ghi 8 chấm, hay V không bao giờ xảy ra.

c.Biến cố ngẫu nhiên: Là biến cố có thể xảy ra hoặc không xảy ra khi thực hiện một phép thử.

VD: Tung một con xúc xắc, xét biến cố “xuất hiện mặt có 1 chấm”, giả sử gọi là A. A là biến cố ngẫu nhiên, vì khi xúc xắc chạm đất, nó có thể hiện mặt 1, 2 hoặc 3, 4 … vv, hay mặt 1 chấm có thể hiện ra hoặc không.

Tất cả các biến cố mà chúng ta gặp trong thực tế đều thuộc về một trong ba loại biến cố kể trên. Tuy nhiên, các biến cố ngẫu nhiên là các biến cố thường gặp hơn cả.

2. Xác suất của biến cố:

Như trên đã thấy, việc biến cố ngẫu nhiên xảy ra hay không xảy ra trong phép thử là điều không thể đoán trước. Tuy nhiên, bằng trực quan, ta có thể nhận thấy các biến cố ngẫu nhiên khác nhau có những khả năng xảy ra khác nhau. Chẳng hạn, biến cố “Xuất hiện mặt sấp” khi tung một đồng xu sẽ có khả năng xảy ra lớn hơn nhiều so với biến cố “Xuất hiện mặt 1 chấm” khi tung một con xúc xắc. Hơn nữa, khi lặp đi lặp lại nhiều lần cùng một phép thử cùng một điều kiện, người ta thấy tính chất ngẫu nhiên của biến cố dần mất đi và khả năng xảy ra của biến cố sẽ được thể hiện theo những quy luật nhất định. Từ đó ta thấy: khả năng khách quan xuất hiện một biến cố nào đó có thể đo lường (hay định lượng) được. Định nghĩa:

“Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử.”

Ta chú ý rằng, đây là khả năng khách quan, do những điều kiện xảy ra của phép thử quy định chứ không tùy thuộc vào ý muốn chủ quan của con người. Định nghĩa cũng cho thấy rằng: bản chất xác suất của một biến cố là một con số xác định.

II. Cách tính xác suất của một biến cố

Để tính được xác suất của một biến cố, người ta xây dựng các định nghĩa và định lý sau đây:

– Định nghĩa cổ điển về xác suất.

– Định nghĩa thống kê về xác suất

– Định nghĩa hình học về xác suất

– Xác suất chủ quan

– Định nghĩa tiên đề về xác suất

1. Định nghĩa cổ điển về xác suất:

Giả sử thực hiện một phép thử là tung một con xúc xắc đều đặn và đồng chất. Gọi A là biến cố “Xuất hiện mặt chẵn chấm”. Ta sẽ xác định xác suất của biến cố A.

Khi tung một con xúc xắc đều đặn và đồng chất, ta thấy có 6 trường hợp (hay 6 kết cục) có thể xảy ra là: Xuất hiện mặt 1 chấm, 2 chấm, 3 chấm, 4 chấm, 5 chấm, 6 chấm. Những trường hợp này thỏa mãn hai điều kiện: Trước hết chúng duy nhất, tức là trong kết quả của phép thử xảy ra một và chỉ một trong các trường hợp đó; thứ hai: khả năng xảy ra những trường hợp này là như nhau (cơ sở nào để cho rằng những trường hợp này xảy ra như nhau?). Các trường hợp thỏa mãn hai điều kiện nói trên được gọi là các trường hợp duy nhất đồng khả năng (hay kết cục duy nhất đồng khả năng). Trong số 6 kết cục duy nhất đồng khả năng  đó ta thấy chỉ có 3 kết cục mà nếu xảy ra thì biến cố A ở trên sẽ xảy ra, đó là các kết cục: xuất hiện mặt 2 chấm, 4 chấm và 6 chấm. Những kết cục làm cho biến cố xảy ra được gọi là kết cục thuận lợi cho biến cố. Như vậy, ta thấy khả năng xảy ra của biến cố A là 3 phần 6, hay 1 phần 2. Đó chính là cách xác định xác suất của biến cố theo quan điểm cổ điển.

a. Định nghĩa:

“Xác suất xuất hiện biến cố A trong một phép thử là tỷ số giữa số kết cục thuận lợi cho A và tổng số các kết cục duy nhất đồng khả năng có thể xảy ra khi thực hiện phép thử đó.”

Nếu ký hiệu \displaystyle P(A) là xác suất của biến cố A, m là số kết cục thuận lợi cho biến cố A, n là số kết cục duy nhất đồng khả năng của phép thử, ta có công thức: \displaystyle P(A)=\frac{m}{n}.

b. Các tính chất:

1) Xác suất của biến cố chắc chắn là 1: \displaystyle P(U)=1. Thật vậy, nếu U là biến cố chắc chắn thì tất cả các kết cục duy nhất đồng khả năng có thể xảy ra cũng đồng thời là các kết cục thuận lợi. Do đó \displaystyle m=n và ta có: \displaystyle P(U)=\frac{m}{n}=1.

2) Xác suất của biến cố không thể có bằng 0. \displaystyle P(V)=0. Thật vậy, nếu V là biến cố không thể có thì trong số các kết cục duy nhất đồng khả năng không có kết cục nào thuận lợi cho biến cố xảy ra. Như vậy \displaystyle m=0, do đó: \displaystyle P(V)=\frac{m}{n}=0.

3) Xác suất của biến cố ngẫu nhiên là một số dương nằm trong khoảng từ 0 đến 1.Thật vậy, vì số kết cục thuận lợi cho một biến cố ngẫu nhiên luôn thỏa mãn \displaystyle 0<m<1 (cơ sở nào để kết luận như vậy?), do đó: \displaystyle 0<P(A)=\frac{m}{n}<1.

Như vậy, xác suất của một biến cố A bất kỳ sẽ có tính chất: \displaystyle 0\le P(A)\le 1.

Lưu ý: Mệnh đề đảo của hai tính chất 1) và 2) chưa chắc đã đúng. Tức là, nếu một biến cố có xác suất bằng 1 thì chưa chắc đã là biến cố chắc chắn; và nếu một biến cố có xác suất bằng 0, thì chưa chắc đã là biến cố không thể có (ví dụ minh họa là gì?).

c. Phương pháp tính xác suất bằng định nghĩa cổ điển:

1) Phương pháp suy luận trực tiếp.

2) Phương pháp dùng sơ đồ Venn (sơ đồ hình cây – sơ đồ dạng bảng – sơ đồ dạng tập hợp).

3) Phương pháp dùng các công thức giải tích tổ hợp.

Bạn vui lòng xem tài liệu tham khảo ở cuối bài để đi chi tiết vào các phương pháp trên (khá dễ hiểu), Blog chỉ xin được nhắc lại tiêu đề phương pháp.

d. Ưu điểm và hạn chế của định nghĩa cổ điển về xác suất:

Định nghĩa cổ điển về xác suất có một ưu điểm cơ bản là: để tìm xác suất của biến cố, ta không cần phải tiến hành trực tiếp phép thử (chỉ cần tiến hành một cách giả định). Ngoài ra, nếu đáp ứng đầy đủ các yêu cầu của định nghĩa (các yêu cầu nào?) thì nó cho phép ta tìm được một cách chính xác giá trị của xác suất. Tuy nhiên định nghĩa cổ điển về xác suất cũng có những hạn chế đáng kể. Nó đòi hỏi là số kết cục duy nhất đồng khả năng có thể xảy ra trong phép thử phải là hữu hạn. Trong thực tế, có nhiều phép thử mà trong đó số kết cục có thể là vô hạn (xem mục 3. Định nghĩa hình học về xác suất). Trong những trường hợp này, định nghĩa cổ điển về xác suất không áp dụng được. Chỉ riêng điều đó đã hạn chế khả năng áp dụng của định nghĩa cổ điển. Hạn chế này có thể khắc phục được bằng cách mở rộng định nghĩa cổ điển (xem mục 3. Định nghĩa hình học về xác suất). Hạn chế lớn nhất của định nghĩa cổ điển là: trong thực tế, nhiều khi không thể biểu diễn kết quả của phép thử dưới dạng tập hợp các kết cục duy nhất và đồng khả năng. Thường thì tính đồng khả năng của các kết cục được suy ra từ tính đối xứng. Chẳng hạn, khi tung một con xúc xắc, ta giả thiết rằng nó đều đặn và đồng nhất. Tuy nhiên, những bài toán mà ta có thể đưa ra các giả thiết về tính đối xứng rất hiếm gặp trong thực tế. Vì lý do đó mà ngoài định nghĩa cổ điển về xác suất, trong thực tế, người ta còn sử dụng định nghĩa xác suất theo quan điểm thống kê.

2. Định nghĩa thống kê về xác suất:

a. Tần suất:

“Tần suất xuất hiện một biến cố trong n phép thử là tỷ số giữa số phép thử trong đó biến cố xuất hiện và tổng số phép thử được thực hiện.”

Như vậy, nếu ký hiệu số phép thử là n, số lần xuất hiện biến cố A là k, tần suất xuất hiện biến cố A là \displaystyle f(A) thì: \displaystyle f(A)=\frac{k}{n}. Cùng với khái niệm xác suất, khái niệm tần suất là một trong những khái niệm cơ bản của lý thuyết xác suất. VD:

– Khi kiểm tra ngẫu nhiên 80 sản phẩm từ một dây chuyền sản xuất, người ta phát hiện ra 3 phế phẩm. Gọi A là biến cố “Xuất hiện phế phẩm”. Vậy tần xuất xuất hiện phế phẩm bằng: \displaystyle f(A)=\frac{3}{{80}} (ở ví dụ này: phép thử là kiểm tra sản phẩm, tổng số phép thử được thực hiện là 80, số phép thử trong đó biến cố A xuất hiện là 3).

– Bắn 50 phát đạn vào bia thấy có 47 phát trúng. Gọi A là biến cố “Bắn trúng bia”. Tân suất của việc bắn trúng bia bằng: \displaystyle f(A)=\frac{47}{{50}} (ở ví dụ này: phép thử là bắn súng vào bia, tổng số phép thử được thực hiện là 50, số phép thử trong đó biến cố A xuất hiện là 47).

Người ta nhận thấy, nếu tiến hành các thí nghiệm trong những điều kiện như nhau và số phép thử khá lớn thì tần suất thể hiện tính ổn định khá rõ ràng. Tính chất này thể hiện ở chỗ là: nếu tiến hành một số lần khá lớn (rất nhiều lần) cùng một phép thử, thì tần suất sẽ dao động rất ít xung quanh một giá trị nào đó. VD: Để nghiên cứu khả năng xuất hiện mặt sấp khi tung một đồng xu, người ta tiến hành tung một đồng xu nhiều lần và thu được kết quả sau đây:

Người làm

thí nghiệm

Số lần

tung (n)

Số lần

được mặt sấp (k)

Tần suất

f(A) = k/n

Buffon

Pearson

Pearson

4040

12000

24000

2048

6019

12012

0.5069

0.5016

0.5005

Qua thí nghiệm trên ta thấy, khi số phép thử tăng lên thì tần suất xuất hiện mặt sấp sẽ giao động ngày càng ít hơn xung quanh giá trị không đổi 0.5. Tính ổn định của tần suất là cơ sở để đưa ra định nghĩa thống kê về xác suất.

b. Định nghĩa thống kê về xác suất:

“Xác suất xuất hiện biến cố A trong một phép thử là một số p không đổi mà tần suất f xuất hiện biến cố đó trong n phép thử sẽ dao động rất ít xung quanh nó khi số phép thử tăng lên vô hạn.”

Như vậy, về mặt thực tế, với số phép thử đủ lớn, ta có thể lấy: \displaystyle P(A)\approx f(A) (Cơ sở của cách lấy xấp xỉ này sẽ được trình bày ở chương V. Các định lý giới hạn).

c. Ưu điểm và hạn chế của định nghĩa thống kê về xác suất:

Định nghĩa thống kê về xác suất có ưu điểm lớn là nó không đòi hỏi những điều kiện áp dụng như  đối với định nghĩa cổ điển. Nó hoàn toàn dựa trên các quan sát thực tế để làm cơ sở kết luận về xác suất xảy ra của một biến cố. Tuy nhiên, định nghĩa thống kê về xác suất chỉ áp dụng được đối với các hiện tượng ngẫu nhiên mà tần suất của nó có tính ổn định. Hơn nữa, để xác định một cách tương đối chính xác giá trị của xác suất, ta phải tiến hành trên thực tế một số lượng đủ lớn các phép thử. Nói cách khác, xác suất theo quan điểm thống kê là xác suất được tính sau khi phép thử đã thực hiện. Trong nhiều bài toán thực tế, rất khó hoặc không thể tiến hành nhiều phép thử để dựa vào đó mà tính xác suất của một biến cố. 

Trong nhiều trường hợp, nếu không cần thiết phải thực sự tiến hành phép thử thực tế, để khắc phục hạn chế trên, người ta có thể mô phỏng kết quả của phép thử bằng cách sử dụng bảng số ngẫu nhiên (Phụ lục 10 – sách Giáo trình Lý thuyết Xác suất và Thống kê Toán – ĐH KTQD – 4th edition). Để làm điều đó, người ta chọn ngẫu nhiên một dòng của bảng số ngẫu nhiên và dùng các chữ số của dòng đó để thay thế cho kết quả của phép thử. Chẳng hạn, nếu tiến hành tung một con xúc sắc trong 10 lần thì có thể mô tả kết quả tung bằng cách chọn ngẫu nhiên một dòng của bảng số ngẫu nhiên. Giả sử ta chọn dòng thứ nhất và thu được dãy số sau:

\displaystyle 155\underbrace{9}_{\times }\underbrace{{90}}_{\times }6\underbrace{{89}}_{\times }2\underbrace{{90}}_{\times }\underbrace{8}_{\times }3\underbrace{0}_{\times }3\underbrace{8}_{\times }5\underbrace{{08}}_{\times }\underbrace{{89}}_{\times }54

Các chữ số nằm ngoài số chấm có thể hiện ở mặt con xúc xắc (số 0 hoặc số lớn hơn 6) sẽ không được tính trong trường hợp này, thể hiện bằng dấu \displaystyle \times . Kết quả của phép thử có thể được mô phỏng như sau: Lần đầu được 1 điểm, lần 2 được 5 điểm, lần 3 được 5 điểm, lần 4 được 6 điểm … và dựa vào kết quả đó để xác định tần suất (nguồn gốc hay cơ sở của việc mô phỏng này là gì?).

3. Định nghĩa hình học về xác suất:

Định nghĩa hình học về xác suất có thể được sử dụng khi: xác suất để một điểm ngẫu nhiên rơi vào một phần nào đó của một miền cho trước tỷ lệ với độ đo của miền đó (độ dài, diện tích, thể tích … vv.) và không phụ thuộc và vị trí và dạng thức của miền đó.

Nếu độ đo hình học của toàn bộ miền cho trước là \displaystyle S, còn độ đo hình học của một phần A nào đó của nó là \displaystyle {{S}_{A}}, thì xác suất để điểm ngẫu nhiên rơi vào phần A sẽ bằng: \displaystyle p=\frac{{{{S}_{A}}}}{S}trong đó \displaystyle S và \displaystyle {{S}_{A}} có thể có độ đo bất kỳ.

Ta thấy rằng, nếu sử dụng phương pháp cổ điển, số kết cục đồng khả năng để một điểm bất kỳ thuộc miền A là không xác định được, vì có vô hạn điểm thuộc miền A (có vô số điểm nằm trên 1 đoạn/đường thẳng/phần mặt phẳng/không gian). Như vậy, có thể xem định nghĩa hình học về xác suất là sự mở rộng tương ứng của định nghĩa cổ điển về xác suất, khắc phục được một trường hợp: số kết cục đồng khả năng có thể xảy ra của phép thử là vô hạn.

4. Xác suất chủ quan:

Xác suất chủ quan được định nghĩa như sự đánh giá chủ quan của một cá nhân nào đó về khả năng xảy ra của biến cố. Sự đánh giá này chủ yếu dựa vào những nhận xét cá nhân, thông tin ngoại lai, trực giác hoặc các kinh nghiệm tích lũy được của mỗi cá nhân liên quan đến hiện tượng được xem xét. Như vậy, với cùng một hiện tượng, xác suất chủ quan của người này có thể khác biệt rất nhiều so với xác suất chủ quan của người khác. Vì vậy, nó còn được gọi là xác suất của cá nhân. Cách tiếp cận này chủ yếu được sử dụng khi không thể áp dụng các phương pháp tính xác suất một cách khách quan (như ở mục 1, 2, 3). Chẳng hạn tình huống: không thể quan niệm hết được các kết cục có thể có của một phép thử, hoặc: không thể lặp lại nhiều lần một phép thử để xác định tần suất của biến cố.

5. Định nghĩa tiên đề về xác suất:

Vào những năm 30 của thế kỷ 20, nhà toán học người Nga Kolmogorov đã xây dựng hệ tiên đề làm cơ sở cho việc định nghĩa một cách hoàn chỉnh khái niệm xác suất về mặt lý thuyết. Hệ tiên đề được xây dựng trên cơ sở khái niệm về: không gian các biến cố sơ cấp \displaystyle {{E}_{1}},{{E}_{2}},...{{E}_{n}}, đó là tập hợp mọi kết cục có thể có của phép thử. Lúc đó, mỗi biến cố A có thể quan niệm như một tập hợp con của không gian đó. Từ đó, ta có tiên đề sau:

Tiên đề 1: Với mọi biến cố A, ta đều có \displaystyle P(A)\ge 0.

Tiên đề 2: Nếu \displaystyle {{E}_{1}},{{E}_{2}},...{{E}_{n}} tạo nên không gian các biến cố sơ cấp thì: \displaystyle P({{E}_{1}})+P({{E}_{2}})+...+P({{E}_{n}})=1.

Tiên đề 3: Nếu các biến cố \displaystyle {{A}_{1}},{{A}_{2}},...{{A}_{n}},... là các tập hợp con không giao nhau của các biến cố sơ cấp thì: \displaystyle P(\sum\limits_{{i=1}}^{\infty }{{{{A}_{i}}}})=\sum\limits_{{i=1}}^{\infty }{{P({{A}_{i}})}}.

Từ các tiên đề trên, chúng ta sẽ xây dựng các định lý cơ bản của xác suất.

III. Nguyên lý xác suất lớn và xác suất nhỏ

Trong một số bài toán thực tế, ta thường gặp các biến cố có xác suất rất nhỏ, tức là gần bằng 0. Trong trường hợp đó, liệu có thể cho rằng những biến cố có xác suất rất nhỏ sẽ không xảy ra khi thực hiện một phép thử? Tất nhiên là không thể kết luận như vậy, vì như trên đã nêu, thậm chí một biến cố có xác suất bằng không vẫn chưa chắc là biến cố không thể có, tức là vẫn có thể xảy ra (lấy ví dụ minh họa?).

Tuy nhiên, qua nhiều lần quan sát, người ta thấy rằng các biến cố có xác suất nhỏ gần như sẽ không xảy ra khi tiến hành một phép thử (dẫn chứng nghiên cứu?). Trên cơ sở đó, có thể đưa ra (ai đưa ra nguyên lý này?Nguyên lý thực tế không thể có của các biến cố có xác suất nhỏ sau đây: Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng: trong một phép thử, biến cố đó sẽ không xảy ra.

Hiển nhiên là việc quy định một mức xác suất được coi là rất nhỏ sẽ tùy thuộc vào từng bài toán cụ thể. Chẳng hạn, nếu xác suất để chiếc dù của vận động viên không mở khi sử dụng bằng 0.01 thì xác suất đó chưa thể coi là nhỏ và chắc chắn là không thể sử dụng loại dù đó (sử dụng sẽ rất nguy hiểm). Song nếu xác suất để một chuyến tàu đường dài đến ga chậm bằng 0.01 thì thực tế lại có thể cho rằng tàu sẽ đến ga đúng giờ (không ảnh hưởng nhiều lắm).

“Một xác suất khá nhỏ mà với nó có thể cho rằng biến cố thực tế sẽ không xảy ra được gọi là mức ý nghĩa.”

Tùy thuộc vào từng bài toán thực tế, mức ý nghĩa này có thể được lấy trong khoảng từ 0.01 đến 0.05.

Tương tự như vậy, ta có thể đưa ra Nguyên lý thực tế chắc chắn xảy ra của các biến cố có xác suất lớn như sau: Nếu biến cố ngẫu nhiên có xác suất gần bằng 1 thì thực tế, có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử (dẫn chứng nghiên cứu). Hiển nhiên là, cũng như ở trên, việc quy định một mức xác suất được coi là đủ lớn tùy thuộc vào từng bài toán cụ thể.

Tham khảo:

– Chương 1 – Giáo trình Lý thuyết Xác suất và Thống kê Toán – ĐH KTQD – 4th edition.

Chia sẻ bài viết này trên:

Like Loading...

Related

Từ khóa » Khái Niệm Về Biến Cố Ngẫu Nhiên