Phân Phối Poisson – Wikipedia Tiếng Việt
Có thể bạn quan tâm
Hàm khối xác suấtTrục hoành là chỉ số k. Hàm khối xác suất được định nghĩa dựa trên duy nhất biến nguyên k. Đường nối dùng để minh họa chứ không có nghĩa là liên tục. | |
Hàm phân phối tích lũyTrục hoành là chỉ số k. | |
Tham số | |
Giá | |
Hàm khối xác suất | |
Hàm phân phối tích lũy | (với là hàm gamma không đầy đủ) |
Giá trị kỳ vọng | |
Trung vị | |
Yếu vị | |
Phương sai | |
Độ xiên | |
Độ nhọn | |
Entropy | |
Hàm sinh mô men | |
Hàm đặc trưng |
Trong lý thuyết xác suất và thống kê, Phân phối Poisson (Tiếng Anh: Poisson distribution) là một phân phối xác suất rời rạc cho biết xác suất xảy ra một số lượng sự kiện trong một khoảng thời gian nhất định không đổi và với một tỷ lệ trung bình cho trước. Tỷ lệ trung bình đó được ký hiệu là .
Phân phối Poisson còn được dùng cho khoảng mà đơn vị khác thời gian như: khoảng cách, diện tích hay thể tích. Một ví dụ cổ điển là sự phân rã hạt nhân của các nguyên tử.
Phân phối này được tìm ra bởi nhà toán học Siméon-Denis Poisson (1781–1840) và đã được xuất bản cùng với lý thuyết xác suất của ông, vào năm 1838 với tựa đề Recherches sur la probabilité des jugements en matières criminelles et matière civile ("Research on the Probability of Judgments in Criminal and Civil Matters"). Theo đó, nếu xem xét một biến ngẫu nhiên N nào đó, và đếm số lần xuất hiện (rời rạc) của nó trong một khoảng thời gian cho trước. Nếu giá trị kì vọng (hay số lần trung bình mà biến ngẫu nhiên đó xảy ra trong khoảng thời gian đó là λ, thì xác suất để cũng chính sự kiện đó xảy ra k lần (k là số nguyên không âm, k = 0, 1, 2,...) sẽ được tính theo công thức
với
- e là cơ số của logarit tự nhiên (e = 2.71828...)
- k là số lần xuất hiện của một sự kiện - mà xác suất của nó là cho bởi công thức trên
- k! là giai thừa của k
- λ là số thực dương, bằng với giá trị kì vọng xuất hiện của sự kiện trong một khoảng cho sẵn. Ví dụ, nếu một sự kiện trung bình xảy ra 1 lần trong 4 phút, giờ ta quan tâm số lần sự kiện xảy ra trong khoảng thời gian 10 phút, ta dùng mô hình phân phối Poisson với λ = 10/4 = 2.5.
Vì đây là biến ngẫu nhiên rời rạc, công thức trên cho ta công thức của hàm khối xác suất.
Các phân phối liên quan
[sửa | sửa mã nguồn]- Nếu và , thì hiệu tuân theo phân phối Skellam.
- Nếu và là độc lập, và , thì phân phối của phụ thuộc điều kiện vào là một phân phối nhị thức. Đặc biệt, . Tổng quát hơn, nếu X1, X2,..., Xn là các biến ngẫu nhiên Poisson với các tham số tương ứng là λ1, λ2,..., λn thì
- Phân phối Poisson có thể được xem là một trường hợp hạn chế của phân phối nhị thức khi mà số lần thử (trials) tiến đến vô hạn và giá trị kì vọng của số lần thành công là giữ nguyên. Vì thế, nó có thể dùng để xấp xỉ cho phân phối nhị thức nếu n là đủ lớn và p là đủ nhỏ. Có một quy luật theo kinh nghiệm là phân phối Poisson có thể ước lượng tốt cho một phân phối nhị thức nếu n lớn hơn 20 và p là nhỏ hơn hoặc bằng 0.05. Cũng theo quy luật này, xấp xỉ được xem là rất chính xác nếu n ≥ 100 và np ≤ 10.[1]
- Với giá trị đủ bé của λ, (ví dụ λ>1000), thì phân phối chuẩn với trung bình λ, và độ lệch λ, là một xấp xỉ rất chính xác cho phân phối Poisson. Nếu λ lớn hơn 10, thì phân phối chuẩn là một xấp xỉ tốt nếu ta thực hiện chèn thêm 1/2 vào, nghĩa là, P(X ≤ x), với x (viết thường) là một số nguyên không âm, sẽ được thay bởi P(X ≤ x + 0.5).
Sự ra đời
[sửa | sửa mã nguồn]Phân phối Poisson ra đời gắn liền với quá trình Poisson. Nó được áp dụng cho nhiều hiện tượng (có tính rời rạc) (nghĩa là số lần xuất hiện trong một khoảng (thời gian, không gian) cho trước đó phải là số nguyên 0, 1, 2, 3,...) với xác suất để sự kiện (hiện tượng) đó xảy ra là không đổi trong suốt khoảng (thời gian, không gian) đó. Các ví dụ sau được mô hình theo phân phối Poisson:
- Số lượng xe hơi đi ngang qua 1 điểm trên con đường trong một khoảng thời gian cho trước.
- Số lần gõ bị sai của khi đánh máy một trang giấy.
- Số cuộc điện thoại tại một trạm điện thoại trong mỗi phút.
- Số lần truy cập vào một máy chủ web trong mỗi phút.
- Số lần động vật bị chết do xe cộ cán phải trên mỗi đơn vị độ dài của một con đường.
- Số lần đột biến xảy ra trên một đoạn DNA sau khi chịu một lượng bức xạ..
- Số lượng cây thông trên mỗi đơn vị diện tích rừng hỗn hợp.
- Số lượng ngôi sao trong một thể tích không gian vũ trụ.
- Số lượng người lính bị chết do ngựa đá mỗi năm trông mỗi đội của kị binh Phổ. Ví dụ này rất nổi tiếng trong cuốn sách của Ladislaus Josephovich Bortkiewicz (1868–1931).
- Phân phối của các tế bào cảm quang trong võng mạc của mắt.
- Số lượng bóng đèn bị cháy trong một khoảng thời gian xác định.
- Số lượng virut có thể lây nhiễm lên một tế bào trong cấu trúc tế bào.
- Số lưộng phát minh của một nhà sáng chế trong suốt cuộc đời của họ.
Tại sao lại tồn tại phân phối này? — Luật của các sự kiện hiếm
[sửa | sửa mã nguồn]Các tính chất
[sửa | sửa mã nguồn]- Giá trị kì vọng của một biến ngẫu nhiên phân phối Poisson là λ và nó cũng chính là độ lệch. Các giá trị mômen cao hơn của phân phối Poisson chính là các đa thức Touchard trong λ, với các hệ số có ý nghĩa tổ hợp. Cụ thể là nếu khi giá trị kì vọng của phân phối Poisson là 1, thì công thức Dobinski nói rằng moment thứ n bằng với số phân hoạch của một tập hợp có kích thước là n.
- mode của một biến ngẫu nhiên phân phối Poisson với λ không là số nguyên thì bằng với , chính là số nguyên lớn nhất không vượt quá λ. Nếu λ là số nguyên dương, thì modes chính là λ và λ − 1.
- Tổng của các biến ngẫu nhiên theo phân phối Poisson:
- Hàm khởi tạo mômen của phân phối Poisson với giá trị kì vọng λ là
- Mọi nửa bất biến (cumulant) của phân phối Poisson bằng với giá trị kì vọng λ. Mômen giai thừa thứ n của phân phối Poisson là λn.
- Phân phối Poisson chính là phân phối xác suất có thể chia hết vô hạn.
- Định hướng phân kì Kullback-Leibler giữa Poi(λ0) và Poi(λ) được cho bởi
Khởi tạo các biến ngẫu nhiên có phân phối Poisson
[sửa | sửa mã nguồn]Một cách đơn giản để khởi tạo các số ngẫu nhiên theo phân phối Poisson được đưa ra bởi Knuth, xem tham khảo ở dưới.
algorithm poisson random number (Knuth): init: Let L ← e−λ, k ← 0 and p ← 1. do: k ← k + 1. Generate uniform random number u and let p ← p × u. while p ≥ L. return k − 1.Dù đơn giản, nhưng độ phức tạp của giải thuật là tuyến tính với λ. Nên có nhiều giải thuật khác giải quyết vấn đề này. Xem tham khảo tại sách của Ahrens & Dieter.
Ước lượng tham số
[sửa | sửa mã nguồn]Hợp lý cực đại
[sửa | sửa mã nguồn]Cho một mẫu gồm n giá trị được đo ki chúng ta muốn ước lượng giá trị của tham số λ của tập hợp phân phối Poisson mà từ đó mẫu này được rút ra. Để tính giá trị hợp lý cực đại (maximum likelihood), ta tạo ra hàm log-likelihood
Lấy đạo hàm của L theo λ và cho nó bằng 0:
Giải tìm λ sẽ cho ta ước lượng hợp lý cực đại của λ:
Vì mỗi quan sát có kì vọng λ theo ý nghĩa của mẫu. Vì thế nó là một ước lượng không lệch của λ.
Suy luận Bayes
[sửa | sửa mã nguồn]Trong suy luận Bayes, tiên nghiệm liên hợp (conjugate prior) cho tham số λ của phân phối Poisson là phân phối Gamma. Nếu
đại diện cho λ được phân phối theo mật độ Gamma g' được tham số hóa theo một tham số hình dạng (shape parameter) α và một tham số tỉ lệ (scale parameter) nghịch đảo β:
Thì, nếu cho cùng một mẫu gồm n giá trị được đo ki như ở trên, và một tiên nghiệm của Gamma(α, β), thì phân phối hậu nghiệm (posterior distribution) là
"Luật số nhỏ"
[sửa | sửa mã nguồn]Phân phối Poisson còn được gọi là luật số nhỏ vì nó là xác suất phân phối của số lần xuất hiện của một sự kiện mà rất hiếm khi xảy ra, nhưng cơ hội để xảy ra thì lại rất nhiều. Và The Law of Small Numbers là tiêu đề của cuốn sách viết bởi Ladislaus Bortkiewicz về phân phối Poisson, được xuất bản năm 1898. Vì thế, một số cho rằng phân phối Poisson nên được gọi là phân phối Bortkiewicz.[2]
Tính toán gần đúng cho xác suất Poisson
[sửa | sửa mã nguồn]Khi k lớn (>20) việc sử dụng xấp xỉ hàm logarit và lũy thừa là cần thiết. Ví dụ sau viết bằng Java.
/**Calculates an approximation of the Poisson probability. * @param mean - lambda, the average number of occurrences * @param observed - the actual number of occurences observed * @return ln(Poisson probability) - the natural log of the Poisson probability. */ publicstaticdoublepoissonProbabilityApproximation(doublemean,intobserved){ doublek=observed; doublea=k*Math.log(mean); doubleb=-mean; returna+b-factorialApproximation(k); } /**Srinivasa Ramanujan ln(n!) factorial estimation. * Good for larger values of n. * @return ln(n!) */ publicstaticdoublefactorialApproximation(doublen){ if(n<2.)return0; doublea=n*Math.log(n)-n; doubleb=Math.log(n*(1.+4.*n*(1.+2.*n)))/6.; returna+b+Math.log(Math.PI)/2.; }Nhiễu Poisson
[sửa | sửa mã nguồn]Xem thêm
[sửa | sửa mã nguồn]- Phân phối Poisson phức hợp
- Quá trình Poisson
- Hồi qui Poisson
- Lý thuyết hàng đợi
- Erlang distribution
- Phân phối Skellam.
- Incomplete gamma function dùng để tính CDF.
- Dobinski's formula
- Schwarz formula
- Bổ đề Robbins
Công cụ trực tuyến để minh họa hình ảnh cho phân phối Poisson
[sửa | sửa mã nguồn]Phân phối Poisson có tương tác tại đại học Texas A&M (TAMU) Lưu trữ 2008-02-03 tại Wayback Machine
Chú thích
[sửa | sửa mã nguồn]- ^ NIST/SEMATECH, '6.3.3.1. Counts Control Charts', e-Handbook of Statistical Methods, <http://www.itl.nist.gov/div898/handbook/pmc/section3/pmc331.htm> [accessed ngày 25 tháng 10 năm 2006]
- ^ p.e. I J Good, Some statistical applications of Poisson's work, Statist. Sci. 1 (2) (1986), 157-180. JSTOR link
Tham khảo
[sửa | sửa mã nguồn]- Donald E. Knuth (1969). Seminumerical Algorithms. The Art of Computer Programming, Volume 2. Addison Wesley.
- Joachim H. Ahrens, Ulrich Dieter (1974). “Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions”. Computing. 12 (3): 223--246. doi:10.1007/BF02293108.
- Joachim H. Ahrens, Ulrich Dieter (1982). “Computer Generation of Poisson Deviates”. ACM Transactions on Mathematical Software. 8 (2): 163--179. doi:10.1145/355993.355997.
Liên kết ngoài
[sửa | sửa mã nguồn]- “Law of rare events”. PlanetMath.
- Queueing Theory Basics
- M/M/1 Queueing System
- Engineering Statistics Handbook: Poisson Distribution
- xkcd webcomic involving a Poisson distribution
- Poisson Distribution at QWiki Lưu trữ 2007-11-01 tại Wayback Machine
- Poisson Derivation 1: Continuous limit of a Binomial distribution Lưu trữ 2007-11-01 tại Wayback Machine
- Poisson Derivation 2: Generating function approach Lưu trữ 2007-10-27 tại Wayback Machine
- Poisson Derivation 3: Summation of the waiting-time distribution Lưu trữ 2007-10-13 tại Wayback Machine
- Máy tính trực tuyến Phân phối Poisson
| |||||
---|---|---|---|---|---|
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
| |||||
|
Bản mẫu:Statistics
Từ khóa » Công Thức Poisson
-
Phân Phối Poisson Là Gì? Xem Xong 5 Phút Hiểu Luôn.
-
Bài 2: Phân Phối Poisson
-
Phân Phối Poission
-
XSTK Chương 3 P2/5 Bài Tập Quy Luật Poisson - YouTube
-
Chi Tiết Bài Học Phân Phối Poisson - Vimentor
-
POISSON (Hàm POISSON) - Microsoft Support
-
Phân Phối Poisson | Công Thức, Ví Dụ, Định Nghĩa, Trung Bình Và ...
-
Hệ Số Biến Thiên Phân Phối Poisson. Công Thức Phân Phối Và Poisson
-
Phân Phối Poisson được Sử Dụng. Công Thức Phân Phối Và Poisson
-
Công Thức Poisson – Công Thức Tổng Poisson | Giải Tích
-
Phân Phối Poisson - Poisson Distribution - Gists · GitHub
-
Các Phân Phối Xác Xuất Thường Gặp - Slideshare
-
Công Thức Tổng Poisson (Poisson Summation Formula)