توزیع پواسون
در آمار و احتمال توزیع پواسون (به انگلیسی: Poisson distribution، /ˈpwɑːsɒn/) (یا قانون پواسون اعداد کوچک) یک توزیع احتمالی گسسته است که احتمال اینکه یک حادثه به تعداد مشخصی در فاصلهٔ زمانی یا مکانی ثابتی رخ دهد را شرح میدهد؛ به شرط اینکه این حوادث با نرخ میانگین مشخصی و مستقل از زمان آخرین حادثه رخ دهند. (توزیع پواسون همچنین برای تعدادی از حوادث در فاصلههای مشخص دیگری مثل مسافت، مساحت یا حجم استفاده شود) این توزیع برای اولین بار توسط Siméon Denis Poisson 1781-1840 معرفی و به ضمیمه تئوری احتمال او در سال ۱۸۳۸ در یکی از کتابهایش بنامRecherches sur la probabilité des jugements en matière criminelle et en matière civile(جستاری در احتمال قضاوتها در مسائل کیفری و حقوقی) چاپ شد. اولین استفادهٔ عملی از این توزیع به سال ۱۸۹۸ برمی گردد جایی که Ladislaus Bortkiewicz به بررسی تعداد تصادفی از سربازان ارتش پروس که توسط پا زدن اسب کشته شدند میپردازد. این اثر بیشتر بر متغیرهای تصادفی خاصی تأکید میکند مانند متغیر تصادفی N که تعداد ظهورها (یا ورودهای) گسسته را که در فاصله زمانی مشخصی اتفاق میافتند را میشمارد. توزیع پواسن در هر زمینهای استفاده میشود برای مثال: فرض کنید شخصی بهطور متوسط چهار ایمیل در روز دریافت میکند تعداد ایمیلهای دریافت شده در برخی از روزها میتواند کمی کمتر یا بیشتر از چهار باشد ولی در بازه زمانی طولانی اگر بر دریافت ایمیل نظارت کنیم، میبینیم نرخ دریافت ثابت است. حال فرض کنید فرایند یا ترکیبی از چند فرایند یک جریان رویداد به صورت تصادفی تولید کنند، توزیع پواسن احتمال اینکه تعداد این رخدادها ۲٬۳٬۴ و اعداد دیگر باشد را مشخص میکند. توزیع پواسن درجه پراکندگی اطراف نرخ متوسط وقوع رخداد را پیشبینی میکند.
- در سیستمهای الکتریکی: تعداد دفعاتی که زنگ یک تلفن به صدا در میآید
- در نجوم: فوتونهایی که به تلسکوپ میرسند
- در صنعت: تعداد محصولات معیوب یک کارخانه
- در فیزیک: تعداد ذرات؛ alpha انتشار یافته در یک ثانیه
- در زیستشناسی: تعداد جهشها روی یک رشتهٔ معین از DNA دارای توزیع پواسن است.
تابع جرم احتمال محور افقی اندیس k میباشد، که معادل تعداد رخداد است. λ معادل نرخ چشمداشتی برای رخدادها است. محور عمودی احتمال k رخداد موقعی است که λ را از قبل بدانیم. این تابع فقط در مقادیر صحیح k تعریف شدهاست. خطوط متصل کننده تنها به دید بهتر کمک میکنند. | |||
تابع توزیع تجمعی محور افقی اندیس k است، که معادل تعداد رخداد است. CDF در مقادیر صحیح k غیرپیوسته است، و در بقیه جاها صاف است، زیرا یک متغیر تصادفی که توسط پواسن توزیع شده است، تنها مقادیر صحیح را میپذیرد. | |||
نماد | |||
---|---|---|---|
فراسنجهها | (نرخ رخداد) | ||
تکیهگاه | (اعداد طبیعی از صفر شروع می شوند) | ||
تابع جرم احتمال | |||
تابع توزیع تجمعی |
، یا ، یا
برای ، که در آن برابر تابع گامای ناکامل بالایی، برابر تابع کف است، و Q معادل تابع گامای منظمشده است. | ||
میانگین | |||
میانه | |||
مُد | |||
واریانس | |||
چولگی | |||
کشیدگی | |||
آنتروپی |
(برای های بزرگ) | ||
تابع مولد گشتاور | |||
تابع مشخصه | |||
تابع مولد احتمال | |||
اطلاع فیشر |
اگر امید ریاضی ظهورها در این بازه λ باشد، احتمال اینکه دقیقاً k ظهور داشته باشیم (k عدد صحیح نامنفی است، k=۰، ۱، ۲، …) برابر است با:
بطوریکه
- e پایه لگاریتم طبیعی است (e=۲٫۷۱۸۲۸)
- k تعداد ظهورهای یک حادثه است که احتمالش با تابع فوق داده شدهاست.
- λ یک عدد مثبت حقیقی و برابر با امید ریاضی ظهورها در طول بازه داده شدهاست. برای مثال اگر بهطور میانگین در هر دقیقه ۴ حادثه اتفاق بیفتد و احتمال اتفاق افتادن یک حادثه در فاصله زمانی ۱۰ دقیقهای را بخواهیم، باید از توزیع پواسون با λ = 10×4 = 40 استفاده کنیم.
تابع فوق به عنوان تابعی از k یک تابع جرم احتمال ست. توزیع پواسون میتواند به عنوان تقریبی از توزیع دوجملهای در نظر گرفته شود. توزیع پواسون میتواند برای سیستمهایی بکار برده شود که دارای تعداد وقایع بسیار زیاد هستند و احتمال وقوع هر واقعه بسیار کم است؛ به عنوان یک مثال کلاسیک برای این حالت میتوان فروپاشی هستهای اتمها را در نظر گرفت (احتمال فروپاشی یک اتم بسیار کم است ولی میلیونها اتم در کنار یکدیگر وجود دارند که در واقع تعداد وقایع بسیاری داریم).
نویز پواسون
پارامتر λنه تنها بمعنی متوسط تعداد وقایع بلکه نشاندهنده واریانس آن نیز میباشد (جدول را ببینید). بنابراین تعداد ظهورهای مشاهده شده حول مقدار متوسطش λ با انحراف معیار . این نوسانات با عنوان نویز پواسون یا (معمولاً در الکترونیک) به عنوان shot noise شناخته میشوند. ارتباط میانگین و انحراف معیار در شمردن ظهورهای گسسته بهطور علمی مفید است. با دقت کردن به اینکه چگونه نوسانات با مقدار متوسط سیگنال تغییر میکنند میتوان سهم هر سیگنال را تخمین زد، حتی اگر این سهم بقدری ضعیف باشد که نتوانیم بهطور مستقیم آن را آشکار کنیم.
توزیعهای مرتبط
- اگر توزیع پواسون با پارامتر و توزیع پواسون با پارامتر داشته باشد آنگاه تفاضل آنها دارای توزیع skellam خواهد بود.
- اگر با توزیع پواسون با پارامتر و با توزیع پواسون با پارامتر مستقل باشند و آنگاه متغیر تصادفی به شرط دارای توزیع دوجملهای خواهد بود. بهطور خاص در حالت کلی اگر X1, X2,... , Xn متغیرهای مستقل پواسون با پارامترهای λ1, λ2,... , λn باشند آنگاه :: [1]
خواص
میانگین و واریانس توزیع پوسان هر دو برابر است با
امید ریاضی قدر مطلق انحراف از میانگین متغیر تصادفی که از یک توزیع پوسان پیروی میکند برابر است با
مد توزیع احتمال پوسان برابر است با
منابع
- en:Poisson distribution