توزیع احتمال
در نظریه احتمال و آمار تابع توزیع احتمال بیانگر احتمال هر یک از مقادیر متغیر تصادفی (در مورد متغیر گسسته) یا احتمال قرار گرفتن متغیر در یک بازه مشخص (در مورد متغیر تصادفی پیوسته) میباشد. توزیع تجمعی احتمال یک متغیر تصادفی تابعی است از دامنهٔ آن متغیر بر بازهٔ . به طوری که احتمال رخدادن پیشامدهای با مقدار عددی کمتر از آن را نمایش میدهد. و به صورت دقیق به شکل زیر تعریف میشود:
بر اساس این که این متغیر گسسته یا پیوسته باشد توزیع گسسته یا پیوسته نام میگیرد.
خاصیتهای تابع توزیع احتمال
- همواره داریم: و
- تابع توزیع تجمعی غیر نزولی ست، یعنی:
- تابع توزیع همواره از راست پیوستهاست:
اگر تابع توزیع تجمعی پیوسته باشد مشتق ان برابر تابع چگالی متغیر مورد بررسی است و اگر تابع توزیع گسسته باشد مشتق ان برابر تابع احتمال متغیر مورد بررسی است.[1]
توزیع احتمال گسسته
پیشینهٔ نظریهٔ احتمال، به قرن هفدهم میلادی و مطالعات بلیز پاسکال روی اعداد ظاهر شده بر تاسها برمیگردد. پس از او لاپلاس، احتمال را به صورت نسبت پیشامدهای مطلوب به کل پیشامدها تعریف کرد. برای مثال احتمال آمدن عدد زوج، هنگام انداختن یک تاس سالم، برابر است با ۳ (یعنی تعداد حالتهایی که ممکن است عدد زوج بیاید یا به تعبیر دیگر ۲، ۴ یا ۶ ظاهر شود) بخش بر ۶ (یعنی کل حالتهایی که ممکن است با انداختن تاس ظاهر شود یا به تعبیر دیگر آمدن ۱، ۲، ۳، ۴، ۵ یا ۶) که برابر میشود با یا .
نظریهٔ احتمال
چند تعریف
برای ادامهٔ بحث، لازم است که ابتدا چند واژه را تعریف کنیم:
- آزمایش تصادفی
- یک آزمایش که نتیجهٔ آن به هیچوجه قابل پیشبینی نباشد یا اصطلاحاً تصادفی باشد؛ مثل انداختن تاس یا سکه.
- فضای نمونه
- [2] مجموعهٔ کل نتیجههایی که ممکن است از یک آزمایش تصادفی حاصل شود؛ مثلاً در آزمایش انداختن تاس فضای نمونه به صورت است.
- پیشامد
- [3] به هریک از زیرمجموعههای فضای نمونه یک پیشامد میگویند؛ مثلاً یک پیشامد در آزمایش انداختن تاس است.
- فضای نمونهٔ همشانس
- [4] در صورتی که همهٔ اعضای فضای نمونه شانس برابری برای ظاهر شدن داشته باشند یا به عبارت دیگر، شانس تمام اعضا یکسان باشد، این فضای نمونه را همشانس میخوانیم. مثلاً آزمایش انداختن تاس سالم[5] در فضای همشانس است.
احتمال در فضای متناهی
اگر فضای نمونهٔ ما همشانس و دارای تعداد اعضای متناهی باشد، برای محاسبهٔ احتمال وقوع یک پیشامد، فرمول لاپلاس را به کار میگیریم.
یا به عبارت دیگر، احتمال وقوع یک پیشامد برابر است با نسبت اندازهٔ پیشامد به اندازهٔ فضای نمونه. برای مثال اگر آزمایش انداختن تاس سالم را در نظر بگیریم که دارای فضای نمونهٔ همشانس با اندازهٔ متناهی است، با توجه به آنچه پیشتر گفته شد، احتمال آمدن عدد ۶، برابر است با اندازه پیشامد (یعنی اندازهٔ که ۱ است) بخش بر اندازهٔ فضای نمونه (یعنی اندازهٔ که ۶ است). به این ترتیب احتمال آمدن عدد ۶، برابر با محاسبه میشود.
احتمال پیشامدهای مرکب
گاهی میخواهیم با داشتن احتمال چند پیشامد، بتوانیم احتمال مجموعهٔ حاصل از اعمال جبر مجموعهها بر آنها را نیز محاسبه کنیم. دو مورد از این موارد مهمتر است:
- احتمال مکمل یک پیشامد: مکمل یک پیشامد زمانی اتفاق میافتد که خود آن پیشامد اتفاق نیفتد. به عبارت دیگر ما میخواهیم احتمال رخ ندادن یک پیشامد را حساب کنیم. از آنجا که پیشامد زیرمجموعهای از فضای نمونه است، مکمل آن، مجموعهٔ اعضای فضای نمونه است که در پیشامد مورد نظر ما نیستند. به این ترتیب با توجه به فرمول لاپلاس، رابطهٔ زیر برای محاسبهٔ احتمال مکمل یک پیشامد، با داشتن احتمال خود آن پیشامد به دست میآید:
با توجه به آنچه گفته شد اثبات این رابطه بسیار ساده است.
- احتمال اجتماع[6] دو پیشامد: همانطور که از مفهوم اجتماع مجموعهها برمیآید، وقوع اجتماع دو پیشامد به معنی آن است که حداقل یکی از این دو پیشامد اتفاق بیفتد. برای محاسبهٔ احتمال اجتماع دو پیشامد، با فرض داشتن احتمال خود آنها و احتمال اشتراک[7] شان، رابطهٔ زیر را داریم:
اثبات این رابطه با دانستن اینکه میسر است.
تخصیص احتمال
تا اینجا بیشتر دربارهٔ آزمایشها و فضاهای نمونهای بحث کردیم که همشانس هستند. با اینهمه، بسیاری از آزمایشها در فضای همشانس اتفاق نمیافتند و لذا برای محاسبهٔ احتمال آنها نمیتوان به سادگی فرمول لاپلاس را به کار برد.
برای حل این مشکل، راهحل تخصیص احتمال[8] را به این ترتیب به کار میبریم: به تکتک اعضای فضای نمونه احتمالی نسبت میدهیم که از دو قانون زیر پیروی کند:
- مقدار هر یک از این احتمالها باید بین صفر و یک باشد؛ به عبارت دیگر برای هر داشته باشیم:
- مجموع مقدار احتمالهای تخصیصدادهشده، برابر ۱ باشد؛ به عبارت دیگر داشته باشیم:
به تابع احتمال p، تابع توزیع احتمال[9] میگوییم.
اگر تابع احتمال به هر عضو فضای نمونه، مقدار یکسانی نسبت دهد، آن را توزیع یکنواخت[10] میخوانیم.
روشن است که با توجه به آنچه در اینجا تعریف کردیم، احتمال وقوع یک پیشامد برابر است با مجموع احتمال اعضایی از فضای نمونه که در آن پیشامد حضور دارند.
احتمال شرطی و استقلال پیشامدها
فرض کنید خانوادهای دو فرزند دارد. میخواهیم بدانیم اگر فرزند اول پسر باشد، با چه احتمالی فرزند دوم دختر خواهد بود؟ برای حل چنین مسئلهای از رابطهٔ احتمال شرطی[11] استفاده میکنیم که به شکل زیر است:
یا به عبارت دیگر احتمال وقوع E، اگر F اتفاق افتاده باشد، برابر است با نسبت احتمال اشتراک E و F به احتمال F.
حال اگر این دو پیشامد از هم مستقل[12] باشند، روشن است که وقوع E ارتباطی با وقوع F نخواهد داشت یا به تعبیر دیگر همان خواهد بود.
به این ترتیب میتوانیم دو پیشامد E و F را مستقل بدانیم، در صورتی که:
توزیع احتمال دوجملهای
یک آزمایش تصادفی بسیار مشهور، موسوم به آزمایش برنولی،[13] به این شکل تعریف میشود:
- آزمایشی تصادفی که در هر بار انجام آن تنها یا پیروزی اتفاق میافتد یا شکست.
با توجه به این آزمایش، در صورتی که n بار آزمایش برنولی انجام شود، و این آزمایشها از هم مستقل باشند و احتمال پیروزی نیز p باشد، آنگاه تابع توزیع احتمال، مشهور به توزیع احتمال دوجملهای[14] خواهیم داشت که به صورت است (k تعداد پیروزیهاست).
علت این نامگذاری، شباهت فوقالعادهٔ رابطهٔ بهدستآمده با رابطهٔ بسط دوجملهای نیوتن است.
توزیع احتمال هندسی
اگر آزمایش برنولی (که در بخش قبل معرفی شد) آنقدر تکرار شود تا پیروزی به دست آید، در این صورت توزیع احتمالی به دست میآید که به توزیع احتمال هندسی[15] مشهور است. در این حالت فضای نمونه، تعداد اعضای نامتناهی دارد و هر عضو را میشود یک توالی[16] در نظر گرفت. تابع توزیع احتمال در این حالت به شکل زیر است (p احتمال پیروزی و k تعداد دفعات لازم برای تکرار آزمایش است تا پیروزی حاصل شود):
توجه کنید که تعریف این توزیع را میتوانستیم به این ترتیب انجام دهیم که آنقدر آزمایش تکرار شود تا نتیجهٔ شکست به دست آید. اگر تعریف به این شکل باشد، کافی است جای p و 1-p را در رابطهٔ بهدستآمده عوض کنیم.
متغیر تصادفی، امیدریاضی و واریانس
در این بخش به معرفی سه تابع بسیار مهم مرتبط با احتمال میپردازیم. این تابعها، کاربردهای وسیعی در نظریهٔ احتمال و مباحث آماری دارند.
متغیر تصادفی
متغیر تصادفی،[17] تابعی است که از فضای نمونه بر اعداد حقیقی تعریف شدهاست؛ یعنی هر عضو از فضای نمونه را به یک عدد حقیقی مربوط میکند. متغیر تصادفی را معمولاً با X نشان میدهند. (اشتباه نکنید! متغیر تصادفی، نه متغیر است و نه تصادفی! این تنها یک نامگذاری است).
مثلاً فرض کنید که خانوادهای دو فرزند دارد. به این ترتیب فضای نمونهٔ حالتهای ممکن برای این جنسیت دو فرزند به صورت {(پ، د) و (د، پ) و (د، د) و (پ، پ)} خواهد بود. حال فرض کنید متغیر تصادفی X قرار است تعداد فرزندان دختر را مشخص کند. به این ترتیب خواهیم داشت:
همانطور که برای یک آزمایش تصادفی، توزیع احتمال تعریف کردیم، میتوانیم برای متغیر تصادفی نیز تابع توزیع احتمال تعریف کنیم که با (p(X=r نموده میشود. مثلاً در مورد همان مثال بالا، تابع توزیع احتمال به این شکل درمیآید:
حال میتوانیم دومین تابع را معرفی کنیم.
امیدریاضی
امیدریاضی،[18] در حقیقت یک نوع میانگینگیری از متغیر تصادفی است. یعنی اینکه اگر یک آزمایش را بینهایتبار تکرار کنیم و از مقدارهای متغیر تصادفی مرتبط با نتایج میانگین بگیریم، چه عددی به دست خواهد آمد. معرفی دقیق ریاضی این تابع کمک بیشتری خواهد کرد:
برای نمونه، اگر همان مثال گفته شده در بخش قبل را در نظر بگیریم، امیدریاضی تعداد دختران یک خانواده با دو فرزند به صورت زیر خواهد بود:
یکی از مهمترین ویژگیهای تابع امیدریاضی، خطی بودن آن است؛ یعنی اگر n متغیر تصادفی به صورت داشته باشیم، تساوی زیر برقرار خواهند بود:
برای ادامهٔ بحث، بد نیست تعریف زیر را انجام دهیم:
- دو متغیر تصادفی X و Y را مستقل میخوانیم در صورتی که برای هر داشته باشیم احتمال X=a و Y=b برابر است با حاصلضرب احتمال X=a در احتمال Y=b.
با توجه به این تعریف، میتوان ثابت کرد که حکم مهم زیر برقرار است:
- اگر X و Y دو متغیر تصادفی مستقل باشند، آنگاه خواهیم داشت (E(XY)=E(X)E(Y.
اگر به یاد داشته باشید در مبحث قبل، توزیع احتمال دوجملهای و هندسی را تعریف کردیم. محاسبات نشان میدهند که امیدریاضی توزیع احتمال دوجملهای برابر و امیدریاضی توزیع احتمال هندسی برابر خواهد بود.
حال به معرفی آخرین تابع میپردازیم که در محاسبات آماری جایگاه ویژهای دارد.
واریانس
واریانس[19] در محاسبات آماری، یک معیار برای سنجش میزان پراکندگی دادهها از میانگین است. ما در این مباحث، امیدریاضی را مشابه میانگین در نظر گرفتیم و به این ترتیب واریانس را چنین تعریف میکنیم:
- اگر X متغیر تصادفی روی فضای نمونهٔ S باشد، واریانس X برابر خواهد بود با:
حکم بسیار مهمی که در محاسبات بسیار راهگشاست و از تعریف نتیجه میشود به قرار زیر است:
- اگر متغیر تصادفی X روی فضای نمونهٔ S تعریف شده باشد، واریانس از رابطهٔ زیر نیز به دست میآید:
در اینجا مقصود از این است که مقدارهای متغیر تصادفی را به توان ۲ برسانیم.
مثلاً برای محاسبهٔ واریانس متغیر تصادفی تعداد فرزندان دختر در یک خانواده با دو فرزند (که در بخشهای قبل توزیع احتمال و امیدریاضی آن به دست آمد)، باید به این ترتیب عمل کنیم:
واریانس مجموع چند متغیر تصادفی مستقل را میتوان برحسب واریانس تکتک این متغیرها حساب کرد:
تأکید میکنیم که این حکم فقط در صورتی قابل استفاده است که متغیرها مستقل باشند.
منابع
- سعید رضاخواه، آمار و احتمال کاربردی، انتشارات دانشگاه امیر کبیر، شابک ۹۶۴-۴۶۳-۰۹۱-۲ (کتابخانه ملی: م۷۹–۲۰۶۷۴) مقدار
|شابک=
را بررسی کنید: invalid character (کمک) - Sample Space
- Event_probability_theory
- Equally Likely
- Fair
- Union_set_theory
- Intersection_set_theory
- Assigning Probabilities
- Probability_distributions Probability Distribution
- Uniform Distribution
- Conditional_probability Conditional
- Independent
- Bernoulli_Trial
- Bionomial Distribution
- Geometric Distribution
- Sequence
- Random_Variable
- Expected_value
- Variance
در ویکیانبار پروندههایی دربارهٔ توزیع احتمال موجود است. |