فرایند برنولی
فرایند برنولی در آمار و احتمال فرایند برنولی یک دنباله متناهی یا نامتناهی از متغیرهای تصادفی دودویی است. این فرایند، یک فرایند تصادفی گسسته در زمان است که فقط دو مقدار را میگیرد (به صورت متعارف صفر و یک). متغیرهای برنولی دارای توزیع یکسان و مستقل از هم هستند. در واقع این فرایند را میتوان به صورت پرتابهای متوالی سکه تعبیر کرد که امکان دارد سکه عادل نباشد (احتمال رو آمدن و پشت آمدنش برابر نیست) اما میزان عدم توازن احتمال در طول زمان ثابت است. هر متغیر تصادفی در این دنباله متناظر است با یک آزمایش برنولی. تمامی این پرتابها دارای توزیع برنولی هستند. بیشتر آنچه را که دربارهٔ فرایند برنولی گفته میشود میتوان به آزمایشی با بیش از 2 پیشامد تعمیم داد (مانند پرتاب یک تاس شش وجهی)
تعریف
فرایند برنولی دنبالهای متناهی یا نامتناهی از متغیرهای تصادفی مستقل است که در آن:
- به ازای هر مقدار ، صفر یا یک است.
- برای تمام مقادیر احتمال اینکه برابر است.
به بیان دیگر فرایند برنولی دنبالهای از آزمایشهای برنولی مستقل با توزیع یکسان است. مستقل بودن آزمایشها این مفهوم را میرساند که این فرایند بدون حافظه است. با فرض دانستن مقدار ، رخدادهای گذشته اطلاعی از رخدادهای آینده نمیدهد. (به واقع ، در صورتی که مشخص نباشد، آن را از رخدادهای گذشته بدست می آوریم)
اگر فرایند نامتناهی باشد از هر نقطهای به بعد در دنباله فرایندی مشابه با فرایند اصلی را خواهیم داشت.
تعبیر فرایند
دو مقدار ممکن برای هر کدام ازها به صورت معمول «موفقیت» و «شکست» نامیده میشود؛ بنابراین هنگام نمایش با اعداد ۰ یا ۱ پیشامد به صورت تعداد موفقیت در امین پرتاب تعبیر میشود.
دو تعبیر معمول دیگر عبارتند از، «درست» و «غلط» یا «بله» و «خیر». با هر تعبیر از این دو مقدار، متغیر تصادفی آزمایش برنولی با پارامتر نامیده میشود.
در بسیاری از کاربردها زمان به صورت یک شاخص در آزمایشها ظاهر میشود و افزایش مییابد. به بیان دیگر آزمایشهای در زمانهای رخ میدهد. به صورت عام هرi و در این فرایند به صورت ساده دو عضو از یک مجموعه متغیرهای تصادفی با شاخصهای {1, 2, … , n} یا {۱, ۲, ۳, ...} به صورت متناهی یا نامتناهی هستند.
تعدادی متغیرهای تصادفی و توزیعهای احتمالاتی از فرایند برنولی به صورت زیر استخراج میشود:
- تعداد موفقیتها در n آزمایش اول که توزیع دوجملهای دارد .
- تعداد آزمایشهای مورد نیاز برای r موفقیت که توزیع توزیع دوجملهای منفی دارد .
- تعداد آزمایشهای لازم برای حصول یک موفقیت که توزیع هندسی دارد . این یک حالت خاص از توزیع دو جملهای منفی است.
تعریف رسمی
فرایند برنولی را میتوان در فرم فضای احتمالاتی به صورت یک دنباله از متغیرهای تصادفی مستقل تعبیر کرد که میتواند دو مقدار شیر یا خط بگیرد. فضای حالت برای یک مقدار یکتا به صورت زیر بیان میشود
.
بهطور خاص، مجموعه شمارا. بررسی هر کدام از مجموعههای ؟
بررسی هر کدام از مجموعهٔ یک طرفه یا دو طرفه رایج است. یک توپولوژی طبیعی روی این فضا، product topology نام دارد. مجموعهها در این توپولوژی دنبالههای محدود از پرتابهای سکه هستند که همان رشتههایی از شیر یا خط با طول محدود هستند که مابقی دنباله به صورت حالات بی اهمیت در نظر گرفته میشود. این مجموعهها از دنبالههای متناهی، به مجموعههای استوانه ای در توپولوژِی ضرب باز میگردد. مجموعهٔ تمام رشتههای این چنینی ا یک جبر سیگما، یا بهطور خاص یک جبر بارل را میسازد. این جبر عموماً به صورت نوشته میشود بهطوریکه اجزای دنبالههایی با طول محدود از پرتاب سکه هستند.
اگر شانس شیر یا خط به صورت داده شده باشد، آنگاه میتوان یک اندازه گیر طبیعی در فضای ضربی تعریف کرد. با فرض یک مجموعهٔ استوانهای که یک دنباله خاص از نتایج پرتاب سکهها در زمانهای است، احتمال مشاهدهٔ یک دنبالهٔ خاص به صورت زیر است:
در رابطهٔ اخیر تعداد دفعات مشاهدهٔ شیر در دنباله و دفعات مشاهدهٔ خط در همان دنباله است. نوشتار گوناگونی برای تعبیر بالا وجود دارد. یک نمونهٔ رایح اینگونه نوشته میشود:
در رابطهٔ بالا یک متغیر تصادفی دودویی است. مقدار احتمال Bernoulli measure نامیده میشود.
توجه شود که احتمال هر دنباله نامتناهی خاص از پرتاب سکهها صفر است، زیرا برای هر ، .
بنابراین یک فرایند برنولی با سه تایی احتمالاتی تعریف میشود.
قانون اعداد بزرگ، توزیع دوجملهای و قضیهٔ حد مرکزی
فرایندی را فرض کنید که در آن شیر با ۱ و خط با ۰ نشان داده میشود. قانون اعداد بزرگ بیان میکند که میانگین دنبالههای تصادفی که به صورت :
بیان میشود به امید ریاضی خود میل میکند. رخدادهایی که این حد را ارضا نمیکند احتمال صفر دارند. امید ریاضی در رخداد شیرها که فرض میشود با ۱ نمایش داده شده برابر است با . برای هر متغیر تصادفی در میان دنباله نامتناهی از آژمایشهای برنولی که فرایند برنولی را میسازد رابطهٔ زیر برقرار است:
- برای دانستن تعداد شیرها در یک دنباله از پرتاب سکهها به تعداد n به سادگی تعداد حالات شمرده میشود : در پرتاب n بار یک سکه، که یک رشته به طول n را میسازد، تعداد k بار شیر در این پرتابها از توزیع دوجملهای با ضرایب زیر بدست میآید:
- اگر احتمال رخداد شیر با مشخص شود، آنگاه احتمال کل مشاهدهٔ یک رشته به طول با بار شیر در آن به صورت زیر است :
این احتمال با نام توزیع دو جملهای شناخته میشود.
مقدار حدی برای یک دنباله به اندازه کافی بزرگ از پرتاب سکهها، با استفاده از تقریب استرلینگ به صورت زیر است :
با قرار دادن رابطهٔ اخیر در توزیع نرمال بدست میآید. این مطلب محتوای قضیه حد مرکزی و سادهترین مثال از آن است.
ترکیب قانون اعداد بزرگ و قضیه حد مرکزی به یک نتیجه جالب asymptotic equipartition property می انجامد.
سیستم دینامیکی
فرایند برنولی را میتوان به عنوان یک سیستم دینامیکی فهمید. علت این امر وجود یک تقارن طبیعی در فضای ضربی است که با عملگر شیفت داده میشود.
مقدار اندازهگیری (measure ) نسبت به انتقال نا متغیر است .
دنباله برنولی
عبارت دنباله برنولی عموماً به فهم از همان فرایند برنولی بازمیگردد، با این وجود این عبارت یک مفهوم کاملاً متفاوت دارد. فرض کیند یک فرایند برنولی به صورت رسمی، یک متغیر تصادفی تعریف شود. برای هر دنباله نامتناهی از پرتاب سکهها یک دنبالهٔ طبیعی بهطور زیر تعریف میشود:
این دنباله، دنباله برنولی مرتبط با فرایند برنولی میباشد. برای مثال اگر یک دنباله از پرتاب سکهها را نمایش دهد، آنگاه دنبالهٔ برنولی مرتبط لیست اعداد طبیعی یا نقطههای زمانی هست که پیشامد شیر رخ داده است.
بنابر تعریف یک دنباله برنولی ، نیز زیرمجموعه تصادفی از مجموعهٔ شاخصها (index) میباشد که همان اعداد طبیعی است.
تقریباً تمام دنبالههای برنولی دنبالههای ارگودیک هستند.
استخراج اعداد تصادفی
قدیمیترین استخراجکنندهٔ تصادفی که von Neumann extractor
استخراج کنندی پایه ی فون نویمان
اگر فرایند مشاهده شده را با دنبالهای از صفرها و یکها یا بیتها نمایش دهیم، و رشتهٔ ورودی را ره صورت غیر همپوشان از زوج بیتهای پشت سر هم نمایش دهیم، آنگاه برای هر زوج :
- اگر بیتها یکسان بودند، دور ریخته شود
- اگر بیتها یکسان نبودند، اولین بیت خروجی داده شود.
جدول زیر محاسبات را خلاصه میکند.
input | output |
---|---|
00 | discard |
01 | 0 |
10 | 1 |
11 | discard |
برای نمونه یک رشتهٔ ورودی از هشت بیت به صورت میتواند به صورت گروه بندی شود. آنگاه با توجه به جدول بالا این زوجها به خروجی زیر منجر میشود:
در رشتهٔ خروچی 0 و 1 بهطور مساوی محتمل هستند همانطور که 01 و 10 بهطور یکسان محتمل هستند که هر دو دارای احتمال هستند. این استخراج از توزیع یکنواخت نیاز به آزمایشهای ورودی مستقل از هم ندارد تنها کافیلست که ناهمبسته باشند. بهطور کلی تر، این مکانیز برای هر دنبالهٔ جابجایی پذیر از بیتها کار میکند:تمام چینشهای دنبالهها ی متناهی دارای شانس یکسان هستند.
استخراجکننده فون نویمان از دوبیت ورودی برای تولید خروجی 1 یا 0 استفاده میکند، بنابراین طول دنباله خروجی حداقل نصف دنباله ورودی است. بهطور میانگین محاسبات متناسب با از زوجهای ورودی را دور میریزد.
دور ریختن رودی حداقل متناسب با است، و این حداقل زمانی رخ میدهد که .
استخراجکننده فون نیومن تکراری (iterated)
کاهش بهره وری و هدر رفتن ویژگی تصادفی در رشتهٔ ورودی با استفاده از تکرار الگوریتم قابل کاهش یافتن است. یه این وسیله خروجی را میتوان به میزان دلخواه به باند آنتروپی نزدیک کرد. الگوریتم به صورت بازگشتی تصادفی بودن هدر رفتهٔ موجود در دو منبع ورودی را بازیافت میکند. به صورت سر راست، الگوریتم بر این واقعیت استوار است که به فرض مشخص بودن دنبالهٔ تولید شده، هر دو منبع هنوز دنبالههای قابل تعویض از بیتها هستند و بنابراین برای مرحلهٔ بعد الگوریتم استخراج مناسب است.
input | output | new sequence 1 | new sequence 2 |
---|---|---|---|
00 | none | 0 | 0 |
01 | 0 | 1 | none |
10 | 1 | 1 | none |
11 | none | 0 | 1 |
(در صورتی که طول دادهٔ ورودی فرد باشد، آخرین بیت دور ریخته میشود)
آنگاه الگوریتم بر روی هر کدام از دو رشتهٔ جدید به صورت بازگشتی اعمال میشود تا زمانی که ورودی خالی شود.
مثال: رشتهٔ ورودی به صورت است که پردازش آن به صورت زیر است:
step number | input | output | new sequence 1 | new sequence 2 |
---|---|---|---|---|
0 | (10)(01)(10)(11) | (1)(0)(1)() | (1)(1)(1)(0) | ()()()(1) |
1 | (11)(10) | ()(1) | (0)(1) | (1)() |
1.1 | (01) | (0) | (1) | () |
1.1.1 | 1 | none | none | none |
1.2 | 1 | none | none | none |
2 | 1 | none | none | none |
بنابر این خروجی به صورت است، پس از هشت بیت ورودی، پنج از خروجی تولید شد این درحالی است که الگوریتم پایه تنها 3 بیت تولید میکرد.