نمونه‌سازی مجدد (آمار)

در آمار، آزمون تصادفیدن به روش‌های متنوع برای انجام یکی از موارد زیر می‌باشد:

تخمین دقت آمار نمونه (میانه، واریانس، صدک) با استفاده از زیرمجموعه‌های داده‌های دردست‌رس (تصادفیدن جکنایف) یا رسم تصادفی جایگزینی از مجموعه‌ای از نقاط داده (بوت‌استرپینگ)
تغییر برچسب‌های نقاط داده در زمان اجرای معناداری آماری (آزمون جایگشتی)
اعتبارسنجی مدل‌ها با استفاده از زیرمجموعه‌های تصادفی

روش‌های رایج تصادفیدن شامل بوت‌استرپینگ، جککنیفینگ و آزمون جایگشتی هستند.

آزمون جایگشتی

یک آزمون جایگشتی نوعی آزمون فرض آماری است که در آن توزیع آماره آزمون تحت فرضیه تهی، با محاسبه تمام مقادیر ممکن از آماره آزمون تحت بازآورایی‌های برچسب‌های نقاط مشاهده‌شده بدست می‌آید. به عبارت دیگر، روشی که در آن رفتارها در یک طراحی آزمایش به موضوعات نسبت داده می‌شوند، در آنالیز طراحی بازتاب می‌شود. اگر تحت فرضیه تهی، برچسب‌ها قابل جابجایی باشند، آزمون‌های حاصل سطوح اهمیت دقیقی را بدست می‌دهند؛ متغیرهای تصادفی تعویض پذیر را ببینید. می‌توان از این آزمون‌ها، فاصله اطمینان را بدست آورد. این نظریه حاصل تکامل پژوهش‌های رانلد فیشر و ای‌جی‌جی پیتمن در سال ۱۹۳۰ است.

برای نشان‌دادن اساس ایده یک آزمون جایگشتی، فرض کنید که ما دو گروه A و B را داریم، که میانگین نمونه‌های آنان ${\bar {x}}_{A}$ و ${\bar {x}}_{B}$ اند، و می‌خواهیم امتحان کنیم، در سطح معنی ۵ درصد، آیا آن‌ها از توزیع یکسانی نشات گرفته‌اند یا نه. آزمون جایگشت برای تعیین این موضوع طراحی شده‌است که آیا اختلاف مشاهده شده بین میانگین نمونه به اندازه کافی بزرگ است که فرض تهی H $_{0}$ را که طبق آن دو گروه دارای توزیع احتمال یکسانند، رد کند.

عملکرد این تست بدین‌گونه است. ابتدا، اختلاف میانگین دو نمونه محاسبه می‌شود: این مقدار مشاهده‌شده، آماره آزمون است، که با T نمایش می‌یابد. سپس مشاهده گروه A و B مخلوط می‌شود.

بعداً، اختلاف بین میانگین نمونه محاسبه و برای هر روش ممکن تقسیم این مقادیر مخلوط به دو گروه به اندازه $n_{A}$ و $n_{B}$ ثبت می‌شود (مثلاً، برای تمام جایگشت برچسب‌های گروه‌های A و B). مجموعه این اختلافات محاسبه شده، توزیع دقیق اختلافات ممکن تحت این فرضیه تهی، که برچسب گروه اهمیتی ندارد، می‌باشد.

پی-مقدار یک‌طرفه این آزمون به عنوان نسبت جایگشت نمونه‌گیری محاسبه می‌شود که اختلاف میانگین آن بزرگ‌تر یا مساوی T است. پی-مقدار دوطرفه آزمون به عنوان نسبت جایگشت نمونه‌گیری محاسبه می‌شود که تفاوت مطلق آن بزرگتر یا مساوی T است.

اگر تنها هدف این آزمون رد یا رد نکردن فرضیه تهی باشد، می‌توانیم به عنوان یک نوع جایگزین اختلافات ثبت‌شده از آن استفاده کنیم و سپس ببینیم آیا T در وسط ۹۵ درصد از آن‌ها قرار دارد. اگر نه، فرضیه منحنی احتمال یکسان را در سطح مفهوم ۵ درصد، رد می‌کنیم.

منابع

ترجمه از ویکی‌پدیا انگلیسی

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.