آمار باثبات

آمار باثبات راهی برای دستیابی به روش‌های پایه آماری است به طوری که برآوردها تحت تأثیر مقادیر نامتعارف بسیار بزرگ یا بسیار کوچک قرار نگیرد. در واقع آمار باثبات، آماری با اجرای خوب برای داده‌ای است که از طیف گسترده توزیع احتمال بدست می‌آید، به ویژه برای توزیع‌هایی که نرمال نیستند. روش‌های آماری مقاوم برای حل بسیاری از مسائل رایج مانند تخمین پارامتر مکان، پارامتر مقیاس و رگرسیون خطی توسعه یافته‌اند. یکی از اهداف ایجاد روش‌های آماری است که به‌طور بی‌جهت تحت تأثیر داده پرت قرار نمی‌گیرند. هدف دیگر فراهم‌کردن روش‌هایی با کارایی خوب در زمانی است که خروج‌های اندکی از توزیع‌های پارامتری وجود دارد. برای مثال، روش‌های مقاوم برای ترکیب دو توزیع نرمال با انحرافات استاندارد مختلف به خوبی جواب می‌دهند: مثلاً، یک و سه؛ در این مدل، روش‌های غیر مقاوم مانند آزمون t کارایی خوبی ندارند.

معرفی

آمار باثبات در جستجوی بدست آوردن روش‌هایی آماری است که تحت تأثیر داده‌های انحرافی در نمونه یا داده‌های نامتعارف نسبت به فرضیات مدل، قرار نمی‌گیرد و در عین حال قابل انطباق با روش‌های متداول آماری باشد. روش‌های پایهٔ آماری بر فرضیاتی بنا می‌شوند که در عمل و در بیشتر موارد فراهم کردن آن‌ها دشوار است. به ویژه معمول است که فرض شود باقی مانده‌ها به صورت گوسی توزیع شده‌اند، حداقل به‌طور تقریبی، یا آنکه قضیه حد مرکزی معتبر باقی می‌ماند تا تخمین‌هایی با توزیع گوسی تولید کند، اما متأسفانه وقتی در میان داده‌ها تعدادی نقطهٔ نامتعارف وجود داشته باشد روش‌های پایه کارایی اندکی از خود نشان می‌دهند. آماره‌های پارامتری باثبات سعی می‌کنند فرض توزیع گوسی در روش‌های پایه را با توزیع تی-استیودنت با درجهٔ آزادی کم یا حتی ترکیبی از دو یا چند توزیع جایگزین کنند. برای برآورد کمی میزان ثبات یک روش آماری، سنجش‌های ثبات را تعریف می‌کنیم. دو سنجش بسیار متداول عبارتند از حد واژگونی و تابع تأثیر.

مثال

  • میانه، سنجشی باثبات از میزان تمایل به مرکز[1] است درحالی که میانگین اینگونه نیست به‌طور مثال اگر در یک دسته از داده‌ها ۵۰٪ آن‌ها نامتعارف باشد باز مقدار میانه تغییر نمی‌کند اما اگر در یک دسته فقط یک دادهٔ نامتعارف داشته باشیم مقدار میانگین تغییر می‌کند. به بیان دیگر حد واژگونی برای میانه ۵۰٪ و برای میانگین صفر درصد است.
  • انحراف مطلق از میانه[2] و دامنهٔ میان‌چارکی[3] برآورهای با ثباتی از پراکندگی آماری[4] بدست می‌دهند درحالی که انحراف معیار و دامنه اینگونه نیستند.

ته‌بریده کردن[5] یک روش عمومی برای باثبات کردن آماره است.

پانویس

جستارهای وابسته

منابع

    • (Robust Statistics, Peter. J. Huber, Wiley, 1981 (republished in paperback, 2004

    مشارکت‌کنندگان ویکی‌پدیا. «Robust statistics». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۲۴ سپتامبر ۲۰۱۰.

    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.