نیکویی برازش
نیکویی برازش (به انگلیسی: Goodness of fit) یا خوش سازگاری برای یک مدل آماری بیان کننده آن است که آن «مدل آماری» به چه اندازه با یک مجموعه از «مشاهدات» متناسب است. اندازه نیکویی برازش معمولاً تفاوت بین مقادیر مشاهده شده و مقادیر مورد انتظار در مدل بررسی شونده را خلاصه سازی میکند. از این اندازه میتوان در آزمون فرض آماری استفاده کرد، مثلاً برای آزمون بهنجاری باقیمانده، یا برای آزمون آنکه بررسی شود که آیا دو نمونه از یک توزیع یکسان گرفته شدهاند یا نه، (آزمون کولموگروف–اسمیرنف را ببینید)، یا اینکه آیا فرکانسهای حاصل شده از توزیع تعیین شده پیروی میکنند (آزمون کای مربع پیرسون را ببینید). در تحلیل واریانس، یکی از مولفههایی که واریانس به آن بخشبندی میشود، میتواند فقدان تناسب مجموع مربعات باشد.
بخشی از مجموعه مباحث دربارهٔ آمار |
تحلیل رگرسیون |
---|
مدلها |
|
|
|
|
تخمین |
|
|
|
|
پیشزمینه |
|
|
پس از تخمین یک مدل خطی خاص، سؤالی که مطرح میشود این است که: خط وایازش تخمین زده شده چه میزان با مشاهدات واقعی تطابق دارد؟ یک معیار سنجش مناسب برای نیکویی برازش (یا برازندگی)، نسبت واریانس نمونه ای y است که بوسیلهٔ مدل توضیح داده میشود. این متغیر نامیده شده و به صورت زیر تعریف میشود: رابطه (۱–۱) که در این رابطه است و بیانگر میانگین نمونه ای میباشد. توجه داشته باشید که مساوی میانگین نمونه ای است. از شرط مرتبه اول داریم:در نتیجه میتوانیم را به صورت زیر تعریف نماییم : که در آن است. در بسیاری از مدلهای مشابه که شامل عرض از مبدأ هستند رابطه زیر برقرار است: رابطه (2-1) که است. با استفاده از این رابطه میتوان را به صورت زیر بازنویسی کرد: رابطه(۳–۱) فوق نشان میدهد که واریانس نمونه ای را میتوان به صورت حاصل جمع واریانسهای نمونه ای دو جزء متعامد تجزیه نمود: تخمین زن و )residual). بنابراین بیان میکند که چه نسبتی از تغییرات نمونه در توسط مدل توضیح داده میشود. اگر مدل مورد مطالعه شامل عرض از مبدأ باشد دو عبارت فوق برای تعیین معادلند. علاوه بر این در این مورد میتوان نشان داد که مقدار همواره بین صفر و یک قرار دارد. تنها اگر تمام باشند مساوی یک خواهد بود و مقدار صفر نشان میدهد که مدل به جزمیانگین نمونه ای هیچ چیز دیگری را توضیح نمیدهد. در یک مورد استثنایی که مدل شامل عرض از مبدأ نیست دو عبارت مطرح شده برای معادل نیستند و این بدین دلیل است که رابطهٔ (۲–۱)نقض میشود زیرا دیگر معادل صفر نمیباشد. در این وضعیت ممکن است مقدار محاسبه شده از رابطه ی(۳–۱) منفی گردد. یک روش اندازهگیری جایگزین که بهطور معمول به وسیلهٔ نرمافزارها مورد استفاده قرار میگیرد اگر عرض از مبدأ وجود نداشته باشد است که طبق رابطهٔ زیر تعریف میگردد و مقدار آن بزرگتر از استاندارد است: رابطه (۴–۱) از آنجا که تغییرات توضیح داده شده در را توضیح میدهد نسبت به تغییر این متغیر حساس است؛ بنابراین در مدلهایی که مصرف را توضیح میدهند، تغییرات در مصرف یا رشد مصرف الزاماً توسط مقادیر شان قابل مقایسه با هم نمیباشند. به عنوان مثال تغییر در مصرف کل برای یک کشور مورد نظر معمولاً آسانتر از توضیح تغییرات cross-sectional مصرف در سطح خانوار هاست. در نتیجه معیار قطعی برای اینکه یک مقدار کم یا زیاد تلقی شود وجود نداردمثلا مقدار ۰٫۲ ممکن است در کارکرد خاص بزرگ و در سایر موارد کم تلقی شود و حتی مقدار ۰٫۹۵ ممکن است در یک مورد خاص کم بهشمار آید گاهی اوقات به عنوان معیاری برای کیفیت مدل آماری تفسیر میشود که در این حالت چیزی به جز کیفیت تقریب خطی را اندازهگیری نمینماید هنگامی که رویکردOLS برای بدست آوردن بهترین تقریب خطی توسعه داده شود، صرف نظر از درستی مدل و اعتبار فرضیاتش، تخمین مدل خطی به وسیلهٔ OLS بهترین ممکن را بدست میدهد. هر روش تخمین دیگر اگرچه دارای تخمین زن با مشخصات آماری بهتر تحت فرضیاتش باشد، منجر به کمتر ی خواهد شد. هنگامی که مدل توسط OLS تخمین زده نشود دو رابطهٔ (۱–۱) و (۲–۱)معادل نیستند و روشن نیست چگونه باید تعریف شود. برای استفادههای بعدی ما تعریف جایگزینی برای ارائه مینماییم که برای OLS معادل روابط(۱–۱) و (۲–۱)و برای هر تخمین زن دیگری بین صفر و یک خواهد بود. رابطه(۵–۱) که بیانگر مجذور ضریب همبستگی بین مقدار واقعی و fitted value هاست. در نتیجه مهمترین جنبه از نتایج تخمین ما بهشمار نمیآید. مشکل دیگر این است که مقدار ان با افزایش تعداد متغیرهای توضیح دهنده کاهش نمییابد. یک راه معمول برای حل این مشکل تصحیح واریانس تخمین زده شده برای درجات آزادی است. این امر یا را نتیجه میدهد که طبق رابطهٔ زیر تعریف میشود: رابطه(۶–۱) این روش محاسبهٔ نیکویی برازش مقداری جریمه برای افزایش تعداد متغیرهای توضیح دهنده در مدل در نظر میگیرد و بنابراین هنگامی که متغیرهای توضیح دهنده به مدل اضافه میشوند افزایش نخواهند یافت. در حقیقت آن ممکن است با اضافه شدن یک متغیر به جمع متغیرهای توضیح دهنده کاهش یابد. توجه کنید که در بسیاری از موارد ممکن است مقداری منفی باشد و همچنین مقدار آن کوچکتر از خواهد بود مگر اینکه مدل تنها شامل جزء ثابت بوده و هر دو مقدار مساوی صفر گردند.
پانویس
منابع
مشارکتکنندگان ویکیپدیا. «Goodness of fit». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۳۰ سپتامبر ۲۰۲۰.
۲۰۰۴(A GUIDE TO ECONOMETRICS(VERBEEK