استراتژی ماشه
در نظریه بازی، استراتژی ماشه یکی از استراتژیهای پرکاربرد در بازیهای تکرارشونده است. بازیکنی که استراتژی ماشه را به کار میبرد، در ابتدا همکاری میکند، اما به محض این که بازیکن دیگر استراتژی دیگری در پیش گرفت، بازیکنی که استراتژی ماشه را به کار بسته است، تا انتهای بازی روشی غیر از حالت اولیه در پیش میگیرد. از آن که کوچکترین عدم همکاری از سوی بازیکن رقیب، موجب کنار گذاشتن همکاری تا ابد میشود، استراتژی ماشه بیشترین بی تفاوتی را برای بازیکنی که آن را در پیش گرفته، منعکس میسازد.
دوراهی زندانی بی نهایت تکرارشونده
معمای دوراهی زندانی بی نهایت تکرارشونده، مثالی خوب برای بررسی استراتژی ماشه است. شکل استاندارد بازی برای دو بازیکن، به صورت جدول زیر است:
زندانی ۲ سکوت میکند | زندانی ۲ خیانت میکند | |
---|---|---|
زندانی ۱ سکوت میکند | هر کدام یک ماه زندانی | زندانی ۱ یک سال حبس زندانی ۲ آزاد میشود |
زندانی ۱ خیانت میکند | زندانی۱ آزاد میشود زندانی ۲ یک سال حبس |
هر کدام ۳ ماه زندانی |
در این بازی، در هر مرحله دو انتخاب برای هر یک از دو بازیکن وجود دارد:
- همکاری
- تخطی برای یک منفعت فوری
اگر یک بازیکن تخطی کند، او در بقیه بازی تنبیه خواهد شد. در واقع، برای هر دو بازیکن بهتر است که همکاری کنند، تا این که یکی به دیگری خیانت کند. لذا انتخاب ترکیب استراتژی (سکوت، سکوت) نسبت به (خیانت، خیانت) برای هر دو بازیکن بهتر است. همچنین تنها تعادل نش بازی، ترکیب ترک همکاری و تنبیه یکدیگر است.
در استراتژی ماشه، یک بازیکن در دور اول و دورهای بعدی، همکاری میکند و این روند را تا زمانی که حریفش نسبت به توافقشان خیانت نکردهاست، ادامه میدهد. هر گاه یکی از بازیکنان متوجه شود که حریفش به او خیانت کردهاست، از مرحله بعد تا ابد او را تنبیه خواهد کرد.
به منظور محاسبه تعادل نش زیر بازی کامل برای استراتژی ماشه زیر که برای بازی در نظر گرفته شده، استراتژی برای بازیکنان i و j به صورت زیر است:
- در پیش گرفتن سکوت، تا زمانی که هیچ کس در دورههای قبلی خیانت نکردهاست.
- در صورت خیانت یک نفر در دوره قبل، در پیش گرفتن خیانت برای همیشه...
این استراتژی در صورتی که ضریب تنزیل باشد، تعادل نش زیربازی کامل است. به عبارت دیگر، اگر ضریب تنزیل کمتر از نیم باشد، هیچ یک از دو بازیکن انگیزه ای برای خیانت و خروج از توافق ندارند.
برای اثبات این که این استراتژی تعادل نش زیربازی کامل است، نشان میدهیم که همکاری بهترین پاسخ به همکاری بازیکن دیگر است و ترک توافق نیز بهترین پاسخ به ترک توافق از سوی بازیکنِ حریف.
مرحله 1: فرض میکنیم تاکنون خیانتی نشدهاست:
- آوردهٔ بازیکن i از همکاری برابر است با:
- آوردهٔ بازیکن i از خیانت برابر است با:
در این حالت، همکاری تا زمانی که باشد بهتر از خیانت است. این نشان میدهد که اگر باشد، همکاری بهینه پارتو است.
مرحله 2: فرض کنید که تاکنون یک نفر خیانت کردهاست. در این صورت:
- آوردهٔ بازیکن i از همکاری برابر است با:
- آوردهٔ بازیکن i از ترک توافق و خیانت برابر است با:
در این حالت نیز به ازای مقادیر مختلف دلتا، خیانت بهترین پاسخ است.
استدلال اخیر نشان میدهد که اگر دلتا از نیم بزرگتر باشد، انگیزه ای برای تخطی از همکاری وجود ندارد.
استراتژی ماشه در روابط بینالملل
در روابط بینالملل، یک کشور تحت استراتژی ماشه تنها در صورتی با کشور شریکش همکاری میکند که هیچگاه از سوی آن کشور استثمار نشده و آن کشور به توافقهایش پایبند بوده باشد. از آن که در صورت تخطی یک کشور از توافق، کشور دیگر تا ابد خلاف آن توافق را عمل خواهد کرد، استراتژی ماشه میتواند تبدیل به یک حالت محدودکننده شود، حالتی که همه اعضا در آن به شدیدترین شکل رفتار میکنند. قضیه عامیانه بیان میکند که اگر دو کشور صبور باشند، میتوان به یک تعادل کامل دست یافت.
مقایسه با سایر استراتژی ها
این به آن در و استراتژی ماشه، استراتژیهایی هستند که تا حدی به هم شبیهاند. در هر دو استراتژی در صورتی که بازیکن توان ترک توافقش را داشته باشد، در ابتدا از آن امتناع میکند. تفاوت در این است که استراتژی ماشه به شکل سختگیرانه ای شدیدترین تنبیه ممکن را برای بازیکنی که تخطی کردهاست در نظر میگرد، اما این به آن در (tit-for-tat) سخاوتمندانه تر است.