سخنرانی مهم رابرت اومن هنگام دریافت جایزه نوبل اقتصاد در سال 200
جنـگ و صلـح
«جنگها و دیگر نزاعها از جمله سرچشمههای اصلی و عمده بدبختی انسانها هستند» این جمله آغازین اعلانیه سال 2005 بانک سوئد برای جایزه اقتصاد به یاد آلفرد نوبل است.
بنابراین شایسته است که این سخنرانی را به یکی از پرفشارترین و عمیقترین موضوعاتی که بشر تا به حال با آن مواجه شده اختصاص دهیم: جنگ و صلح.
به نظر من شاید ما باید برای رسیدگی به صلح در جهان جهت تلاشهای خود را تغییر دهیم، تا امروز همه تلاشها برای پایان دادن به نزاعهای خاص بودهاند، مثلا: هند و پاکستان، ایرلند شمالی و جنوبی، جنگهای قاره آفریقا، جنگهای منطقه بالکان، روسیه و چچن، اسرائیل و ملتهای عرب و ... به نظر من بهتر آن خواهد بود که ما باید توجه خود را از موارد خاص سلب کرده و به مطالعه خود جنگ به معنای عمومی آن بپردازیم.
اجازه دهید تا مقایسهای انجام دهم. دو راه برای مقابله با سرطان وجود دارد. یکی مطالعات بالینی است. مثلا فردی سرطان سینه دارد. چه کار باید بکند؟ جراحی؟ رادیولوژی، شیمی درمانی؟ چه نوع شیمی درمانی! آیا نیازی به برداشتن غدد سرطانی هست؟ جواب این سوالها بستگی به آزمایشات بالینی فرد دارد. نوع درمان هر فردی بستگی به نتیجه آزمایشات خود دارد و در نتیجه هر موردی باید به طور خاص بررسی شود.
ولی راه دیگری نیز برای مقابله با سرطان وجود دارد. شما نه جراحی میکنید، نه رادیولوژی، نه شیمی درمانی و نه به آمار مراجعه میکنید، شما اصلا با مریض کاری ندارید بلکه سعی میکنید از ساز و کار سلولهای سرطانی سر در بیاورید. آیا شکل از DNA است؟ چه اتفاقی در این سلولها میافتد؟ شما در این راه مقابله به دنبال «درمان» نیستید بلکه فقط سعی میکنید «بفهمید» و نتایجتان را بر روی موشها آزمایش میکنید، نه آدمها. سعی میکنید که موشها را مریض کنید نه درمان. لوئیس پاستوریک پزشک بود. برای او درمان بیماران امری مهم بود ولی رابرت کخ پزشک نبود و تلاشی برای درمان بیماران انجام نمیداد. او فقط سعی میکرد بفهمد که سازوکار بیماریهای واگیردار چیست؟ ولی سرانجام نتایج تحقیقات وی در درمان بیماریها از اهمیت به سزایی برخوردار شد.
جنگ از ابتدای تمدن انسانها وجود داشته، هیچ چیز به اندازه جنگ در طول تاریخ به طور ثابت حضور نداشته است. جنگ یک پدیده است، نه یک سری اتفاقات مجزا از زندگی انسانها.
البته مطمئنا تلاشهای انجام گرفته برای حل و فصل نزاعهای خاص، بسیار ارزشمند و ستودنیاند و گاهی واقعا نتیجه میدهند؛ ولی با این حال راه دیگری نیز برای برخورد وجود دارد: مطالعه جنگ به عنوان یک پدیده کلی و مطالعه مشخصات کلی و معرفی آن از لحاظهای تاریخی، اجتماعی، روانشناسی و -بله- عقلانی. چرا انسان عقلایی به جنگ میرود؟ منظور من از «عقلانیت» این است:
رفتار یک فرد «عقلائی» است اگر آن رفتار بر اساس اطلاعات وی در علائق وی بگنجد.
با این تعریف، آیا جنگ میتواند عقلائی باشد؟ متاسفانه جواب بله است. آبراهام لینکلن در یکی از بزرگترین و بهترین سخنرانیهای خود چنین گفت که : «هر دو دسته جنگ را زشت میدانستند؛ ولی یکی شروع جنگ را به حیات ترجیح داد و دیگری قبول آن را به مرگ ایشان و این چنین جنگ آغاز شد.»
این یک اشتباه بزرگ است که بگوییم جنگ غیرعقلایی است. ما با غیرعقلایی خواندن پدیدههای ناخوشایند جهان- مانند جنگها، اعتصابها، تبعیضنژادی و ... - در واقع چشم را روی آنها میبندیم و نادیدهشان میگیریم در حالی که آنها لزوما غیرعقلائی نیستند و در واقع با وجود اینکه شاید این امر ناخوشایند باشد، برخی از آنها عقلائیاند. اگر جنگ عقلائی است، پس ما اگر بتوانیم ساختار آن را شناسایی کنیم، شاید بتوانیم مشکل را شناسایی کنیم در حالی که اگر با تصور غیرعقلائی بودن، چشم بر آن ببندیم قطعا نخواهیم توانست که مشکل را دریابیم. سالها پیش من در جمعی از دانشجویان دانشگاه ییل حضور داشتم. جیم توبین، که بعدها برنده جایزه نوبل شد، نیز آنجا بود. بحث آزادی در جریان بود و یکی از سوالهایی که در جریان بحث مطرح شد، این بود، آیا کسی میتواند اقتصاد را در یک کلمه خلاصه کند؟» توبین پاسخ داد: «بله» گفت: «انگیزهها» در واقع سر و کار اقتصاد فقط با انگیزهها است.
بنابراین، آنچه که من به دنبال آن هستم، تحلیلی اقتصادی از جنگ است. البته ممکن است آن طور که میخواستم، نتوانسته باشم منظور خود را بیان کنم. من در مورد اینکه چگونه باید یک جنگ را پشتیبانی مالی کرد، یا چگونه باید بعد از جنگ به نوسازی پرداخت یا هر چیزی شبیه اینها حرف نمیزنم، بلکه سخن من درباره شناسایی انگیزههایی است که به جنگ منتهی میشود و اینکه چگونه میتوان انگیزههایی ایجاد کرد که از جنگ جلوگیری کرد.
بگذارید مثالی بزنم. اقتصاد به ما نشان میدهد که چیزها همیشه آن طوری که به نظر میآیند، نیستند. برای مثال، فرض کنید دولتی میخواهد درآمدهای مالیاتی خود را افزایش دهد. به نظر میرسد که برای نیل به این هدف باید نرخ مالیاتها را افزایش یابد در حالی که نه تنها این کار درست نیست بلکه درست بر عکس چیزی است که باید انجام یابد. برای افزایش درآمدهای مالیاتی باید نرخ مالیات کاهش یابد تا مردم انگیزه بیشتری برای کار کردن پیدا کنند، از میزان فرار از مالیاتها کاسته شود، اقتصاد رونق بیشتری پیدا کند و ... این فقط یک مثال بود و هزاران مورد شبیه آن وجود دارد. اقتصاد یک بازی است: انگیزههای بازیکنان تاثیرات متقابل و پیچیدهای بر هم میگذارند و به نتایج غیرمنتظره و گاه مخالف با شهود موجود میانجامند همان طور که میبینم اقتصاد واقعا این گونه عمل میکند.
حال بیایید به مساله جنگ بازگردیم و اینکه چگونه انسان عقلایی در این تصویر میگنجد. در اینجا نیز مثالی مانند مثال قبل وجود دارد. برای جلوگیری از وقوع جنگ باید چه کرد؟ آنچه در نظر اول به وضوح باید انجام یابد خلع سلاح و کم کردن تسهیلات نظامی است. این طور نیست اتفاقا باز هم باید درست بر عکس این امر صورت گیرد. در طول سالهای متمادی جنگ سرد بین ایالات متحده و شوروی، چیزی که از وقوع جنگ واقعی بین دو کشور جلوگیری کرد هواپیماهایی بود که هر 24ساعت روز و هر 365 روز سال را با سلاحهای هستهای پرواز میکردند و آماده حمله بودند. در آخر دوباره میخواهم بر این نکته تاکید کنم که باید شروع به مطالعه محض جنگ کنیم، از تمام جوانب آن سعی کنیم بفهمیم چه چیزی باعث وقوع آن میشود. مطالعهای محض و کاملا علمی که شاید منتهی به صلح شود همان طور که میبینیم مطالعات جزئی و خاص تا به حال آنگونه که باید نتیجه ندادهاند.
حال مایلم تا اندکی به فعالیتهای خود که توسط (Prize Committe) بررسی شدهاند بپردازم، مخصوصا اجازه دهید در مورد بازیهای تکرار شونده (Repeated games) و ارتباط آنها با جنگ، دیگر نزاعها از قبیل اعتصابها و .... و به طور کلی کلیه وضعیتهایی که به تقابل میانجامند، صحبت کنم.
مدل بازیهای تکرار شونده، تقابلهای طولانی مدت را مدل میکند. این تئوری قادر است پدیدههایی از قبیل نوعدوستی، همکاری، اعتماد، وفاداری، انتقام، تهدید(علیه خود یا دیگران) - پدیدهای که در ابتدا شاید غیرعقلانی به نظر آید - را براساس پارادایم حداکثر کردن سود «فردی» تئوری بازیها و اقتصاد نئوکلاسیک توضیح دهد.
اینکه این تئوری میتواند این پدیدهها را «توضیح» دهد به این معنی نیست که مردم با فکر و اندیشه و بنا به نفع شخصی خود تصمیم میگیرند که انتقام بگیرند یا سخاوتمندانه رفتار کنند بلکه در طول قرنها مردم هنجارهای رفتاری را به وجود آوردهاند که عموما موفق و در واقع بهینهاند. این چنین بهینهکردن رفتارها شاید بیولوژیکی یا ژنتیکی باشد و شاید Memotic، این واژه از ریشه Meme ساخته شده که اولینبار توسط ریچارد داوکین(زیستشناس) در مقابل واژه ژن (Gene) به کار برده شد.
وی معتقد بود همانگونه که ژن عامل انتقال موروثی و تکامل زیستی است، Meme نیز عامل انتقال موروثی و تکامل اجتماعی است.
یکی از بزرگترین اکتشافات تئوری بازیها در اوایل دهه هفتاد، هنگامی به وقوع پیوست که زیستشناسهایی به نامهای جان مینارد اسمیت و جورج پرایس دریافتند که تعادل استراتژیک در بازیها و تعادل جمعیت در دنیا از قوانین مشابهی پیروی میکنند، بدین ترتیب تکامل - چه از نوع ژنتیک و چه Mematic در نهایت به یک تعادل استراتژیک منتهی خواهد شد. پس آنچه میخواهیم بدان برسیم این است که در بازیهای تکرار شونده، تعادل استراتژیک منجر به پدیدههایی همچون نوعدوستی، همکاری، اعتماد، وفاداری، انتقام، تهدید و ... میگردد. اجازه دهید ببینیم که این نتیجهگیری از کجا به دست میآید.
منظور من از «تعادل استراتژیک» چیست؟ به طور کلی، در یک بازی هنگامی گفته میشود که بازیکنان در تعادل استراتژیک به سر میبرند که بازیهاشان متقابلا بهینه باشند: هنگامی که رفتارها و طرحهای هر بازیکن در محیط استراتژیک داده شده عقلانی باشد یعنی هنگامی که هرکدام از آنها از رفتارهای و طرحهای دیگران آگاه است.
در سال 1994 در پانزدهمین سالگرد انتشار «تئوری بازیها و رفتار اقتصادی» توسط جانفون نویمان و اسکار مورگنسترن، جایزه نوبل اقتصاد به دلیل به قاعده درآوردن و توسعه مفهوم تعادل استراتژیک به جاننش اعطا شد.
این جایزه مشترکا با نش به جان هرسینی (John Harsangi) و رینهارد زلتن تعلق گرفت که اولی به خاطر به قاعده در آوردن و توسعه تعادل Bayesian و دومی تعادل کامل مورد تقدیر قرار گرفتند. مفاهیم تعادل هماهنگ شده (Carrelated equilibrian) (اومن، 1974 و 1987) و تعادل قوی (Strony equilibrian) (اومن 1959) که هر دو در اعطای جایزه امسال درنظر گرفته شدهاند و سه مفهوم بنیادی ذکر شده سنگ بناهای تئوری بازیهای غیرهمکارانه هستند.
پس از جایزه نوبل 1994، دو جایزه نوبل اقتصاد دیگر به کاربردهای از مفاهیم بنیادی اعطا شد که اولین آنها در 1996 به ویلیام ویکری به خاطر تحقیقاتش در زمینه حراج تعلق گرفت (ویکری هر زمان بین اعلام برندگان و جشن درگذشت) ساختار حراجها در میان کاربردهای عمده و کاربردی نظریه بازیها است.
دومین جایزه امسال (2005) اعطا شد. پروفسور شلینگ به خاطر به کارگیری مفاهیم بنیادی تعادل (که در بالا به آنها اشاره شد) به بازیهای تکرار شونده، مورد تقدیر قرار گرفته است. یک بازی تکرارشونده اینگونه است که فرض کنید که شما بازی G را با همان بازیکنان هر سال بازی میکنید. یک نفر میتواند این رفتار را به عنوان یک بازی بزرگ درنظر بگیرد - که به آن ابربازی G نیز میگویند و با G نشان میدهند - که قانون آن این است که بازی G را هر سال بازیکن تکرار کند. ایده این است که مفاهیم مذکور به جای به کارگیری بر روی بازی G، بر روی G به کار گرفته شوند و نتایج در این حالت بررسی شوند.
نظریه بازیهای تکرارشونده که از این فرآیند، پدیدار گشته بسیار غنی و عمیق است. در چند دقیقهای که از زمان من باقیمانده، من به سختی خواهم توانست تا عمق آن را بشکافم، ولی اجازه دهید که سعی خود را بکنم. من به طور خلاصه فقط از یک جنبه به موضوع خواهم پرداخت: همکاری، به طور کلی نتیجه این است: «تکرار، همکاری، را ممکن میسازد». اجازه دهید این نتیجه را قدری روشنتر کنیم. ما هنگامی نتیجه یک بازی را «همکارانه» مینامیم که هیچ بازیکنی نتواند تخمینکننده نتیجه بهتری برای خود شود. توجه به این نکته مهم است که در کل، یک نتیجه «همکارانه» ناشی از تعادل نیست، بلکه نتیجه یک توافق است. برای مثال، در بازی مشهور «معمای زندانی» (در این بازی دو فرد مورد بازجویی قرار میگیرند و از هر دو خواسته میشود که در مورد فرد دیگر اعتراف کنند، شرایط اینگونه است که اگر یکی برعلیه دیگری اعتراف کند، خود آزاد شده و دیگری به 20سال زندان محکوم میشود، اگر هر دو برعلیه هم اعتراف کنند، خود آزاد شده و دیگری به 20سال زندان محکوم میشود، اگر هر دو بر علیه هم اعتراف کنند، هر دو به 5 سال زندان و اگر هیچ یک اعترافی نکنند هر دو به یک سال زندان محکوم میشوند.م)
شرایطی که هیچ یک از زندانیها اعتراف نکنند یک نتیجه همکارانه است و با اینکه بهترین انتخاب هیچ یک از زندانیها نیست ولی برای هر دو آنها بهتر از تعادل یکتای بازی است (طبق نظریه بازیها میتوان اثبات کرد که این بازی تنها در یک حالت به تعادل میرسد و آن شرایطی است که هر دو زندانیها برعلیه دیگری اعتراف کنند.م)
مثال سادهتری نیز میتوان زد: در بازی H روناوکالین بازی میکنند. رونا باید تصمیم بگیرد که هردوشان به یک اندازه پول بگیرند (مثلا 1000تومان) یا خودش 10برابر بیشتر و به دیگری 10برابر کمتر. در همان زمان کالین نیز باید تصمیم بگیرد که آیا باید یک عمل مستحق مجازات را انجام دهد یا نه که در صورت انجام هردوشان تنبیه شده و تقسیم پول منتفی خواهد شد و هیچکدام از بازیکنان هیچ چیزی به دست نخواهند آورد. جدول بازی به شکل زیر است:
نتیجه (عوپ) یعنی دریافت هرکدام 1000تومان یک نتیجه همکارانه است.
در حالی که هیچ بازیکنی نمیتواند تعیینکننده مقدار بیشتری برای خود باشد، ولی مانند «معمای زندانی» این نتیجه در حالت تعادل به دست نمیآید.
چرا نتایج همکارانه با اینکه در حالت تعادل به دست نمیآیند باز هم جالب توجهند؟ پاسخ این است که این نتایج در زمینههایی که در آنها قراردادها لازم الاجرا هستند با قرارداد - توافق - قابل دستیابیاند. چنین زمینههایی بسیاراند؛ برای مثال یک زمینه ملی با یک دستگاه قضایی اگر قراردادها لازمالاجرا باشند، روناوکالین میتوانند به نتیجه (عوپ) دست پیدا کنند و اگر نه (عوپ) چندان قابل دستیابی نخواهد بود.
نظریه بازیهای همکارانه که ریشه در چنین ملاحظاتی دارد یک دهه قبل از مطالعات نش به وجود آمده است (فون نویمان و مورگن اشترن) این نظریه که به نظر من بسیار قوی و پربار است، باعث پربار شدن ایدههای اصلی نظریه بازیها شده است. چیزی که من اینجا به دنبال آن هستم، رابط بین نظریه بازیهای همکارانه و بازیهای تکرار شونده است. ایده اصلی این است که تکرار مانند یک مکانیسم اجبار عمل میکند که باعث اهمیت یافتن و روشنتر شدن نتایج همکارانه در حالت تعادل میگردد- وقتی که همه به گونهای عمل میکنند که بیشترین نفع را برایشان دارد.
این امر از لحاظ شهودی به سادگی قابل فهم است. مردم یک رابطه طولانی مدت همکاری با هم دارند. آنها میدانند که فردایی هم وجود دارد و هر رفتار بیجایی مجازاتی در پی خواهد داشت. مثلا فردی که به مشتریان خود کلک میزند، درست است که در کوتاه مدت سود میبرد ولی قطعا نخواهد توانست به مدت طولانی در بازار به فعالیت خود ادامه دهد.
حال اجازه دهید این مطالب را در قالب بازی H بیشتر توضیح دهم و روشنتر کنم. اگر بازی فقط یکبار انجام پذیرد، در این صورت بهترین کار برای رونا این خواهد بود که دست به بازی حریصانه بزند و بهترین گزینه برای کالین این خواهد بود که به این بازی تن دهد و دست به مجازات نزند. البته کالین خیلی از شرایط راضی نخواهد بود زیرا مبلغ خیلی کمتری از رونا به دست میآورد ولی چاره دیگری نیز نخواهد داشت. به این ترتیب تنها حالت تعادل این بازی حالت (ح و پ) خواهد بود.
ولی در این بازی H ، کاری هست که کالین بتواند انجام دهد. او میتواند رونا را تهدید کند که اگر حریصانه بازی کرد، دست به مجازات خواهد زد، بنابراین به نفع رونا نخواهد بود که حریصانه بازی کند.
استراتژی رونا این است که: «همیشه (ع) را بازی کن» و استراتژی کالین: «تا موقعی که رونا (ع) را بازی کرد (پ) را بازی کن و اگر (ح) را بازی کرد (ت) را بازی کن».
اگر بخواهیم روشنتر سخن بگویم. چیزی که باعث ایجاد این تعادل میشود، تهدید به مجازات است.
البته فرضی وجود دارد که صحت مطلب بالا بسته به آن است و آن بالا نبودن نرخ ترجیح زمانی بازیکنان است.
منظور من تنها نرخ ترجیح زمانی مالی که در بانکها ارائه میشود نیست. منظور من نرخ ترجیح زمانی فردی و درونی است. برای اینکه تکرار بتواند باعث ایجاد همکاری در بین بازیکنان شود، لازم است که آنها زیاد خواهان نتایج آنی نباشند، بدین معنی که اهمیت زیادی برای زمان حال قائل نباشند. اگر شما همین حالا خواهان صلح هستید احتمالا هیچگاه به صلح نخواهید رسید. ولی اگر زمان داشته باشید- اگر بتوانید صبر کنید- هر چیز تغییر خواهد کرد؛ در این شرایط است که خواهید توانست به صلح دست یابید. این یکی از ویژگیهای متناقضنما و وارونه تئوری بازیها و در واقع علم است. همین یک یا دو هفته پیش بود که فهمیدم گرم شدن زمین میتواند با تغییر جهت جریان آب گرم گلف استریم (جریان آب گرم در اقیانوس اطلس که از طرف مکزیک به سمت اروپا جریان دارد) باعث خنکتر شدن آب و هوای قاره اروپا شود.
یعنی گرم شدن باعث خنک شدن شود. خواستار صلح آنی بودن نیز ممکن است باعث شود که نه حالا و نه در آینده به صلح نرسیم ولی اگر صبر داشته باشیم ممکن است حتی همین حالا به صلح برسیم.
دلیل این موضوع همان چیزی است که در بالا گفته شد: در استراتژیهایی که در حالت تعادل ابر بازیها منجر به همکاری میشوند مجازاتهایی گنجانده شدهاند، به این ترتیب که اگر در هر مرحلهای همکاری در شرف اتفاق افتادن نباشد، در مراحل بعد از آن این مجازاتها اتفاق میافتند. اگر نرخ ترجیح زمانی بسیار بالا باشد، در این صورت بازیکنان بیشتر به زمان حال علاقهمند خواهند بود تا آینده بدین ترتیب بازیکنان به جای صبر کردن و منتظر نتیجه همکارانه ماندن گزینهای را انتخاب خواهند کرد که در زمان حال برای آنها بیشترین نفع را دارد. این مساله باعث تباه شدن راهکار «مجازات در مراحل بعدی» میشود.
به طور خلاصه: در ابر بازی H ، نتیجه همکارانه (پ و ع) در حالت تعادل قابل دستیابی است. این یک حالت خاص قاعدهای کلی به نام «تئوری فولک» است که میگوید هر نتیجه همکارانه بازی G یک نتیجه استراتژیک و تعادلی ابربازیG است (حتی اگر این نتیجه یک نتیجه تعادل G نباشد) و برعکس؛ هر نتیجه استراتژیک و تعادلی بازی G یک نتیجه همکارانه برای G است.
به عبارت دیگر، تکرار به عنوان یک مکانیسم اجباری عمل میکند، یعنی در یک بازی که شکاری در یک مرحله به دست نمیآید، تکرار باعث دستیابی به نتیجه همکارانه میشود. البته عامل ذکر شده در فوق را نیز نباید نادیده گرفت، این استدلال زمانی صحیح خواهد بود که نرخ ترجیح زمانی همه بازیکنان کم باشد.
نکته دیگری که باید به آن اشاره کرد دوباره به جایزه نوبل سال 1994 مربوط میشود: جان نش به این خاطر برنده جایزه نوبل شد که بحث تعادل را توسعه داد و رینهارد سلتن نیز به خاطر دستاوردهایش در زمینه تعادل کامل برنده این جایزه شد. تعادل کامل تقریبا به این معنی است که «تهدید به مجازات» معتبر است به این معنی که اگر شما مجبور به انجام مجازاتی شوید، بعد از انجام مجازات هنوز در حالت تعادل هستید و انگیزهای برای منحرف شدن ندارید.
آنچه در بالا ذکر شد، مسلما در مورد تعادلی که در ابربازی H توضیح دادیم صادق نیست. اگر رونا بازی (2) را بهرغم تهدید کالین بازی کند، در این صورت کالین هیچ گاه ترجیح نخواهد داد که برای همیشه دست به مجازات بزند. این مساله باعث مطرحشدن این سوال میشود که آیا امکان دارد در بازیهای تکرارشونده، (ع و پ) علاوهبر تعادل استراتژیک در تعادل کامل نیز دستیافتنی باشد.
جواب آری است. در سال 1976، لیود شیپلی - که به نظر بهترین تئوریسین نظریهبازیها است - و من قضیهای را که به نام «قضیه کامل فولک» شناخته میشود را اثبات کردیم. همزمان با این کار نتیجه مشابهی نیز مستقلا توسط آریل رابین اشتاین ارائه شد.
هر دو نتیجه تقریبا به طور همزمان منتشر شدند (اومن و شیپلی 1994 - رابین اشتاین 1994). قضیه کامل فولک عبارت است از اینکه در ابربازی G هر نتیجه همکارانه G به عنوان یک نتیجه تعادل کامل ابربازی G قابلدستیابی است. (حتی اگر این نتیجه یک نتیجه تعادلی بازی G نباشد.) عکس قضیه نیز برقرار است. به طور خلاصه، برای هر بازی G داریم:
قضیه کامل فولک: نتایج همکارانه بازی G منطبق با نتایج تعادل کامل ابربازی G هستند.
تکرار دوباره به عنوان یک مکانیسم اجبار عمل میکند. یعنی همکاری را که در یک بازی یک مرحلهای قابلدستیابی نیست، دستیافتنی میکند، حتی وقتی که تعادل استراتژیک جایش را به تعادل کامل که بسیار دقیقتر از آن است میدهد. در این جا نیز دوباره باید به فرض کم بودن نرخهای ترجیح زمانی توجه داشته باشیم.
اثبات قضیه کامل فولک، اثبات جالبی است. به همین دلیل من قصد دارم تا آن را به گونهای ساده در قالب بازی H و نتیجه همکارانه (ع و پ) توضیح دهم. در وهله اول، تعادل بازی را همیشه به سمت نتیجه (ع و پ) هدایت میکند. در صورتی که رونا حریصانه بازی کند، کالین برای تنبیه او (ت) را بازی خواهد کرد. البته او این بازی را برای همیشه انجام نخواهد داد، بلکه تنها تا زمانی که انحراف رونا برای بازی حریصانه بیثمر شود. البته این خود به تنهایی کافی نیست؛ بلکه علاوهبر این انگیزه دیگری نیز باید باشد تا کالین دست به بازی تنبیه کننده بزند. در واقع ایده اصلی اثبات نیز از همین موضوع به دست میآید: اگر کالین رونا را تنبیه نکند، آن گاه رونا با بازی حریصانه کالین را تنبیه خواهد کرد (یعنی رونا کالین را به خاطر اینکه او را تنبیه نکرده تنبیه خواهد کرد.) این پروسه به همین ترتیب ادامه مییابد، یعنی اگر هر کدام از بازیکنان دیگری را تنبیه نکند، به خاطر این کار توسط بازیکن دیگر تنبیه خواهد شد.
قسمت اعظمی از جامعه با این چنین استدلالی از فروپاشی مصون میماند. اگر شما توسط یک افسر پلیس برای سرعت غیرمجاز متوقف شوید، از رشوه دادن ابا میکنید زیرا از این میترسید که وی شما را به این کار متهم کند. اما او چرا نباید پیشنهاد رشوه را قبول نکند؟ زیرا از این میترسد که شما از او به این اتهام شکایت کنید.
به این ترتیب نظریه بازیهای همکارانه نه تنها تمام نتایج همکارانه یک بازی را معین میسازد، بلکه اطلاعات لازم برای انتخاب میان آنها را نیز در اختیار ما قرار میدهد. راههای بسیاری برای این کار وجود دارد، اما شاید شناختهترین آنها نظریه «هسته» (Core) باشد که توسط لوید شیپلی در اوایل دهه 50 ارائه شده است. گوییم نتیجه X از یک بازی در هسته آن قرار دارد، اگر هیچ مجموعه S از بازیکنها وجود نداشته باشد که بتوانند بهتر از آن عمل کنند. شایان ذکر است که مفهوم هسته نقشی اساسی در کاربردهای نظریه بازیها در اقتصاد بر عهده دارد.
ارتباط قوی دیگری که بین بازیهای تکرارشونده و تعادل وجود دارد این است که وقتی در یک بازی بازیکنان در تعادل (استراتژیک) هستند، برای هیچ کدام از آنها به صرفه نیست که استراتژی بازی خود را تغییر دهند. یک تعادل قوی نیز به شکل مشابهی تعریف میشود، با این تفاوت که در این نوع تعادل نه تنها برای هیچ یک از بازیکنان بلکه برای هیچ مجموعهای از آنها نیز بهصرفه نیست که بازی خود را تغییر دهند. بنابراین قضیه زیر را داریم:
قضیه (اومن - 1959): نتایجی که در هسته بازی G قرار دارند مطابق با نتایج تعادل قوی ابربازی G هستند.
جان نش در مقاله سال 1950 خود علاوهبر تشریح تعادل استراتژیک (که به خاطر آن برنده جایزه نوبل شد) به بررسی موضوع دیگری نیز پرداخت که با نام برنامهاش (Nash program) شناخته میشود. وی در این موضوع به بررسی قضایای نظریهبازیهای همکارانه در قالب برخی بازیهای غیرهمکارانه خاص پرداخت و به این ترتیب پلی بین نظریه بازیهای همکارانه و غیرهمکارانه ایجاد کرد. سه قضیهای که در بالا معرفی شدند نشان میدهند که تکرار نیز عینا چنین پلی را ایجاد میکند (در واقع تکرار، تحقق برنامهاش است.)
*اومن برنده جایزه نوبل سال 2005 اقتصاد است. این سخنرانی، سخنرانی وی به مناسبت دریافت این جایزه است
رابرت جی اومن *
مترجم: حسن افروزی
منبع: روزنامه دنیای اقتصاد
کلمات کلیدی :
» نظر