嘿嘿……
最著(zhù)名的當然就是囚徒困境了……
兩個(gè)持槍搶劫的歹徒被警察抓住,分開(kāi)審問(wèn),這時(shí),每一個(gè)歹徒就會(huì )面臨這種情況:
1、如果兩人都抵賴(lài),就是攻守同盟,就會(huì )因搶劫證據不足,各判刑1年;
2、如果兩人都招供,各判10年;
3、如果兩人中一個(gè)坦白而另一個(gè)抵賴(lài),坦白無(wú)罪釋放,抵賴(lài)的判15年。
于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴(lài)。然而,不管同伙選擇什麼,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴(lài)、自己坦白的話(huà)就無(wú)罪釋放,不坦白的話(huà)判1年,坦白比不坦白好;如果同伙坦白、自己坦白的話(huà)判10年,不坦白的話(huà)判15年,坦白還是比不坦白好。結果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴(lài),各判一年,顯然這個(gè)結果好。
最終會(huì )達到帕累托最優(yōu)……
嘿嘿…… 最著(zhù)名的當然就是囚徒困境了…… 兩個(gè)持槍搶劫的歹徒被警察抓住,分開(kāi)審問(wèn),這時(shí),每一個(gè)歹徒就會(huì )面臨這種情況:1、如果兩人都抵賴(lài),就是攻守同盟,就會(huì )因搶劫證據不足,各判刑1年;2、如果兩人都招供,各判10年;3、如果兩人中一個(gè)坦白而另一個(gè)抵賴(lài),坦白無(wú)罪釋放,抵賴(lài)的判15年。
于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴(lài)。然而,不管同伙選擇什麼,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴(lài)、自己坦白的話(huà)就無(wú)罪釋放,不坦白的話(huà)判1年,坦白比不坦白好;如果同伙坦白、自己坦白的話(huà)判10年,不坦白的話(huà)判15年,坦白還是比不坦白好。
結果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴(lài),各判一年,顯然這個(gè)結果好。
最終會(huì )達到帕累托最優(yōu)……。
在經(jīng)濟學(xué)中,“智豬博弈”(Pigs'payoffs)是一個(gè)著(zhù)名博弈論例子。
這個(gè)例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會(huì )落下少量的食物。
如果有一只豬去踩踏板,另一只豬就有機會(huì )搶先吃到另一邊落下的食物。當小豬踩動(dòng)踏板時(shí),大豬會(huì )在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動(dòng)了踏板,則還有機會(huì )在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會(huì )采取什么策略?答案是:小豬將選擇“搭便車(chē)”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。 原因何在?因為,小豬踩踏板將一無(wú)所獲,不踩踏板反而能吃上食物。
對小豬而言,無(wú)論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀(guān)大豬,已明知小豬是不會(huì )去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
“小豬躺著(zhù)大豬跑”的現象是由于故事中的游戲規則所導致的。規則的核心指標是:每次落下的事物數量和踏板與投食口之間的距離。
如果改變一下核心指標,豬圈里還會(huì )出現同樣的“小豬躺著(zhù)大豬跑”的景象嗎?試試看。 改變方案一:減量方案。
投食僅原來(lái)的一半分量。結果是小豬大豬都不去踩踏板了。
小豬去踩,大豬將會(huì )把食物吃完;大豬去踩,小豬將也會(huì )把食物吃完。誰(shuí)去踩踏板,就意味著(zhù)為對方貢獻食物,所以誰(shuí)也不會(huì )有踩踏板的動(dòng)力了。
如果目的是想讓豬們去多踩踏板,這個(gè)游戲規則的設計顯然是失敗的。 改變方案二:增量方案。
投食為原來(lái)的一倍分量。結果是小豬、大豬都會(huì )去踩踏板。
誰(shuí)想吃,誰(shuí)就會(huì )去踩踏板。反正對方不會(huì )一次把食物吃完。
小豬和大豬相當于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會(huì ),所以競爭意識卻不會(huì )很強。 對于游戲規則的設計者來(lái)說(shuō),這個(gè)規則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們去多踩踏板的效果并不好。
改變方案三:減量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。
結果呢,小豬和大豬都在拼命地搶著(zhù)踩踏板。等待者不得食,而多勞者多得。
每次的收獲剛好消費完。 對于游戲設計者,這是一個(gè)最好的方案。
成本不高,但收獲最大。 原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。
但是對于社會(huì )而言,因為小豬未能參與競爭,小豬搭便車(chē)時(shí)的社會(huì )資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規則的設計者是不愿看見(jiàn)有人搭便車(chē)的,政府如此,公司的老板也是如此。
而能否完全杜絕“搭便車(chē)”現象,就要看游戲規則的核心指標設置是否合適了。 2話(huà)說(shuō)有一天,一位富翁在家中被殺,財物被盜。
警方在此案的偵破過(guò)程中,抓到兩個(gè)犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過(guò)人,辯稱(chēng)是先發(fā)現富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。
于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個(gè)人單獨談話(huà)。
檢察官說(shuō),“由于你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。但是,我可以和你做個(gè)交易。
如果你單獨坦白殺人的罪行,我只判你三個(gè)月的監禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個(gè)月的監禁。
但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。”斯卡爾菲絲和那庫爾斯該怎么辦呢?他們面臨著(zhù)兩難的選擇——坦白或抵賴(lài)。
顯然最好的策略是雙方都抵賴(lài),結果是大家都只被判一年。但是由于兩人處于隔離的情況下無(wú)法串供。
所以,按照亞當·斯密的理論,每一個(gè)人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監禁———3個(gè)月,但前提是同伙抵賴(lài),顯然要比自己抵賴(lài)要坐10年牢好。
這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。
如果對方坦白了而自己抵賴(lài)了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判5年,總比被判10年好吧。
所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴(lài))和結局(被判1年刑)就不會(huì )出現。這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱(chēng)為“納什均衡”,也叫非合作均衡。
因為,每一方在選擇策略時(shí)都沒(méi)有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會(huì )福利或任何其他對手的利益。也就是說(shuō),這種策略組合由所有局中人(也稱(chēng)當事人、參與者)的最佳策略組合構成。
沒(méi)有人會(huì )主動(dòng)改變自己的策略以便使自己獲得更大利益。
故事發(fā)生在一個(gè)村莊,村里有100對夫妻, 他們都是地道的邏輯學(xué)家(智能的);村里有 一些奇特的風(fēng)俗:每天晚上,村里的男人們都將點(diǎn)起篝火,繞圈圍坐舉行會(huì )議,議題是談?wù)?自己的妻子。
在會(huì )議開(kāi)始時(shí),如果一個(gè)男人有 理由相信他的妻子對他總是守貞的,那么他就 在會(huì )議上當眾贊揚她的美德。另一方面,如果 在會(huì )議之前的任何時(shí)間,只要他發(fā)現他妻子不 貞的證據,那他就會(huì )在會(huì )議上悲鳴怯哭,并企 求神靈嚴厲地懲罰她。
則,如果一個(gè)妻子曾 有不貞,那她和她的情人會(huì )立即告知村里除她 丈夫之外所有的已婚男人(奇異的傳統風(fēng)俗)。所有這些傳統和風(fēng)俗都是村民的共同知識。
事實(shí)上,每個(gè)妻子都已對丈夫不忠。于是 每個(gè)丈夫都知道除自己妻子之外其他人的妻子 都是不貞的女子,因而每個(gè)晚上的會(huì )議上每個(gè) 男人都贊美自己的妻子。
這種狀況持續了很多年,直到有一天來(lái)了 一位傳教士。傳教士參加了篝火會(huì )議,并聽(tīng)到 每個(gè)男人都在贊美自己的妻子,他站起來(lái)走到圍坐圓圈的中心,大聲地提醒說(shuō):“這個(gè)村子里 有一個(gè)妻子已經(jīng)不貞了。”
在此后的99個(gè)晚上, 丈夫們繼續贊美各自的妻子,但在第100個(gè)晚 上,他們全都悲鳴怯哭,并企求神靈嚴懲自己 的妻子。
這個(gè)例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會(huì )落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會(huì )搶先吃到另一邊落下的食物。當小豬踩動(dòng)踏板時(shí),大豬會(huì )在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動(dòng)了踏板,則還有機會(huì )在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會(huì )采取什么策略?答案是:小豬將選擇“搭便車(chē)”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。
原因何在?因為,小豬踩踏板將一無(wú)所獲,不踩踏板反而能吃上食物。對小豬而言,無(wú)論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀(guān)大豬,已明知小豬是不會(huì )去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
“小豬躺著(zhù)大豬跑”的現象是由于故事中的游戲規則所導致的。規則的核心指標是:每次落下的事物數量和踏板與投食口之間的距離。
如果改變一下核心指標,豬圈里還會(huì )出現同樣的“小豬躺著(zhù)大豬跑”的景象嗎?試試看。
改變方案一:減量方案。投食僅原來(lái)的一半分量。結果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì )把食物吃完;大豬去踩,小豬將也會(huì )把食物吃完。誰(shuí)去踩踏板,就意味著(zhù)為對方貢獻食物,所以誰(shuí)也不會(huì )有踩踏板的動(dòng)力了。
如果目的是想讓豬們去多踩踏板,這個(gè)游戲規則的設計顯然是失敗的。
改變方案二:增量方案。投食為原來(lái)的一倍分量。結果是小豬、大豬都會(huì )去踩踏板。誰(shuí)想吃,誰(shuí)就會(huì )去踩踏板。反正對方不會(huì )一次把食物吃完。小豬和大豬相當于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會(huì ),所以競爭意識卻不會(huì )很強。
對于游戲規則的設計者來(lái)說(shuō),這個(gè)規則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們去多踩踏板的效果并不好。
改變方案三:減量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶著(zhù)踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。
對于游戲設計者,這是一個(gè)最好的方案。成本不高,但收獲最大。
原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會(huì )而言,因為小豬未能參與競爭,小豬搭便車(chē)時(shí)的社會(huì )資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規則的設計者是不愿看見(jiàn)有人搭便車(chē)的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車(chē)”現象,就要看游戲規則的核心指標設置是否合適了。
比如,公司的激勵制度設計,獎勵力度太大,又是持股,又是期權,公司職員個(gè)個(gè)都成了百萬(wàn)富翁,成本高不說(shuō),員工的積極性并不一定很高。這相當于“智豬博弈”
增量方案所描述的情形。但是如果獎勵力度不大,而且見(jiàn)者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì )有動(dòng)力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵機制設計就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個(gè)人(如業(yè)務(wù)按比例提成),既節約了成本(對公司而言),又消除了“搭便車(chē)”現象,能實(shí)現有效的激勵。
許多人并未讀過(guò)“智豬博弈”的故事,但是卻在自覺(jué)地使用小豬的策略。股市上等待莊家抬轎的散戶(hù);等待產(chǎn)業(yè)市場(chǎng)中出現具有贏(yíng)利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng )造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟管理的游戲規則的人,必須深諳“智豬博弈”指標改變的個(gè)中道理。
經(jīng)典例子:囚徒困境 囚徒困境的故事講的是,兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。
警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個(gè)人:如果兩人都抵賴(lài),各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個(gè)坦白而另一個(gè)抵賴(lài),坦白的放出去,抵賴(lài)的判十年。
于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴(lài)。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴(lài)、自己坦白的話(huà)放出去,不坦白的話(huà)判一年,坦白比不坦白好;如果同伙坦白、自己坦白的話(huà)判八年,不坦白的話(huà)判十年,坦白還是比不坦白好。
結果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴(lài),各判一年,顯然這個(gè)結果好。
但這個(gè)辦不到,因為它不能滿(mǎn)足人類(lèi)的理性要求。囚徒困境所反映出的深刻問(wèn)題是,人類(lèi)的個(gè)人理性有時(shí)能導致集體的非理性——聰明的人類(lèi)會(huì )因自己的聰明而作繭自縛。
推薦看一下,耶魯大學(xué)博弈論視頻,,沒(méi)有的話(huà)可以發(fā)給你里面有很多經(jīng)典例子望采納,謝謝。
學(xué)習?shū)B(niǎo)網(wǎng)站是免費的綜合學(xué)習網(wǎng)站,提供各行各業(yè)學(xué)習資料、學(xué)習資訊供大家學(xué)習參考,如學(xué)習資料/生活百科/各行業(yè)論文/中小學(xué)作文/實(shí)用范文實(shí)用文檔等等!
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:0.100秒