囚徒困境理論囚徒困境理論認為囚徒最佳的選擇是什么

2026-04-27 知識經驗

囚徒困境理論囚徒困境理論認為囚徒最佳的選擇是什么

文章插圖
大家好,小跳來為大家解答以上的問題。囚徒困境理論認為囚徒最佳的選擇是什么，囚徒困境理論這個很多人還不知道,現在讓我們一起來看看吧！
1、囚徒困境是博弈論的非零和博弈中具代表性的例子，反映個人最佳選擇并非團體最佳選擇。
2、雖然困境本身只屬模型性質，但現實中的價格競爭、環境保護等方面，也會頻繁出現類似情況。
3、【經典的囚徒困境】1950年，由就職于蘭德公司的梅里爾·弗勒德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關困境的理論，后來由顧問艾伯特·塔克（Albert Tucker）以囚徒方式闡述，并命名為“囚徒困境” 。
4、經典的囚徒困境如下：警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人有罪。
5、于是警方分開囚禁嫌疑犯，分別和二人見面，并向雙方提供以下相同的選擇：若一人認罪并作證檢控對方（相關術語稱“背叛”對方），而對方保持沉默，此人將即時獲釋，沉默者將判監10年。
【囚徒困境理論囚徒困境理論認為囚徒最佳的選擇是什么】6、若二人都保持沉默（相關術語稱互相“合作”），則二人同樣判監半年。
7、若二人都互相檢舉（互相“背叛”），則二人同樣判監2年。
8、【解說】如同博弈論的其他例證，囚徒困境假定每個參與者（即“囚徒”）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。
9、參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為“嚴格劣勢”，理性的參與者絕不會選擇。
10、另外，沒有任何其他力量干預個人決策，參與者可完全按照自己意愿選擇策略。
11、囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由于隔絕監禁，并不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。
12、就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。
13、試設想困境中兩名理性囚徒會如何作出選擇：若對方沉默、我背叛會讓我獲釋，所以會選擇背叛。
14、若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。
15、二人面對的情況一樣，所以二人的理性思考都會得出相同的結論——選擇背叛。
16、背叛是兩種策略之中的支配性策略。
17、因此，這場博弈中唯一可能達到的納什均衡，就是雙方參與者都背叛對方，結果二人同樣服刑2年。
18、這場博弈的納什均衡，顯然不是顧及團體利益的帕累托最優解決方案。
19、以全體利益而言，如果兩個參與者都合作保持沉默，兩人都只會被判刑半年，總體利益更高，結果也比兩人背叛對方、判刑2年的情況較佳。
20、但根據以上假設，二人均為理性的個人，且只追求自己個人利益。
21、均衡狀況會是兩個囚徒都選擇背叛，結果二人判監均比合作為高，總體利益較合作為低。
22、這就是“困境”所在。
23、例子華麗地證明了：非零和博弈中，帕累托最優和納什均衡是互相沖突的。
本文到此分享完畢，希望對大家有所幫助。

上一篇：有什么小竅門去除墻上水印

下一篇：蘋果手機鍵盤怎么切換成手寫