三國歷史真正的轉折點:白衣渡江 襄樊之戰與夷陵之戰的博弈分析

文章推薦指數: 80 %
投票人數:10人

公元219年發生的襄樊之戰,以蜀漢劉備部將關羽北伐曹魏,水淹七軍、圍困襄、樊兩城開端,以東吳孫權部將呂蒙「白衣渡江」偷襲南郡,關羽敗走麥城,身首異處結束。

這是一次典型的囚徒困境。

赤壁之戰前,劉備與孫權結成聯盟,約定共同對抗北方最強大的曹操,以獲得合作收益。

關羽北伐是針對曹操的軍事行為,可以理解為劉備一方努力履行聯盟的合作契約,執行合作策略。

孫權一方趁劉備一方正努力執行合作策略,趁其毫無防範之機,偷襲了關羽的後方根據地,導致關羽兵敗身死。

孫權一方的偷襲不是針對曹操的軍事行為,而是針對劉備的軍事行為,是典型的執行了背叛策略。

孫權合作 孫權背叛
劉備合作 2,2 -1,3
劉備背叛 3,-1 0,0

(「,」左側數值為劉備的收益,右側數值為孫權的收益)

在單次的囚徒困境博弈模型中,若博弈雙方同時選擇合作,則各獲得2收益;同時選擇背叛,則各獲得0收益;一方選擇合作另一方選擇背叛,合作方收益-1,背叛方收益3。

同時選擇合作能讓集體獲得最高收益,2+2=4。

但是當一方選擇合作給定時,另一方選擇合作收益2,選擇背叛收益3,2<3,對集體中的個體來說,當對方會選擇合作時,其最佳策略是選擇背叛。

同時選擇合作策略,對集體來說雖然是收益最高的策略,但對個體來說並不是——損害同伴的利益才能最大化自身利益。

當一方努力履行合作契約時,另一方有很強的激勵不履行合作契約,而是採取背叛策略。

作為孫權一方來說,當劉備一方努力履行合作契約時,其執行背叛的策略,的的確確能夠獲得最高收益——這從呂蒙能夠輕而易舉拿下南郡就可以證明——成本低、收益高。

如果只考慮襄樊之戰這一單次博弈,而不考慮未來,孫權偷襲南郡能得到最大收益,是最佳策略。

在單次的囚徒困境博弈模型中,實際上,無論對方選什麼,選擇背叛永遠是最佳策略。

上面我們已經分析了一方選擇合作策略給定時,另一方的最佳策略是背叛。

若一方選擇背叛給定,則另一方選擇合作收益-1,選擇背叛收益0,-1<0,最佳策略依然是選擇背叛。

作為劉備一方來說,似乎根本不該考慮履行合作契約,任何合作的舉動都是劣選策略,只會降低自己的收益。

關羽的北伐是愚蠢的,把劉備一方推到了一個註定大敗虧輸的境地——孫權若選擇背叛,劉備選擇合作的收益是最低的-1。

我見過很多誇讚孫權的偷襲多麼明智,而諷刺關羽的北伐是多麼愚蠢的言論。

這些言論,包括我之前的分析,全部!都錯!錯!錯!

真正出了昏招的孫權!

為什麼?

因為以上我們分析的是單次囚徒困境博弈!所謂單次博弈,就是說博弈參與者在這次博弈之後就老死不相往來了,你遇不到我,我也找不到你,不會有下一次博弈了。

但現實情況是,劉備就在西川,孫權就在江東,你能找到我,我想見你也很容易,今天這次博弈結束之後,明天還要接著博弈,並且不知道今後還有多少場博弈。

這種情況叫做無限次數重複博弈。

單次博弈與無限次數重複博弈有什麼區別?後者是要考慮未來的,前者卻不需要考慮。

未來會發生什麼?

未來會發生收益!

這時一個新策略出現了,叫做「報復」。

所謂報復,就是在上一局博弈中,甲方遭遇乙方背叛,那麼在下一輪博弈中,甲方也要對乙方採用背叛策略。

報復雖然針對的是過去的行為,目的卻是為了獲取更多的未來收益。

重複博弈中,「報復」如何影響博弈結果?

孫權合作 孫權背叛
劉備合作 2,2 -1,3
劉備背叛 3,-1 0,0

(「,」左側數值為劉備的收益,右側數值為孫權的收益)

在一個共有N輪博弈的重複博弈中,給定甲遭遇背叛就會在下一輪實施報復,不遭遇背叛就會一直合作。

第n輪甲合作,乙背叛了,乙收益3;在第n+1輪,甲報復乙,選擇背叛,乙無論如何選擇,收益最高為0;兩輪收益相加總和為3+0=3。

第n輪甲合作,乙也選擇合作,乙收益2;由於甲沒有遭到背叛,所以第n+1輪甲會選合作,乙也選合作,收益2,;兩輪收益相加總和為2+2=4。

乙背叛甲的兩輪收益總和為3,乙一直與甲合作兩輪收益總和為4,3<4,因此比起背叛,乙更願意跟甲合作。

現在給定甲永遠不會實施報復,即,無論在第n輪乙採用什麼策略,甲在第n+1輪依舊會選合作。

第n輪,甲合作,乙合作,乙收益2;第二輪甲合作,乙合作,乙收益2;兩輪相加,乙總共收益4。

第n輪甲合作,乙背叛,乙收益3;第n+1輪甲合作,乙背叛,乙收益3;乙兩輪收益相加總和為6。

4<6,跟兩輪合作相比,兩輪背叛收益更高。

實際上,我們還可以組成其他的策略組合,但是,只要甲永遠選擇合作,乙永遠選擇背叛所得的收益一定是最高的。

因此,在甲不會報復的情況下,乙最佳選擇永遠是背叛,甲就永遠無法得到合作收益。

報復提高了背叛者的背叛成本,使背叛的收益小於合作,從而激勵了人們履行合作契約。

報復讓自己更安全。

當乙認為甲會對背叛行為進行報復的可能性越高的時候,就越不願意背叛甲,反之,乙認為甲會對背叛行為進行報復的可能性越低,就越願意背叛甲。

乙如何判斷甲對背叛行為的進行報復的可能性?看他曾經報復的頻率!曾經實施報復的頻率越高,就說明未來會實施報復的機率也就越高;曾經實施報復的頻率越低,就說明未來會實施報復的機率也就越低。

甲每一次的報復或不報復的決定,都關係著未來博弈中遭遇背叛的可能性。

對這一次背叛行為實施了報復,在未來遭遇背叛的可能性就越低,未來合作收益也就越高;不對這一次背叛行為實施報復,在未來遭遇背叛的可能性就越高,未來合作收益也就越低。

為了降低未來博弈中博弈對手的背叛激勵,獲得儘可能多的未來收益,一定要儘可能對每一次背叛行為進行報復!

當孫權派呂蒙趁虛而入,占領南郡,導致關羽身死時,他就應該料想到,劉備絕不會善罷甘休,因為對背叛行為進行報復關係到未來。

但孫權似乎並沒有想到,最起碼沒有想到劉備實施報復的嚴重性。

公元221年,劉備親自率領5萬大軍討伐孫權,發動了夷陵之戰。

這一場戰役,孫權部將陸遜「火燒連營」,打得劉備幾乎全軍覆沒——孫權贏了。

有什麼嚴重後果?

孫權與劉備能夠結成聯盟,合作對抗曹操,是因為無論是孫權還是劉備,其能力都不足以完成獨自對抗曹操的目標,合作能讓雙方獲得比單幹更高的收益。

只要孫權和劉備無法單獨對抗曹操這一現實不變,雙方合作獲得的收益就會大於單幹獲得的收益。

這個博弈的期限是「無限」的——不知道在未來的什麼時候會結束。

這也就意味著,這個未來可能很長(從實際情況看,這個未來確實很長),未來越長,雙方就可以從未來的合作中獲得越豐厚的回報。

合作雙方的能力越強,大機率來說,合作收益就會越高。

如果一方的能力受到削弱,不僅僅影響到這一方的收益,還會讓另一方的合作收益也減少。

呂蒙「白衣渡江」之前,劉備定軍山之戰斬殺夏侯淵,從曹操手中奪取漢中;襄樊之戰,關羽水淹七軍,斬殺龐德,生擒于禁,圍困襄陽、樊城,逼得曹操考慮遷都以避鋒芒。

這些軍事行動給曹操帶來了嚴重的、真實的威脅,曹操必然需要增加力量對來應對劉備一方的行動。

對劉備一方增加力量,就意味著沒有更多力量應對孫權一方,即使孫權無力發起對曹操的進攻,自身的防禦壓力總歸會減少,這就提高了孫權一方的收益。

夷陵之戰中劉備損失慘重,導致蜀漢被削弱。

蜀漢的衰弱,使曹操可以減少針對蜀漢的力量,將這些力量投入到針對東吳一方。

蜀漢的削弱,不僅僅降低了蜀漢獲取收益的能力,同時也降低了東吳獲取收益的能力。

每一輪博弈的合作收益都降低了,那麼未來博弈的輪次越多,也就是未來越長,損失的收益也就越多。

看似襄樊之戰和夷陵之戰孫權都是最後的勝利者,但實際上孫權一方為了眼前的收益,放棄了許許多多未來收益。

「白衣渡江」之前,孫劉聯盟給曹魏的帶來了巨大壓力,但是在「白衣渡江」之後,這一聯盟再也沒能對曹魏集團形成實質性的威脅,只是勉強維持不被消滅而已。

那什麼時候應該選擇背叛呢?很明顯,沒有未來的時候!越是沒有未來,就越要背叛,奪取儘量多的眼前收益。

比如說曹魏眼看就要被嚴重削弱了,對抗他不需要與劉備結盟了,這時候在孫權看來,孫劉聯盟的未來大機率就要結束了,沒有那麼多未來收益可以獲得了,眼前收益大於未來收益,就應該準備採取背叛策略。

我們引入貼現率P。

明天得到2收益,不如立刻得到2收益值錢,因為明天會出現很多意外導致你無法得到這2收益,貼現率就是明天依舊會得到2收益的機率,也可以理解成明天的2收益比幾天的2收益貶值的比率。

若第n輪甲方遭遇乙方背叛,在以後的博弈中,甲就再也不會與乙方合作,則乙方的收益為第n輪背叛的收益3,加以後的無窮個0,最終為3。

乙一直與甲合作的收益是第n輪的收益2,加上n+1輪的收益2P,加上n+2輪的收益2P²,加上n+3輪的收益2P³……就是無窮多個2相加。

若乙該背叛甲,說明背叛收益高於一直合作的收益,則3>2+2P+2P²+2P³……,求得P小於1/3時,滿足不等式。

當下一輪博弈依舊會繼續的機率不小於1/3時,乙背叛甲的收益就小於一直與甲合作的收益,乙就不該背叛;只有預期博弈繼續的機率小於1/3時,乙背叛甲的收益才會大於繼續與甲合作,乙應該背叛甲。

背叛或者合作,與貼現率的大小有關!

這就是為什麼說孫權趁機奪取南郡是一個愚蠢的短視行為,因為在當時的情況看來,曹魏集團會在很長一段時間裡保持最強者地位,這就說明孫劉聯盟合作的貼現率是比較大的,而貼現率大時,選擇合作才是收益最高的策略。

夷陵之戰之後,諸葛亮主持了蜀漢與東吳的重新談判,再一次讓雙方回到了合作的策略上,為什麼蜀漢會願意重新與東吳合作呢?理由是——預期的貼現率特別大。

第n輪甲遭遇乙背叛,乙收益3,n+1輪甲報復乙,選擇背叛,乙收益0,n+2輪甲乙重新合作,乙收益2P²,n+3輪收益2P³……乙一直與甲合作,第n輪收益2,n+1輪收益2P,n+2輪收益2P²,n+3輪收益2P³……滿足背叛收益小於合作,則滿足3≤2+2P,求得P≥1/2。

當貼現率足夠大時,在一輪背叛與一輪報復後,乙與甲合作的未來收益依舊足夠大,乙沒有繼續背叛的激勵,因此甲在報復後,與乙繼續合作可以獲得更多收益。

因為蜀漢和東吳都承認貼現率確實是比較大的,也就是說,雙方合作才能對抗曹魏的現實會延續很長時間,所以雙方才願意重新達成合作關係。

劉備發動夷陵之戰是對的,因為報復是必須的;諸葛亮在夷陵之戰後重新與東吳結成聯盟也是對的,因為需要與東吳合作才能對抗曹魏;但是孫權在關羽北伐曹操的時候偷襲南郡卻是錯的,在貼現率明顯很高的情況下採用了背叛策略,是為了眼前的蠅頭小利放棄了巨大的未來收益,是非常不明智的。

這是可以用數理證明的。

孫劉聯盟的頹勢看起來是從夷陵之戰開始的,實際上在呂蒙「白衣渡江」之時,歷史的天平已經開始傾斜了。

劉備死後,諸葛亮主持了蜀漢與東吳的重新談判,又達成了合作關係,但是,勢已成,不可逆,結局已經寫就,回天乏力了。

作者:第五大洋,歷史百家爭鳴特約作者


請為這篇文章評分?


相關文章 

攻心為上,三國兵不血刃的完美戰役

東漢末年,群雄並起。連年征伐,民不聊生。而三國歷史出現了兩次攻心為上,不戰而屈人之兵的戰例。1.諸葛亮平定南中225年蜀漢丞相諸葛亮為了平定叛亂而對南中蠻族發動的一場戰爭。這場戰爭被稱為南中平定...

孫權為何要把荊州借給劉備

在眾多三國故事裡面,劉備向孫權借荊州的事實是多數網友都熟知的,但孫權當初為何要把把荊州借給劉備呢,這就是本文今天要講述的——

襄樊之戰及三國格局演變——以博弈論視角分析

襄樊之戰是東漢末年的一次關鍵戰役,確定了三國鼎立的格局,魏蜀吳基於自身利益的最大化,不斷進行博弈,外交政策屢次更迭。本文以博弈論的視角探討襄樊之戰及戰後各國政治策略的合理性。一、赤壁之戰後魏蜀吳...