01
博弈論的由來
何爲博弈論?
首先,我們來追根溯源,對博弈論做一個簡單的介紹,什麽是博弈論?Stanford的經濟學家David Kreps對博弈論做過一個非常精准的概括,他說,博弈論是有關情境的知識。博弈論就其本質而言,是研究人的決策,我們無時無刻不面對決策。博弈論的基本前提在于,決策的正確與否,什麽是最優選,並不僅僅依賴于自身的行動本身,更在于所處的情境。簡而言之,我需要做什麽,應該做什麽,取決于你在和誰打交道,他們在做什麽,會做什麽。
2005年的諾貝爾經濟學獎得主Robert Aumann曾經給博弈論下了一個簡單但是非常精當的定義,他說,博弈論是互動的決策科學。所謂互動,就是指這個情境的參與者,他們的行動和決策會互相影響,所以我要做出最優的選擇,必須要考慮對手的行動和反應,主體之間相互依存,相互影響。
所謂博弈二字,中文的原意指的就是棋局,下棋,就是一種在互動中進行決策的情境。我們經常講人生如棋,這樣的場景,其實無處不在,夫妻,親子,企業競爭,大國外交,其實莫不如此。博弈論因此有非常豐富的應用場景。
己欲立而立人,己欲達而達人
博弈論帶給我們的最大價值,是帶來一種處事和思考的方式。你如何制定你的決策,不是依靠教條,重要的是去認識自己的對手,理解對方的行動邏輯,要希望達到自己的目的,希望實現自身利益的最大化,就要學會從別人的角度來考慮問題,也就是我們經常所說的,換位思考。一廂情願可能處處碰壁,相反,在很多的時候,己欲立而立人,己欲達而達人。比如說,你要員工爲你死心塌地幹活,首先就要想清楚人家想要什麽,這樣才能有的放矢地提供激勵。就像胡雪岩說過的一句話,前半夜想自己,後半夜想別人。
這樣的一種思維方式,就是所謂的策略性思維。策略性思維並不是博弈論的發明,博弈論的貢獻,就是以這樣一種古老的智慧,對複雜的互動決策問題進行科學系統的分析和研究。
博弈論之父——馮諾伊曼
現代博弈論的鼻祖,被公認爲馮諾伊曼。可能很多從事不同領域工作的朋友都聽說過這個名字。馮諾依曼是匈牙利裔的猶太人,被廣泛認爲是有史以來最聰明的人。在1944年,馮諾依曼和摩根斯坦合作寫了一本書,叫《博弈論與經濟行爲》,這本書被認爲代表了現代博弈理論的興起,所以馮諾依曼也是博弈論之父。
馮諾依曼對博弈論産生興趣,他的靈感來自于他的一個業余愛好,就是打撲克。他非常喜歡打牌,而且打牌的時候非常喜歡算牌,但是很不幸,表現非常非常糟糕。後來有一天,他痛定思痛,概率不是打牌的全部,如何出牌不僅僅取決于算准牌面,更要讀懂人心,實現對對手的洞察和操控,這就是我們所說的策略,于是開始從事對策略的研究。對于馮諾依曼而言,這項研究幾乎就是一個茶余飯後的閑情逸致,但是博弈論在幾十年以後改變了當代經濟學的研究範式,而且在二戰期間,他以博弈論爲基礎建立了戰爭分析模型,爲盟軍出謀劃策,推演戰局發展。二戰之後,他又建立了美蘇互動的模型,預測冷戰的發展。但是,我需要告訴大家的是,博弈論起源于撲克,基于博弈論的模型讓他能指點江山,預知天下興亡,但是在牌桌上,他還是沒能占到什麽便宜。幾十年以來,有很多數學家和計算機科學家希望借助基于博弈論模型的計算找到打牌的最佳策略,但是努力收效並不顯著,並不能從職業賭徒身上占到便宜。
講這個故事,我想要告訴大家兩件事:
01
第一,我們要充分認識世界的複雜性;
02
第二,博弈論從技術角度,是數學的應用,但是博弈論來自于人的策略性思維。策略的智慧源遠流長,根植于我們的DNA。比如這些職業賭客,他們沒有正經地學習過博弈論,但是他們其實已經在實踐複雜的策略判斷,而博弈論的作用,就是對策略思維的智慧進行系統化,刪繁就簡,從複雜的現實中抽象出簡單的模型,幫助我們把握決策問題的關鍵。
John Nash與納什均衡
早期的博弈論是非常抽象的,對于絕大多數人是完全摸不到頭腦的,很難廣泛應用于具體的場景。我們要說的下一個人,就是John Nash,也就是美麗心靈《Beautiful Mind》這部電影的主人公原型。一個遊戲,或者說一個互動的情境,最終會演變成一個什麽樣的結果,如果對此做出合理可靠的預測,用經濟學的術語而言,什麽樣的結果可以構成一種均衡?John Nash給出了答案,他提出了一個概念,叫做納什均衡,成爲博弈論分析的基石,博弈論也因此被廣泛應用,徹底改變了經濟學和國際關系研究的方法論。
納什均衡這個概念,幫助我們對一個博弈的結果做出可靠的預測,它告訴我們什麽樣的發展才具有穩定性,是一個均衡。
所謂納什均衡,就是說,當局中的每一個行動主體,給定其他人策略,都已經不能通過單方面的策略改變而實現額外的收益。也就是說,每個人的策略選擇都已經實現了自身利益的最大化,因此每個人都沒有改變現狀的積極性,這樣的局面就在互動中實現了平衡。
02
靜態博弈經典情景之一
囚徒困境
我們先來看一看著名的囚徒困境。有兩個犯罪嫌疑人,A和B,涉嫌共同作案。警方懷疑他們作案,但是並沒有確切的證據,所以最終的量刑要取決于供詞。如果兩個人都招供,會各判六年;如果兩人都不招,沒有足夠證據,只能以請罪提控,各判一年了事。警方希望得到有利的供詞,所以正確的做法,可能很多朋友知道,就是把兩人分開關押,單獨審訊。
警方可以對每一個人說,你有一個得到寬大處理的機會,如果你招供,你的同伴抵賴,恭喜你,你無罪釋放,你的同伴從嚴處理,判十年;但是如果你講義氣,一旦你的同夥招供,那對不起,你就要把牢底坐穿了。
我們以這樣一個矩陣,來表述這個情境。嫌犯甲,有上、下兩個戰略選項,招供或者抵賴。嫌犯乙,有左右兩個選項,招供和抵賴,這個博弈,會有四個可能的策略組合或者結果,兩人都招供,兩人都抵賴,甲招供,乙抵賴,或者反過來,甲抵賴,乙招供。每格代表一個可能的結果,左邊的數字,代表甲在這個策略組合之下獲得的回報,右邊數字代表嫌犯乙。比如說我們看這裏,甲選擇招供,乙選擇抵賴,所以乙坐牢10年,甲可以無罪釋放。
這樣一個情境,最終的結果會是什麽樣的呢?我們先來看一看甲的權衡。他必須考慮乙可能的行動。甲會想,如果乙招供,那麽自己沒有理由死扛,最優選擇一定也是招供;如果乙抵賴呢?甲是否應該與之統一戰線?如果這樣做,其結果自己會被判一年,如果選擇招供,自己就可以全身而退,對于自己這顯然有利,雖然這樣坑了隊友,是不是?
總結下來,在這個情境之中,對于甲而言,無論乙做什麽,最優的選擇,都應該是招供!甲會這樣想問題,乙呢?乙所面對的權衡是一樣的,甲會這麽想,乙也會這樣想,同時也會想到對方一定會招供。在這個情境裏,招供是唯一的選擇,這就做所謂的占優策略,就是不管對方怎麽做,招供可以帶來更高的回報。那麽(招供,招供)這樣的策略組合,我們看,就完全符合了納什均衡的定義:給定其它參與人的策略,任何一個參與人不能通過單方面改變自己的行動獲益,給定乙招供,招供是甲的最優策略;給定甲招供,招供也是乙的最優選擇。我們就得到了這個博弈的唯一納什均衡。
那麽我請各位來思考一個問題。如果我們考慮兩個人的總體利益,哪一個結果帶來最高的回報?很顯然,要最大化集體利益,應該是兩人合作,堅決抵賴,這樣的話警方也沒有太好的辦法。但是這樣的結果不是一個均衡。囚徒困境,帶給我們的這樣的一種啓示,個體與群體之間的矛盾。個體理性帶來背叛的誘惑,個體的最優選擇帶來群體利益的損失,這就是所謂的囚徒困境。
千夫之諾諾
這樣的場景其實在社會、在市場無處不在。我們來舉幾個例子。
大家可能聽到過這樣的故事,1956年蘇共20大,赫魯曉夫向大會代表作報告,系統批判斯大林,要求肅清個人崇拜的流毒。很多人都在心中質疑,你現在秋後算賬,斯大林掌權的時候,你在幹什麽?所以有人從觀衆席遞過來一張紙條,上面寫著:當時你在哪裏?赫魯曉夫拿起紙條,念出了上面的內容,然後望向台下,喊道:這是誰寫的,請你馬上站起來。台下鴉雀無聲,他又念了一遍,然後說:當時我就坐在你現在坐的那個位子上。我們看到,這也是囚徒困境的一種體現,一士之谔谔違背個體理性,千夫之諾諾才是納什均衡。
爲什麽看不見的手會失靈?
亞當斯密在《國富論》中有這樣一段經典描述:“當個人在追求他自己的私利的時候,市場看不見的手會導致最佳經濟後果。我們的晚餐並不是來自于屠夫、啤酒釀造商或者點心師傅的善心,而是源于他們對自身利益的考慮。每個人只關心自己的安全、他自己的得益。他由一只看不見的手引導著,去提升他原先沒有想過的另一目標。他通過追求自身的利益,結果也提升了社會的利益,比他一心要提升社會利益還要有效。”他告訴我們,受看不見的手的指引,個人的自利行爲會帶來互利,自由市場經濟也因此變成了一種價值准則。但是博弈論在一定程度上,顛覆了亞當斯密以來的經濟學道統,它告訴我們,個體理性與集體理性之間存在沖突,社會利益的損失,並不是由于個體決策的失誤,恰恰相反,可能是個體理性的結果與反映。
旅行者困境
比如我們來看一看這樣一個例子,叫做旅行者困境。兩位旅行者從一個生産細瓷花瓶的地方歸來,在當地購買的花瓶都在托運過程中摔壞了。航空公司需要賠償,他們知道花瓶的價格應在八九十元左右,但不知道確切價格。怎麽辦呢?航空公司要求兩位旅客各自在一百元以內寫下花瓶價格,如果所報價格一致,以所報價格賠償;如果不一致,以較低價格賠償,並對報低價者獎勵兩元,以獎勵其誠實,並對虛報者處以兩元罰款。我們來思考一下,這個博弈的最終結果(納什均衡)會是什麽?
如果兩個人都寫100,就會是一個互利的結果,但這是一個均衡嗎?假定我相信另外一個人會寫100,我的最優選擇不是100,我會想,我應該寫99,這樣我將獲賠99,同時獲得2元的獎勵。但這是均衡嗎?不是,因爲我會這麽想,我准備占他的便宜,我能想得到,他也能想到,他也會寫99,給定他寫99,我的最優選擇應該是寫98,這樣最終我的實際獲利就是100。但是這同樣不是均衡,我知道這個道理,對方也可以,所以如果對方寫98,我的最優就是97。這個故事最後如何收場呢?納什均衡,只有一個,那就是都寫0。如果另外一個人寫0,我寫任何的數字都不能得到賠償,還要被罰款2元。航空公司一毛不拔,通過兩個乘客的勾心鬥角而坐收漁利,對于兩個乘客這是最壞的結果,但其原因,並不是乘客的愚蠢,恰恰是他們擁有完全的個體理性。
這個故事略有誇張之處,它只是以一個極端的案例,說明個體利益的最大化往往結果事與願違。我們看看現實中企業的價格戰,互相壓價傾銷,明明知道會兩敗俱傷,還是欲罷不能。給定對手的價格,我稍微降一點價,損失一點單位利潤,但是竊取了市場份額,但是一家企業這麽想,其它企業同樣不會坐以待斃,于是輪番降價,最後誰也奈何不了誰,利潤拱手讓給了消費者。
次貸危機,黑天鵝還是灰犀牛?
曾經有兩本暢銷書,一本叫《黑天鵝》,一本叫《灰犀牛》。黑天鵝指的是概率極低並不認爲會發生但是會對市場帶來深遠影響的事件,比如次貸危機。而灰犀牛,指的是已知的風險,但是大家並不采取行動來防患于未然。這本書的開篇介紹了2001年阿根廷主權債券違約的事件,阿根廷面對經濟災難,債務難以爲繼,所以有識之士提出債務重組建議,債權人主動減記30%,實現軟著陸,債券機構私下也都如此認爲,但是不付諸行動,導致阿根廷違約,債權人損失70%。作者米歇爾沃克認爲這是一種錯誤。
但是我們學過博弈論就會知道,這才是納什均衡。給定其它債權人減記,阿根廷政府財務狀況改善,那麽我應該拒絕讓步,其它債權人的犧牲,會讓阿根廷政府有更大的財務空間來清償對我的債務。如果其它債權人拒絕減記,那麽阿根廷政府注定違約,我又爲什麽要做出犧牲?看似漠視風險的結果,其實恰恰是一種個體理性驅動的必然。
那麽我們再來看看黑天鵝。在次貸危機之後,塔勒布的黑天鵝一時洛陽紙貴。但是次貸危機真的是不可知的黑天鵝嗎?
次貸危機更像是灰犀牛,有很多經濟學家和金融大鳄都曾經預測過崩盤的風險。花旗銀行在次貸危機中損失慘重,但是花旗的前主席Chuck Prince早就公開預警,次貸市場的大規模崩盤可能波及其它證券市場,帶來市場流動性的極度枯竭。甚至呼籲政府加強監管。但是,花旗無意撤出,他說,“流動性市場的深度前所未有。在某一時刻,流動性可能會轉向流出市場,但是我不認爲已經糟糕到了那個地步。”這是爲什麽?這同樣是一種囚徒困境,給定其它機構仍然樂此不疲,如果撤出次貸市場,而危機沒有發生,那就意味著機構的業績下滑,個人聲譽和收入都會受到損失;如果隨大流,繼續在次貸市場紮堆,即使危機發生,那也只不過犯了所有人都會犯的錯誤。我們看,我們看到的就是一個糟糕但是現實的均衡。Chuck Prince對此有一句名言,只要音樂響起,你就要跳進舞池。身在局中,身不由己。
03
靜態博弈的經典情境之二
智豬博弈
我來介紹另外一個經典的博弈情境,這就是智豬博弈。豬圈中有一大一小兩只豬。食槽在豬圈一側,而另一側則有一個控制飼料供應的踏板,必須要踩踏板,才有食物來,每踩一下踏板,將有十份飼料進槽,但是往返踏板與食槽需要消耗兩份飼料所帶來的熱量。
每頭豬需要選擇是否要去踩踏板,如果小豬踩踏板,大豬先得到食物,大豬獲得九份,小豬獲得一份;如果大豬踩踏板,則小豬先得到食物,大豬獲得六份,小豬獲得四份。如果都去踩踏板,則同時得到食物,大豬可獲得七份,小豬獲得三份;如果都等待,則無食物。這個博弈最終的結果是什麽呢?
我們來看一看,我們還是用2乘2的矩陣來表述這個博弈。大豬在上下之間做選擇,踩踏板,或者等待。小豬在左右之間選,踩踏板或是等待。有四個可能的策略組合,在每格中,左邊的數字代表相應的策略組合之下大豬的回報,右邊的數字是小豬的回報。我們先來看一看,小豬應該怎麽想。如果大豬去踩踏板,小豬應該等待,它不費事,還先得到食物,兵不血刃吃到4份;如果大豬等待呢?小豬如果去踩,花費了力氣,等到跑回來,大豬已經吃了九份了,自己只吃到1份,還消耗了相當于兩份飼料的熱量,這是不是得不償失?還不如自己也等待。
所以我們看到,無論大豬做什麽,小豬都應該等待,這是它的占優策略。那麽給定小豬一定會等待,大豬做什麽?如果大豬也按兵不動,那就沒得吃,如果大豬花點力氣,雖然讓小豬占了便宜,自己還是有得吃。所以智豬博弈有唯一的均衡結果,那就是大豬做貢獻,小豬占便宜。
大家看,這個情境,和剛才的囚徒困境有所不同。在囚徒困境中,人人都想占便宜,個體理性帶來集體的損失。在這個智豬博弈之中,雖然大豬小豬也心懷鬼胎,但是最終的結果,其實是皆大歡喜,實現了效率。
那麽,這和囚徒困境的根本不同在哪裏?
在這裏,博弈的參與人,有大有小,是非對稱的,大小不同,激勵和行爲也就不同。
歐佩克的減産博弈
我們來舉一個例子,OPEC,或者OPEC+,是石油出産國的一個共謀機制,他們訂立協議,限制産量,來支持石油價格。在理論上,這類操縱市場的共謀機制是非常難以維持的,還是那句話,個體是自利的。我們訂好協議減産,我回去就要琢磨琢磨,我要不要遵守協議呢?給定別人都在減産,那麽油價就會推高,那麽我的最優選擇,可能就是偷偷增産,單位利潤增加,賣得還更多,這個誘惑必然存在,這個價格共謀可能就會瓦解。
那麽OPEC+爲什麽可以長期存在呢?就是因爲這裏有沙特,以及俄羅斯這樣的大戶,我們從這張圖中可以看到,就是沙特與俄羅斯承擔了減産的主要責任。它們默許小國作弊,多生産一些,並不影響大局,自己的市場份額大,減産支持價格的大頭還是落在自己手上;相反,如果沙特、俄羅斯也像科威特一樣作弊,價格可能一瀉千裏,最後吃虧的還是自己。
要想富,誰來修路?
這樣的情境,在現實生活中也同樣非常普遍,比如說,我們來想一下。一個村裏,有富人大戶,也有升鬥小民,現在說,咱們來集資修條路吧,修條路咱們就可以往城裏賣土特産了。這個故事的結局,我相信大家都想得到,那就是富人出錢,窮人沾光,道理非常簡單,修了路,富人從中獲利更多,路修不起來,損失自然也更大。所以,我們看啊,在社會上要實現合作,避免囚徒困境,有一個可能的途徑,就是找一個老大,來貢獻公共資源。
大豬的無奈:
全球多邊經濟治理體系爲何面對分崩離析?
比如基辛格就講過,“幾乎是某種自然定律,每一世紀似乎總會出現一個有實力、有意志、且有知識與道德動力,希圖根據其自身的價值觀來塑造整個國際體系的國家。”(亨利·基辛格,《大外交》)。20世紀50年代以來,這個大豬,就是美國,美國的一家獨大,在很大程度上,有助于多邊國際治理體系的穩定和效率。美國經濟地位的相對下滑,和經濟重心的多極化,也在一定程度上造成當今國際治理體系的舉步維艱,帶來了三個和尚沒水喝的局面。
04
動態博弈
倒推法的思維方式
狹路相逢的三個搶手
我們下邊再來介紹另外一種場景。有三位槍手狹路相逢,A有80%的命中率,B有70%的命中率,C有50%的命中率。如果三人同時開槍射擊,請問誰的存活概率最高?是槍法最好的A嗎?事實上,不是。我們來看一下三個人在第一輪射擊中的目標選擇。對于A而言,最好的選擇是B,如果可以擊中B,自己活下來,那麽下一輪面對的就是C,這是一個更容易對付的對手。但是對B,他的目標一定是A,如果自己活下來,而A被擊中,下一輪的對手就是C。那麽對于C,這個問題很簡單了,他的目標也是A,如果自己活下來,而A被擊中,下一輪的對手就是B,這總會更容易一些。所以我們看,這一輪亂射之後,C100%可以存活,B活下來的概率是15%,那麽A呢?B和C兩個人都沒有打中的概率,是15%。最強者存活概率是最低的,因爲他是衆矢之的。
如果我們把這個場景變個花樣,讓他們輪流開槍,假定C先動,B其次,A最後。那麽對于C,最優的選擇是什麽?
在這個場景之下,參與人輪番出手,每個人都可以觀察到對手過去的行動,這就與剛才我們所說的靜態博弈有所不同了,行動有次序,這就是所謂的動態博弈,或者叫做序貫博弈。我們就必須采用一種新的分析思路。
其實我們下棋,就是一種動態博弈,雙方交替進行。如何落子呢?我小時候下棋,長輩告訴我一句話,叫下棋要看三步,就是要有前瞻性,我權衡我的選擇,我必須要預見,我走出一步棋,對手會如何反應,我必須把我自己代入對手的情境,預計對手對我所有可能的行動會做出的最優反應,再回到當下做出抉擇,確保我的行動引導對手做出對自己最有利的應對。我們下棋是不是就是這樣下的?
這樣的思考方式,就是所謂的倒推法,即從動態博弈中的後動者出發,分析他在各種可能情境中的最優應對,再回到先動者,其選擇要考慮後動者的應對,來尋找最佳的方案。
我們就用這樣一種思維方式來考慮一下這個輪流射擊的場景。三人中最後一位出手的是A,我們應用倒推法,如果他有機會出手,他的最優選擇必定是向B開槍,因爲B在未來給自己的威脅更大。那麽我們回到B,如果B有機會出手,他的選擇一定是A。那麽我們回到C,這是第一位行動人,他預見到兩位最強者會以各自作爲目標,他的最優選擇是什麽呢?他必定要最大化B和A交火的機會,所以他最優的做法,就是朝天開槍。
三國夷陵之戰:黃承彥爲何救陸遜?
我講兩個大家熟悉的故事,都來自三國演義。第一個,是劉備伐吳,夷陵之戰,火燒連營,蜀國幾乎全軍覆沒,東吳的陸遜率軍一路追擊到魚腹浦,被諸葛亮的八陣圖困住,幾乎要命喪其中,被諸葛亮的嶽父黃承彥救出,陸遜率軍班師。那我們就要問一個問題了,黃承彥爲什麽要救陸遜呢?我們來看一看這個選擇是否是理性的。我們不要忘記這個博弈之中,還有一位參與人,就是魏國。救還是不救,需要考慮此後魏國的應對。蜀國此時已經是風中殘燭。如果不救,吳國同樣元氣大傷。那麽魏國必定揮師南下,兩敗俱傷的蜀吳沒有還手之力。救下陸遜,就是幫助吳國保存實力。吳國不敢進一步緊逼,螳螂捕蟬,還有魏國黃雀在後;魏國的戰略重心也必定轉向吳國。救下吳國,其實最大化了蜀國的生存幾率,在絕境中維護了三足鼎立的局面。
空城計:司馬懿的博弈策略
另外一個故事,就是空城計。司馬懿真的被諸葛亮的虛張聲勢唬住了嗎?這是一種解釋,我們還可以有另外一種解釋。這個博弈中還有一個隱性的參與人,這就是魏明帝曹叡。那麽對于司馬懿而言,面對擺出空城計的諸葛亮,進還是退,必須考慮將來曹叡的反應。曹叡猜忌司馬懿,爲什麽不對司馬懿下手,就是需要司馬懿對付諸葛亮的北伐。如果撤兵,諸葛亮將來卷土重來,曹叡還需要倚重自己;如果拿下諸葛亮,兔死狗烹,曹叡必定卸磨殺驢。兩相權衡,退兵是司馬懿最優的選擇。
美鋁經典案例
下面,我們用一個簡單的市場進入的例子,來進一步介紹動態博弈和倒推法思維。
我們來考慮這樣一個情境,這也是美鋁的經典案例。一家企業A壟斷市場,獲利100。A面對潛在市場進入威脅,宣稱如果有新進入者,一定會予以堅決反擊,發動價格戰,令其無利可圖。
假定有一家企業B入場。如果A不予反擊(價格戰),兩家平分市場,A獲得50利潤,而B則需要投資20的固定成本,因此獲利30。如果A予以反擊,則必須付出20投資擴大産能,增加産量,以壓低價格,價格戰結果爲,A從市場獲利60,而B獲10,扣除20投資,A獲得40,B遭遇10的損失。顯然,如果A真的會如自己所承諾的這樣發動價格戰,B不可能進入?但是如果你是B呢?你會相信A的價格戰威脅嗎?你應該進入嗎?
我們用博弈樹來描述這個場景。這個博弈樹始于一個節點,代表先動者,在這裏誰是先動者呢?顯然是企業B,先有B決定是否進入,才有A決定是否發動價格戰。B有兩個選擇,就像樹上的兩個枝條,一個是進入,一個不進入,如果不進入,那麽歲月靜好,A繼續享受壟斷利潤100。
那麽如果進入呢?我們就來到了下一個結點,代表後動者,企業A的結點。A有兩個選擇,一個是不予反擊,那麽兩家平分市場,A獲得50,B扣除成本20後獲得淨利30。另一個選擇,是投資20擴大産能發動價格戰,那麽它獲利60,再扣除20成本,得到40,B企業遭遇損失。
那麽我們就可以使用倒推法了,B企業必須考慮,A如果需要決策,是否會有積極性兌現承諾,發動價格戰,如果發動價格戰,獲利是40,不發動價格戰,平分市場,那獲利50。我們看,價格戰得不償失,不如就算了。好了,我們知道A企業,會接納市場中新的進入者,那麽回到先動者B,它的最優選擇是什麽,考慮到A的反應,如果不進入,收益是0,如果進入,收益就是30,顯然,它應該無視價格戰的威脅。
我們用博弈樹表述了這個情境,用倒推法做出了分析。
朝核談判爲何舉步維艱?
因此我們也可以看到,朝鮮核談判爲何難以取得進展,無法實現互信,這就是博弈論中的所謂動態不一致性問題。談判雙方都沒有積極性在對方履約之後兌現承諾。如果朝鮮不可逆轉地銷毀了核設施,還有什麽必要繼續爲其提供所承諾的經濟援助呢?反過來,當朝鮮獲得了足夠的經濟補償,最優的選擇是在處置核設施上拖延怠工,虛與委蛇,保留籌碼,繼續訛詐。
如何讓自己的承諾或威脅更加可信?
從這一點,我們延伸到另外一個重要的問題,就是如何讓你的承諾或者威脅可信?
我們回到剛才的市場進入問題。我們看到,當A企業關于價格戰的威脅並不可信。當B企業進入這個市場,A企業並無堅壁清野的決心,價格占除了壓低利潤之外,還需要投資擴大産能。有沒有什麽辦法能讓A企業的價格戰威脅起到足夠的威懾作用呢?我們來看一看,如果A企業不管有沒有人進入,自己先把産能建起來,會發生什麽?我們來看,它在這個情境之中的收益結構就變化了。如果B企業選擇不進入,A企業繼續享受壟斷利潤,它的收益變成了80,因爲它已經投資擴張了産能;如果B企業進入,而A企業發動價格戰,那麽它的收益仍然是40,沒有變化。但是我們來看,重要的是,如果B企業選擇進入,而A企業選擇綏靖,與對方平分市場,它的得益只有30,因爲它已經投資了産能。那麽如果B企業進入,A企業的最優應對是什麽呢?顯然,價格戰在此情此景之下回報更高。B企業預見到,進入這個市場會迎來A企業的迎頭痛擊,它的最優策略,就是退避三舍。我們看,A企業通過投資産能,繼續享有壟斷利潤。它的産能投資並未投入生産,是閑置産能,這個錢看似是白花了,但是它改變了博弈的收益結構,幫助A企業維護了壟斷地位。從這個案例中,我們可以看到,爲什麽很多大企業手上儲備著閑置産能,這其實是一種對潛在進入者的威懾,我的産能投資已經完成了,你要進來,我可以毫不費力地擴大生産壓制價格,你進來,這個市場就是焦土。
通過這個例子,我們看到,如何讓自己的承諾或者威脅更加可信,就是能夠采取策略性行動,改變博弈的收益結構,讓自己所承諾的行動成爲相關情景之下的最優,履行承諾符合你的利益,承諾就具有可信度。
我們下邊就舉幾個例子來說明具有這樣效果的策略性行動。
如何讓“血戰到底”的威脅變得更加可信?
我們先來看一看一個經典的情境。一支軍隊鎮守一座島嶼,島嶼上有一座橋聯通大陸。數倍于己的敵人大軍壓境。指揮官希望嚇退敵軍,揚言島寸土不讓,要與入侵者血戰到底。這個威脅是否可信呢?這是要大打折扣的,等到敵人發動進攻時,每個人都要掂量掂量,是否一定要搭上性命,還是從橋上撤退逃回大陸呢?到那時,與其以卵擊石,不如保命。預見到守軍的反應,對方就會發動進攻。那麽指揮官如何才能有效地對來犯之敵施加威懾呢?我猜大家都知道答案,就是把橋燒掉,主動切斷退路,如果敵人來犯,拼死反抗就是惟一的選擇。敵人預見到這一點,是否還真的膽敢來犯,恐怕也要掂量掂量。
中國曆史上,有破釜沉舟、背水一戰的故事,古希臘的色諾芬抗擊波斯、征服者威廉入侵英格蘭、西班牙的科爾特斯征服墨西哥,都采用了類似的策略。這些曆史經驗告訴我們一個很重要的道理,很多時候,你的選擇越多,你的處境就越不利,選擇帶來誘惑,誘惑會讓你軟弱,守住底線就會更難,你也就更容易被人牽著鼻子走。
寶麗來爲何起訴柯達
主動切斷退路,在商業中有一個經典案例。寶麗來這家公司,我們都知道,在很長的一段時期,寶麗來壟斷了快速攝影市場。雖然積累了充足的財務資源,這家公司一直拒絕多元化,拒絕在其它領域投資。爲什麽有錢不去賺呢?這其實是寶麗來公司捍衛市場地位的宣言。在1976年,柯達公司企圖進入快速攝影市場,寶麗來迅速做出回應,起訴柯達技術侵權。這場官司打了14年,柯達公司敗訴,賠償9億美元,被迫撤出。寶麗來的創始人Edwin Land說,這是我們的靈魂所系,這是我們的人生的全部,但是對他們來說,這只是一個另外一個領域。我們要呆在我們的地盤,把它看住。我們來想想看,如果寶麗來也有多元化的投資組合,東邊不亮西邊亮,是否還有這樣的決心和動力對抗競爭者呢?
商業議價博弈
最後,我們來看一個經典的議價問題。假設你是一個商家,不斷有買家來找你做生意。每個買家都希望逼迫你壓低價格,你如何才能讓他們相信,你有你的定價原則,不會輕易降價呢?有一個經典的解決方案。就是你在進行銷售的時候,銷售合同中包括一個所謂的最惠國條款,客戶可以得到最低價保障,如果你在未來銷售中向其它人給予了更低的價格,那麽客戶可以回來,補足差價,甚至可以得到額外的賠償。這個條款,看似對客戶非常有利,但是事實是否如此呢?我們就來做一個簡單的分析。
你的産品成本50,你定價500,有個客戶來找你討價還價,你說,我們沒有必要浪費時間,我給你提供最惠國待遇,如果以後我的價格降低了,你再來找我,這個客戶就會放心大膽地完成交易,交錢提貨走人。第二個客戶來,第三個客戶來,照此辦理。又來了一個新客戶,一定要讓你降價,他知道即使打個對折,你依然有暴利,何樂而不爲呢?有了最惠國待遇的條款,你絕不敢輕易降價,你對這個客戶降了價,就要對所有過去的客戶給予補償,吃進去的利潤都要吐出來,多做這一筆生意得不償失。所以你一定不會降價,這位客戶知道你的銷售包含了最惠國待遇條款,也會預計到你不會降價,自然也就不會再和你討價還價。一個看似保護客戶的條款,其實是薅羊毛的手段。
05
總結
我來做一個簡單的總結。今天我們對博弈論的基本概況和策略性思維做了一個簡單的介紹,我們通過囚徒困境、智豬博弈這樣的經典場景,了解了靜態博弈和納什均衡的概念;我們又介紹了動態博弈的場景和倒推法的邏輯。雖然博弈論是技術性很強的學科,但是策略性思維的智慧在我們的生活中無處不在,其本質,就在于換位思考,從別人的角度去想問題,知己知彼,方能百戰不殆。
希望我的介紹能給大家帶來啓發,對工作與生活帶來幫助,産生對博弈論這一門學問的興趣。
博弈論的智慧
考慮各方的動機,並納入到自己的決策中
個體的理性決策未必會帶來群體的最優結果
面對諸多可能性,不妨向前展望,倒後推導
選擇太多未必是好事,減少選項可能有戰略價值
作者介紹
傅強教授
新加坡國立大學商學院
策略與政策系
中文EMBA學術主任
傅強教授于1998年畢業于北京大學光華管理學院,並在美國印第安納大學獲得經濟學博士學位,自2005年起執教于新加坡國立大學商學院,講授管理經濟學、宏觀經濟與國際金融等課程,被評爲新國大商學院EMBA最佳教師,現任中文EMBA項目學術主任。
傅強教授曾兩次當選新加坡最具影響力40歲以下商科教授,爲衆多金融機構與大型企業高管授課、咨詢,或擔任董事、監事等職務。傅強教授從事應用對策論的理論研究,曾擔任德國巴伐利亞州財政部Max Planck公共稅收與法律研究所、加拿大CIREQ經濟研究所客座研究員。其學術論文廣泛發表于諸如the American Economic Review, Theoretical Economics, Journal of Public Economics, Games and Economic Behavior等國際頂級學術期刊。
感謝授權轉載
- 本文來自微信公衆號新加坡國立大學EMBA,ID:NUS_EMBA
-
原標題:教授觀點 | 傅強:博弈論的智慧與策略性思維精華總結(完整版)
— END —