📉 生存者偏誤如何讓你高估歷史報酬
「看不見的死人 」才是最重要的訊息。從二戰飛機到散戶投資,生存者偏誤(Survivorship Bias)無處不在。
故事:二戰飛機回防
二戰期間,美軍想加強轟炸機的裝甲,於是統計從歐洲戰場返航的飛機,看哪些部位中彈最多。結果發現:機翼、機尾、機腹有大量彈孔,引擎和駕駛艙反而很少。
軍方想當然爾地說:「那就加強機翼和機尾的裝甲!」
統計學家 Abraham Wald 卻說:「恰恰相反 — 應該加強引擎和駕駛艙。」
為什麼?因為那些引擎中彈的飛機根本飛不回來,所以你看不到它們的彈孔。能返航的飛機都是「機翼中彈但還能飛 」的倖存者。真正致命的彈孔分布,藏在墜落的飛機上,不在你能看到的飛機上。
The absence of evidence is not the evidence of absence.
沒看到證據,不代表證據不存在。 — Carl Sagan(套用在 Wald 的故事上)
翻譯成投資:你只看到了股神,沒看到死人
翻開任何投資網站、書本、YouTube 頻道,你看到的內容大致是這樣:
- 「巴菲特怎麼複利賺 60 年」
- 「X 神 5 年 10 倍的故事」
- 「抱台積電從 100 到 1000」
- 「少年股神 30 歲財務自由」
但你從來不會看到:
- 「跟巴菲特同年代的 99 個破產投資人」
- 「同樣方法但賠光的 X 神同學」
- 「抱了一檔結果下市的故事」
- 「少年股神 35 歲被裁員,40 歲又從零開始」
不是因為這些故事不存在,而是沒人想講,也沒人想聽。輸家被市場淘汰、被自己刪除、被人類記憶過濾掉。媒體和社群只放大贏家。
美國 SEC 與多項學術研究顯示:長期(10 年以上)主動交易賠錢的散戶比例約 80-95%。你看到的成功故事是 5-20% 倖存者的選擇性曝光,而非整體真相。
量化版災難:回測漏掉退市股
假設你想驗證一個策略:「買進台灣電子業前 50 大公司,等權重持有,每年再平衡」。你跑歷史回測,從 2000 年開始。
結果:年化 +12%、Sharpe 0.8、MDD -32%。看起來不錯,可以放心執行?
慢著。你用的「前 50 大電子業 」名單,是今天的前 50 大,不是 2000 年的前 50 大。當年的前 50 大裡有多少已經下市、被併購、消失了?
例如:廣輝、東元光電、達電工業、訊碟、宇詮、廣輝... 這些當年熱門電子股,有的破產、有的被併、有的下市。你的回測自動把它們的虧損從歷史抹除了,只看現在還活著的公司。
正確做法:用「時間點正確的歷史成分股名單」,把退市股的虧損補回去。這叫做「Survivorship-bias-free 資料庫」,通常要付費才能取得(Wharton、Bloomberg、FactSet 都有提供)。
學術研究顯示:不修正生存者偏誤的回測,年化報酬可能高估 1.5% - 4%。換算到 10 年複利,你以為策略賺 200%,實際可能只賺 80%。純粹是統計幻覺。
更隱形的版本:基金績效排行榜
每年 5 月你會看到「過去 10 年績效前 10 名基金」這種排行榜。你會想:「啊,就買這些!過去 10 年績效這麼好,未來應該也不錯 」。
錯。10 年前的「前 10 名」基金,有大量根本已經被清算合併、消失了。同期間可能有 200 檔同類型基金,其中表現差的早就消失,只留下倖存者進入排行榜。
而且,你「過去 10 年表現好 」的基金,接下來 10 年有多少還會繼續前 10?學術研究數據:大約 15-20%。也就是說,你選了個「過去績效冠軍 」,有 80% 機率它未來會跌出前 10。
這就是為什麼William Sharpe 和 Eugene Fama 都告訴你:長期而言 85% 主動經理人輸給對應的指數 ETF。
如何修正?三個原則
原則 1:看「整體分布」而非「成功個案」
問:「這個方法的所有實踐者,失敗率是多少?」而不是「這個方法的成功者長怎樣?」
例如:看到「波段交易 5 年 10 倍 」,要問「這個學派全部人的長期回報分布 」 — 平均、中位數、5% 分位、95% 分位。答案通常是:中位數虧本、平均小賺、極少數大賺,跟賭場差不多。
原則 2:量化驗證強制用 SBF 資料
SBF = Survivorship-Bias-Free。任何回測超過 5 年期間都要用包含已退市公司的歷史資料庫。台股TWSE 有提供退市公司歷史 K 線(收費),美股推薦 CRSP 資料庫(學術)。
原則 3:Howard Marks 法則
價值投資派的 Howard Marks 說:
Risk means more things can happen than will happen.
風險的本質是「可能發生的事多於實際發生的事」。
歷史只展示「實際發生的 」一條路徑,但你的策略必須能在「所有可能發生的路徑 」上都活得下來。 — Howard Marks, Oaktree Capital
這正是生存者偏誤的本質 — 你看到的歷史是「市場恰好走的那條路 」,不是「市場本來可以走的所有路 」。
💡 重點摘要
- 生存者偏誤 = 統計樣本只含活下來的,死掉的看不見,結論完全失真。
- 散戶版: 媒體只放贏家故事,你以為主動投資能複製,實際 80-95% 散戶長期虧錢。
- 量化版: 用「今天的成分股」回測歷史,自動漏掉退市股的虧損 — 報酬高估 1.5-4%。
- 基金版: 績效排行榜本身就有生存者偏誤,過去前 10 大有 80% 未來會跌出前 10。
- 修正三原則: 看整體分布(不只成功個案)、用 SBF 資料庫、記住 Howard Marks「可能發生的事多於實際發生的事 」。