🎲 Monte Carlo 怎麼分辨運氣 vs 真本事

回測 Sharpe 1.96 看起來很厲害,但 95% 信賴區間可能是 0.8-3.0 — 代表你的真實 Sharpe 也可能只有 0.8。

單次回測的致命弱點

你跑了一個策略 10 年回測,得到 Sharpe = 1.96、年化 18%、MDD -22%。看起來相當不錯,可以 ALL IN 了嗎?

慢著。這個 1.96 是「歷史上恰好發生的那一條路徑」 的結果。如果歷史重來,市場的隨機性會產生不一樣的價格序列,你的策略表現也會不一樣。

關鍵問題:如果歷史能重來 1000 次,你的策略 Sharpe 分布會是什麼樣?

單一回測是一張靜止照片。
市場的真實樣貌需要 1000 張隨機照片才看得清楚。 — 量化交易的隨機性原則

Monte Carlo 是什麼?

Monte Carlo (蒙地卡羅) 模擬得名自摩納哥的賭場 — 因為核心思想就是「隨機抽樣 」,像賭場輪盤一樣。1940 年代由 Stanislaw Ulam 提出,最初用在曼哈頓計畫(原子彈研究)。

在量化交易裡的應用很直接:

  1. 把你策略的「每筆交易報酬率」抓出來,例如:[+2.1%, -1.3%, +4.5%, -2.0%, ...]
  2. 從這個分布裡隨機重抽 1000 次,每次抽出和你實際交易一樣多的次數
  3. 每次重抽都計算一個 Sharpe 值,得到 1000 個 Sharpe
  4. 看這 1000 個值的分布、平均值、信賴區間

結果可能像這樣:

  • 平均 Sharpe:1.42
  • 5% 分位數:0.83
  • 95% 分位數:2.51
  • 結論:你的策略真實 Sharpe 95% 信賴區間 = [0.83, 2.51]

這代表什麼?同一個策略,實際上跑下次可能只拿到 Sharpe 0.83 — 不再「優秀」,只算「可接受」

白話例子:擲硬幣

想像你「覺得」自己有預測硬幣的能力。你擲了 10 次,猜對 7 次,勝率 70%。你會說「我有 70% 的真本事!」嗎?

統計告訴你:即使是純運氣(50% 勝率),擲 10 次出現 7 次正確的機率高達 17%。換句話說,你的 70% 勝率很可能只是運氣

Monte Carlo 在策略上幹的事一模一樣 — 它在問:「如果你只是運氣,你拿到這麼漂亮回測的機率有多大?

📊 直觀理解

同樣的策略本質,跑不同年度的市場,結果可以差到 3 倍。Monte Carlo 把「跑很多次 」這件事用統計模擬出來,讓你看清「單次結果背後的真實分布 」。

如何判斷策略「真有效」?

看 Monte Carlo 分布的下緣(5% 分位數):

下緣 Sharpe判斷解釋
> 1.0🟢 真有效就算運氣最差也算優秀
0.5 - 1.0🟡 可能有效運氣差時表現平庸但不虧
0 - 0.5🟠 高度可疑運氣成份高,實戰可能歸零
< 0🔴 多半是運氣運氣差時就虧錢,別用

例如:你的策略平均 Sharpe 1.42,但下緣只有 0.4 → 代表 5% 的機率實戰 Sharpe 連 0.4 都不到,等於沒有可靠優勢。不要用

反之,Renaissance Technologies 的 Medallion Fund,長期平均 Sharpe ~7,Monte Carlo 信賴區間下緣可能還 > 4 — 這才是真正的真 alpha

實作:在 Python 裡 10 行就能做

核心邏輯只是「重抽 + 算 Sharpe」:

步驟:

  1. 把你的每筆交易報酬存成 array,例如 returns = [0.021, -0.013, 0.045, ...]
  2. 跑 1000 次迴圈,每次用 numpy.random.choice(returns, size=N, replace=True) 重抽
  3. 每次計算 Sharpe = mean / std × sqrt(252)
  4. 收集這 1000 個 Sharpe → 看 numpy.percentile(sharpes, [5, 50, 95])
⚠️ 小心 bootstrap 的假設

這種「從歷史報酬重抽」的做法稱為 bootstrap,假設未來的報酬分布跟過去一樣。如果市場 regime 切換(例如低利率時代結束、AI 浪潮起飛),這個假設就不成立。所以 Monte Carlo 是必要但不充分的驗證 — 它告訴你「在過去市場條件下這個策略夠不夠穩」,不告訴你「未來會不會壞掉」。

三大派別都同意這件事

  • 量化派(Simons): Medallion Fund 每筆交易都納入分布模擬,只看「長期期望值穩定為正 」才上線。
  • 價值派(Buffett): 雖然不跑 Monte Carlo,但「安全邊際(Margin of Safety) 」本質一樣 — 假設你判斷錯了多少,股價還能撐住?
  • 總體+風險派(Taleb): 整個《黑天鵝》論述就是「單一觀察值無法代表分布尾端 」,正是 Monte Carlo 的哲學基礎。

這不是某個流派的工具,是嚴肅投資人的最低門檻

💡 重點摘要

  • 單次回測 = 單張靜止照片,看不出策略真實分布。
  • Monte Carlo = 隨機重抽 1000 次跑同樣策略,看 Sharpe 的分布(平均值 + 95% 信賴區間)。
  • 關鍵看下緣 — 信賴區間下緣 (5%) Sharpe > 1 才算真有效;< 0 多半是運氣。
  • Bootstrap 假設未來 = 過去,Monte Carlo 是必要但不充分驗證。未來 regime 變化還需另外考慮。
  • 嚴肅投資人的最低門檻 — 不只量化派,連價值派的「安全邊際」、總體派的「黑天鵝」邏輯都是同一個哲學:接受不確定性、看分布而非點估計。

📚 延伸閱讀