同一群二十多歲的年輕人,被同一份追蹤民調,在一週內先說「巨變、崩盤」,再說「震撼、暴升」。

如果這是真的,等於有數十萬名年輕人在幾天內集體拋棄一位候選人、又默默回頭。更可能的解釋是:你看到的不是民意轉向,是抽樣雜訊。本文用三個 2023 年 12 月底的真實案例說明——那些被標題放大的起落,幾乎都還落在統計誤差之內。

±3%一份 1,068 人的民調,整體抽樣誤差
±11.1%拆到 20–29 歲、兩波對比的最大誤差
156 人每份民調分到 20–29 歲的樣本數

樣本越小,誤差越大

本文不質疑各家民調的準確性,而是聚焦在新聞標題與選材。要看懂民調,除了支持度的數字,更要看樣本數與抽樣誤差。一份民調為了成本效益,通常做滿 1,068 份,在 95% 信心水準下整體誤差約 ±3%。可是一旦要談「20–29 歲怎麼想」,分到這個年齡層的樣本只剩約 156 人,誤差就遠不只 ±3%。

想看抽樣誤差公式?展開

某次民調某位候選人支持度的抽樣誤差 = 1.96 × √( p(1−p) ⁄ n )
兩次民調某位候選人支持度的抽樣誤差 = 1.96 × √( p1(1−p1)⁄n1 + p2(1−p2)⁄n2 ) (假設兩樣本獨立)

±3% 是整份民調的把握。一旦你問「年輕人怎麼想」,把握就只剩 ±7.8%。

於是同一個族群的支持度,今天被說「崩盤」、明天被說「飆升」,民意看似每天都在變。但從統計來看,這種波動往往難以分辨究竟是民意轉向,還是抽樣誤差。下面三個案例,把媒體的標題和原始數字擺在一起看。

案例一:被點名「巨變」「暴升」的兩個數字,其實都還在誤差裡

美麗島追蹤民調公布完整交叉分析報表,柯文哲在 20–29 歲的支持度第 94 到 101 波是這樣走的。把游標移上各點看數值,或往下捲,看這條「忽高忽低」的線如何被誤差帶一步步收編。

柯文哲 20–29 歲支持度:八波追蹤與逐波 95% 信賴區間

媒體看到的。第 94 到 101 波,柯文哲 20–29 歲支持度依序是 30.0、31.3、27.2、29.9、25.5、28.4,然後跳到 36.1、40.2。單看這條線,確實「忽高忽低」。

每一波各有誤差。20–29 歲在每份民調裡只分到約 156 人,單波的 95% 信賴區間約 ±7 個百分點。把每一波各自的區間畫上去——竿子往往比點與點的高低差還長。

相鄰波其實分不開。八波平均是 31.1%。被圈出來喊「巨變」的第 96 波(27.2%)、喊「暴升」的第 101 波(40.2%),它們的信賴區間和鄰近波次大幅重疊:在統計上,根本分不出誰真的比較高。

整合樣本,雜訊就消失了。真要看趨勢,把樣本疊起來再比:12 月上旬(86、89、92 波,≈525 人)是 34.80%;下旬(95、98、101 波,≈572 人)是 32.35%。前後幾乎沒動。所謂崩盤與暴升,攤平後不見了。

資料:美麗島追蹤民調第 94–101 波 20–29 歲柯文哲支持度。誤差棒為各波 95% 信賴區間(細項 n≈156,1.96·√(p(1−p)⁄n),約 ±7 個百分點)。註:美麗島每波約三分之二樣本與前波重複,波次間並非獨立,實際比較更複雜,此處逐波區間為示意。

數字是冷冰冰的,人卻是活生生的。

所謂 10% 支持度的起落,換算回實際母群,相當於全台灣 28 萬名 20–29 歲年輕人。難道在一兩週內,30 萬年輕人突然放棄柯文哲,不久又有 15 萬人默默回頭?這違反基本的投票行為常識。年輕人的政治傾向或許尚未定型,但被詮釋成「亂竄」的選民,並不合理——連政治評論者都曾據此驚呼「這群人亂竄、大起大落逾 10%」

案例二:「雪崩到 10%」的真相,藏在 12/21、12/22 兩天

柯文哲在台北市執政八年,2018、2022 兩次選舉,柯文哲與黃珊珊在同時有藍綠對手的情況下仍拿到 41.1%、25.14% 得票,至少兩成市民偏好他。可是第 94 波與第 101 波只隔一週,台北市支持度都維持在兩成左右;偏偏中間第 95–98 波,只要加入 12 月 21 或 22 日的樣本,就瞬間「雪崩」到 10% 上下;不含這兩天的波次,又彈回兩成。

用底下的步進按鈕逐步看:先看「忽高忽低」的線,再加上誤差棒、再框出 12/21–12/22 三波,最後對齊執政基準。圖內任一處 hover 也會跳出十字游標,列出該波的數值與信賴區間。

柯文哲台北市支持度:含 12/21、12/22 樣本的波次才掉到 10%

資料:美麗島追蹤民調第 94–101 波台北市柯文哲支持度。紅色區塊為含 12 月 21、22 日樣本的第 96–98 波。誤差棒為各波 95% 信賴區間:原報表未列台北市細項樣本數,此處依台北市選舉人口占比估每波 n≈115(約 1,068×10.8%)試算,僅供示意。同一批民調,柯文哲總體支持度波動不到 2.6%。

<2.6%同期柯文哲總體支持度波動
>10%台北市細項短時間起落
25 萬換算成台北市民「轉離又轉回」

同一批民調,柯文哲總體支持度波動不到 2.6%,小於誤差範圍;台北市細項卻在幾天內起落超過 10%,等於 25 萬市民短時間轉離又轉回。即便期間有農地爭議,在總體幾乎不動的情況下,台北市的起落更可能是細項樣本太少造成的誤差。若選舉團隊也照細項數字做決策,恐怕會誤判選情。

案例三:同一群 50–59 歲選民,三家民調指向三個方向

這不是哪一家民調的問題,也不是只有年輕族群會跳。同一時期,ETtoday 民調也有賴清德 50–59 歲「大跌」「崩跌」的報導。

把同一時期、同一族群的三家民調擺在一起:ETtoday 忽跌忽升,美麗島與 TVBS 卻平穩微升。如果這是真實的民意轉向,三家方向應該一致。圖例可點擊(或用步進按鈕)只看一家,把它的走勢從另兩家裡剝出來看。

賴清德 50–59 歲支持度:三家民調沿時間的走勢

資料:ETtoday、美麗島追蹤民調、TVBS 民調賴清德 50–59 歲支持度。各點依調查期間中點對位於日期軸。

把時間軸拿掉,只看每一波的支持度散在哪裡,差別更直接:ETtoday 同一族群的點從 29.7% 散到 45.6%,落差近 16 個百分點;美麗島、TVBS 則集中得多。可點任一列名(或用步進按鈕)只看一家。

同族群、同期間,三家民調的支持度散布

資料同上圖。短豎線為各家平均;列上方淡色括弧為 min–max 落差範圍。真趨勢三家應同向;散成這樣,更像小樣本不可避免的雜訊。

與其從政治事件解釋民調起落,或爭論哪一家最準,這些波動的真正原因,可能只是小樣本不可避免的誤差。這不是最吸引人的解釋,卻常是最合理的那一個。

為什麼總能「挑到」一個有趣的差異

從這些案例逐項找細項、算信賴區間,或許真能找到一兩個「顯著」的變動。但這正是多重比較問題(Multiple Comparison Problem)。

民調常說的 95% 信心水準,是針對「單一次比較」而言,偽陽性機率 5%。一旦你把所有細項、所有波次、所有族群拿來廣泛比較,「至少出現一次偽陽性」的機率就會迅速膨脹——比較做得越多,越容易撈到純屬隨機的偽趨勢。把這種撈出來的細項差異,配上一則近期爭議事件,宣稱「某事件讓某候選人在某族群崩跌」,就是典型的多重比較謬誤。尤其當整體支持度沒怎麼動、只有細項在跳時,更該對任何「事件→細項變化」的推論保持戒心。

標題的好意,與閱聽人的功課

台灣媒體生態蓬勃,各家都想從民調裡找到亮點、彰顯報導價值。但呼籲各方更看重樣本數與抽樣誤差,別把單次民調的細項數字當重點、別過度推論而誤導情緒,也別辜負每一位辛苦取樣的民調工作者。

作為閱聽人,看到陡升陡降的民調時,多問一句樣本數與誤差(整體與細項),就更有能力判斷那是不是真的。若要看細項族群的波動,可以整合一段連續時間再比較(如美麗島的每日市話滾動民調),或參考細項樣本足額的調查(如皮爾森數據受菱傳媒委託的總統網路民意調查)。

雜訊不是最吸引人的解釋,但常是最誠實的那一個。