Friday, January 6, 2012

什麼叫「不科學不合邏輯」的民調

(本文短版於6/1/2012刊於《經濟日報》)

數字可以說明問題,也可用來撒謊;民意調查可以了解民情,亦能扭曲民意。在民調汗牛充棟的今天,郝鐵川說港大身份認同民調「不科學不合邏輯」,值得探討。五十多年前出版的一本經典小書《統計數字會撒謊》,美國作家Darrel Huff叫大家看到統計數字時,記住問五個問題:

誰說的?

藥廠推介新藥,美白潤膚產品廣告謂調查發現「百分百用家滿意效果」,當然不能輕信;這不僅是「利益衝突」,而是最大受益者的宣傳。每逢周末,新聞淡靜,各大政黨爭相以「公布民意調查」開記者會爭取曝光,調查結果總與政黨立場脗合,有這樣巧合嗎?最新一例,機場管理局諮詢建第三條跑道的結果,報章大字標題「73%市民支持第三條跑道」,你信嗎?

他是如何知道的?

信不信,要看調查方法,「隨機抽樣」於統計學上有嚴格定義,不少政黨隨便在街上找百多個路人,誰願意停下敷衍幾句,就算成功訪問,把「隨意」當作「隨機」,樣本數目亦不足,這樣的調查,反正我不信。機管局的第三條跑道諮詢,問卷數目夠多,24242份,六千多份是網上問卷、另六千多是旅客在機場自行填寫,其餘約一萬一千多份,在巡迴展覽中收集。

我們可以問,位於會展、機場、荃灣、九龍塘創新中心的數天展覽,誰去參觀?由誰去組織參觀?展覽的資料是否一面倒?在機場填寫問卷的人,多是機場常客,他們的意見是否有代表性?香港大學的分析報告,開宗明義說明,問卷調查並非隨機抽樣,不代表任何群體(population),但不少報章皆簡化以「73%市民支持第三條跑道」為標題,機管局應該很高興。

遺漏了什麼?

第三條跑道諮詢一例,較少使用機場的人及無去參觀展覽的人,他們的意見不合比例地少。其他種類的「遺漏」,例如新聞說:「流感孕婦死亡人數較正常上升50%」,原來是由兩個增加至三個,遺漏了「基數」,容易引人誤解;等同有人驚叫高呼「我的暗瘡增長百分百」,原來是由一粒增加至兩粒。(暗瘡例子借用《李天命的思考藝術》,論語意曖昩之數字迷彩。)

是否有人偷換了概念?

疾病案例多,不等同疾病比鄰近地區嚴重,如香港「常見」禽流感病例,可能是因為監察網完善,資訊公開;走私案件增加,未必因為走私趨嚴重,只是因為海關「做嘢」。

這個資料有意義嗎?

數據與民調可以有很多含混與漏洞,推論亦可以有偏差,令很多調查無甚意義。有統計說,美國總統平均壽命,高於美國人平均。問題關鍵在,現時通用的「平均壽命」統計,是以出生時起計的;活到一定年歲的一群人,他們的壽命自然比平均高,因為有很多夭折或早死的人,被算進平均壽命的數據裡。想一想:一群今天78歲的人,他們最終的平均壽命,極大機會比人口平均的80歲為高。

中聯辦宣傳文體部部長郝鐵川批評港大民意調查中心的香港人身份認同調查「不科學不合邏輯」,也可用這框架審視一下。

調查有意義嗎? 「身份認同」的課題,是政治學、社會學、文化研究等學科中,一個甚為老掉牙,但有其實際意義的主流研究範疇。「國籍」與「身份認同」,無論是學術上,或從人的基本心理層面而言,從來是兩回事。曾幾何時,香港的回歸,大家都關心「人心的回歸」;學術層面而言,香港回歸「案例」全球罕有,可作為大理論中的特例審視之。研究為定期進行的縱向研究,正可紀錄人心回歸的歷程,具參考價值。

調查可信嗎?信或不信,並非基於「港大」或「鍾庭耀」的信譽,港大民調的資料是公開的,其研究方法、問卷問題,都公開予大眾批評討論。我們所相信的,是學術的尊嚴,及眾多學者互相監督,就事論事,自我完善的學風。

問卷設計當然非完美,例如詢問「你會稱自己為什麼人」時,被訪者的答案,可能隨語境而變。例如我面對上海人或澳門人時,會自稱香港人;面對外國人時,有時會自稱「中國的香港人」;在不知香港為何物的偏僻小國,我會自稱中國人。香港人身份百變,難道不值得深入研究?

港大的調查,從隨機抽樣、樣本數、問卷問題而言,沒有明顯破綻。如要數臭調查數字如何誤導,暗藏什麼目的,有關政府或政黨的很多調查,大有潛質,郝鐵川先生有興趣學術討論的話,可考慮把焦點轉移一下。