The reading notes record thoughts from things I read. 這網誌是我的一些閱讀後的思考和摘要記錄。My website 我的網頁: http://raympoon.playgroundhk.com

數字美麗的誤導

數字表達真是奇妙。人的理解能力有限,不同的數字表達方式有驚人的效果。人的認知範圍只在日常所見的比例,對很大或很小的數目會有誤解。在有些情況下,將數據以不同的方式表達,擴大或縮小,其意義會有變動。另一些被濫用的數據是或然率,因為不容易清楚了解,所以經常被用來誤導讀者。

中國持有約一萬億美元的美國國債,如果美元貶值對中國影響是否很大。一萬億美元下調百份之十即是損失一千億,即等於一家工廠五萬七千年的生產力。如果以一個工人計算,即乘大一千倍,時間會是五千七百萬年,回到恐龍時代。這工人從恐龍時代一直工作到今天,其間生產的總價值就因美元下跌百份之十而全部不見了。

其實美元在過去不斷波動,升跌百份之十很常見,只有香港不見,因為港元和美元掛鉤。人民幣情況有點相似,因為匯率不是自由浮動。如果匯率可以堅持不變動,賬面不會因美元兌其他貨幣下跌而有損失。當然宏觀地看全世界的經濟會下調,但美元現時是全球儲備貨幣,所有國家都同時受到影響,相對下,對單一國家的影響不會大得驚人。國債的風險最大是政權易手,使之變成廢紙。工廠比喻很有趣,但美金升跌中國不會有工廠消失。

阿媽教仔食飯要食乾淨,不可浪費一粒飯。如果每人都食剩一粒飯而浪費了,全世界六十五億人就每餐浪費六十五億粒飯。以每碗飯一千粒計,是六百五十萬碗飯,足夠一個人食一萬八千年。因為人每餐浪費一粒飯,可能引致一個可以有一萬八千歲的人餓死了。這個結論究竟有什麼問題。如果以阿媽教仔的角度看,是完全沒有問題;如果阿仔因此感動而不浪費食物就目的已達,而六十五億人之中人人都可能會浪費食物亦不算說錯。問題是不能假設人人都食飯,因為很多民族不以米飯作主要食糧,所以接下來的數學程式不成立。另一個假設是不浪費一粒飯就會有另一人食多一粒飯,這個因果關係並不實際,因為糧食供應問題複雜,包括天氣、農業技術、食物市場、經濟因素等等。

另一個更有趣的問題是會否有一個一萬八千歲的人。試想有一個二十八歲的人已生存了一萬天,如果每天都檢查一次,答案是取樣一萬次此人仍然生存。以統計學來說,這個人一直生存至超過一萬八千歲的或然率是非常高。如果說人平均年齡只有八十歲,但卻不能說所有人都會死於八十歲,因為統計取樣只搜集有人死亡時的年齡,而所有仍生存的人都未有死亡年齡數據。這個結論出了問題,可以用黑天鵝現象解釋。歐洲只有白天鵝,所以有說天鵝就是代表白色,但只需要有一隻黑天鵝出現(結果在新西蘭出現了),無限大的或然率就變得很小。人只要有一日死去,永生的或然率就化為烏有。

另一個著名的數字表達例子是美國唱片業協會RIAA 發放的數據;它說在二零零二年美國人在互聯網下載音樂有二十一億次,每次下載商業上會損失一張唱片的銷售;每張唱片價值十二美元,所以唱片業該年損失二百五十二億美元。這個結論故意錯誤地假設每次下載都成功、整張唱片都被下載而如果不下載會有人一定買一張唱片。該年唱片銷量是八億張,因此音樂下載被說使唱片業損失了百分之七十三的收入。真實的情況是該年唱片銷售數量只是下跌百分之九,而收入只下跌百分之七;而銷量下跌亦受新唱片出版減少和影碟競爭影響。