跳到主要內容

精準預測 - 筆記

getImage

若要我選出2013年對我思考有幫助的20本書,這本一定在其中。
(當然不是說我去年只看20本書  XD,去年的閱讀總量有紀錄的是283本……)


預測最難的部分:從巨量資料中分辨出雜訊和真正的信號。

無論統計的結果如何,如果你沒辦法找到它背後的道理,那就代表這次的分析出了問題。

人總是照自己的意思解釋事情,完全錯失了這些事情本身真正的意義。 --莎士比亞

我們永遠不可能做出完全客觀的預測。預測永遠都會受到我們主觀看法的影響。

對卡爾.波普(科學哲學家)來說,一個假設,除非可以被證明為偽,不然就是不科學的。

風險與不確定性的差別:風險可以標上價格,像是發生的機率為1/10,不確定性是難以衡量的風險,對於潛藏其中的魔鬼,或許有些模糊的印象,但你不清楚到底有多少魔鬼,也不知道它們什麼時候要攻擊。
評等機構做的就是粉飾不確定性,使之看起來或感覺像是風險。

預測模型三原則:
1. 用機率思考
    不是丟出一個數字,宣稱會知道什麼事,而是提出一個範圍的可能結果。
    (如果什麼因素多了五個百分點,那成功的機率就多了xx%。)

2.今天的預測就是你餘生的第一個預測
   正確的態度就是你應該做出今天最有可能的預測。
   (不管之前說過了什麼。『事實改變的時候,我就改變我的想法』--凱恩斯)

3.尋求共識
   集體或團體的預測通常比單獨的預測更準確,但這不表示團體的預測就是好的。

做好預測的關鍵在於不要限制自己只看量化的資訊,關鍵在於適切評估資訊的良好過程。
(亦即發展工具和習慣。)

因為電腦程式對氣象系統中自然發生的反饋過度敏感,會開始產生自己的反饋。這不只是在雜訊中再也找不到訊號而已,雜訊還被放大了。

預報最重要的檢驗標準之一,稱為校準(calibration)。(也就是好好利用回饋。)

在統計學上,把雜訊當作訊號的動作稱為過度配適(overfitting)。

如果我們不知道、或是不在乎關係的真實狀況,就會有很多理由讓我們傾向於將模型過度配適。

過度配適代表的是雙重打擊:這樣會讓我們的模型在書面上看起來比較好,但在現實世界的表現比較糟。因為後面這項特質,所以過度配適的模型如果拿來做真實的預測,最終還是會得到應有的懲罰。而由於前面那項,所以模型表面上看起來比較今人印象深刻,號稱可以做出非常正確、有報導價值的預測,代表比之前運用過的技術更進步,直到遭到懲罰為止。這樣會議這個模型比較容易登上學術期刊,或是賣給客戶,把比較誠實的模型排擠出市場之外。但如果這個模型配適的是雜訊,就有可能會傷害到科學。

沒有脈絡,資料就沒有用。

我們的社會對專家有需求,但是我們對於正確的預測其實沒那麼大的需求。

外推法(extrapolation)是非常基本的預測方法——通常來說,太過基本了。這個方法包含的假設是:目前的趨勢會無限的延續下去,直到未來。有些最知名的預測失誤都是太過隨意應用這個假設所造成的。

預測這個動作本身就可以改變人們的行為方式。
有時候,這些行為改變會影響預測本身的結果,可能會讓預測失效。

一個好的模型就算失誤了也會很有用。「想當然爾,不管我們做什麼樣的預測,平均來說都會是錯的。」奧佐諾夫告訴我。「所以重點通常在於了解是怎麼錯的,錯了的時候該做什麼,還有錯了的時候要怎麼把我們的代價減到最低。」

關鍵在於要記得,模型是種工具,幫助我們了解宇宙的複雜,而永遠不能代替宇宙本身。這一點不止在我們做預測時候很重要。

貝耶斯的主張不是說這個世界本質上就是機率性的或不確定的。
他們的主張應該說是種陳述--用數學和哲學的方式表達--我們如何認識這個宇宙:我們用趨近法認識宇宙,隨著我們收集的證據越多,我們越來越接近真理。
貝氏定理與條件機率有關。也就是說,這個定理會告訴我們如果某些事件發生之後,某個理論或假設為真的機率有多少。

貝氏定理背後的概念不是要我們只要更新一次機率的估計就好。而是說,隨著我們看到新的證據出現,我們就應該不斷地這樣做。

在人生大部分的領域中,最重要的是想出機率,而不是提出是與否。

任何預測模型的目標都在於捕捉到的訊號要盡量的多,雜訊要盡量的少。

「你的模型越複雜,預測就越差。」

在正式的用法上,「共識」(consensus)跟「一致同意」(unanimity)並不是同義字」」不是達到了單純的多數。共識隱含的是經過商議的過程後大體上意見一致」」在這段時間中,團體的大多數成員會統整成某個特定的想法或替代方案。(例如:「我們達成共識,要吃中國菜當午餐,但是賀拉修決定要吃披薩。」)
事實上,以共識為導向的過程通常代表的是投票的替代方案。

貝氏定理鼓勵我們,對自己衡量新資訊的方式要自我要求。要是我們的想法值得,我們就應該願意建立可以證偽的假設,用這些想法來提出預測,檢驗它。大多數的時候,我們不會去意識到資料中有多少雜訊,所以我們的偏差是會去太過著重最新的資料點。

但是我們如果在個人層面或專業層面上投注太多心力在某個問題上,也會有相反的偏差,在事實向我們提出挑戰的時候,沒有去挑戰自己的想法。

你越是經常願意去檢驗你的想法,你就越快會開始去避開這些問題,從你的錯誤中學習。

…… (其餘筆記放至google Docs上。)

留言

這個網誌中的熱門文章

小褶 Life(3) 古亭景美線段

經過上周的總統大選後,想說可以好好地規劃路線,這週末再來享受我的Bike Life,沒想到天氣預報一直恐嚇著我:「週末會下雨,週末會下雨,週末會下雨......。」 哇靠,早上起來,天色是有些陰暗,查了yahoo天氣,竟然下雨機率僅20%,趕緊重新考慮騎車的路線。 這次的目標是新店溪。 想說從哪邊切入比較好,唔,從師大路那邊進古亭河濱公園看來是不錯的選擇,要是下午真的下雨,就在師大路那邊晃一下午也比較安全。 查了google map,怪怪的,不知哪邊是公園的入口處。 不管了,到那附近再說,總有路口的。 結果是......迷路了。 -___-||| 到師大路跟兒童交通博物館那邊,就是看不到古亭河濱公園的入口。 沒辦法,走確定知道的路,以前新店上班時,總是從思源街接到景美堤外便道,果然,從那邊進去就對了。 (後來從古亭河濱公園也騎到中正河濱公園,才發現,那邊只有很小一條汽車進來的道路,真的很難找。 建議從思源街沿自來水廠那邊進來比較方便。) 就目前騎的3個線段而言,沿景美溪新店溪的河濱是最好騎的了,路又寬廣又平直,要飆車也容易。 看看地圖,只到舊橋就沒了,不知什麼時候才會完工咧...... 這樣,之後還可以直接騎到動物園咧!! 這個線段有較多的網球場地,靠古亭河濱公園那邊還有羽球場地,騎車的族群跟前兩次的線段比較起來,嗯,在地居民比較多(關渡到淡水則是遊客特多),應該是方便的緣故吧,騎Dahoon折疊車的人也比較多,莫非這附近有Dahoon專賣店?! 終點出來就到景美夜市一帶。 不錯的塗鴉作品。北市很多自行車道旁的圍牆,是開放給民眾塗鴉的。 (旁邊有 borther的簽名,莫非這是傳說中塗鴉客brother先生的作品?! 但......割腕的少女 ...... 繪在自行車道的旁邊,想表達什麼咧!?) 在終點處有很大的Taipei Cycling Mark。 雖然一開始有些小迷路,但也剛好繞到了兒童交通博物館......的外面,跟小丸子的看板合照。 門票太貴了,也聽有人說其實有些不值得,所以也不打算買票進去。 >___

能力並非來自於神來之筆

建立深度關係的關鍵是投入,經由時間與精力的累計,你與這一事物的關係日益深厚,你逐漸掌握了它,與它相遇,而能力,是你的存在與它的存在相遇的副產品。 事實上,能力差的人,常是太期待神來之筆的人。 具體來說就是,他們覺得,一旦某個事物被自己掌握,那首先是因為我掌握了自己;如果它沒有被掌握,那是因為我沒有掌握好自己。即,我狀態好,就可以讓周圍世界如我所願;我狀態不好,周圍世界就不能如我所願——倒推後其實是這句:當外界不如自己所願時,他們會在自己身上找原因,因他們認定,自己是能輕鬆掌控世界的,而狀態不好,就是能找到的最直接原因。 因這一邏輯,他們花很大力氣去調整狀態,還會花很多時間去等待自己狀態好,而不懂得,關鍵是持續投入,瑣細努力即可累積出成功。 能力是建立深度關係的副產品,而建立關係時,比努力更為關鍵的一點是,你不是自戀地將自己意願強加在這一事物之上的,而是臣服於這一事物。不是你個人太牛逼,所以掌握了這一事物,而是你臣服,放下自戀,放下預期和判斷,放空自己,然後你就可以與這一事物的存在相遇了。 能持續努力的人,是有了相對成熟的心理:我未必能立即掌握一個事物,但只要我持續努力,並且尊重這一事物自身的規律,我會與這一事物建立起很好的關係。 一旦有“我這個人失敗了”的感覺,一個人就會體驗到,伴隨著自我崩塌感的,是無力感,即你感覺暫時發不出力量了。其實,只是你暫時控制不了外部事物而已。 成功者會相對擁有更多神來之筆,但絕非“一直擁有”,且“神來之筆”之所以會有,是大量投入而與事物建立了關係的結果。 總結一下,要破除對“神來之筆”過於期待而不受挫的心理,需要懂得這樣幾點: 一、能力是建立了深度關係的結果; 二、建立深度關係需要持續的投入; 三、建立深度關係的關鍵,不是將你的自戀強加於事物之上,而是放下自戀想像,尊重事物本身的真實規律; 四、一件外部事物能否被我控制,取決於那一刻我的內部狀態,這是嬰兒式全能自戀心理的殘留; 五、一受挫,就覺得“我整個人不好”,也源自全能自戀心理——我和整個世界是一體的,所以我能控制一切,否則就意味著一切都是我控制不了的; 六、關鍵不是要神來之筆這種好的感覺,而是如何處理挫敗感。 -- 《巨嬰國》

GLOOMY BEAR 暴力熊

Gloomy Bear身世背景: Gloomy是一隻在路邊被遺棄的粉紅色小熊 , 被小朋友Pity發現,並將牠帶回家中收養, 並為小熊取名為Gloomy。 可惜.....Gloomy外表可愛,但因為被拋棄的緣故~卻有著一般熊的暴力性格, 長大長出爪子後就時常向主人用暴力招數打招呼, 而Pity就慘被Gloomy日日夜夜地欺負!悲慘ㄉ人生就這樣子開始囉!! 暴力熊喜好~咬主人頭, 而牠的主人,復原能力極高...打不死喔~厲害厲害! 暴力熊顏色:粉紅色,金色,銀色,紅色,藍色,黃色,還有罕見的綠色與混色。 粉紅色暴力熊性別:女 頭大身細,眼珠黑色,爪白色兼尖利,具有殺傷力,她多數用口爪殺人,殺完人後喜歡在街上徘徊。 小主人每次都被暴力熊揍得半死兼頭破血流, 但仍然不離不棄地緊緊抱住這隻血腥的寵物; Pity就算受到傷害亦要讓開心的回憶遮掩,然後繼續微笑期待小熊再次跟他一起溫習/做功課/看書;相信等待他的會是小熊的溫柔而非暴力傷害; 暴力熊和他小主人之間微妙的情感讓人感動又心酸; 這次轉輪科技所推出的暴力熊,內容包含小男孩Pity與粉紅熊Gloomy兩支一組。造形上善用Gloomy胖胖的軀體,將轉輪關節隱藏其中,全身有14處可動。可替換配件包含小男孩被打的表情,還有防止熊熊咬人的口罩以及牠嘴角流下來的血,原型制作為山口勝久。