跳到主要內容

發表文章

目前顯示的是 9月, 2014的文章

隨機騙局

Fooled by Randomness 隨機騙局:潛藏在生活與市場中的機率陷阱 塔雷伯(Nassim Nicholas Taleb)的書。 他的《黑天鵝效應》算是幾年前讓我的思考模式大進化的一本好書,後來的《反脆弱》其實比較硬,不是那麼好讀。 《隨機騙局》算是他的成名之作,不過台灣出的是更新二版。 這三部曲建議讀的順序是:《隨機騙局》、《黑天鵝效應》、《反脆弱》。 本書中,機率主要是應用懷疑論的分支,不屬工程學門(儘管數學妄自尊大,喜歡處理這個主題,但是和機率微積分有關的問題,價值只能作為註腳而已)。 怎麼做呢?機率不只用於計算骰子每一面出現的機率,或者更為複雜的變化用途﹔它是指接受我們的知識缺乏確定性,並且發展各種方法以處理我們的無知。 作者的整個事業生涯,都在抨擊機率的計量使用。 本書的觀念是「 事情比我們所想的要隨機 」,而不是「一切事情都隨機」。 《有錢人想的和你不一樣》指出,他研究最深、超過一千位百萬富翁的具代表性群組,並沒有在他們的童年展現高智力,因此推斷並不是你的天賦使你富有----而是勤奮工作造成的。從這裡,可以天真地推論機運在成功中並未扮演任何角色。 我的直覺是,如果百萬富翁的屬性接近一般人,我會做出更令人不安的解釋,說那是因為運氣發揮了某種作用。運氣是民主的,不管原來的技能為何,都會降臨在每個人身上。作者點出百萬富翁和一般人不同的一些特質,例如韌性和勤勞。這是混淆必要和因果的另一個說法。就算所有的百萬富翁都是執著、勤奮的人,並不會使執著的勤奮工作者成為百萬富翁。 許多不成功的創業家也是執著、勤奮的人。作者在天真經驗主義的教科書個案中,也尋找這些百萬富翁共同具備的特質,並且研判他們都喜歡冒險犯難。冒險犯難顯然是大獲成功的、必要條件----卻也是失敗的、必要條件。要是作者對破產公民做相同的研究,肯定會發現他們也喜愛冒險犯難。 ( 存活者偏誤 ) 我們的缺陷是無法修復的,至少就這個環境來說是如此----不過,只有相信理想化人類存在的空想家,才會覺得這是壞消息。目前的思維有以下兩種南轅北轍的人類觀點,它們之間幾乎沒有其他見解。一邊是本地學院的英語教授;二十步快樂術和一星期成為更好的人的秘訣作家。這稱作烏托邦觀點,他們相信合理和理性----我們應該克服路上的文化障礙,成為

轉身不踏來時路

「要離開這地方的決心,令人覺得堅固得一時無法動搖,那是經過長時間從各種角度檢討而得的結論, 好像已經沒有任何漏洞的樣子,擦亮了火柴, 燒 掉了橋樑,因此連留在心裡的東西也消失了。 街頭或許還殘留些許自己的影子,可是誰也不會留意,而這地方將會繼續改變下去,終於連那 影子 的蹤跡也會消失……。 覺得一切都將順利地往前推進。……」 《1973年的彈珠玩具》--村上春樹

預測分析時代

  預測分析時代:讓數據告訴你,誰會買、誰說謊、誰會離職、誰會死! Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die 這本書其實不如預期中的好看,當初是看在「 Amazon 商業分類 No.1 」的廣告下買的,不過在machine learning的不少觀念確實改變了我舊有的思維,幫助不可謂不大。 對於big data有興趣的,可順便參閱舊文「 統計學,最強的商業武器 - 筆記 」。 預測建模流程是一種從訓練實例學習,自動處理資料的作業,所以必須將肯定個案和否定個案都包含在內。 預測分析的目標是改善作業效率,而不是為了搞清楚人們的意圖。  ==> 這有巧妙的避開倫理爭議 每個組織必須決定資料的人、事、時、地、儲存期間和原因: 保留--儲存什麼及儲存多久。 取用--哪些員工、哪類人員或團體成員可以取得並檢視哪些資料要素。 分享--要散播什麼資料、散播給組織裡的哪些團體和哪些外部組織。 合併--哪些資料要素可以加以彙整或結合。 反應--如何依據各項資料要素決定組織的反應、對外拓展或其他行為。 偏見有循環性,是一種自我應驗的預言,而且這種循環會因為運用預測分析而受到強化。 扼殺機器學習的元凶就是 過度學習 (或稱過度擬合〔overfitting〕)。 過度學習是指誤把雜訊當資訊,對於資料已顯示的訊息做過多的報設。如果你針對數字做過多的解讀,你就會過度學習,越走越偏,無法發現資料潛藏的事實。 機器學習的目的是歸納(induction) :歸納----從詳細事實到一般通則的推論。 不過,可別把歸納跟演繹(deduction)混為一談,因為兩著恰好相反: 演繹----從通則到特定個案的提論(或說是從因到果的推論)。 演繹通常比較直截了當,只是應用已知知規則。舉例來說,如果所友人都會死,蘇格拉底是人,演繹法告訴我們,蘇格控底也會死。 歸納是一種藝術形式,我們手中握有世界如何運作的縮影:資料把發生過的事情詳實記錄下來。我們設法能資料中尋找概論,獲得重要推論,找出在未知的情