學習Big Data 的幾本書

兩年內看了幾十本 Big Data 技術相關書籍，試了十幾個技術框架，把覺得對我有幫助的書籍分享一下。

Big Data 系統環境的建置，觀念都在這三本說了:

巨量資料的下一步：Big Data新戰略、技術及大型網站應用實錄
Big data principles and best practices of scalable realtime data systems (by Nathan Marz)
NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence

主架構上就是使用 Hadoop、MongoDB，不寫為什麼不是Cassandra或是HBase，有故事的。

Real-Timeprocess則是使用Storm / Fluentd / Kafka / Redis，也不用問為什麼不是flume / logstash / Spark，都有用過，一樣有故事，先選如上架構就是。

也不解釋Storm vs. Spark ，會這樣問的都是兩種架構都沒玩過的人，試過就知道，各有其擅長場景，Spark目前個人還是先用在 ML或ETL部分。

MongoDB: The Definitive Guide
Hadoop: The Definitive Guide , 4th
Scaling MongoDB - 50 Tips and Tricks for MongoDB Developers
Hadoop实战(第2版) 陆嘉恒
Storm Blueprints: Patterns for Distributed Real-time Computation
Storm Real-time Processing Cookbook
Learning Apache Kafka - Second Edition
Redis入门指南（第2版）

資料分析，先試了R，嚴格說起來，R看的書還比Python的多，這邊推薦的只是個人偏好問題。

Agile Data Science: Building Data Analytics Applications with Hadoop
Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython
Machine Learning in Action
Machine Learning with R

為了快速部署及設定，於是又去搞了Docker，發現尚未成熟(當時使用 ver 1.5)，所以還是先回Vagrant使用，加上Ansible，可以加速實驗環境的產生及配置。(好吧，我就是看puppet / chef 不習慣......)

clip_image002[4] clip_image004 clip_image006

The Docker Book: Containerization is the new virtualization
Vagrant: Up and Running
Ansible: Up and Running

Big Data System 太深了，花了近18個月，弄了幾十個實驗，才有架構設計上的sense，至於數據分析方面，花了幾個月，也只能說「略懂」、「略懂」。

耗了不少精力，只能說公司若要搞Big Data，起碼需要一個小隊。

一般大數據商業應用思考的書，可看：

大數據的獲利模式
大數據的關鍵思考
大數據時代的致勝決策
BigData讓你看見真實慾望
精準預測：如何從巨量雜訊中，看出重要的訊息？
大數據
開放資料大商機
預測分析時代

clip_image002[6] clip_image004[4] clip_image006[4] clip_image008[4]

另外，哈佛商業評論某期中有一篇：誰需要巨量資料，也很值得閱讀。

留言

這個網誌中的熱門文章

Alison Krauss的『When you say nothing at all』

你一定聽過這首歌:When you say nothing at all，不論你是看了『Notting Hill』或是喜歡『男孩特區』，你聽到的可能是Ronan Keating的版本。最近在聽『Various.Artists.-.[Best.Audiophile.Voices.III]』，裡面有Alison Krauss演唱的版本，我的老天，沒蓋你，馬上把這首歌納入我的經典歌曲集。誰是Alison Krauss呢? 以下是她的介紹(擷自Very-CD): 多次被評為世界最美的女聲，坐擁 11 座格萊美獎，代表歌曲包括 When You Say Nothing At All 和《冷山》中那首動人的 The Scarlet Tide 等等。在和"聯合車站"樂隊的合作後，Union Station 的 Bluegrass 威力又把她往前推了一把，讓已經擁有翅膀的Alison 又添加一道光環。當一位鄉村電臺 DJ 某天在節目中播放 Alison 精選專輯主打歌 When You Say Nothing At All 後，每天如浪潮般的點歌頻率，開啟了鄉村音樂的一個新傳奇。 Alison 在 1995 年與 Union Station 合作的精選大碟，曾是鄉村音樂排行榜第 2 名、流行音樂專輯第 15 名，全美銷量達二百萬張，這對於一個鄉村歌手而言，是相當大的數目。不過與其說專輯得到如此多的成功是個意外，不如承認 Alison 無可否認十分甜美的歌喉，及用心演唱的態度，才是讓她長久以來受歌迷肯定的主要原因。 16歲時，Alison Krauss 與美國鄉村音樂最重要的獨立唱片公司 Rounder 簽約，發行的第一張個人專輯，立刻成為樂評家的最愛。 18 歲首度獲得葛萊美獎，之後又繼續獲得無數鄉村音樂獎項，其中包括 11 項葛萊美獎，總總的榮耀應該都是因為她從小苦學古典小提琴、民謠小提琴及歌唱技巧。樂評家均認為 Alison Krauss and Union Station 從 80 年代末至 90 年代中，將草根藍調音樂從地方性音樂帶領成為全世界均能接受的樂風，在樂壇佔有舉足輕重的地位。 1999年，Alison Krauss 的專輯《Forget About It》成為金唱片。一年後，她因在《O Brother ，Where Art You》...

GLOOMY BEAR 暴力熊

Gloomy Bear身世背景： Gloomy是一隻在路邊被遺棄的粉紅色小熊，被小朋友Pity發現，並將牠帶回家中收養，並為小熊取名為Gloomy。可惜.....Gloomy外表可愛，但因為被拋棄的緣故~卻有著一般熊的暴力性格，長大長出爪子後就時常向主人用暴力招數打招呼，而Pity就慘被Gloomy日日夜夜地欺負！悲慘ㄉ人生就這樣子開始囉!! 暴力熊喜好～咬主人頭，而牠的主人,復原能力極高...打不死喔～厲害厲害! 暴力熊顏色：粉紅色，金色，銀色，紅色，藍色，黃色，還有罕見的綠色與混色。粉紅色暴力熊性別:女頭大身細，眼珠黑色，爪白色兼尖利,具有殺傷力，她多數用口爪殺人，殺完人後喜歡在街上徘徊。小主人每次都被暴力熊揍得半死兼頭破血流, 但仍然不離不棄地緊緊抱住這隻血腥的寵物; Pity就算受到傷害亦要讓開心的回憶遮掩,然後繼續微笑期待小熊再次跟他一起溫習/做功課/看書;相信等待他的會是小熊的溫柔而非暴力傷害; 暴力熊和他小主人之間微妙的情感讓人感動又心酸; 這次轉輪科技所推出的暴力熊，內容包含小男孩Pity與粉紅熊Gloomy兩支一組。造形上善用Gloomy胖胖的軀體，將轉輪關節隱藏其中，全身有14處可動。可替換配件包含小男孩被打的表情，還有防止熊熊咬人的口罩以及牠嘴角流下來的血，原型制作為山口勝久。

明天是晴天嗎(明日晴れるかな)

因為最近的日劇：求婚大作戰，才聽到這首歌的。桑田佳祐的"明日晴れるかな"。歌詞的內容跟劇情還蠻貼切，求婚大作戰就劇情而言不是頂好的，但題材相當有趣，令人反省的地方也頗多。很多時候很多事，如果再來一次，我們會怎麼選擇怎麼做？這MV不同於日劇的片尾MV：中文歌詞如下：明天是晴天嗎　作詞:桑田佳祐　作曲:桑田佳祐　編曲:桑田佳祐島健炙熱的淚呼喚著愛　曾經閃爍的歲月也迷失了方向明天我依舊徘徊在街頭　沒有回頭路可走側耳傾聽心靈深處是什麼在私語　獨自躲在昏暗的街頭回首當日的天空　上帝賜予我們孤獨與試煉想哭就要放聲大哭　難道是命中注定叫人不敢面對日覆一日不可思議　Oh baby No maybe 愛已走遠情已不再　我只能佯裝嘆息將怨恨拋給這世界　Oh baby you are maybe 憂喜交織幸福的feeling　抱緊我 one more time 珍惜曾經的我　讓回憶刻骨銘心往事已經隨風人生路還漫長只為見證夢想　誰來開啟奇跡之扉? 多想再一次觸碰你的笑顏　不知你是否發現命運的鑰匙就握在你手中 Why baby? Oh tell me　愛恨纏綿假裝視而不見　只為能守護在愛人身邊 Oh baby you are maybe 距離勝負僅一步之遙　站在崩潰邊緣的feeling 我想穿越 one more chance I talk to myself　Oh baby No maybe 愛已走遠情已不再　輕輕的嘆息背後只留下深深的悔恨 Oh baby Smile baby 生命轉瞬即逝每個人都在心中默默祈禱明天是晴天嗎　在那遙遠的天空下這些是有趣的文章：釋日劇《求婚大作戰》中的「哈利路亞」劇情解釋

Krilo Life

搜尋此網誌