適合初學者閱讀的 8 本資料科學書籍

在過去的幾年中,公眾對資料科學的興趣激增。以往相當神秘的領域現在成為新聞、政治和國際法以及我們社交媒體消息中常見的話題。資料素養逐漸成為每個產業中高度需求的技能,而且消費者每天都將資料點輸入到巨型商業智慧系統中。

無論您只是想要持續掌握資料熱潮,還是想要開始學習資料科學或培養資料素養,本文都提供一系列書籍幫助新手索資料科學的世界。

1.《The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists》,作者:Carl Shan、William Chen、Henry Wang 和 Max Song

作者:Carl Shan、William Chen、Henry Wang 和 Max Song
網站:The Data Science Handbook | Amazon

獲得資訊的最佳方法通常直接向專業人士請教,還有什麼方法比與 25 位業界頂尖專家交談更有用?《The Data Science Handbook》採訪了頂尖的資料科學家,從前任美國資料長到著名企業的團隊領導人,乃至於建立本身計畫的資料科學家新秀,藉以提供深入這個產業的獨特觀點。

這些精選的採訪內容將引導新手熟悉整個產業,提供資料生活建議、學習錯誤、職業發展提示以及在資料科學領域獲得成功的策略。這本書並未深入探討資料科學的各個技術層面,也沒有嘗試提供面面俱到的指南,而是提供大量實用的建議和見解。

2.《Doing Data Science: Straight Talk from the Frontline》,作者:Cathy O'Neil 和 Rachel Schutt

作者:Cathy O’Neil 和 Rachel Schutt
網站:O’Reilly | Amazon

《Doing Data Science》直接切中要點。這本書以哥倫比亞大學的「Introduction to Data Science」(資料科學概論) 課程為基礎,適合希望進入該學科的任何初學者閱讀。資料科學顧問 Cathy O’Neil 與課程講師 Rachel Schutt 合作,讓一般民眾學習資料科學課程。

這些專家不僅提供有關這個主題的知識性講座,而且也分享相關的案例研究和程式碼,並深入研究可用的範例。這本書所涵蓋演算法、方法、模型和資料視覺化,都是相當實用的技術資源。

3.《Numsense! Data Science for the Layman: No Math Added》,作者:Annalyn Ng 和 Kenneth Soo

作者:Annalyn Ng 和 Kenneth Soo
網站:Amazon

資料科學與數學息息相關,因此讓人望之卻步。這本書以淺顯易懂的術語,透過較少依賴數學的方式來介紹資料科學,讓資料科學變得不再令人恐懼且更容易瞭解。

每章都專門介紹一種特殊實用的演算法,而且詳細介紹其運作原理和實際範例,以供瞭解實際使用情況。每個部分都有視覺化內容,讓讀者更容易瞭解。本書的參考資料表中詳細介紹每種演算法的優缺點,並附上常用資料科學術語的簡便詞彙表來補強內容。

4.《The Art of Data Science》,作者:Roger D. Peng 和 Elizabeth Matsui

作者:Roger D. Peng 和 Elizabeth Matsui
網站:Amazon

《The Art of Data Science》深入探討您隨時可以使用的大量資料,並從中探及索獲得見解。本書重點介紹如何分析資料並進行篩選,藉此找出資料背後的故事。作者運用本身的經驗,透過分析資料科學引導初學者和管理人員。

兩位作者都擁有管理資料專案以及在專業環境中管理分析員的經驗。作者討論本身的經驗,說明哪些做法將確實產生成功的結果,以及哪些陷阱會導致資料專案必然失敗。

5.《Data Science For Dummies》,作者:Lillian Pierson

作者:Lillian Pierson
網站:Amazon

「Dummies」系列一直擅長運用平實簡單的術語講解概念,而《Data Science For Dummies》也同樣力求做到這一點。這本書更著重於資料科學的業務層面,而且可做為進入專業領域的入門指南。這是適合初學者的資源,其中廣泛介紹該學科,讓讀者熟悉大數據的概念,以及資料科學在我們的生活中應用的方式。

本書也廣泛探討資料工程、R 和 Python 之類的程式語言、機器學習、演算法、人工智慧和資料視覺化技術等主題。如果您對資料科學感到好奇,或只是希望您的父母瞭解這門科學,這會是不錯的起點。

6.《Big Data For Dummies》,作者:Judith Hurwitz、Alan Nugent、Fern Halper 和 Marcia Kaufman

作者:Judith Hurwitz、Alan Nugent、Fern Halper 和 Marcia Kaufman
網站:Amazon

討論「傻瓜」的資料科學主題時,還有一本對大數據及其重要性進行概述的書籍。本書探討中心問題「什麼是大數據?」,並且從技術和業務角度解說這個概念。這本書解說如何在商業智慧中使用大數據以及如何協助分析師發現和解決問題。

此外,這本書也提供有關主題的技術建議,例如如何理和支援您收集的資料,以及如何調整方法和工具來分析資料。《Big Data For Dummies》可以協助您釐清資料的含義、如何處理資料以及如何在業務環境中運用資料。

7.《Data Jujitsu: The Art of Turning Data into Product》,作者:DJ Patil

作者:DJ Patil
網站:Amazon

如果您想要獲得一個人提供的資料科學建議,可以向美國科技政策辦公室前任首席資料科學家請益。DJ Patil 是「資料科學」這個詞的公認發明者,在《Data Jujitsu》中,Patil 引入資料科學做為解決問題的思維方式。

作者重點介紹在資料導向產業中發現的不同問題,同時也指出,有些問題只是不容易解決,不是不可能解決。複雜的問題可以透過細分為簡單的部分並使用資料分析進行檢查加以解決。《Data Jujitsu》針對如何駕馭資料力量提供了多種範例和建議。

8.《Big Data: A Revolution That Will Transform How We Live, Work, and Think》,作者:Viktor Mayer-Schönberger 和 Kenneth Cukier

作者:Viktor Mayer-Schönberger 和 Kenneth Cukier
網站:Amazon

大數據似乎總是佔據新聞版面。資料至上的公司重要性更加提升、資料外洩以及個人和銀行資訊洩露的情況持續發生,各方展開激烈的政策爭辯,因此資料隱私成為法律。本書主要探討資料對我們生活幾乎所有層面所產生的影響,從企業到個人,甚至從政府到個人科學領域。

Mayer-Schönberger 和 Cukier 說明演算法為何只要分析我們上網的習慣,就能揭露我們認為沒有人知道、關於我們自己的事實。線上零售商可以依據瀏覽的情況來建議產品或預測購買方式,社交媒體摘要可以針對我們的政治傾向和同溫層效應進行發文。甚至約會應用程式也會使用資料來塑造愛情生活。在採取措施來控制資料庫中的個人資訊時,我們也必須注意資料掌握在正確的人手中。這本書討論我們自己的資料將 (而且已經在) 如何以可怕、特別且有趣的方式改變並影響我們。

免責聲明:Tableau 不為本文列出的任何產品或其中的觀點提供官方背書,也未因其而受益,因此本頁面並未加入任何關聯連結計劃。本文僅供教育目的,我們提供上述關於產品和出版物的資訊,目的在於協助讀者可以自行做出明智的決定。