지난 몇 년 동안 데이터 과학에 대한 일반 대중의 관심이 급증했습니다. 상당히 소수의 전문가만 이해하던 분야였던 것이 이제는 뉴스, 정치 및 국제법, 소셜 미디어 피드의 일반적인 화제가 되었습니다. 데이터 해독 능력이 모든 산업 분야에서 수요가 매우 높은 기술이 되고 있으며, 소비자들은 거대한 비즈니스 인텔리전스 시스템에 매일 데이터 요소를 입력합니다.
단지 데이터 열풍에 대한 최신 소식을 얻으려는 것이든, 데이터 과학 또는 데이터 해독 능력에 이르는 여정을 시작하려는 것이든, 이 문서에는 초심자가 데이터 과학의 세계를 탐험하는 데 도움이 되는 도서 목록이 나와 있습니다. 우리말로 번역된 책은 한글판 제목을 괄호 안에 표기했으며, 모든 책의 사이트는 영어 페이지로 링크됩니다.
1. “The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists”, 저자: Carl Shan, William Chen, Henry Wang 및 Max Song
저자: Carl Shan, William Chen, Henry Wang 및 Max Song
웹 사이트: The Data Science Handbook | Amazon
정보를 얻는 최고의 방법은 많은 경우에 해당 분야 종사자에게 직접 듣는 것입니다. 업계 최고의 전문가 25명의 이야기를 듣는 것보다 좋은 방법이 있을까요? ‘The Data Science Handbook’은 전 미국 최고 데이터 책임자부터 유망 기업의 팀 책임자, 직접 프로그램을 만드는 떠오르는 데이터 과학자에 이르기까지 업계를 선도하는 최고의 데이터 과학자들을 인터뷰하여 독자적인 업계 전망을 제안합니다.
이 책에 소개된 여러 인터뷰는 초보자에게 데이터 생활에 대한 조언을 제공하고, 시행착오를 통한 학습, 경력 개발을 위한 팁 그리고 데이터 과학 분야에서 성공하기 위한 전략 등을 통해 업계의 이모저모를 안내합니다. 이 책은 주제의 기술적인 측면을 철저하게 조사하거나, 혹은 모든 내용을 아우르는 안내서라기보다는, 실제적인 조언 및 인사이트를 수집한 것입니다.
2. “Doing Data Science: Straight Talk from the Frontline”(데이터과학 입문 - 구글, MS, 이베이 데이터과학자에게 배우다), 저자: Cathy O'Neil, Rachel Schutt
저자: Cathy O'Neil, Rachel Schutt
웹 사이트: O'Reilly | Amazon
‘데이터과학 입문’은 곧바로 요점부터 이야기합니다. 콜롬비아 대학의 데이터 과학 입문 강의를 바탕으로 이 분야에 진출하려고 고려 중인 초보자를 대상으로 합니다. 데이터 과학 컨설턴트인 Cathy O’Neil이 강좌의 강사인 Rachel Schutt와 협업하여 데이터 과학 강좌를 일반 대중에게 제공합니다.
이 전문가들은 주제에 관한 박식한 강의를 제공할 뿐만 아니라, 이해하기 쉬운 사례를 찾아 관련 사례 연구 및 코드를 공유합니다. 알고리즘, 방법, 모델 및 데이터 시각화에 대해 다루며 많은 사람이 즐겨 찾는 실용적인 기술 리소스가 됩니다.
3. “Numsense! Data Science for the Layman: No Math Added”(수학 없이 배우는 데이터 과학과 알고리즘 - 모두를 위한 데이터 사이언스), 저자: Annalyn Ng, Kenneth Soo
저자: Annalyn Ng, Kenneth Soo
웹 사이트: Amazon
데이터 과학은 수학과 많은 관련이 있어서, 데이터 과학이 이해하기 어렵고 벅찬 것으로 보일 수 있습니다. ‘Numsense’는 독자가 자신감을 잃지 않고 이해하기 쉽도록 비전문가의 용어로 쓰인, 데이터 과학 및 알고리즘에 대해 수학은 잘 몰라도 되는 입문서 역할을 약속합니다.
각 장에 하나의 유용한 특정 알고리즘을 할당하고 작동 방식과 실제 사용을 볼 수 있는 사례로 세분화하여 설명합니다. 이해하기 쉽도록 프로세스에 대한 시각적 자료가 딸려 있습니다. 참고 자료에는 각 알고리즘의 장단점이 자세히 나와 있으며, 책의 끝에는 일반적인 데이터 과학 용어를 담은 유용한 용어집도 있습니다.
4. “The Art of Data Science”, 저자: Roger D. Peng, Elizabeth Matsui
저자: Roger D. Peng, Elizabeth Matsui
웹 사이트: Amazon
‘The Art of Data Science’는 손쉽게 데이터의 호수에서 탐색하고 발견하는 실례를 주내용으로 합니다. 데이터를 분석하고 필터링하여 데이터 뒤에 있는 스토리를 찾아내는 과정에 초점을 맞춥니다. 저자는 데이터 과학 분석을 통해 초보자와 관리자 입장 각각에 맞게 조언하는 데 자신의 실제 경험을 활용합니다.
두 저자 모두 직접 데이터 프로젝트를 관리해 보았고, 또한 직장에서 분석가를 관리한 경험도 있습니다. 성공적인 결과를 확실히 이끌어 내는 방법과 데이터 프로젝트를 실패에 빠뜨리는 함정에 대해 자신들의 실제 경험을 들려 줍니다.
5. “Data Science For Dummies”, 저자: Lillian Pierson
저자: Lillian Pierson
웹 사이트: Amazon
쉬운 용어로 개념을 잘 알려주는 것으로 유명한 ‘Dummies’ 시리즈의 하나로, ‘Data Science For Dummies’도 같은 목표를 갖습니다. 데이터 과학의 비즈니스 측면에 더 초점을 맞추어, 전문가로서 이 분야에 들어서는 입문자용 안내서 역할을 합니다. 독자가 빅 데이터 개념에 익숙해지는 데 필요한 지식 분야와 데이터 과학이 실생활에 어떻게 적용될 수 있는지에 대한 광범위한 개요를 제공하는 초보자용 리소스입니다.
또한 데이터 엔지니어링, R, Python 같은 프로그래밍 언어, 기계 학습, 알고리즘, 인공 지능, 데이터 시각화 기법과 같은 주제도 개략적으로 다룹니다. 데이터 과학에 대해 잠시 호기심이 생겼거나, 아니면 부모님께서 데이터 과학의 요지라도 아시기를 바란다면, 이 책부터 보는 것이 좋을 것입니다.
6. “Big Data For Dummies”, 저자: Judith Hurwitz, Alan Nugent, Fern Halper, Marcia Kaufman
저자: Judith Hurwitz, Alan Nugent, Fern Halper, Marcia Kaufman
웹 사이트: Amazon
데이터 과학을 주제로 한 책을 살펴보고 있긴 하지만, 빅 데이터의 개요 및 중요한 이유에 대한 ‘dummies’ 시리즈 책도 나와 있습니다. 이 책에서는 ‘빅 데이터란 무엇인가?’라는 중심 질문을 다루고 기술 및 비즈니스 두 개의 관점에서 개념을 설명합니다. 비즈니스 인텔리전스에서 빅 데이터가 어떻게 사용되는지와 분석가가 문제를 발견하고 해결하는 데 빅 데이터가 어떻게 도움이 되는지 보여줍니다.
이 책은 또한 수집하는 데이터를 구성 및 지원하는 방법과 데이터 분석에 맞게 방법 및 도구를 조정하는 방법에 대한 기술적인 조언도 제공합니다. ‘Big Data for Dummies’는 데이터가 의미하는 바, 데이터 이용 방법 및 비즈니스 환경에서 적용하는 법을 알아낼 수 있도록 지원하기로 약속합니다.
7. “Data Jujitsu: The Art of Turning Data into Product”, 저자: DJ Patil
저자: DJ Patil
웹 사이트: Amazon
데이터 과학에 대한 조언을 한 명에게서 듣는다면, 백악관 과학기술정책실의 전 최고 데이터 과학자에게 묻는 것이 나쁠 것은 없겠습니다. DJ Patil은 ‘데이터 과학’이란 용어를 만든 장본인으로 알려져 있는데, ‘Data Jujitsu’라는 책에서 데이터 과학을 문제를 해결하려는 사고 방식으로 소개합니다.
데이터에서 촉발된 산업에서 발견된 다양한 문제를 강조하며, 단지 해결하기 어려울 뿐인 문제와 불가능한 문제 간에 차이가 있다고 말합니다. 복잡한 문제인 경우 간단한 부분으로 분해하고 데이터 분석을 사용하여 검토함으로써 해결할 수 있습니다. ‘Data Jujitsu’는 매우 다양한 사례와, 데이터의 힘을 활용하기 위한 조언을 다루고 있습니다.
8. “Big Data: A Revolution That Will Transform How We Live, Work, and Think”(빅 데이터가 만드는 세상 - 데이터는 알고 있다), 저자: Viktor Mayer-Schönberger, Kenneth Cukier
저자: Viktor Mayer-Schönberger, Kenneth Cukier
웹 사이트: Amazon
빅 데이터가 뉴스에 오르내리지 않는 날은 없을 것으로 보입니다. 데이터를 우선하는 회사가 더 많은 권력을 잡고, 데이터 누출 및 개인 및 은행 정보 유출이 발생하며, 정책 토론이 거세게 진행되고, 데이터 개인 정보 보호 관련 규정이 법률안으로 채택됩니다. 이 책은 비즈니스부터, 개인, 정부 및 개별적인 과학 과목에 이르기까지 우리 생활의 거의 모든 측면에 미치는 데이터의 영향에 대해 논의하는 것을 목표로 합니다.
Mayer-Schönberger와 Cukier는 어떻게 알고리즘이, 단지 온라인상의 습관을 분석하는 것만으로 누구도 몰랐다고 생각되는 우리 자신에 관한 사실을 밝혀내는지에 관해 설명합니다. 온라인 소매업체는 검색 기록을 바탕으로 제품을 추천하고 구매 패턴을 예측하며, 소셜 미디어 피드는 정치적인 편견을 겨냥하고 반향실 효과를 노립니다. 데이트 앱조차도 데이터를 사용하여 연애에 대해 조언합니다. 데이터베이스의 개인 정보 인식 내용을 제한하는 조치를 취할 때에는 데이터가 계속 올바르게 사용되고 있는지에도 주의를 기울여야 합니다. 이 책에서는 우리의 데이터가 우리를 움직이고 결정할, 그리고 이미 그렇게 하고 있는, 두렵고, 유용하면서도 완전히 흥미로운 방법에 대해 논의합니다.
고지 사항: Tableau는 이 문서에 나열된 제품 또는 그 안에 나온 의견을 공식적으로 홍보하거나 그로 인한 이득을 얻지 않으며 그와 같이 이 페이지는 제휴사 링크 프로그램을 포함하고 있지 않습니다. 이 문서는 순수하게 교육 목적으로 만들어졌으며 제품 및 출판물에 대한 위의 정보는 독자가 스스로 정보에 기반한 결정을 내릴 수 있도록 제공하는 것입니다.