值得关注的 10 个最佳数据科学博客

数据科学方面的优秀资源有很多,但是可能会让人有些不知所措,不知道要从哪里着手。本文将为大家列出一些最有用的博客和网站,涵盖从数据科学专家到新手的水平。除了提供建议和学习资源之外,此数据科学博客列表中还包含许多网站,您可以通过这些网站了解最新新闻、趋势和专业人士的意见。

如果您刚刚入门,并且想了解有关主题的更多信息,请查阅我们为初学者提供的有关数据科学的优秀书籍列表(链接)。

1.Data Science Central

运营者:Vincent Granville
网站链接:DataScienceCentral.com

Data Science Central,顾名思义,是与数据科学和大数据相关的所有内容的在线资源中心。该站点涵盖了有关分析、技术、工具、数据可视化、代码和工作机会的各种数据科学主题。行业专家会提供关于关键主题的讨论和见解。

该站点更新频繁,几乎每天都有两篇由特约作者撰写的博客文章,并且提供了一个供讨论或提问的社区论坛。

2.SmartData Collective

运营者:Social Media Today
网站链接:SmartDataCollective.com

SmartData Collective 是一个专注于商业智能和数据管理趋势的社区站点。与 Data Science Central 类似,它也可以通过行业专家的参与来提供关于数据科学的见解。Data Science Central 直接关注整个数据科学,而 SmartData Collective 着眼于更广泛的领域以及数据科学与业务的结合方式。

3.What's The Big Data?

运营者:Gil Press
网站链接:WhatsTheBigData.com

What's The Big Data? 采取了数据科学的其他方法,专注于大数据演变为当今的巨型规模所带来的影响。该博客的创始人 Gil Press 非常熟悉大数据和数据科学,他曾从事数据研究工作,现在从事咨询业务。

Press 在他的博客中探讨了大数据如何与我们的生活交互,以及如何对从技术到商业再到政府和政策的一切产生影响。他提供了数据领域的新闻和评论来源。

4.No Free Hunch

运营者:Kaggle
网站链接:Blog.Kaggle.com

该博客与其他博客略有不同,它直接探索数据科学家思想并提供教程和新闻。这是数据科学网站 Kaggle 的博客,该网站主办了多个数据科学项目和竞赛,在竞赛中,数据科学家需要为特色数据集生成最佳模型。组织可以发布数据问题,并提供一定金额的奖励,数据专业人员将参加竞赛,提出解决办法。众包可确保实验具有创新性和趣味性,并提供了很多值得学习的观点。

该网站已经组织了 200 多场竞赛,其中包括一些引人注目的竞赛,例如改进 Microsoft Kinect 手势识别、改进 CERN 对希格斯玻色子的搜索,以及众所周知的 Heritage Health 300 万美元奖金(用于改进对需要去医院看病的患者的预测)。Kaggle 的官方博客更深入地介绍了这些竞赛,对获胜者进行了采访,讨论了他们解决数据科学问题的方法。该博客还为所有水平的数据科学爱好者提供新闻和教程。

5. insideBIGDATA

运营者:Rich Brueckner
网站链接:InsideBIGDATA.com

InsideBIGDATA 专注于数据科学的机器学习方面。它涵盖了 IT 和商业中的大数据、机器学习、深度学习和人工智能。嘉宾访谈提供了行业角度的见解,而新闻和编辑精选文章则重点介绍了该领域的重要事件。所有文章都按主题整齐地分类,以便聚焦于某一特定主题。该博客还维护了大量事件、工作和研究报告等的资源。该资源适用于任何想要了解有关机器学习最新知识的人。

6.Simply Statistics

运营者:Jeff Leek、Roger Peng 和 Rafa Irizarry
网站链接:SimplyStatistics.org

如果您无法获取足够的统计数据,那么该博客是您的理想选择。该博客由三位生物统计学教授运营,提供大数据方面的大量统计数据,并介绍了各个领域的数据科学家如何使用这些统计数据,他们三人也分别介绍了各自领域的使用情况。对于任何想要投身该行业的新统计学家,他们还提供了对数据科学家的采访,探讨他们的职业和在行业中的角色。

7.Datafloq

运营者:Mark Van Rijmenam
网站链接:Datafloq.com

Datafloq 由 Mark Van Rijmenam 运营(他著有《Think Bigger: Developing a Successful Big Data Strategy for Your Business》一书),该网站是数据科学中大数据的优秀资源。该博客侧重于大数据的商业方面以及如何使数据科学为组织所用。它还提供有关热门技术主题的信息,例如区块链和人工智能。尽管 Datafloq 在很大程度上是文章和见解的资源,但它也寻求通过职位发布、供应商、活动和培训来吸引专业人员。

8.Data Science 101

运营者:Ryan Swanstrom
网站链接:101.DataScience.Community

对于任何想要进入数据科学领域的人来说,这里是很好的开始。Ryan Swanstrom 曾为 Microsoft、Wells Fargo 和政府国防承包商效力,从事数据科学工作。他目前担任 Unify Consulting 的数据科学主管,从事咨询工作。在此博客中,他分享了如何成为一名成功的数据科学家的宝贵经验、技巧和建议。该博客可以追溯到 2012 年,包含大量档案,值得深入研究,以了解最近几年数据科学讨论方面的实践历史。

9.Dataconomy

运营者:Dataconomy Media
网站链接:Dataconomy.com

Dataconomy 是面向未来数据科学家的另一资源。它提供常规的大数据新闻、技术趋势以及行业专家的述评。但它与其他数据科学中心的不同之处在于,它拥有用于在数据科学领域创建事业的资源。该站点提供免费的 IT 研究库和初学者入门指南。对于从业人员和希望取得职场进一步发展的人士,它还提供职位公告板和候选者数据库。

10.Data Science Report

运营者:Starbridge Partners
网站链接:StarbridgePartners.com/Data-Science-Report

在深度资源方面,Data Science Report 整理了各种格式的资源,以便您深入了解数据科学。该站点收集了免费课程、文章、书籍、视频和 TED 演讲,以帮助各种水平的数据科学家。您可以通过筛选主题来查找关于入门、薪资谈判、面试、技术、社交媒体、市场营销以及“纯粹有趣”的主题的精选信息。该资源中心适用于处于职业生涯任何阶段的数据科学家以及任何想要了解数据的人。