10本免费机器学习与数据科学电子书

这是一份快速整理出的书单,可以祝您顺利地踏上学习之路。该书单从统计学基础开始,进阶至机器学习基础,然后扩展到几个更大的话题,先是对高级话题进行快速概览,最后再对全部内容加以总结。书单中既有经典话题,也有当代的前沿话题,希望你能在其中找到感兴趣的话题。

1.《统计思考:面向程序员的概率和统计》 (Think Stats: Probability and Statistics for Programmers)

http://www.greenteapress.com/thinkstats/

作者:Allen B. Downey

本书是对面向Python程序员的概率和统计的介绍。

本书重点讨论了可以用来探索真实数据集并回答有趣问题的简单技术。该书使用美国国立卫生研究院(NIH)的数据提供案例研究。鼓励读者从事具有真实数据集的项目。

2.《面向黑客的概率编程和贝叶斯方法》 (Probabilistic Programming & Bayesian Methods for Hackers)

http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/

作者:Cam Davidson-Pilon

一本从计算/理解第一,数学第二的视角,对贝叶斯方法和概率编程的介绍性著作。

贝叶斯方法是推理的自然方法,但是对读者而言,该方法隐藏在漫长繁杂的数学分析步骤之后。一般关于贝叶斯推理的典型教材要花二到三章的篇幅讲概率论,然后才进入贝叶斯推理。遗憾的是,由于大多数贝叶斯模型的在数学上难以处理,所以一般只对读者给出简单、人造的例子。这可以让用户对贝叶斯推理有一种“不过如此”的感觉。实际上,笔者以前就是如此。

3.《理解机器学习:从理论到算法》( Understanding Machine Learning: From Theory to Algorithms)

http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/

作者:Shai Shalev-Shwartz,Shai Ben-David

机器学习是计算机科学发展最快的领域之一,诞生了广泛的应用。本教科书的目的是以简明的方式介绍机器学习及其提供的算法范例。本书介绍了机器学习基础知识,以及将这些原理转化为实际算法的数学推导的理论论述过程。在介绍了基础知识后,本书涵盖了以前教科书无法解决的广泛的中心课题。其中包括对学习的计算复杂性的讨论,凸度和稳定性的概念,重要的算法范例,包括随机梯度下降、神经网络和结构输出学习等。此外还讨论了如PAC-Bayes方法和压缩边界等新兴的理论概念。

4.《统计学习的要素》(The Elements of Statistical Learning)

http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf

作者:Trevor Hastie,Robert Tibshirani,Jerome Friedman

这本书在共同的概念框架下描述了统计学习领域内的重要思想。虽然这种方法是统计学的,但书中重点强调了概念,而不是数学。书中给出了大量例子,使用了丰富的彩图。本书对于科学界或产业界中对数据挖掘感兴趣的统计人员来说都是宝贵的资源。这本书的内容涵盖广泛,从监督学习(预测)到非监督学习。书中讨论的题目包括神经网络、支持向量机、分类树和boosting ,这是的第一本全面涵盖该内容的书。

5.《统计学习及其在R语言中的应用》(An Introduction to Statistical Learning with Applications in R)

http://www-bcf.usc.edu/~gareth/ISL/

作者:Gareth James,Daniela Witten,Trevor Hastie,Robert Tibshirani

本书提供了统计学习方法的介绍。目标读者为非数学科学专业的高年级本科生、硕士生、博士生。书中还包含了一些基于R的实验,详细介绍了如何在现实生活中实现各种方法,并为数据科学家的实际应用提供了宝贵的资源。

6.《数据科学基础》(Foundations of Data Science)

https://www.cs.cornell.edu/jeh/book.pdf

作者:Avrim Blum,John Hopcroft和Ravindran Kannan

虽然计算机科学的传统领域仍然非常重要,但越来越多的研究人员将会使用计算机来了解和提取应用程序中出现的大量数据中的可用信息,而不仅仅是用计算机解决一些特定的明确问题。有鉴于此,我们编写了这本书,涵盖了未来40年内可能有用的理论,正如对机器人理论、算法和相关主题的理解在过去40年中给学生们带来的优势一样。

7.《程序员数据挖掘指南:关于数字的古代艺术》(A Programmer's Guide to Data Mining: The Ancient Art of the Numerati)

http://guidetodatamining.com/

作者:Ron Zacharski

本指南遵循逐步学习的方法。我建议您不要被动地阅读这本书,而是积极地用我提供的Python代码进行练习和实验。希望您能积极参与数据挖掘技术的尝试和编程。教科书内容一步步循序渐进,彼此间互为基础。当您读完本书时,已经为深入理解数据挖掘技术奠定了基础。

8.《大型数据集的挖掘》(Mining of Massive Datasets)

http://mmds.org/

作者:Jure Leskovec,Anand Rajaraman,Jeff Ullman

本书是基于斯坦福大学计算机科学课程CS246:大型数据集挖掘(以及CS345A:数据挖掘)课程内容编写而成。

和课程内容一样,本书是为未正式修过先修课程的计算机科学本科生而设计的。为了支持更深入的探索,大部分章节中将补充进一步的阅读参考内容。

9.《深度学习》(Deep Learning)

http://www.deeplearningbook.org/

作者:Ian Goodfellow,Yoshua Bengio,Aaron Courville

本教科书旨在帮助学生和从业人员步入机器学习领域,特别是深度学习领域。该书的网络版现已完成,并将提供免费下载。

10.《机器学习的向往》(Machine Learning Yearning)

作者:Andrew Ng(吴恩达)

http://www.mlyearning.org/

人工智能、机器学习和深度学习正在改变众多行业。但建立机器学习系统需要做出实际决策:

•您应该收集更多的训练数据吗?

•你应该使用端对端的深度学习吗?

•训练集与测试集不匹配时如何处理?

•更多的问题。

在过去,学习如何做出这些“策略性”决定的唯一途径是花费多年时间去上研究生课程或在企业中慢慢摸索。我正在写一本书,以帮助您快速获得这一技能,使您可以更好地构建人工智能系统。

关注我就是关注数据,微信扫一扫,就知数据的一切!

10本免费机器学习与数据科学电子书_第1张图片

你可能感兴趣的:(10本免费机器学习与数据科学电子书)