数据分析之学习计划

最近才真正决定做数据分析这个方向,在此列了个简单的数据分析技能图,之后我就会照着这张图来不断地完善自己的知识体系。

首先,我们先从数据分析中用的工具说起。

到目前为止,我刚把Python基础学完,后面打算接着学一下爬虫和数据分析常用的几个模块(numpy、pandas和matplotlib),并且时不时地刷几道Leetcode上的算法题,巩固下基础。

《R语言数据分析》这本书我看了一点,大概知道了R语言做数据分析是个怎样的过程,不过我并没有做太多的上机练习,因为现在最主要的是先把Python相关的知识学完,这个就先放一放。

至于Excel和SQL这两个作为最最基础的工具,我决定花更多的时间来练到熟练使用的程度。SQL我主要是在sqlzoo这个网站上练习,Excel也是根据大家的推荐先看看王佩丰老师的视频。

至于SAS、SPSS之类的数据分析软件,似乎在一般的互联网企业用的比较少,如果除了上面的学习还有剩余时间,我打算做个初步的了解就好了。

接下来是数据分析中用到的知识,重要的事放后面,上面提到的工具其实都是比较好学会的,反而是数据分析的基础知识很难掌握。

数据分析一般都是基于统计学知识的,对于统计学里的那堆公式,我想很多人都是拒绝的。而对于我们这些想转行的人来说,如何应用统计学的知识比推倒这些公式要重要的多,所以我的学习建议就是在实践中来学习统计的知识,具体就是在学习上面那些工具的时候,找一些具体的分析例子来练练,然后针对这些实例中用到的统计知识再通过百度、看书等方式来学习。

再来说说最近非常火的人工智能。

人工智能本质上还是数据处理,只是相对于传统的数据分析,像深度学习、支持向量机这些算法能够实现的效果实在太科幻了。就像最近Google公布的AlphaGo Zero的论文,Zero在仅仅知道围棋规则的情况下,通过和自己的对弈,不断地自我完善,仅仅用了21天就达到了在乌镇围棋峰会打败柯洁的 AlphaGo Master 的水平。我想人类在棋类上已经很难超越我们自己造出来的机器了。

聊的太远了,回归正题,虽然人工智能、机器学习都是很热的话题,相关技术也在不断地更新,不过到目前为止已经有很多造好的轮子供我们使用了,就像在R语言中做神经网络、随机森林等分析都是有现成的、简单易用的模块的,我们要做的就是先学会使用,然后在学有余力的情况下,进一步就研究它内部的原理和理论。

数据分析技能清单

数据分析技能清单已经列好,接下来就是不断地学习了,看着这些内容感觉任重而道远啊。

下一周学习重点是Python爬虫和numpy、pandas、matplotlib这三个模块,Let's get started.

你可能感兴趣的:(数据分析之学习计划)