一个文科出身的数据爱好者的R语言学习路径

felixzhao123 5 数据分析师

       

       首先介绍一下本人的相关情况:本人毕业于不入流的大学,专业是英语。数学水平在高中水平,因为大学文科专业不需要学习高数等课程,以前以为这是很大的好处,但是现在觉得这是一个非常大的遗憾。

       计算机水平也不高,但是属于比较喜欢倒腾的,编程的话,只是在工作中使用一些相对比较简单的VBA。

       其实在我入职现在的公司之前,我对统计是一无所知的。但是入职以后恰巧我们公司在全球范围内实施Six Sigma Program,如果大家对制造业有所了解的话,对这个也不陌生。Six Sigma的培训课程中有一些基本的统计知识的应用,那些东西对于当时的我而言无异于天书,为了能够把握这个机会,因而奋力学习统计知识,几乎将网上能够买到的统计和数据分析的书都买遍了,也就是从那个时间起,我成了人大经济论坛的常客。在人大经济论坛上,我的收获也是很大的,在此对论坛上无私分享的高手们表示感谢!

       好了,以上就是我的相关情况,其实概括起来就很简单了,就是一个典型的热爱数据分析的文科男。

       下面回到正题,关于我学习R的情况:

       首先,我一开始只使用与Six Sigma相关的软件,Minitab,这个是一个界面化的统计软件,相对而言比较小众,但是比较容易上手,更重要的是有一些与Six Sigma相结合的工具,这是一个很大的优势,但是它在更复杂的数据分析方面就比较吃力了。同时,也开始接触到工作中一些比较复杂的数据分析问题,另外,自己的数据分析的知识也在不停地增长,掌握的方法也逐渐多了起来,也越来越感觉到Minitab的局限性,虽然它也在不断升级。

       那么,下面可以考虑的软件就是SPSS,SAS等商业化软件,这个对我来说是不可行的,因为这些软件不在公司的标配软件清单里面,加上美国人的版权意识,公司的电脑不可以装盗版等原因,就没有办法考虑这些软件了。

       这样看下来,能考虑的就只有Python和R了,我是花了很长时间才决定了使用R的,因为在论坛里面查找相关讨论,我的理解就是,如果你有比较好的编程基础,想搞数据分析,从Python入手比较好,如果你本身比较侧重数据分析,那可能R更好,两者的比较,论坛里有很多很好的资料,在此不多说了。

       一开始学习R,我的反思是我还是走了一些弯路的,一开始看的资料有点过难了,走了弯路,直到最近总结了一下,我觉得合理的路径应该这样的:

       首先介绍给大家的第一本书是R for Dummies,Dummies系列可以说是家喻户晓,我一开始并没有看这本书,直到不久前才看,我个人的体会是,我们这样的编程门外汉在学习编程的时候,往往是被一些基础的东西困住,我们在学习书上的代码,尝试的时候,往往是错在某一个特殊的符号上,一个基本的参数上面,而这本书,对于这些基础的东西的介绍还是非常好的。这本书的中文版现在也有了。

       第二本推荐的书就是R语言实用数据分析和可视化技术,其实这本书的中文名有一定的误导性,这本书的英文名其实是R for Everyone: Advanced Analytics and Graphics,从名字就能看出作者的意图,本书的核心理念是用20%的R的功能处理日常的80%的数据分析任务,姑且不论这本书是否做到了这一点,我个人还是比较赞同这个理念的,因为R的拓展包实在是太多了,一个决策树,至少有3个包,我不是在抱怨,这是R的巨大优势,但学起来也会比较费劲。

       穿插在其中,我觉得可以看一看Lynda.com出品的R Statistics Essential. Lynda这个网站可以说是全球范围内IT在线教育出品质量最好的了,动态的视频可以帮助我们直观地了解一些操作,以及产生的结果,可以说所见即所得。

       下面要介绍的可能大家就比较熟悉了,R语言经典实例,R语言实战,这两本书中,我比较推荐的是R语言实战,内容完整具体,解释清楚,不光是对于代码的解释,对于一些统计知识的介绍也是很好的。

       最后,就是如果要使用R进行数据挖掘,个人比较推荐的是数据挖掘:R语言实战这本书,这是国内作者不可多得的好书,当然,数据挖掘的基本概念,不在我们讨论的范围内。

       以上就是本人一些小的经验的总结,希望能够对于那些与我情况比较相似的同学有所帮助。

       PS:因为是第一次发贴,不知道如何上传图片,以上提到的这些资料,网上商店都可以搜索到,另外基本论坛里面都有电子版的。

文章为作者独立观点,不代表经管之家立场

5

要评论?请先注册或者登录,可用人大经济论坛帐号登录。

palo
........................................
septxiao
好厉害!VBA和统计都想学。。
machine123
前辈,有中文版的 R for Dummies没?
seu_kp
谢谢楼主,必将会好好学习R语言
etom2015
正准备学习R语言,有了前辈的经验,会少走很多弯路。
^