Skip to main content

Intro

language for data science

R是数据科学家发明的统计语言,和python等其他编程语言略有不同,在有些地方会受限,但因为tidyverse中一系列强大的包,能轻松高效优雅的完成数据清洗,整理,处理和可视化,另外也因为其语法的简单,更容易学习和上手,而得到科研工作者的青睐,尽管python的pandas、plotnine和其他包等也能完成,但还是逊色于R,当然python的机器学习能力也是强于R的,最后一点,也是让很多人做出二选一的点,很多生信的包是R专属的,尽管python可以调用,但常常是跑不了或者会出问题的。
总之,两者都是非常优秀的语言,各有所长,精力有限的情况下请选择最适合自己的语言,但双管齐下绝对会让你走得更远。

中文教材
四川师范大学研究生公选课《数据科学中的R语言》 非常优秀的教材
北京大学数学科学学院李东风编写的R语言教程 内容也非常好, 但或许不如上面四川师范大学的规范, 更像内部交流的入门教材
R 语言数据分析实战, 作者黄湘云与赵鹏、谢益辉一起合著了《现代统计图形》, 该书还有章节正在编写中, 已完成的内容供入门足矣

英文
Hadley Wickham的R for Data Science