R语言里面一个比较重要的绘图包——ggplot2,是由Hadley Wickham于2005年创建,于2012年四月进行了重大更新,作者目前的工作是重写代码,简化语法,方便用户开发和使用。ggplot2的核心理念是将绘图与数据分离,数据相关的绘图与数据无关的绘图分离,是按图层作图,有利于结构化思维,同时它保有命令式作图的调整函数,使其更具灵活性,绘制出来的图形美观,同时避免繁琐细节。ggplot2可以通过底层组件构造前所未有的图形,你所受到的限制只是你的想象力。

它大概可以分为三个部分:

(1)数据层(2)几何图形层(3)美学层;

如果你用过photoshop,那么对于图层你一定不会陌生。图层好比是一张玻璃纸,它包含有各种图形元素,你可以分别建立图层然后可以按照不同顺序叠放在一起,组合成图形的最终效果。因此图层可以允许用户一步步的构建图形,方便单独对图层进行修改、增加统计量、甚至改动数据,因此绘制出来的图形一般十分漂亮并且符合自己的意愿。

ggplot2大致包含了一下几个基本概念:

• 数据(Data)和映射(Mapping)
• 标度(Scale)
• 几何对象(Geometric)
• 统计变换(Statistics)
• 坐标系统(Coordinate)
• 图层(Layer)
• 分面(Facet)

数据(Data)和映射(Mapping)
将数据中的变量映射到图形属性。映射控制了二者之间的关系。

标度(Scale)

标度负责控制映射后图形属性的显示方式。具体形式上来看是图例和坐标刻度。Scale和Mapping是紧密相关的概念。

几何对象(Geometric)

几何对象代表我们在图中实际看到的图形元素,如点、线、正方块等多边形。

统计变换(statistics)
对原始数据进行某种统计计算,例如对二元散点图加上一条回归线或者置信区间登记。

分面(Facet)
条件绘图,将数据按某种方式分组,然后分别绘图。分面就是控制分组绘图的方法和排列形式。

我们使用ggplot2自带的数据集mpg,它包含了1999年和2008年之间 EPA使上可用燃料经济性数据的一个子集等信息。它总共有234行,11列数据。

加载了ggplot2包之后,可以使用如下语句绘制出下图

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))+geom_point()+aes(colour=factor(mpg$year))

其中data=mpg,mapping = aes(x=cty,y=hwy)表示数据层,geom_point()表示几何图形层,aes(colour=factor(mpg$year))表示美学图层。我将year映射为映射到颜色属性。如过我们把上面句子写成如下:

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))

则它什么也不会绘出来,因为他缺少几何图形层。写成下面语句绘制出来的散点图全是黑点,因为它缺少美学图层

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))+geom_point()

如果我们觉得这些点太小或者太大的时候,我们可以通过改变size的参数来调节散点的大小,一般使用方法是size=I(x);这个I()最好加上,否则有的时候会出现莫名奇怪的错误,有的时候不加也行,直接size=x也行,x为散点的大小,它一般按照使用者的经验或一次次试来确定大小的。

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))+geom_point(size=I(7))+aes(colour=factor(mpg$year))

我们也可以绘制出它的拟合曲线以及置信区间,它根据年份绘出了两条拟合曲线以及置信区间。

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))+geom_point()+aes(colour=factor(mpg$year))+stat_smooth()

但如果我们只想绘制一条拟合曲线和一个置信区间,我们只需要将代码稍微改变一下就可以搞定。

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))+geom_point(aes(colour=factor(mpg$year)))+stat_smooth()

在前面,我们将year变量映射到散点的颜色上面,现在我们也可以将displ变量映射到散点大小,绘制出来的大小不同的散点。

  1. ggplot(data=mpg,mapping =aes(x=cty,y=hwy))+
  2. geom_point(aes(colour=factor(year),size=displ))+
  3. stat_smooth()

使用过Photoshop的人一定知道透明度,即alpha。当然我们的ggplot2包也提供相关参数,可以改变alpha值得大小来改变散点的透明度。alpha的值在0—1之间,不在这个范围的话则会报错。为了与前面的图片有明显的区别,我再这里的alpha值调的比较小。一般默认alpha值得大小为1。

  1. ggplot(data=mpg,mapping = aes(x=cty,y=hwy))+
  2. geom_point(aes(colour=factor(mpg$year),size=displ),alpha=0.25)+
  3. stat_smooth()

当然我们也可以给图片增加标题,并精细修改图片,给图片增加x,y轴说明,以及其他说明。

  1. ggplot(mpg, aes(x=cty, y=hwy))+
  2. geom_point(aes(colour=class,size=displ),alpha=0.6,position = "jitter")+
  3. stat_smooth()+
  4. scale_size_continuous(range = c(4, 10))+
  5. facet_wrap(~ year,ncol=1)+
  6. ggtitle("汽车油耗与型号")+
  7. labs(y='每加仑高速公路行驶距离',
  8. x='每加仑城市公路行驶距离')+
  9. guides(size=guide_legend(title='排量'),
  10. colour = guide_legend(title='车型',
  11. override.aes=list(size=5)))

写的比较早的博客或者论坛上面会有opts()函数来给图片命名,不过只有在以前的ggplot2包版本里面有opts()函数,但现在比较新的ggplot2包里面已经没有该函数了,如果你使用较新的ggplot2包使用该函数则会提示你找不到该函数,因为它已经被替换为ggtitle(),使用方法如上面代码。

上面代码里面有一个position的函数,通过调整参数来改变图层的位置,现在ggplot2只有5种,再往回版本的更新,也许会增加。大家可以修改position函数的参数来观测不同参数绘制出来的图形会有哪些变化。

fill:填充方式, 先把数据归一化,再填充到绘图区的顶部。

dodge:比如说不同折线的标记有可能重复,可以改变改参数进行一个“避让”方式,即往旁边闪,比如说如柱形图的并排方式。

identity:原地不动,不调整位置,默认。

jitter:如果严重的重叠,随机抖一抖,让本来重叠的露出点头来

stack:在竖直方向叠罗汉,绘制出来类似条形图

在有的时候我们需要把一个变量和其他不同的变量进行一个对比,这个时候我们就需要把他们画在同一张图上面。ggplot2绘图就和Photoshop有一个功能很相似,那就是  图层, 我们可以把不同的图层叠加在一起,这样就画在了同一张图上面。比如说我们要研究mpg数据中cty和hwy,以及displ之间的关系,我们就可以通过如下代码,将他们之间的散点图画在一起。

  1. ggplot()+
  2. geom_point(aes(x=mpg$cty,y=mpg$hwy),color="red")+
  3. geom_point(aes(x=mpg$cty,y=mpg$displ),color="green")

结果如下图:两个因变量用不同的颜色来表示。

接下来,我们来绘制一个扇形图,我们来统计一下class中各个品牌所占比例,代码和图片如下:

  1. ggplot(mpg)+geom_bar(width=1, aes(x=factor(1),fill=mpg$class))+
  2. coord_polar(theta="y")

我们也可以通过使用ggplot2包来绘制 Coxcomb Plots (鸡冠花图,又名玫瑰图),这个也非常简单。width的值可以调整各个扇形区域之间的距离。

  1. ggplot(mpg, aes(x = factor(mpg$class))) +
  2. geom_bar(width = 0.7,aes(color=factor(mpg$class))) + coord_polar()

当然我们也可以给他增添颜色,代码只要稍微改一下:

  1. ggplot(mpg, aes(x = factor(mpg$class),fill=mpg$class)) +
  2. geom_bar(width = 0.7) + coord_polar()

转载请注明原文链接:http://blog.csdn.net/wzgl__wh/article/details/51901093

快速学习ggplot2的更多相关文章

  1. 60分钟Python快速学习(给发哥一个交代)

    60分钟Python快速学习 之前和同事谈到Python,每次下班后跑步都是在听他说,例如Python属于“胶水语言啦”,属于“解释型语言啦!”,是“面向对象的语言啦!”,另外没有数据类型,逻辑全靠空 ...

  2. LinqPad工具:帮你快速学习Linq

    LinqPad工具:帮你快速学习Linq 参考: http://www.cnblogs.com/li-peng/p/3441729.html ★:linqPad下载地址:http://www.linq ...

  3. 快速学习C语言一: Hello World

    估计不会写C语言的同学也都听过C语言,从头开始快速学一下吧,以后肯定能用的上. 如果使用过其它类C的语言,如JAVA,C#等,学C的语法应该挺快的. 先快速学习并练习一些基本的语言要素,基本类型,表达 ...

  4. 【Java线程池快速学习教程】

    1. Java线程池 线程池:顾名思义,用一个池子装载多个线程,使用池子去管理多个线程. 问题来源:应用大量通过new Thread()方法创建执行时间短的线程,较大的消耗系统资源并且系统的响应速度变 ...

  5. 【Java的JNI快速学习教程】

    1. JNI简介 JNI是Java Native Interface的英文缩写,意为Java本地接口. 问题来源:由于Java编写底层的应用较难实现,在一些实时性要求非常高的部分Java较难胜任(实时 ...

  6. 快速学习bootstrap前台框架

    W3c里的解释 使用bootstrap需要注意事项 1.  在html文件第一行要加上<!doctype html>[s1] 2.  导入bootstrap.min.css文件 3.  导 ...

  7. C#快速学习笔记(译)

    下面是通过代码快速学习C#的例子. 1.学习任何语言都必定会学到的hello,world! using System; public class HelloWorld { public static ...

  8. Dapper快速学习

    Dapper快速学习 我们都知道ORM全称叫做Object Relationship Mapper,也就是可以用object来map我们的db,而且市面上的orm框架有很多,其中有一个框架 叫做dap ...

  9. ASP.NET快速学习方案(.NET菜鸟的成长之路)

    想要快速学习ASP.NET网站开发的朋友可以按照下面这个学习安排进度走.可以让你快速入门asp.net网站开发!但也局限于一般的文章类网站!如果想学习更多的技术可以跟着我的博客更新走!我也是一名.NE ...

随机推荐

  1. 基于Coravel定时任务之物联网设备数量统计

    目录 基于Coravel定时任务之物联网设备数量统计 1 应用背景 2 对比各家定时库 2.1 TaskScheduler 2.2 Fluent Scheduler 2.3 Quartz.net 2. ...

  2. SharePoint 2013 Sandbox Solution

    昨天在写SharePoint EventReceiver的时候遇到一个问题,创建了一个local farm SharePoint solution,添加了一个ItemAdded(SPItemEvent ...

  3. 获取配置文件中key=value

    之前一直是写一个方法获取配置文件中的key=value值得,现在提供更简单的. ResourceBundle 是java.utl中的一个专门针对.properties文件的. //获取配置文件对象 R ...

  4. passwd、shadow、group文件格式

    [root@bogon ~]# cat /etc/passwd root:x:0:0:root:/root:/bin/bash 登录名:密码占位符:UID:GID:注释:家目录:用户的默认shell ...

  5. mysql 变量赋值的三种方法

    mysql中变量不用事前申明,在用的时候直接用“@变量名”使用就可以了.第一种用法:set @num=1; 或set @num:=1; //这里要使用变量来保存数据,直接使用@num变量第二种用法:s ...

  6. 从无到有,构建GIS + BIM大厦

    声明:本文是一个系列原创(作者在GIS+BIM行业已有从业15年有余,还是个行业的小学生,文章内容不免有错误或者不当之处,敬请理解),旨在通过这个系列打造一个高性能,高可扩展的GIS+BIM框架,抛砖 ...

  7. IDEA 学习笔记之 Web项目开发

    Web项目开发: 添加新模块: 起名: 添加jars: 添加Tomcat/local: 添加项目:  启动Tomcat: 看到web页面: 修改页面: 重新部署页面:

  8. Spring DestorySingleton流程

     第一节介绍Spring启动(链接)时,介绍AbstractApplicationContext的过销毁过程,主要是调用了内部的destroyBeans方法,这节便来介绍bean的销毁过程. 一.销毁 ...

  9. python语言程序设计基础(嵩天)第三章课后习题部分个人练习

    p69: *题3.5: 源代码: (1)print(30-3**2+8//3**2*10)     答案:21 (2)print(3*4**2/8%5)     答案:1.0 (3)print(2** ...

  10. asp.net 重写OnException返回json或跳转新页面

    protected override void OnException(ExceptionContext filterContext) { // 此处进行异常记录,可以记录到数据库或文本,也可以使用其 ...