主题:R统计图

作者:luomg

关键字:统计,R,ggplot2

1、什么是统计图?

统计图:统计图是从数据到几何对象的图形属性的一个映射

砖石重量对价格的散点图

  1. qplot(carat,price,data=diamonds)

指定数据框据说是个好习惯

做数据变换

  1. qplot(log(carat),log(price),data=diamonds)

图形属性

颜色 大小 形状 横坐标 纵坐标是统计图的图形属性,都可以映射为一组变量

标度

每一个图形属性都对应一个标度的函数,使得数据的取值映射到图形属性的有效取值,及控制点的对应图例的外观

  1. set.seed(1410)
  2. dsmall<-diamonds[sample(nrow(diamonds),100),]
  3. qplot(carat,price,data=dsmall,colour=color)
  4. qplot(carat,price,data=dsmall,shape=cut)
  5. qplot(carat,price,data=diamonds,alpha=I(1/10)) #alpha图形属性设定透明度

图形属性技巧

分类变量:颜色和形状

连续性变量:大小,如果数量很大还得分面

geom几何对象

point

绘制散点图,当指定了x和y参数给qplot时的默认的设置

smooth

拟合一条合适的平滑曲线,并将曲线和标准差展示在图中,技巧如果加了分组分类的东西会拟合多条,比如颜色和形状

boxplot

箱线图,用于概括一系列点的分布情况

path

路径图,显示数据之间绘制连线,这类图的传统的作用是探索时间和其他变量之间的关系,路径图的方向是任意的

line

线条图,显示数据之间绘制连线,这类图的传统的作用是探索时间和其他变量之间的关系,线条图的方向是从左到又

一维分布的几何对象的选择是有变量类型来指定的

连续型变量

histogram 直方图,freqpoly 频率多边形 , density 密度曲线 ,如果只有x则默认为直方图

离散变量

bar条形图

集合对象认识

  1. df<-data.frame(
  2. x=c(3,1,5),
  3. y=c(2,4,6),
  4. label=c("a","b","c"))
  5. p<- ggplot(df,aes(x,y))+xlab(NULL)+ylab(NULL)
  6. p+geom_point()+labs(title="gem point")
  7. p+geom_bar(stat="identity")+labs(title="geom_bar")
  8. p+geom_line(stat="identity")+labs(title="geom_line")
  9. p+geom_area(stat="identity")+labs(title="geom_area")
  10. p+geom_path(stat="identity")+labs(title="geom_path")
  11. p+geom_text(aes(label=label))+labs(title="geom_text")
  12. p+geom_tile(aes(label=label))+labs(title="geom_tile")
  13. p+geom_polygon(aes(label=label))+labs(title="geom_polygon")

span 平滑程度系数 0---1

特定数据几何对象选择

一维+连续 --》 直方图

标度

标度设置以 scales_xxx开头的函数

图形语法的映射就是实现真实数据到计算机能识别的数据的归一化处理 一一映射过程,比如颜色映射,实现颜色分类分组

主题设置

全局设置theme_set(theme_grey()|theme_bw())

局部设置:qplot....+theme_grey()

备份原来的主题可以通过:org<theme_set(theme_grey()|theme_bw())

时间转换

as.numeric(as.POSIXct(data23$LAST_UPD, format="%Y-%m-%d hh24:mi:ss"))

as.POSIXct(1440322200, origin = "1970-01-01") http://finzi.psych.upenn.edu/R/library/base/html/as.POSIXlt.html

R统计图的更多相关文章

  1. 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌

    使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi ...

  2. [原]CentOS7安装Rancher2.1并部署kubernetes (二)---部署kubernetes

    ##################    Rancher v2.1.7  +    Kubernetes 1.13.4  ################ ##################### ...

  3. 利用python进行数据分析2_数据采集与操作

    txt_filename = './files/python_baidu.txt' # 打开文件 file_obj = open(txt_filename, 'r', encoding='utf-8' ...

  4. Django项目:CRM(客户关系管理系统)--81--71PerfectCRM实现CRM项目首页

    {#portal.html#} {## ————————46PerfectCRM实现登陆后页面才能访问————————#} {#{% extends 'king_admin/table_index.h ...

  5. R常见的几种常见统计图

    1,向日葵散点图 2,热图  (颜色越深,数值越大) 3,折线图(散点图),绘制散点图集用 paris(data.frame)

  6. R中基本统计图

    一.条形图 1.安装包install.packages("vcd"); library(vcd);count<-table(Arthritis$Improved);#tabl ...

  7. R绘图基础

    一,布局 R绘图所占的区域,被分成两大部分,一是外围边距,一是绘图区域. 外围边距可使用par()函数中的oma来进行设置.比如oma=c(4,3,2,1),就是指外围边距分别为下边距:4行,左边距3 ...

  8. R语言学习笔记:字符串处理

    想在R语言中生成一个图形文件的文件名,前缀是fitbit,后面跟上月份,再加上".jpg",先不百度,试了试其它语言的类似语法,没一个可行的: C#中:"fitbit&q ...

  9. 用R语言分析我的fitbit计步数据

    目标:把fitbit的每日运动记录导入到R语言中进行分析,画出统计图表来 已有原始数据:fitbit2014年每日的记录电子表格文件,全部数据点此下载,示例如下: 日期 消耗卡路里数 步 距离 攀爬楼 ...

随机推荐

  1. 【Spring 1】Spring简介

    一.Spring简介 首先,Spring框架是由于软件开发的复杂性而创建的.Spring使用的是基本的JavaBean来完成以前只可能由EJB完成的事情.然而,Spring的用途不仅仅限于服务器端的开 ...

  2. C++Builder 2010 Release版本配置

    1.Project->Options->C++Compiler 右边Build Configuration 选择 Release,点击Apply选择optionset文件(第四步中保存op ...

  3. Groovy轻松入门——搭建Groovy开发环境

    摘自: http://www.blogjava.net/BlueSUN/archive/2007/03/17/104391.html Groovy轻松入门--搭建Groovy开发环境 多日来,我发表了 ...

  4. Android 按键式事件

    1. package com.fish.helloworld; import android.app.Activity; import android.graphics.Color; import a ...

  5. eclipse启动tomcat时设置端口

    近在做项目需要更改tomcat的端口号,开发工具用的是Eclipse,更改后在Eclipse中重启发现,端口号依然是8080,原来在配置文件更改了tomcat端口号后,要在Eclipse重新装载一次, ...

  6. POJ 1195

    Mobile phones Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 13774   Accepted: 6393 De ...

  7. VS2013添加NuGet的方法

    1.工具->扩展和更新->联机 2.右上角搜索框搜索NuGet,选择NuGet Package Manager for Visual Studio 2013,安装后重启VS 下面通过添加N ...

  8. [转发]导出Excel 格式 mso-number-format

    应用中经常会遇到要从系统或数据库中导出数据平面文件,一般是导出到txt,csv或excel.txt和csv一般用在系统间的数据交换,而 excel一般有较好的显示效果,可以按照一定的模板导出,导出就不 ...

  9. Java 中的抽象类及接口

    抽象类使用 abstract 关键字修饰,该类即为抽象类. 抽象类的作用: 1.某些情况下,父类约束子类必须包含哪些方法,但不知道子类如何去实现这些方法. 2.可以从多个具有相同特征的类中抽象出一个抽 ...

  10. pthreads多线程数据采集

    以前使用curl的多线程并不是真正的多线程,只是一种模拟的多线程,现在使用pthreads来实现真正意义上的多线程. 下载: windows下: http://windows.php.net/down ...