R实战 第三篇:数据处理】的更多相关文章

数据结构用于存储数据,不同的数据结构对应不同的操作方法,对应不同的分析目的,应选择合适的数据结构.在处理数据时,为了便于检查数据对象,可以通过函数attributes(x)来查看数据对象的属性,str(x)函数用于查看R对象的内部结构,通过print(x)函数,显示数据对象存储的内容,该函数把数据打印到控制台上,另外,RStudio提供了一个可视化查看数据的函数View(x). 一,处理数据的函数 标量通常是常量,每一个标量都有特定的数据类型,常用的数据类型是数值类型,字符类型,逻辑类型和日期类…
在实际分析数据之前,必须对数据进行清理和转化,使数据符合相应的格式,提高数据的质量.数据处理通常包括增加新的变量.处理缺失值.类型转换.数据排序.数据集的合并和获取子集等. 一,增加新的变量 通常需要根据数据框中的现有列,按照特定的公式.业务逻辑,向数据框中新增变量,常用的操作符是: 算术运算符是:+ - * /,求模(%%),整除(%/%), 比较运算符是:不等是 !=,相等是 ==, 逻辑运算符与(&).或(|)和非(!). 举个例子,有数据框mydata mydata<-data.fr…
ggplot2包实现了基于语法的.连贯一致的创建图形的系统,由于ggplot2是基于语法创建图形的,这意味着,它由多个小组件构成,通过底层组件可以构造前所未有的图形.ggplot2可以把绘图拆分成多个面板,且能够按照顺序创建多重图形,基本上,无所不能,是R开发人员必学必会的包. ggplot2图形系统的核心理念是: 把绘图与数据分离,把数据相关的绘图与数据无关的绘图分离: 按图层作图,有利于结构化思维: 具有命令式作图的调整函数,使绘图更具灵活性,绘制出来的图形美观,同时避免繁琐细节. 使用gg…
数据分析的工作,80%的时间耗费在处理数据上,而数据处理的主要过程可以分为:分离-操作-结合(Split-Apply-Combine),也就是说,首先,把数据根据特定的字段分组,每个分组都是独立的:然后,对每个分组按照业务需求执行转换:最后,把转换后的结果组合在一起.在数据处理中,经常需要循环访问数据,R语言是矢量化的,天生具有处理循环操作的优势. 使用ggplot2包中的diamonds数据集做为示例数据 > install.packages('ggplot2') > library(ggp…
文本表是显示数据的重要图形,一个文本表按照区域划分为:列标题,行标题,数据区,美学特征有:前景样式.背景央视.字体.网格线等. 一,使用ggtexttable绘图文本表 载入ggpubr包,可以使用ggtexttable绘制文本表: library(ggpubr) 1,基本函数 绘制一个文本表,用到7个基本函数: ggtexttable():用于绘制文本表, ttheme():用于设置表的样式, rownames_style(), colnames_style(), tbody_style():…
在真实的世界中,缺失数据是经常出现的,并可能对分析的结果造成影响.在R中,经常使用VIM(Visualization and Imputation of Missing values)包来对缺失值进行可视化和插补.在使用VIM绘图时,有些绘图函数会对缺失值会自动进行插补. 缺失数据的分类: MCAR(完全随机缺失):若变量的缺失数据与其他任何观测或未观测的变量都不相关,则数据为MCAR.. MAR(随机缺失):若变量的缺失数据与其他观测变量相关,与未观测变量无关,则数据缺失是随机缺失. NMAR…
数据重塑通常使用reshape2包,reshape2包用于实现对宽数据及长数据之间的相互转换,由于reshape2包不在R的默认安装包列表中,在第一次使用之前,需要安装和引用: install.packages("reshape2") library(reshape2) 重塑数据,首先把数据融合(melt),以使每一行都有唯一的标识-变量组合,然后把数据重塑(cast)为想要的任何形状.在重塑过程中,可以使用任何函数对数据进行整合,也可以把长格式转换为宽格式,这种操作类似于Excel的…
一. 前言 在上一文中 点击跳转 通过IDEA集成Docker插件实现微服务的一键部署,但 youlai-mall 是前后端分离的项目,除了后端微服务的部署之外,当然还少不了前端工程的部署.所以本篇讲述如何通过Docker安装Nginx实现前端Vue项目工程的部署. 二. Docker安装Nginx 1. 创建目录 mkdir -p /usr/share/nginx/conf mkdir -p /usr/share/nginx/html 2. 创建配置文件 touch /usr/share/ng…
grid包是R底层的图形系统,可以绘制几乎所有的图形.除了绘制图形之外,grid包还能对图形进行布局.在绘图时,有时候会遇到这样一种情景,客户想把多个代表不同KPI的图形分布到同一个画布(Page)上,而且每一个图形都是单独绘制的.对于这种需求,可以使用grid包来实现,grid包能把图形逐个地添加到画布中,并按照业务的需求,把图形摆放到合适的位置上去.在布局完成之后,把图形绘制出来. 一,grid包概述 grid包不仅可以输出图形,还可以产生可编辑的图形组件,这些图形组件可以被复用和重组,并能…
原文:http://blog.csdn.net/liaokailin/article/details/48194777 监听源码分析 首先是我们自定义的main方法: package com.lkl.springboot; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import com.lkl.spr…