R语言学习笔记:取数据子集】的更多相关文章

本文参考数据挖掘与R第二章节 读入数据 方法1,下载Data mining with r的配套包 install.packages('DMwR') 方法2,下载txt数据,并且读入数据.方法见上文.     Summary()#的到数据的摘要,概括.(包括最大,小值,中值,均值,4分为,NA的数量) summary(algae)     season       size       speed         mxPH            mnO2       autumn:40   lar…
setwd("d:/r/r-data/")data=read.table("salary.txt",header=T)attach(data)mean(Salary) #工资的平均值length(Salary) #数据个数cumsum(Salary) #累加 salary1=cut(Salary,3) #将数据分为三组table(salary1) salary1=cut(Salary,3,labels=c("low","medium&q…
library(MASS)#载入package MASSdata(package="MASS") #查看MASS中的数据集data(SP500,package="MASS") #载入MASS中的SP500数据集data(SP500) #简化写法getwd() #返回当前工作目录setwd("d:/r/r-data") #将当前工作路径修改为 data=read.table("d:/r/r-data/salary.txt",he…
  R是一个惊艳的图形构建平台,这也是R语言的强大之处.本文将分享R语言简单的绘图命令.   本文所使用的数据或者来自R语言自带的数据(mtcars)或者自行创建.   首先,让我们来看一个简单例子: dose <- c(20, 30, 40, 45, 60) drugA <- c(16,20,27,40,60) plot(dose, drugA) 绘制的图形如下:   我们有必要对上述代码做些说明:首句和第二条语句创建两个向量,第三条语句打开一个图形窗口并生成一幅散点图.   这也许是个极为…
上文介绍了,如何生成序列,本文介绍一下如何取出其数据子集 取出元素的逻辑值 > x<-c(0,-3,4,-1,45,90,5) > x>0 [1] FALSE FALSE  TRUE FALSE  TRUE  TRUE  TRUE 取出符合条件的值的值 > x[x>0] [1]  4 45 90  5 > x[x>5 | x<(-2)] [1] -3 45 90 > x[x>1 & x<20] [1] 4 5 用负号‘-’排除…
List R语言中各组件的名称叫做标签(tags),访问列表有3种方法: j$salary 通过标签名字访问,只要不引起歧义,可以只写出前几个字母. j[['sal']] 夹在两个中括号时引号里的标签名字要写全. j[[2]] 亦可以通过在列表中的位置访问. 这三种方法得到的都是对应组件内容的类型. 如果只加一个中括号,得到的是组件,类型为向量. 需要注意的是 [ ] 可以提取多个组件,但 [[ ]] 一次只能提取列表的一个组件内容. > j <- list(name = 'Joe', sal…
常规读取 一般我们读取文件时都会读取全部的文件然后再进行操作,因为R是基于内存进行计算的. data <- read.table("C:\\Users\\Hider\\Desktop\\test.txt", header = TRUE, encoding = "gbk") 但是当读取的数据量很大的时候,读取的时间会让人捉急,而且会把内存给占满,读完数据之后就不用进行下一步操作了,因为电脑都卡死了. 所以只读取数据的前n行是一个不错的选择,边读取边进行处理. 读…
想在R语言中生成一个图形文件的文件名,前缀是fitbit,后面跟上月份,再加上".jpg",先不百度,试了试其它语言的类似语法,没一个可行的: C#中:"fitbit" + month + ".jpg" VB:"fitbit" & month & ".jpg" Haskell:"fitbit" ++ month ++ ".jpg" 还想到concat之…
一.简介 决策树分类算法(decision tree)通过树状结构对具有某特征属性的样本进行分类.其典型算法包括ID3算法.C4.5算法.C5.0算法.CART算法等.每一个决策树包括根节点(root node),内部节点(internal node)以及叶子节点(leaf node). 根节点:表示第一个特征属性,只有出边没有入边,通常用矩形框表示. 内部节点:表示特征属性,有一条入边至少两条出边,通常用圆圈表示. 叶子节点:表示类别,只有一条入边没有出边,通常用三角表示. 决策树算法主要用于…
博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html ---- 前言: 应用背景兼吐槽 继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯. 这次的主题是论R与excel的结合,又称 论如何正确把EXCEL文件喂给R处理 分为: 1. xlsx包安装及注意事项 2.用vba实现xlsx批量转化csv 以及,这个的对象,针对跟我一样那些从R开始接触编程的,一直以来都是用excel做数据分析的人……编程大牛请轻拍 之所以要研究这个,是因为最近…