R 语言学习(二)—— 向量】的更多相关文章

变量用于临时存储数据,而函数用于操作数据,实现代码的重复使用.在R中,函数只是另一种数据类型的变量,可以被分配,操作,甚至把函数作为参数传递给其他函数.分支控制和循环控制,和通用编程语言的风格很相似,但是,不要因为R具有这些元素,就把R作为通用编程语言来看待,R的最小变量是向量,是一种面向数组(Array-Oriented)的语言.在编程时,尽量用array的方式思考,避免使用循环(for,while,repeat)控制,而使用apply函数家族实现计算的迭代,这是R语言的特色,把特定的函数应用…
上节我们讲到R语言中的基本数据类型,包括数值型,复数型,字符型,逻辑型以及对应的操作和不同数值类型之间的转换.众所周知,R语言的优势在于进行数据挖掘,大数据处理等方面,因此单个的数据并不能满足我们的需要,于是向量,矩阵,数组,数据框等变量类型应运而生. 向量:与我们在数学里面所学到的向量不同,R语言中的向量类似于我们在C语言中学习的数组,表示一个同种数据类型的数据集. 向量的创建:在R语言中使用c( )命令就创建了一个向量,任何类型的数据都可以组成向量,但一个向量里面的数据最好类型一致,不然会发…
#r语言(二)笔记 #早复习 #概述:R是用于统计分析.绘图的语言和操作环境 #对象: #数据类型--统称为对象 #向量(vector):用于存储数值型.字符型或逻辑型数据的一维数组. #定义向量: v<-1 v1<-c(1,2,3) 或者 assign('v1',c(1,2,3)) v<-1:10 #1~10 is.vector(v) #向量的输出: v 或者 print(v1) #向量的操作函数: #排序:sort(v1) 倒序: rev(v1) #最大值 最小值 平均值 max(v…
1. 入门 将摄氏度转化为华氏度 >> 27*1.8+32 [1] 80.6 [1]:表示数字的向量索引号,在 R 语言中任何一个数字都看作一个向量. 向量化 >> temp <- c(27, 29, 23, 14) >> temp * 1.8 + 32 [1] 80.6 84.2 73.4 57.2 c()在这里是一个函数(combine 的缩写),而且是泛型函数,用于对参数的连接, c(..., recursive = FALSE) 再来看一个操作: >…
在R中,基本的数据结构有:向量,矩阵,数组,数据框,列表,因子,函数等. 向量:一系列同类型的有序元素构成. 向量是一维结构. 向量是R最简单的数据结构,在R中没有标量. 标量被看成1个元素的向量. 向量元素必须是同类型的. 由于向量是最简单的数据结构,因此本章中以向量为例子来解释各个概念. 矩阵:二维的同类型元素的集合. 矩阵由函数matrix创建. 矩阵需要输入行数,列数. 矩阵是二维的,引用元素可通过双下标做索引. 矩阵在物理实现时,是向量附加行列数属性来实现的,因此也可以通过向量的方式引…
今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言来描述. > vars<-c("mpg","hp","wt") > head(mtcars[vars]) mpg hp wt Mazda RX4 21.0 110 2.620 Mazda RX4 Wag 21.0 110 2.875 Datsun 710 22.8 93 2.320 Hornet 4 Drive 21.4 110 3.215 Hornet Sportab…
向量是R语言最基本的数据类型. 单个数值(标量)其实没有单独的数据类型,它只不过是只有一个元素的向量. x <- c(1, 2, 4, 9) x <- c(x[1:3], 88, x[4])   #在最后一个数前面插入一个数值88,可以看到用x[4]可以取出第4个元素,用x[1:3]可以取出前3个元素 typeof(x)    #查看向量里的元素的类型,注意默认是double.[1] "double" mode(x)    #r语言中变量类型称为模式(mode).[1] &…
在R中获得快速运行代码的方法 使用向量化运算 R语言的并行计算可以用parallel和foreach包 加快R运行速度还可以使用cmpfun()函数即字节码编译器 再者就是在R中调用C或C++ 同时还可以利用Rprof()来寻找代码的瓶颈 利用分块或者R包来管理内存…
R是向量化的语言,最突出的特点是对向量的运算不需要显式编写循环语句,它会自动地应用于向量的每一个元素.对象是R中存储数据的数据结构,存储在内存中,通过名称或符号访问.对象的名称由大小写字母.数字0-9.点号和下划线组成,名称是区分大小写的,并且不能以数字开头,特殊的对象名称可以通过界定符 `` 来转为合法的对象名称,注意,点号( . ) 被视为没有特殊含义的单字符. R语言非常灵活,例如: R语言区分大小写,不管是变量名和函数名,都是大小写敏感的. 直接给变量赋值,R中不能显式声明变量和类型:…
1.数据分析金字塔 2.[文件]-[改变工作目录] 3.[程序包]-[设定CRAN镜像] [程序包]-[安装程序包] 4.向量 c() 例:x=c(2,5,8,3,5,9) 例:x=c(1:100) 表示把1 - 100的所有数字都给x这个变量 5.查看x的类型:>mode(x) 6.查看x的长度:>length(x) 7.将两个向量组成一个矩阵: >rbind(x1, x2)  注:r是row的意思,即行,按行组成矩阵. >cbind(x1, x2)  注c是column的意思,…
一.R语言应知常用函数 1.getwd() 函数:获取工作目录(同eclipse设置workspace类似),直接在R软件中使用,如下图: 2.setwd(dir=”工作目录”) 函数:设置R软件RStudio的工作目录,如下图(注意目录写法): 3.list.files()函数(同dir()函数):查看R软件当前工作目录下的文件,如下图: 4.一般赋值符号:<- 或-> ,如x<-3 或3->x,表示x等于3 5.ls()函数:查看工作空间中的所有变量:ls.str()函数:查看…
博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html ---- 前言: 应用背景兼吐槽 继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯. 这次的主题是论R与excel的结合,又称 论如何正确把EXCEL文件喂给R处理 分为: 1. xlsx包安装及注意事项 2.用vba实现xlsx批量转化csv 以及,这个的对象,针对跟我一样那些从R开始接触编程的,一直以来都是用excel做数据分析的人……编程大牛请轻拍 之所以要研究这个,是因为最近…
1.不同的行业对数据集(即表格)的行和列称谓不同,统计学家称其为观测(observation)和变量(variable): 2.R语言存储数据的结构: ①向量:类似于C语言里的一位数组,执行组合功能的函数c()可用来创建向量: a <- c(1,2,3,4,5) b <- c("one","two","three") c <- c(TRUE,FALSE,TRUE) 以上,a是数值型向量,b是字符型,c是逻辑型:注意,单个向量中元…
向量化的函数 向量化的函数 ifelse/which/where/any/all/cumsum/cumprod/对于矩阵而言,可以使用rowSums/colSums.对于“穷举所有组合问题",可能需要combn/outer/lower.tri/expand.grid等函数.尽管apply可以显式消除循环,但它实际上是用R而不是C实现的,因此它通常并不能加速代码.然而,其他的apply函数,如lapply,对于加速代码非常帮助 环境和变量的作用域问题 在R语言中,函数被正式的称为“闭包”(clos…
买了三本R语言的书,同时使用来学习R语言,粗略翻下来感觉第一本最好: <R语言编程艺术>The Art of R Programming <R语言初学者使用>A Beginner’s Guide to R <R语言实战>R in Action 一句话简介R语言:R是一种用于数据处理和统计分析的脚本语言,它受到由AT&T实验室开发的统计语言S(Statistics)的启发,且基本上兼容于S语言. 下载并安装R 从google中搜索R,第一个搜索结果就是R语言的网站…
笔者寄语:感谢CDA DSC训练营周末上完课,常老师.曾柯老师加了小课,讲了echart与R结合的函数包recharts的一些基本用法.通过对比谢益辉老师GitHub的说明文档,曾柯老师极大地简化了一些代码,可读性很强. 关于此包起源,百度联姻d3.js=echarts,echarts+R=recharts包(Yang Zhou和Taiyun Wei),谢益辉老师修改可以传递js参数,实现更多功能, 但是呢,谢益辉老师的改良版包还没发出来,于是该神就做了一个函数,先给大家试用(点赞谢益辉老师).…
Basic包是R语言预装的开发包,包含了常用的数据处理函数,可以对数据进行简单地清理和转换,也可以在使用其他转换函数之前,对数据进行预处理,必须熟练掌握常用的数据处理函数,本文分享在数据处理时,经常使用的基础函数. 一,合并向量 函数append用于修改合并向量,可以把两个向量合并为一个: append(x, values, after = length(x)) 例如:从一个向量的指定位置处,插入另一个向量: > append(:, :, after = ) [] 二,匹配函数 匹配函数(mat…
在数据分析中,整理数据的本质可以归纳为:对数据进行分割(Split),然后应用(Apply)某些处理函数,最后将结果重新组合(Combine)成所需的格式返回,简单描述为:Split - Apply - Combine.这个过程可以通过Basic包的apply家族函数来实现,apply家族函数包括了apply.sapply.lapply.tapply.aggregate等,可以应用于数据分析的各个阶段.plyr包是apply家族函数的升级,使用plyr包可以实现:在一个函数内同时完成“Split…
运算符是R语言中最基础的存在,熟悉运算符的使用,是熟练使用R处理数据的基础,操作符,顾名思义,是对数据进行运算的符号,R有自己的一套操作符,实现变量的赋值,引用,运算等功能. 一,赋值符号 为变量赋值,推荐使用  var <-  expression, 把var设置为表达式的值,该赋值符号有方向性. 为参数赋值,使用 = ,R吧等号右侧表达式的值计算出来,赋值给等号右侧的变量. 二,作用域引用符 作用域引用符:: 用于引用包中的对象.当载入多个包时,后载入的包,会把之前包中的同名函数覆盖. dp…
R语言的基础包中提供了三种基本类型用于处理日期和时间,Date用于处理日期,它不包括时间和时区信息:POSIXct/POSIXlt用于处理日期和时间,其中包括了日期.时间和时区信息.R内部在存储日期和时间时,使用不同的方式: Date类:存储了从1970年1月1日以来开始计算的天数,更早的日期表示为负值,也就是说,Date类型是一个整数,以天为单位来计算日期,因此,Date适合用于计算日期. POSIXct类:记录了以时间标准时间(UTC)时区位准的,从1970年1月1日开始计时的秒数,即,PO…
文本数据存储在字符向量中,字符向量的每个元素都是字符串,而非单独的字符.在R中,可以使用双引号,或单引号表示字符. 一,字符串中的字符数量 函数nchar()用于获得字符串中的字符数量: > s <- 'read' > nchar(s) [] 二,转义字符 R语言使用“\”,把特定的字符转义为特殊字符,例如 “\t”是制表符,换行符是“\n”,或者 “\r\n”,通常情况下,\r是回车符,把光标移动到当前行的开始,并覆盖当前行已经存在的数据,而\n是换行,把光标移动到一下行: 常用的转义…
R语言中排序有几个基本函数:sort().rank().order().arrange() 一.总结 sort()函数是对向量进行从小到大的排序 rank()函数返回的是对向量中每个数值对应的秩 order()函数返回的值表示位置,依次对应的是向量的最小值.次小值.第三小值……最大值等(位置索引) arrange()函数(需加载dplyr包)针对数据框,返回基于某列排序后的数据框,方便多重依据排序 二.具体用法 1.sort data ,,,,,) sort(data) # sort(data,…
R语言,一种自由软件编程语言与操作环境,主要用于统计分析.绘图.数据挖掘.R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心团队”负责开发.R是基于S语言的一个GNU计划项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行.R的语法是来自Scheme. R的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux).…
时序分析会用到的函数 函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() stats 返回时间序列的结束时间 frequency() stats 返回时间序列中时间点的个数 window() stats 对时序对象取子集 ma() forecast 拟合一个简单的移动平均模型 stl() stats 用LOESS光滑将时序分解为季节项.趋势项和随机项 monthplot()…
第一章:R语言介绍 一 R的使用 1 R是一种区分大小写的解释型语言.R语句由函数和赋值构成.R使用<-作为赋值符号.例如: x<-rnorm(5) 创建了一个名为x的向量对象,它包含5个来自标准正态分布的随机偏差. 二 图形输出 pdf(”filename.pdf")-- png("filename.png")-- jpeg("filename.jpg")- 三 函数总结 help.start()--打开帮助文档首页 data()--列出当前…
这节的内容是建立在之前我们对R语言最基本向量赋值的基础之上的,笔者本人学完R当中向量的索引感觉异常舒适,因为这个比Python的索引爽多了,是什么值开始索引就从哪里开始索引,到哪里结束就在哪里结束,而不会像Python一样有的时候输入0实际上是从1开始计数,有的时候到99为止实际上你要索引到100,给人一种难以弄清的感觉.学了简洁的R心里大为开朗. 一.得到向量当中某个数值的值 首先我们先生成一个从1到100数值的向量: > x <- c(1:100) > x [1] 1 2 3 4 5…
本系列是一个新的系列,在此系列中,我将和大家共同学习R语言.由于我对R语言的了解也甚少,所以本系列更多以一个学习者的视角来完成. 参考教材:<R语言实战>第二版(Robert I.Kabacoff),书中所提到的John Cook的优秀博文,关于代码规范的<来自Google的R语言编码风格指南>. 目录 Part 1:图形参数 Unit 1:点型和线型 Unit 2:颜色 Unit 3:文本 Unit 4:图形尺寸与边界尺寸 Part 2:添加要素 Unit 1:添加标题和坐标轴标…
本系列是一个新的系列,在此系列中,我将和大家共同学习R语言.由于我对R语言的了解也甚少,所以本系列更多以一个学习者的视角来完成. 参考教材:<R语言实战>第二版(Robert I.Kabacoff),书中所提到的John Cook的优秀博文,关于代码规范的<来自Google的R语言编码风格指南>. 目录 Part 1:函数 Section 1:数学与统计函数 Section 2:概率函数 Section 3:其他实用函数 Part 2:其他控制 Section 1:循环与条件结构…
孩子上初中时拿到过全年级一次考试所有科目的考试成绩表,正好可以用于R语言的统计分析学习.为了不泄漏孩子的姓名,就用学号代替了,感兴趣可以下载测试数据进行练习. num class chn math eng phy chem politics bio history geo pe0158 3 99 120 114 70 49.5 50 49 48.5 49.5 600442 7 107 120 118.5 68.6 43 49 48.5 48.5 49 560249 4 98 120 116 70…
R语言中的因子就是factor,用来表示分类变量(categorical variables),这类变量不能用来计算而只能用来分类或者计数. 可以排序的因子称为有序因子(ordered factor). factor() 用来生成因子数据对象,语法是: factor(data, levels, labels, ...) 其中data是数据,levels是因子的级别向量,labels是因子的标签向量. 以我的10个月的fitbit数据为例,创建一个因子 fitbit <- read.csv("…