转自 :  http://blog.csdn.net/u011253874/article/details/43115447

  1. <span style="font-size:14px;">#R语言备忘录三#
  2. #数组array和矩阵matrix、列表list、数据框dataframe
  3. #数组
  4. #数组的重要属性就是dim,维数
  5. #得到4*5的矩阵
  6. z <- 1:12
  7. dim(z) <- c(3,4)
  8. z
  9. #构建数组
  10. x <- array(1:20, dim = c(4,5))
  11. #三维
  12. y <- array(1:18, dim = c(2,3,3))
  13. #数组下标
  14. y[1, 2, 3]
  15. #数组的广义转置,维度发生变化,把2维变成1维,把3维变成2维,把1维变成3维,即D[i,j,k] = C[j,k,i]
  16. C <- array(1:24, dim = c(2,3,4))
  17. D <- aperm(A, c(2,3,1))
  18. #apply用于数组固定某一维度不变,进行计算
  19. apply(A, 1, sum)
  20. #矩阵
  21. #产生矩阵
  22. A <- matrix(1:15, nrow=3, ncol=5, byrow=TRUE)
  23. B <- matrix(3:17, nrow=5, ncol=3, byrow=TRUE)
  24. #求方阵行列式的值
  25. det(matrix(1:4, ncol = 2))
  26. #内积
  27. #矩阵的内积
  28. A %*% B
  29. #也可以使用crossprod函数
  30. crossprod(A, B)
  31. crossprod(A)
  32. #向量的外积,也叫叉积
  33. x <- 1:5
  34. y <- 2*1:5
  35. x %o% y
  36. #也可以使用tcrossprod函数、outer
  37. outer(x, y)
  38. tcrossprod(x)
  39. #产生对角阵
  40. #如果变量是一个向量,则是以向量为对角线元素的对角阵
  41. v <- c(1, 3, 5)
  42. diag(v)
  43. #如果变量是一个矩阵,则是取矩阵对角线元素作为对角阵对角线元素
  44. diag(A)
  45. #解线性方程Ax=b,
  46. b <- matrix(c(1,1,1), nrow = 3, byrow = TRUE)
  47. B <- matrix(1:9, nrow = 3, byrow = TRUE)
  48. solve(B,b)
  49. #求矩阵的逆
  50. solve(B)
  51. #ev$values是特征根,ev$vectors是特征向量组成的矩阵
  52. SM <- crossprod(A, A)
  53. ev <- eigen(SM)
  54. #奇异解,svd$d返回的是矩阵A的奇异值,svd$u则是正交阵U,svd$v对应的是正交阵V, A = UDVT
  55. svdA <- svd(A)
  56. #把矩阵拉成向量
  57. as.vector(A)
  58. #数组或矩阵的维的名字
  59. X <- matrix(1:6, ncol = 2,
  60. dimnames = list(c("one", "two", "three"), c("First", "Second")),
  61. byrow = T)
  62. #亦或是
  63. dimnames(A) <- list(c("one", "two", "three"), c("First", "Second"))
  64. colnames(A) <- c("First", "Second")
  65. rownames(A) <- c("one", "two", "three")
  66. #列表
  67. #构建列表
  68. Lst <- list(name="Fred", wife="Mary", no.children=3, child.ages=c(4,7,9))
  69. #列表元素,列表名[[下标]]
  70. Lst[[2]]
  71. Lst[[4]][2]
  72. #也可以使用名字代替下标
  73. Lst[["name"]]
  74. Lst$name
  75. #修改列表
  76. Lst$name <- c("John", "Tom")
  77. #删除列表某项
  78. Lst$name <- NULL
  79. #连接几个列表
  80. list.ABC <- c(list.A, list.B, list.C)
  81. #数据框
  82. #data.frame,用法和list相同,如果list里的成分满足数据框,也可以使用as.data.frame转换
  83. df<-data.frame(
  84. Name=c("Alice", "Becka", "James", "Jeffrey", "John"), Sex=c("F", "F", "M", "M", "M"),
  85. Age=c(13, 13, 12, 13, 12),
  86. Height=c(56.5, 65.3, 57.3, 62.5, 59.0)
  87. Weight=c(84.0, 98.0, 83.0, 84.0, 99.5)
  88. )
  89. df
  90. #矩阵可以通过data.frame(X)转换
  91. #取数据框的一部分
  92. df[1:2, 3:5]
  93. df[["Height"]]
  94. df$Weight
  95. #命名
  96. names(df)
  97. rownames(df)
  98. #attch()函数将数据框中的变量调入内存中,方便调用当中的数据
  99. attach(df)
  100. #取消连接
  101. detach(df)
  102. #调用edit进行编辑数据
  103. edit(df)
  104. #因子factor
  105. sex <- c("M","M", "F","F")
  106. sexf <- factor(sex)
  107. #因子水平
  108. sex_level <- levels(sexf)
  109. #用table统计各类数据的频数
  110. sex_tab <- table(sexf)
  111. #用gl()产生因子
  112. #gl(n, k, length = n * k, labels = 1:n, ordered = FALSE)
  113. </span>

、、、、、、、、、、、、、、、、、、、、、、、、、、、

  1. #R语言学习备忘录一#
  2. #向量运算#
  3. x <- c(1,2,3,6)
  4. #不小于x的最小整数
  5. ceiling(x)
  6. #不大于x的最大整数
  7. floor(x)
  8. #向0方向截取的x中的整数
  9. trunc(x)
  10. #将x舍入为指定位的小数
  11. round(x,digits=2)
  12. #将x舍入指定的有效数字位数
  13. signif(x,digits=2)
  14. #三角函数
  15. cos(x)
  16. sin(x)
  17. tan(x)
  18. acos(x)
  19. asin(x)
  20. #分位数,如求25%及50%分位数
  21. quantile(x,c(.25,.5))
  22. #求值域
  23. range(x)
  24. #求乘积函数
  25. prod(x)
  26. #滞后差分
  27. diff(x)
  28. #求最大值和最小值对应的位置
  29. which.min(x)
  30. which.max(x)
  31. #数据标准化
  32. x<-c(123,232,212,232,120,273)
  33. mydata<-scale(x)
  34. mydata
  35. #正则表达式匹配
  36. str<-c("a","A","B","c")
  37. grep("A",str,fixed=TRUE)
  38. #字符
  39. #分割符strsplit
  40. strsplit("abcde","")
  41. #连接字符paste
  42. paste("x",1:10,sep="")
  43. paste("x",1:5,sep="T")
  44. paste("Today is ",date())
  45. #大写转换toupper
  46. toupper("abcEF")
  47. #小写转换tolower
  48. tolower("ABC")
  49. #计算字符数量 nchar
  50. x<-c("ab","deew","James")
  51. nchar(x)
  52. nchar(x[2])
  53. #提取或替换一个数值,和Excel mid函数差不多  substr
  54. x<-"abcdefg"
  55. substr(x,2,5) #2到5个元素
  56. substr(x,2,5)<-"1111111"
  57. x
  58. #注意两种等差数列的差别
  59. 1:n-1
  60. 1:(n-1)
  61. #重复函数rep
  62. y<-rep(1:5,2)
  63. y
  64. #等间隔函数
  65. seq(-5, 5, by=.2)
  66. seq(length=51, from=-5, by=.2)
  67. #上下两种方式效果一样
  68. #求行均值
  69. apply(mydata,1,mean)
  70. #求列均值
  71. apply(mydata,2,mean)
  72. #逻辑变量
  73. #判断一个逻辑向量是否都为真的函数是all
  74. all(c(1,2,3,4,5,6)>3)
  75. #判断一个逻辑向量是否有为真的函数any
  76. any(c(1,2,3,4,5,6)>3)
  77. #缺失数据
  78. #NA表示数据缺省或缺失
  79. z <- c(1:3, NA)
  80. z
  81. a <- is.na(z)
  82. #修改缺失数据
  83. z[is.na(z)] <- 0
  84. #is.nan()判断数据是否精确,inf也属于非精确
  85. x <- c(0/1, 0/0, 1/0, NA)
  86. is.nan(x)
  87. is.finite(x)
  88. is.infinite(x)
  89. is.na(x)
  90. #复数向量
  91. #复数z=x+isin(x)
  92. x <- seq(-pi, pi, by = pi/10)
  93. y <- sin(x)
  94. z <- complex(re = x, im = y)
  95. plot(z)
  96. lins(z)
  97. #向量的下标运算
  98. x <- c(1,4,7)
  99. x[c(2,3)]
  100. #修改元素值
  101. x[c(1,3)] <- c(22, 33)
  102. #逻辑向量
  103. x <- c(1,4,7)
  104. x < 5
  105. x[x<5]
  106. #分段函数
  107. y <- numeric(length(x))
  108. y[x<0] <- 1-x[x<0]
  109. y[x>=0] <- 1-x[x>=0]
  110. #即y=1-x,x<0; y=1+x,x>=0
  111. #下标的负整数运算表示的是删除
  112. v <- 10:20
  113. v[-(1:5)]
  114. #取字符串为下标
  115. ages <- c(Li=33, Zhang=29, Liu=18)
  116. ages["Zhang"]
  117. #给向量赋予名字
  118. fruit <- x(5, 10, 1, 29)
  119. names(fruit) <- c("orange", "banana", "apple", "peach")

数组 array 矩阵 list 数据框 dataframe的更多相关文章

  1. R语言笔记1--向量、数组、矩阵、数据框、列表

    注释:R语言是区分大小写的 1.向量 R语言中可以将各种向量赋值为一个变量,这种赋值操作符就是等号“=”,也可以使用“<-”. 1)产生向量 (1)函数c() 例如:x1=c(2,4,6,8,0 ...

  2. R语言基础:数组&列表&向量&矩阵&因子&数据框

    R语言基础:数组和列表 数组(array) 一维数据是向量,二维数据是矩阵,数组是向量和矩阵的直接推广,是由三维或三维以上的数据构成的. 数组函数是array(),语法是:array(dadta, d ...

  3. 《学习R》笔记:科学计算器、检查变量和工作区、向量、矩阵和数组、列表和数据框

    一.第二章 科学计算器 要检查两个数字是否一样,要使用 all.equal() ,不要使用 == ,== 符号仅用于比较两个整型数是否存在相同 . > all.equal(sqrt(2)^2,2 ...

  4. Spark2 加载保存文件,数据文件转换成数据框dataframe

    hadoop fs -put /home/wangxiao/data/ml/Affairs.csv /datafile/wangxiao/ hadoop fs -ls -R /datafiledrwx ...

  5. pandas中数据框DataFrame获取每一列最大值或最小值

    1.python中数据框求每列的最大值和最小值 df.min() df.max()

  6. R读取一个数据框 Dataframe,删去其中的某一列

    可以参考:http://blog.sina.com.cn/s/blog_80572f5d0101anxw.html

  7. C语言 - cJSON解析特定格式 含有数组array类型的数据

    在ESP32中使用了cJSON库,发现很好用.最近服务器端的JSON格式越来越多样,还是有些注意点,需要做下笔记记录下来. cJSON *MAC_arry = cJSON_GetObjectItem( ...

  8. python数据处理工具 -- pandas(序列与数据框的构造)

    Pandas模块的核心操作对象就是对序列(Series)和数据框(Dataframe).序列可以理解为数据集中的一个字段,数据框是值包含至少两个字段(或序列) 的数据集. 构造序列 1.通过同质的列表 ...

  9. R语言学习4:函数,流程控制,数据框重塑

    本系列是一个新的系列,在此系列中,我将和大家共同学习R语言.由于我对R语言的了解也甚少,所以本系列更多以一个学习者的视角来完成. 参考教材:<R语言实战>第二版(Robert I.Kaba ...

随机推荐

  1. restful规则

    参考连接:https://blog.igevin.info/posts/restful-api-get-started-to-write/#url_rules https://juejin.im/po ...

  2. Nginx 反向代理与负载均衡详解

    序言 Nginx的代理功能与负载均衡功能是最常被用到的,关于nginx的基本语法常识与配置已在Nginx 配置详解中有说明,这篇就开门见山,先描述一些关于代理功能的配置,再说明负载均衡详细. Ngin ...

  3. npm 私服工具verdaccio 安装配置试用

      1. 安装 npm install -g verdaccio 2. 启动 verdaccio // 界面显示信息 Verdaccio doesn't need superuser privileg ...

  4. 【android】Socket简单用法

    Socket通常也称做”套接字“,用于描述IP地址和端口,废话不多说,它就是网络通信过程中端点的抽象表示.值得一提的是,Java在包java.net中提供了两个类Socket和ServerSocket ...

  5. STM32F103外部晶振由8M变为12M

    STM32官方提供的库文件中,HSE(外部高速时钟)默认为8MHz,最高主频为8*9=72MHz,如果将HSE变为12MHz,不修改库文件的话,最高主频则变为12*9=108MHz,最典型的问题就是U ...

  6. ubuntu14.04安装pyspider

    sudo apt-get install libcurl4-openssl-dev libxml2-dev libxslt1-dev sudo atp-get install phantomjs 激活 ...

  7. Linux_LVM Couldn't find device with uuid

    Linux LVM commands result in Couldn't find device with uuid Couldn't find all physical volumes for v ...

  8. 字节序(byte order)和位序(bit order)

    字节序(byte order)和位序(bit order)  在网络编程中经常会提到网络字节序和主机序,也就是说当一个对象由多个字节组成的时候需要注意对象的多个字节在内存中的顺序.  以前我也基本只了 ...

  9. 【转】JMeter 聚合报告之90% Line参数说明

    其实要说明这个参数的含义非常简单,可能你早就知道他的含义,但我对这个参数一直有误解,而且还一直以为是“真理”,原于一次面试,被问到了这个问题,所以引起我这个参数的重新认识. 先说说我错误的认识: 我一 ...

  10. 2012_p1 质因数分解 (prime.cpp/c/pas)

    2012_p1 质因数分解 (prime.cpp/c/pas) 时间限制: 1 Sec  内存限制: 128 MB提交: 80  解决: 27[提交][状态][讨论版][命题人:外部导入] 题目描述 ...