频数表在统计学中是一个非常基本并且重要的概念,我们这里就来讲解它的基本用法。

首先我们需要载入数据,并查看数据的基本信息

  1. install.packages('vcd') #安装vcd包,其中有可以利用的数据Arthritis
  2. library(vcd)
  3. 载入需要的程辑包:grid
  4. > head(Arthritis)#################################################
  5. ID Treatment  Sex Age Improved
  6. 1 57   Treated Male  27     Some
  7. 2 46   Treated Male  29     None
  8. 3 77   Treated Male  30     None
  9. 4 17   Treated Male  32   Marked
  10. 5 36   Treated Male  46   Marked
  11. 6 23   Treated Male  58   Marked
  12. > class(Arthritis)################################################
  13. [1] "data.frame"
  14. > summary(Arthritis)##############################################
  15. ID          Treatment      Sex          Age          Improved
  16. Min.   : 1.00   Placebo:43   Female:59   Min.   :23.00   None  :42
  17. 1st Qu.:21.75   Treated:41   Male  :25   1st Qu.:46.00   Some  :14
  18. Median :42.50                            Median :57.00   Marked:28
  19. Mean   :42.50                            Mean   :53.36
  20. 3rd Qu.:63.25                            3rd Qu.:63.00
  21. Max.   :84.00                            Max.   :74.00

从结果中看以看出,Arthritis是一个data.frame结构的数据。其中ID和Age是numeric型的数据,其他三个都是factor型的数据。

创建一维列联表

  1. > a<-table(Arthritis$Improved)#创建一维列联表
  2. > class(a)                    #查看变量a的类型
  3. [1] "table"
  4. > a
  5. None   Some Marked
  6. 42     14     28

从结果中可以看出,就是如下的表格

None Some Marked
42 14 28

创建二维列联表

  1. > b<-table(Arthritis$Sex,Arthritis$Improved)
  2. > class(b)
  3. [1] "table"
  4. > b
  5. None Some Marked
  6. Female   25   12     22
  7. Male     17    2      6

结果是如下表格

  None Some Marked
Female 25 12 22
Male 17 2 6

 我们还可以将一维列联表a和二维列联表b转化成百分比的形式

  1. > prop.table(a)
  2. None      Some    Marked
  3. 0.5000000 0.1666667 0.3333333
  4. > prop.table(b)
  5. None       Some     Marked
  6. Female 0.29761905 0.14285714 0.26190476
  7. Male   0.20238095 0.02380952 0.07142857

给table添加边际和

  1. > addmargins(a)####################################
  2. None   Some Marked    Sum
  3. 42     14     28     84
  4. > addmargins(b)####################################
  5. None Some Marked Sum
  6. Female   25   12     22  59
  7. Male     17    2      6  25
  8. Sum      42   14     28  84
  9. > addmargins(prop.table(a))#########################
  10. None      Some    Marked       Sum
  11. 0.5000000 0.1666667 0.3333333 1.0000000
  12. > addmargins(prop.table(b))#########################
  13. None       Some     Marked        Sum
  14. Female 0.29761905 0.14285714 0.26190476 0.70238095
  15. Male   0.20238095 0.02380952 0.07142857 0.29761905
  16. Sum    0.50000000 0.16666667 0.33333333 1.00000000

只添加某个部分边际和

    1. > addmargins(prop.table(b),1)
    2. None       Some     Marked
    3. Female 0.29761905 0.14285714 0.26190476
    4. Male   0.20238095 0.02380952 0.07142857
    5. Sum    0.50000000 0.16666667 0.33333333
    6. > addmargins(prop.table(b),2)
    7. None       Some     Marked        Sum
    8. Female 0.29761905 0.14285714 0.26190476 0.70238095
    9. Male   0.20238095 0.02380952 0.07142857 0.29761905

[R语言统计]频数表的更多相关文章

  1. 通过R语言统计考研英语(二)单词出现频率

    通过R语言统计考研英语(二)单词出现频率 大家对英语考试并不陌生,首先是背单词,就是所谓的高频词汇.厚厚的一本单词,真的看的头大.最近结合自己刚学的R语言,为年底的考研做准备,想统计一下最近考研英语( ...

  2. R语言统计学习-1简介

    一. 统计学习概述 统计学习是指一组用于理解数据和建模的工具集.这些工具可分为有监督或无监督.1.监督学习:用于根据一个或多个输入预测或估计输出.常用于商业.医学.天体物理学和公共政策等领域.2.无监 ...

  3. R语言—统计结果输出至本地文件方法总结

    1.sink()在代码开始前加一行:sink(“output.txt”),就会自动把结果全部输出到工作文件夹下的output.txt文本文档.这时在R控制台的输出窗口中是看不到输出结果的.代码结束时用 ...

  4. R语言统计词频 画词云

    原始数据: 程序: #统计词频 library(wordcloud) # F:/master2017/ch4/weibo170.cut.txt text <- readLines("F ...

  5. R语言统计字符串的字符数ncahr函数

    函数计算字符数量,包括在一个字符串的空格的个数. 语法 nchar()函数的基本语法是: nchar(x) 以下是所使用的参数的说明: x - 向量输入. 示例 result <- nchar( ...

  6. R语言-简单线性回归图-方法

    目标:利用R语言统计描绘50组实验对比结果 第一步:导入.csv文件 X <- read.table("D:abc11.csv",header = TRUE, sep = & ...

  7. 手把手教你学习R语言

    本文为带大家了解R语言以及分段式的步骤教程! 人们学习R语言时普遍存在缺乏系统学习方法的问题.学习者不知道从哪开始,如何进行,选择什么学习资源.虽然网络上有许多不错的免费学习资源,然而它们多过了头,反 ...

  8. 【转】R语言知识体系概览

    摘要:R语言的知识体系并非语法这么简单,如果都不了R的全貌,何谈学好R语言呢.本文将展示介绍R语言的知识体系结构,并告诉读者如何才能高效地学习R语言. 最近遇到很多的程序员都想转行到数据分析,于是就开 ...

  9. R语言学习(一)前言

    本系列文章由 @YhL_Leo 出品,转载请注明出处. 文章链接: http://blog.csdn.net/yhl_leo/article/details/49768161 R是一个有着统计分析功能 ...

随机推荐

  1. C#Copy

    1.浅拷贝(值类型): public class LightCopy { public int Val { get; set; } public LightCopy(int ival) { Val = ...

  2. [Android开发那点破事]解决android.os.NetworkOnMainThreadException

    [Android开发那点破事]解决android.os.NetworkOnMainThreadException 昨天和女朋友换了手机,我的iPhone 4S 换了她得三星I9003.第一感觉就是好卡 ...

  3. 机器学习(5): K-means 算法

    3. K-means 算法:        3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一      3.2 算法接受参数 k :然后将事先输入的n个数据对象划分为 k个聚类以便 ...

  4. sql 跨表修改的方式

    update xhj_mon_job_log a set person_id = (select id from xhj_mon_job_manage b where a.task_id = b.id ...

  5. Mybatis(五):Mybatis的三种使用方式

    注意,这篇文章只介绍mybatis单独使用时如何操作,是没有用到spring的,如果需要了解mybatis和spring如何搭建,请移步这里Mybatis(六):spring与mybatis三种整合方 ...

  6. oracle 11G 导出空表失败的解决方法

    一.问题原因:     11G中有个新特性,当表无数据时,不分配segment,以节省空间     1.insert一行,再rollback就产生segment了. 该方法是在在空表中插入数据,再删除 ...

  7. [svc][op]Ubuntu优化-服务管理(启动级别)

    一 修改Ubuntu启动级别 sudo apt-get install sysv-rc-conf 执行: sysv-rc-conf 打x的表示开机启动. 二 启动级别 Ubuntu默认启动级别为2 r ...

  8. 使用PM2管理Node.js集群

    介绍 众所周知,Node.js运行在Chrome的JavaScript运行时平台上,我们把该平台优雅地称之为V8引擎.不论是V8引擎,还是之后的Node.js,都是以单线程的方式运行的,因此,在多核心 ...

  9. ny716 River Crossing

    River Crossing 时间限制:1000 ms  |  内存限制:65535 KB 难度:4 描述 Afandi is herding N sheep across the expanses ...

  10. Oracle PLSQL Demo - 07.LOOP循环,以EXIT WHEN退出[EXIT in LOOP]

    declare v_sal ; begin loop v_sal :; dbms_output.put_line(v_sal); ; end loop; end;