R语言均值,中位数和模式

R统计分析是通过用许多内置函数来执行的。
大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。

我们正在讨论本章中的函数是平均数,中位数和模式。

平均值

它是通过取的值的总和,并除以一个数据系列的数量计算的。

函数mean()是用来计算这在R语言中

语法

用于计算平均值在 R 中的基本语法是:

mean(x, trim = 0, na.rm = FALSE,
...)

以下是所使用的参数的说明:

x 是输入向量。

trim 用于删除一些要素/空格从排序向量的两端。

na.rm 用于从输入矢量删除丢失的值。

示例

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- mean(x)

print(result.mean))

当我们上面的代码执行时,它产生以下结果:

[1] 8.22

应用修剪选项

当修剪参数被提供时,在向量中的值获得排序,然后观察所需要的数据从计算平均丢弃。

当trim =0.3,是从每一端的3个值将被从找到中计算删除的意思。

在这种情况下,排序矢量为(-21,-5,2,3,4.2,7,8,12,18,54)和从向量表除去,用于计算平均值的值从(-21,-5,2)左侧和从(12,18,54)右边。

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- 
mean(x,trim=0.3)

print(result.mean

当我们上面的代码执行时,它产生以下结果:

[1] 5.55

应用NA选项

如果有缺失值,则意味着函数返回 NA。

从计算中使用 na.rm= TRUE 删除缺失值。这意味着删除 NA
值。

# Create a vector.

 x <-
c(12,7,3,4.2,18,2,54,-21,8,-5,NA)



# Find mean.

result.mean <-  mean(x)

print(result.mean)



# Find mean dropping NA values.

result.mean <- 
mean(x,na.rm=TRUE)

print(result.mean)

当我们上面的代码执行时,它产生以下结果:

[1] NA

[1] 8.22

中位数

在一个数据串的中间最值被称为中值。median() 函数用于在 R
中计算此值。

语法

在 R 中用于计算中位数的基本语法是:

median(x, na.rm = FALSE)

以下是所使用的参数的说明:

x 是输入向量。

na.rm 用于从输入矢量删除丢失的值。

例子

# Create the vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find the median.

median.result <- median(x)

print(median.result)

当我们上面的代码执行时,它产生以下结果:

[1] 5.6

模式

模式是一个具有最高发生次数的一组数据的值。不同于平均数和中位数,模式可以同时拥有数字和字符数据。

R没有一个标准的内置函数来计算模式。因此,我们创建一个用户函数来计算在R数据集的模式,该函数将向量作为输入,并给出了模式的值输出。

示例

# Create the function.

getmode <- function(v) {

    uniqv
<- unique(v)

  
 uniqv[which.max(tabulate(match(v, uniqv)))]

}



# Create the vector with numbers.

v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)



# Calculate the mode using the user function.

result <- getmode(v)

print(result)



# Create the vector with characters.

charv <- c("o","it","the","it","it")



# Calculate the mode using the user function.

result <- getmode(charv)

print(result)

当我们上面的代码执行时,它产生以下结果:

[1] 2

[1] "it"

R语言均值,中位数和模式的更多相关文章

  1. R语言数据管理(二):模式与类

      最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...

  2. R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

    R语言︱数据集分组 大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较. 一.日期分组 1.关于时间的包都有很多 ...

  3. 使用R语言-计算均值,方差等

    R语言对于数值计算很方便,最近用到了计算方差,标准差的功能,特记录. 数据准备 height <- c(6.00, 5.92, 5.58, 5.92) 1 计算均值 mean(height) [ ...

  4. 基于R语言的数据分析和挖掘方法总结——中位数检验

    3.1 单组样本符号秩检验(Wilcoxon signed-rank test) 3.1.1 方法简介 此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilc ...

  5. 基于R语言的数据分析和挖掘方法总结——均值检验

    2.1 单组样本均值t检验(One-sample t-test) 2.1.1 方法简介 t检验,又称学生t(student t)检验,是由英国统计学家戈斯特(William Sealy Gosset, ...

  6. R语言平均值,中位数和众数

    R语言平均值,中位数和众数 R中的统计分析通过使用许多内置函数来执行的.这些函数大部分是R基础包的一部分.这些函数将R向量与参数一起作为输入,并在执行计算后给出结果. 我们在本章中讨论的是如何求平均值 ...

  7. 如何在R语言中使用Logistic回归模型

    在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...

  8. R语言实战(二)数据管理

    本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...

  9. 机器学习与R语言

    此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...

随机推荐

  1. HZOI20190722 B visit 组合数+CRT合并

    题目:https://www.cnblogs.com/Juve/articles/11226266.html solution: 30%:dp 设dp[k][i][j]表示经过k时间,在(i,j)的方 ...

  2. 浏览器标准模式与怪异模式-CSS1Compat and BackCompat

    由于历史的原因,各个浏览器在对页面的渲染上存在差异,甚至同一浏览器在不同版本中,对页面的渲染也不同.在W3C标准出台以前,浏览器在对页面的渲染上没有统一规范,产生了差异(Quirks mode或者称为 ...

  3. resin乱码

    一.jsp乱码 为何jsp 在resin下乱码,但在tomcat下却工作良好的问题 关于JSP页面中的pageEncoding和contentType两种属性的区别:       pageEncodi ...

  4. 装配SpringBean(一)--依赖注入

    所谓依赖注入,我觉得说白了其实就是给成员变量赋值,不管这个成员变量是基本类型还是引用类型,Spring中常用的依赖注入方式有两种: 1.构造器注入 2.setter注入 下面通过代码实例说明这两种注入 ...

  5. mysql知识点回顾与梳理

    一.sql语句执行顺序 from join on where group by avg,sum,count等各种函数 having select distinct order by(asc(升序),d ...

  6. JasperReports报表区段14

    我们将在本章开始,一个简单的报表模板的结构看.依样画葫芦JasperReports的结构报表模板归类到多个区段.部分是有规定的高度,并且可以包含像直线,矩形,图像或文本字段对象报表的部分. 通过提供的 ...

  7. 记一次PHP 数组基本用法

    以前不知道PHP数组可以这样叠加. $b = array( '2' => 'zhang', ); $a = array( ' => 'li' ) + $b; print_r($a); $b ...

  8. 访问树中的所有元素(DOM)

    创建一个函数,给定页面上的DOM元素,将访问元素本身及其所有后代(而不仅仅是它的直接子代).对于访问的每个元素,函数应将该元素传递给提供的回调函数. 函数的参数应该是: 一个DOM元素 一个回调函数( ...

  9. HDU1950

    //虽然是一道LIS问题,但是还是第一次用O(n*lgn)这种算法,赶角波错哈哈哈哈....至少今天有所收获 #include<cstdio> #include<cstring> ...

  10. Linux下安装docker,更改镜像仓库地址,并部署springboot应用

    今天做不成的事,明天也不会做好. 各位同学大家好,随着docker的快速发展,越来越多的人开始使用,一方面随着容器化这个趋势越来越火,docker成为了其中的佼佼者:二来容器化确实降低了运维的门槛,让 ...