R语言均值,中位数和模式

R统计分析是通过用许多内置函数来执行的。
大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。

我们正在讨论本章中的函数是平均数,中位数和模式。

平均值

它是通过取的值的总和,并除以一个数据系列的数量计算的。

函数mean()是用来计算这在R语言中

语法

用于计算平均值在 R 中的基本语法是:

mean(x, trim = 0, na.rm = FALSE,
...)

以下是所使用的参数的说明:

x 是输入向量。

trim 用于删除一些要素/空格从排序向量的两端。

na.rm 用于从输入矢量删除丢失的值。

示例

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- mean(x)

print(result.mean))

当我们上面的代码执行时,它产生以下结果:

[1] 8.22

应用修剪选项

当修剪参数被提供时,在向量中的值获得排序,然后观察所需要的数据从计算平均丢弃。

当trim =0.3,是从每一端的3个值将被从找到中计算删除的意思。

在这种情况下,排序矢量为(-21,-5,2,3,4.2,7,8,12,18,54)和从向量表除去,用于计算平均值的值从(-21,-5,2)左侧和从(12,18,54)右边。

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- 
mean(x,trim=0.3)

print(result.mean

当我们上面的代码执行时,它产生以下结果:

[1] 5.55

应用NA选项

如果有缺失值,则意味着函数返回 NA。

从计算中使用 na.rm= TRUE 删除缺失值。这意味着删除 NA
值。

# Create a vector.

 x <-
c(12,7,3,4.2,18,2,54,-21,8,-5,NA)



# Find mean.

result.mean <-  mean(x)

print(result.mean)



# Find mean dropping NA values.

result.mean <- 
mean(x,na.rm=TRUE)

print(result.mean)

当我们上面的代码执行时,它产生以下结果:

[1] NA

[1] 8.22

中位数

在一个数据串的中间最值被称为中值。median() 函数用于在 R
中计算此值。

语法

在 R 中用于计算中位数的基本语法是:

median(x, na.rm = FALSE)

以下是所使用的参数的说明:

x 是输入向量。

na.rm 用于从输入矢量删除丢失的值。

例子

# Create the vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find the median.

median.result <- median(x)

print(median.result)

当我们上面的代码执行时,它产生以下结果:

[1] 5.6

模式

模式是一个具有最高发生次数的一组数据的值。不同于平均数和中位数,模式可以同时拥有数字和字符数据。

R没有一个标准的内置函数来计算模式。因此,我们创建一个用户函数来计算在R数据集的模式,该函数将向量作为输入,并给出了模式的值输出。

示例

# Create the function.

getmode <- function(v) {

    uniqv
<- unique(v)

  
 uniqv[which.max(tabulate(match(v, uniqv)))]

}



# Create the vector with numbers.

v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)



# Calculate the mode using the user function.

result <- getmode(v)

print(result)



# Create the vector with characters.

charv <- c("o","it","the","it","it")



# Calculate the mode using the user function.

result <- getmode(charv)

print(result)

当我们上面的代码执行时,它产生以下结果:

[1] 2

[1] "it"

R语言均值,中位数和模式的更多相关文章

  1. R语言数据管理(二):模式与类

      最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...

  2. R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

    R语言︱数据集分组 大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较. 一.日期分组 1.关于时间的包都有很多 ...

  3. 使用R语言-计算均值,方差等

    R语言对于数值计算很方便,最近用到了计算方差,标准差的功能,特记录. 数据准备 height <- c(6.00, 5.92, 5.58, 5.92) 1 计算均值 mean(height) [ ...

  4. 基于R语言的数据分析和挖掘方法总结——中位数检验

    3.1 单组样本符号秩检验(Wilcoxon signed-rank test) 3.1.1 方法简介 此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilc ...

  5. 基于R语言的数据分析和挖掘方法总结——均值检验

    2.1 单组样本均值t检验(One-sample t-test) 2.1.1 方法简介 t检验,又称学生t(student t)检验,是由英国统计学家戈斯特(William Sealy Gosset, ...

  6. R语言平均值,中位数和众数

    R语言平均值,中位数和众数 R中的统计分析通过使用许多内置函数来执行的.这些函数大部分是R基础包的一部分.这些函数将R向量与参数一起作为输入,并在执行计算后给出结果. 我们在本章中讨论的是如何求平均值 ...

  7. 如何在R语言中使用Logistic回归模型

    在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...

  8. R语言实战(二)数据管理

    本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...

  9. 机器学习与R语言

    此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...

随机推荐

  1. php 支付宝新版本app支付以及回调

    ;支付宝快速接入; 支付宝2017年新版本支付基本业务逻辑 服务端生成字符串 交给客户端, 客户端调用接口,将这段字符串str传过去 调用起支付界面. 其中字符串str包含了所有请求参数,以及请求参数 ...

  2. sde中的shp数据无法编辑

    最近整理空间数据库时,用sde比较多,发现在编辑sde中的数据时总是出现数据被锁或者是被其他应用程序占用.用了很多方法处理,但不是每个方法都实用.下面讲的是我在删除shp或者给shp增加字段时所遇到的 ...

  3. ArcMap中给点shp添加字段后,shp文件破坏无法打开

    这两天遇到一个奇怪的问题,在整理项目中的建筑物数据时发现,有几个图层进行字段添加后出现问题,shp文件被损坏了.这问题很隐蔽,给shp添加字段后不报错,进行赋值,报错如下: 但是无论是选择“是”还是“ ...

  4. container中的内容 垂直-水平居中

    .container{ display: box; display: -webkit-box; -webkit-box-pack: center; -webkit-box-align: center; ...

  5. String、StringBuffer和StringBuilder源码解析

    1.String 1.1类的定义 public final class String implements java.io.Serializable, Comparable<String> ...

  6. kuangbin带我飞QAQ 线段树

    1. HDU1166 裸线段树点修改 #include <iostream> #include <string.h> #include <cstdio> #incl ...

  7. (大概是最全的解决方法)使用bandicam录制视频导入pr后音画不同步问题

    遇到这个问题大部分都是使用了VBR来录制视频导致的, 搜集了各种能够找到的方法,并没有每个尝试过 一 Handbrake转码 Audio out of sync AFTER importing 解决方 ...

  8. LA2238 Fixed Partition Memory Management

    题目大意: m(m<=10)个内存区域,n(n<=50)个程序.找出一个方案来,使得平均结束时刻尽量小.题目保证有解. 同一个程序运行在不同大小的内存区域内,其运行时间不同.(注意,这里说 ...

  9. UVA11722 Jonining with Friend

    Joining with Friend You are going from Dhaka to Chittagong by train and you came to know one of your ...

  10. Leetcode551.Student Attendance Record I学生出勤记录1

    给定一个字符串来代表一个学生的出勤纪录,这个纪录仅包含以下三个字符: 'A' : Absent,缺勤 'L' : Late,迟到 'P' : Present,到场 如果一个学生的出勤纪录中不超过一个' ...