R语言均值,中位数和模式
在R统计分析是通过用许多内置函数来执行的。
大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。
我们正在讨论本章中的函数是平均数,中位数和模式。
平均值
它是通过取的值的总和,并除以一个数据系列的数量计算的。
函数mean()是用来计算这在R语言中
语法
用于计算平均值在 R 中的基本语法是:
mean(x, trim = 0, na.rm = FALSE,
...)
以下是所使用的参数的说明:
x 是输入向量。
trim 用于删除一些要素/空格从排序向量的两端。
na.rm 用于从输入矢量删除丢失的值。
示例
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find Mean.
result.mean <- mean(x)
print(result.mean))
当我们上面的代码执行时,它产生以下结果:
[1] 8.22
应用修剪选项
当修剪参数被提供时,在向量中的值获得排序,然后观察所需要的数据从计算平均丢弃。
当trim =0.3,是从每一端的3个值将被从找到中计算删除的意思。
在这种情况下,排序矢量为(-21,-5,2,3,4.2,7,8,12,18,54)和从向量表除去,用于计算平均值的值从(-21,-5,2)左侧和从(12,18,54)右边。
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find Mean.
result.mean <-
mean(x,trim=0.3)
print(result.mean
当我们上面的代码执行时,它产生以下结果:
[1] 5.55
应用NA选项
如果有缺失值,则意味着函数返回 NA。
从计算中使用 na.rm= TRUE 删除缺失值。这意味着删除 NA
值。
# Create a vector.
x <-
c(12,7,3,4.2,18,2,54,-21,8,-5,NA)
# Find mean.
result.mean <- mean(x)
print(result.mean)
# Find mean dropping NA values.
result.mean <-
mean(x,na.rm=TRUE)
print(result.mean)
当我们上面的代码执行时,它产生以下结果:
[1] NA
[1] 8.22
中位数
在一个数据串的中间最值被称为中值。median() 函数用于在 R
中计算此值。
语法
在 R 中用于计算中位数的基本语法是:
median(x, na.rm = FALSE)
以下是所使用的参数的说明:
x 是输入向量。
na.rm 用于从输入矢量删除丢失的值。
例子
# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find the median.
median.result <- median(x)
print(median.result)
当我们上面的代码执行时,它产生以下结果:
[1] 5.6
模式
模式是一个具有最高发生次数的一组数据的值。不同于平均数和中位数,模式可以同时拥有数字和字符数据。
R没有一个标准的内置函数来计算模式。因此,我们创建一个用户函数来计算在R数据集的模式,该函数将向量作为输入,并给出了模式的值输出。
示例
# Create the function.
getmode <- function(v) {
uniqv
<- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}
# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)
# Calculate the mode using the user function.
result <- getmode(v)
print(result)
# Create the vector with characters.
charv <- c("o","it","the","it","it")
# Calculate the mode using the user function.
result <- getmode(charv)
print(result)
当我们上面的代码执行时,它产生以下结果:
[1] 2
[1] "it"
R语言均值,中位数和模式的更多相关文章
- R语言数据管理(二):模式与类
最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...
- R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)
R语言︱数据集分组 大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较. 一.日期分组 1.关于时间的包都有很多 ...
- 使用R语言-计算均值,方差等
R语言对于数值计算很方便,最近用到了计算方差,标准差的功能,特记录. 数据准备 height <- c(6.00, 5.92, 5.58, 5.92) 1 计算均值 mean(height) [ ...
- 基于R语言的数据分析和挖掘方法总结——中位数检验
3.1 单组样本符号秩检验(Wilcoxon signed-rank test) 3.1.1 方法简介 此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilc ...
- 基于R语言的数据分析和挖掘方法总结——均值检验
2.1 单组样本均值t检验(One-sample t-test) 2.1.1 方法简介 t检验,又称学生t(student t)检验,是由英国统计学家戈斯特(William Sealy Gosset, ...
- R语言平均值,中位数和众数
R语言平均值,中位数和众数 R中的统计分析通过使用许多内置函数来执行的.这些函数大部分是R基础包的一部分.这些函数将R向量与参数一起作为输入,并在执行计算后给出结果. 我们在本章中讨论的是如何求平均值 ...
- 如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
- R语言实战(二)数据管理
本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...
- 机器学习与R语言
此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...
随机推荐
- php 支付宝新版本app支付以及回调
;支付宝快速接入; 支付宝2017年新版本支付基本业务逻辑 服务端生成字符串 交给客户端, 客户端调用接口,将这段字符串str传过去 调用起支付界面. 其中字符串str包含了所有请求参数,以及请求参数 ...
- sde中的shp数据无法编辑
最近整理空间数据库时,用sde比较多,发现在编辑sde中的数据时总是出现数据被锁或者是被其他应用程序占用.用了很多方法处理,但不是每个方法都实用.下面讲的是我在删除shp或者给shp增加字段时所遇到的 ...
- ArcMap中给点shp添加字段后,shp文件破坏无法打开
这两天遇到一个奇怪的问题,在整理项目中的建筑物数据时发现,有几个图层进行字段添加后出现问题,shp文件被损坏了.这问题很隐蔽,给shp添加字段后不报错,进行赋值,报错如下: 但是无论是选择“是”还是“ ...
- container中的内容 垂直-水平居中
.container{ display: box; display: -webkit-box; -webkit-box-pack: center; -webkit-box-align: center; ...
- String、StringBuffer和StringBuilder源码解析
1.String 1.1类的定义 public final class String implements java.io.Serializable, Comparable<String> ...
- kuangbin带我飞QAQ 线段树
1. HDU1166 裸线段树点修改 #include <iostream> #include <string.h> #include <cstdio> #incl ...
- (大概是最全的解决方法)使用bandicam录制视频导入pr后音画不同步问题
遇到这个问题大部分都是使用了VBR来录制视频导致的, 搜集了各种能够找到的方法,并没有每个尝试过 一 Handbrake转码 Audio out of sync AFTER importing 解决方 ...
- LA2238 Fixed Partition Memory Management
题目大意: m(m<=10)个内存区域,n(n<=50)个程序.找出一个方案来,使得平均结束时刻尽量小.题目保证有解. 同一个程序运行在不同大小的内存区域内,其运行时间不同.(注意,这里说 ...
- UVA11722 Jonining with Friend
Joining with Friend You are going from Dhaka to Chittagong by train and you came to know one of your ...
- Leetcode551.Student Attendance Record I学生出勤记录1
给定一个字符串来代表一个学生的出勤纪录,这个纪录仅包含以下三个字符: 'A' : Absent,缺勤 'L' : Late,迟到 'P' : Present,到场 如果一个学生的出勤纪录中不超过一个' ...