ML(4): NavieBayes在R中的应用

朴素贝叶斯方法是一种使用先验概率去计算后验概率的方法, 具体见上一节. 算法包:e1071 函数:navieBayes(formule,data,laplace=0,...,subset,na.action=na.pass) Formule: 公式的形式:class~x1 + x2 + ..... 相互作用是不允许的 data: 数据集 lapace: 正面双控制拉普拉期平滑.默认值(0)禁用拉普拉斯平滑.它的思想非常简单,就是对没类别下所有划分的计数为1,这样如果训练样本集数量充分大时,并不…

R中一切都是vector

0.可以说R语言中一切结构体的基础是vector! R中一切都是vector,vecotor的每个component必须类型一致(character,numeric,integer....)!vector 是没有dimensions的也没有attributes,所以去掉dimension和attributes就成了vector(其实dimension可以作为attributes的一个属性存在但是named** 命名**一般不会作为attributes的属性的)解释下 0.1为何没有dimensi…

简单介绍一下R中的几种统计分布及常用模型

统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数.比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm.下面我们列出各分布后缀,前面加前缀d.p.q或r就构成函数名:norm:正态,t:t分布,f:F分布,chisq:卡方(包括非中心) unif:均匀,exp:指数,wei…

R中的par()函数的参数

把R中par()函数的主要参数整理了一下(另外本来还整理了每个参数的帮助文档中文解释,但是太长,就分类之后,整理为图表,excel不便放上来,就放了这些表的截图)…

关于R中的mode()和class()的区别

本文原创,转载请注明出处,本人Q1273314690(交流学习) 说明:本文曾经在15年11月在CSDN发过,但是由于CSDN不支持为知笔记的发布为博客的API功能,所以,自今天起,转移到博客园(幸好原来的CSDN也就五六篇哈~). ############################################### 总结: mode:表示对象在内存中的存储类型基本数据类型'atomic' mode: numeric(Integer/double), complex, chara…

R中的name命名系列函数总结

本文原创,转载请注明出处,本人Q1273314690 R中关于给行列赋名称的函数有 dimnames,names,rowname,colname,row.names 这五个函数,初学的时候往往分不清楚他们的区别和各自该用在什么情况下才比较合适. 我做了简单的总结,希望能帮助大家,每个函数的细节我也参照帮助文档做了笔记,但太长就不宜贴到博文了. 建议是如数据框和列表,是在创建对象的时候就直接命名我们平常使用的时候,最好统一一下用法,免得混乱. 原数表格: 来自为知笔记(Wiz…

总结——R中查看属性的函数

本文原创,转载注明出处,本人Q1273314690 R中知道一个变量的主要内容和结构,对我们编写代码是很重要的,也可以帮我们避免很多错误. 但是,R中有好几个关于属性查看的函数,我们往往不知道什么时候使用哪个函数更合适. 在此总结如下: 所以结论是,通常还是使用attributes函数和str函数,就OK了原始表格: 具体的几个函数的细节,虽然我也写了,但文章太长,不再贴出来自为知笔记(Wiz) 附件列表…

R中创建not-yet-evaluated对象

create not-yet-evaluated object在R中创建 not-yet-evaluated(就是some code we will evaluated later!!)对象;然后执行的时候需要调用eval(参数中提供执行环境)或者do.ca()执行: do.call()作用就是 do.call( "someRFunction",aListOfArgs) <=> someRFuncion( aListOfArgs ); do.call() is constr…

R中，去掉dataframe中的NA行

R中使用complete.cases 和 na.omit来去掉包含NA的行现在有个一data.frame datafile如下所示 Date sulfate nitrate ID 1 2015-1-1 NA NA 1 2 2015-1-2 2 6 1 3 2015-1-3 NA 3 1 4 2015-1-4 4 NA 1 5 2015-1-5 NA NA NA 6 2015-1-6 5 7 1 去掉所有包含NA的行, datafile[complete.c…

机器学习:形如抛物线的散点图在python和R中的非线性回归拟合方法

对于样本数据的散点图形如函数y=ax2+bx+c的图像的数据, 在python中的拟合过程为: ##最小二乘法 import numpy as np import scipy as sp import matplotlib.pyplot as plt from scipy.optimize import leastsq ''' 设置样本数据,真实数据需要在这里处理 ''' ##样本数据(Xi,Yi),需要转换成数组(列表)形式 Xi=np.array([1,2,3,4,5,6]) #Yi=np.…

在R中整理数据

原始数据一般分散杂乱,并含有缺失和错误值,因此在进行数据分析前首先要对数据进行整理. 一.首先,了解原始数据的结构. 可使用如下函数(归属baseR)来查看数据结构: class(dataobject) 查看数据对象的类别 dim(dataobject) 查看数据的维度 names(dataobject) 查看列名 str(dataobject) 查看数据概要 glimpse(dataobject) 查看数据概要二.将数据变得整洁可使用下列函数(归属package: tidyr)整理数…

R中sort(), rank(), order()

在R中,和排序相关的函数主要有三个:sort(),rank(),order(). sort(x)是对向量x进行排序,返回值排序后的数值向量.rank()是求秩的函数,它的返回值是这个向量中对应元素的“排名”.而order()的返回值是对应“排名”的元素所在向量中的位置. > x<-c(30,2,100)> sort(x)[1] 2 30 100> order(x)[1] 2 1 3> x[order(x)][1] 2 30 100> rank(x)[1] 2…

在 R 中估计 GARCH 参数存在的问题（基于 rugarch 包）

目录在 R 中估计 GARCH 参数存在的问题(基于 rugarch 包) 导论 rugarch 简介指定一个 \(\text{GARCH}(1, 1)\) 模型模拟一个 GARCH 过程拟合一个 \(\text{GARCH}(1,1)\) 模型 rugarch 中的优化与参数估计优化器的选择结论在 R 中估计 GARCH 参数存在的问题(基于 rugarch 包) 本文翻译自<Problems in Estimating GARCH Parameters in R (Part 2…

在 R 中估计 GARCH 参数存在的问题（续）

目录在 R 中估计 GARCH 参数存在的问题(续) rugarch 包的使用简单实验 rugarch 参数估计的行为极端大样本结论在 R 中估计 GARCH 参数存在的问题(续) 本文承接<在 R 中估计 GARCH 参数存在的问题> 链接:https://www.cnblogs.com/xuruilong100/p/9986088.html 在之前的博客<在 R 中估计 GARCH 参数存在的问题>中,Curtis Miller 讨论了 fGarch 包和 tseri…

在 R 中估计 GARCH 参数存在的问题

目录在 R 中估计 GARCH 参数存在的问题 GARCH 模型基础估计 GARCH 参数 fGarch 参数估计的行为结论译后记在 R 中估计 GARCH 参数存在的问题本文翻译自<Problems In Estimating GARCH Parameters in R > 原文链接:https://ntguardian.wordpress.com/2017/11/02/problems-estimating-garch-parameters-r/ 更新(11/2/17 3:00…

adb install -r 中出现INSTALL_FAILED_UNKNOWN_SOURCES，怎样解决？

adb install -r 中出现INSTALL_FAILED_UNKNOWN_SOURCES,怎样解决? D:\android_code\0708\tools>adb install -r D:\work_feixun\Gallery2.apk3030 KB/s (7663016 bytes in 2.469s) pkg: /data/local/tmp/Gallery2.apkFailure [INSTALL_FAILED_UNKNOWN_SOURCES] 解决:设置->安全->未…

R中ifelse、which、%in%的用法

R中ifelse.which.%in%的用法 (2014-02-08 13:54:08)标签: 教育在R学习过程中,遇到了ifelse.which.%in%,下面分别举例,说明他们的用法.1.ifelseifelse(test, yes, no)test为真,输出yes值,否则输出no值.举例如下:> x <- c(1,1,1,0,0,1,1)> ifelse(x != 1, 1, 0) #若果x的值不等于1,输出1,否则输出0[1] 0 0 0 1 1 0 0 2.which用法wh…

R中使用rvest爬取数据小试

总结R中使用 xpath 和 css selectors 获取标签内容(xpath功能强大,而CSS选择器通常语法比较简洁,运行速度更快些) 例:抓取下面标签的内容: <h3 class="lister index unbold text"><span>小明他很忙</span></h3> (1)使用xpath(与python里使用xpath 相似,R中可以使用html_text() 获取标签中的内容,如"<span>…

R中基本函数学习[转载]

转自:https://www.douban.com/note/511740050/ 1.数据管理 numeric:数值型向量 logical:逻辑型向量 character:字符型向量list:列表 data.frame:数据框 c:连接为向量或列表 √length:求长度subset:求子集 √seq,from:to,sequence:等差序列 √rep:重复 NA:缺失值 NULL:空对象 sort,order,unique,rev:排序 unlist:展平列表 attr,att…

R中字符串操作

简介 Stringr中包含3个主要的函数族字符操作空格处理模式匹配常用函数在平常的数据分析工作中,经常要用到如下的函数函数操作 str_length() 获取字符串长度 str_sub() 截取字符串 str_dup() 复制字符串 str_pad() 空格填充 str_trunc() 截取字符串 str_trim() 去除空格 str_split(str, "[:,]") 拆分 str_c() str_c() 拼接 str_detect() 检测模式是否存在 str_s…

【翻译】R 中的设计模式

目录 R 中的设计模式不动点算法包装器模式接口模式柯里化(Currying) 闭包(Closures) 缓存模式计数器模式 R 中的设计模式本文翻译自 Design Patterns in R(By Sebastian Warnholz). 本文的灵感来源于: Stuart Sierra 的演讲,关于函数式编程中的设计模式:以及我从 F# for fun an profit 想到的想法:以及我在使用 R 的过程中用不同方法解决问题获得的反馈. 设计模式似乎是一个很大的词,特别是因…

R语言编程艺术（2）R中的数据结构

本文对应<R语言编程艺术>第2章:向量:第3章:矩阵和数组:第4章:列表:第5章:数据框:第6章:因子和表 ========================================================================= R语言最基本的数据类型就是向量(vector),单个数值和矩阵都是向量的一种特例. 声明:R中不需要声明变量,但是注意函数式语言的特性,如果读写向量中的元素时,R事先不知道对象是向量的话,则函数没有执行的对象.如下代码是无法工作的: y[1]…

R中的各种概率统计分布

名称名称 R对应的名字附加参数 β分布 beta beta shape1, shape2, ncp 二项式分布 binomial binom size, prob 柯西分布 Cauchy cauchy location, scale 卡方分布 chi-squared chisq df, ncp 指数分布 exponential exp rate F分布 F f df1, df1, ncp Gamma(γ)分布 gamma gamma shape, scale 几何分布 geometric g…

R中绘制聚类的离散图

R中利用cluster简单的绘制常见聚类离散图 # 引入cluster库(clara.fanny) library(cluster) # 聚类散点图绘制 # 引入factoextra,cluster库(fviz_cluster) library(ggplot2) library(factoextra) # 确定簇心个数 cluster_num <- 3 # 读取数据 data <- read.csv("data.csv",header = T) # 调用kmeans算法 k…

(2)R中的数据类型和数据结构

R中的数据结构主要面向<线性代数>中的一些概念,如向量.矩阵等.值得注意的是,R中其实没有简单数据(数值型.逻辑型.字符型等),对于简单类型会自动看做长度为1的向量.比如: > b=5 > length(b) [1] 1 > typeof(b) [1] "double" > mode(b) [1] "numeric" R中最重要的数据结构是向量(vector)和矩阵(matrix). 向量由一系列类型相同的有序元素构成:矩阵是数组…

R中的路径设置

软件的路径设置对于电脑的内存管理和自己的寻根究底十分重要.所以,合理的设置R中相关路径,能更加方便快捷的管理自己的相关文件,提高学习R语言的效率,建立自己的习惯体系. R中的路径设置主要有以下几个方面: 工作目录的路径安装包的路径关于工作目录 1.使用getwd()函数来显示当前工作目录. > getwd() [1] "C:/Users/Administrator/Documents" 1 2 2.使用setwd()函数更改当前目录. > dir.create(&quo…

R中的sample函数

今天介绍一些运算函数,它们的使用很简单,没有什么难度,但是也会用的着. 在医学统计学或者流行病学里的现场调查.样本选择经常会提到一个词:随机抽样.随机抽样是为了保证各比较组之间均衡性的一个很重要的方法.那么今天介绍的第一个函数就是用于抽样的函数sample: > x=1:10 > sample(x=x) [1] 3 5 9 6 10 7 2 1 8 4 第一行代码表示给x向量x赋值,第二行代码表示对x向量进行随机抽样.结果输出为每次抽样抽得的结果,可以看出该抽样为无放回抽样-…

R中的apply族函数和多线程计算

一.apply族函数 1.apply 应用于矩阵和数组 # apply # 1代表行,2代表列 # create a matrix of 10 rows x 2 columns m <- matrix(c(1:10, 11:20), nrow = 10, ncol = 2) # mean of the rows apply(m, 1, mean) [1] 6 7 8 9 10 11 12 13 14 15 # mean of the columns apply(m, 2, mean) [1]…

R中K-Means、Clara、C-Means三种聚类的评估

R中cluster中包含多种聚类算法,下面通过某个数据集,进行三种聚类算法的评估 # ============================ # 评估聚类 # # ============================ # 引入fpc包(cluster.stats) library(fpc) # 引入包库(clara.fanny) library(cluster) #=====调用聚类算法====================================================…

R中利用SQL语言读取数据框（sqldf库的使用）

熟悉MySQL的朋友可以使用sqldf来操作数据框 # 引入sqldf库(sqldf) library(sqldf) # 释放RMySQL库的加载(针对sqldf报错) #detach("package:RMySQL", unload=T) # 读取数据 data <- read.csv("data.csv") # sql查询 results <- sqldf("select distinct(name) from data") #…

【ML(4): NavieBayes在R中的应用】的更多相关文章