数据分析与挖掘 - R语言：贝叶斯分类算法（案例三）

案例三比较简单，不需要自己写公式算法，使用了R自带的naiveBayes函数。

代码如下：

> library(e1071)
> classifier<-naiveBayes(iris[,1:4], iris[,5])

#或写成下面形式，都可以。

> classifier<- naiveBayes(Species ~ ., data = iris)    #其中Species是类别变量

#预测

> predict(classifier, iris[1, -5])

预测结果为：

[1] setosa

Levels: setosa versicolor virginica

和原数据一样！

*********************************这里是分割线**************************************

我们再拿这个方法来预测一下案例一中的样本。

#样本数据集：

mydata <- matrix(c("sunny","hot","high","weak","no",

                 "sunny","hot","high","strong","no",

                 "overcast","hot","high","weak","yes",

                 "rain","mild","high","weak","yes",

                 "rain","cool","normal","weak","yes",

                 "rain","cool","normal","strong","no",

                 "overcast","cool","normal","strong","yes",

                 "sunny","mild","high","weak","no",

                 "sunny","cool","normal","weak","yes",

                 "rain","mild","normal","weak","yes",

                 "sunny","mild","normal","strong","yes",

                 "overcast","mild","high","strong","yes",

                 "overcast","hot","normal","weak","yes",

                 "rain","mild","high","strong","no"), byrow = TRUE, nrow=14, ncol=5)

#添加列名：

colnames(mydata) <-  c("outlook","temperature","humidity","wind","playtennis")

#贝叶斯算法：

m<-naiveBayes(mydata[,1:4], mydata[,5])

#或使用下面的方法

m<- naiveBayes(playtennis ~ ., data = mydata)    
#报错：Error in sum(x) : invalid 'type' (character) of argument 无效的类型，只能是数字？

#创建预测数据集：

new_data = data.frame(outlook="rain", temperature="cool", humidity="normal", wind="strong", playtennis="so")

#预测：

predict(m, new_data)

在使用naiveBayes函数时报错：Error in sum(x) : invalid 'type' (character) of argument

我们看一下官方文档，对data有这样一句描述：

data　　Either a data frame of predictors (categorical and/or numeric) or a contingency table.

data是一个数字类型的数据框。

数据分析与挖掘 - R语言：贝叶斯分类算法（案例三）的更多相关文章

数据分析与挖掘 - R语言：贝叶斯分类算法（案例一）
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. 名词解释: 先验概率:由以往的数据分析得到的概率, 叫做先验概率. 后验概率:而在 ...
零基础数据分析与挖掘R语言实战课程（R语言）
随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析, 挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况 ...
数据分析与挖掘 - R语言：贝叶斯分类算法（案例二）
接着案例一,我们再使用另一种方法实例一个案例直接上代码: #!/usr/bin/Rscript library(plyr) library(reshape2) #1.根据训练集创建朴素贝叶斯分类器 ...
数据分析与挖掘 - R语言：KNN算法
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. KNN算法步骤:需对所有样本点(已知分类+未知分类)进行归一化处理.然后,对未知分 ...
数据分析与挖掘 - R语言：K-means聚类算法
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. 1.分析题目--有一个用户点击数据样本(husercollect)--按用户访问的 ...
数据分析与挖掘 - R语言：多元线性回归
一个简单的例子!环境:CentOS6.5Hadoop集群.Hive.R.RHive,具体安装及调试方法见博客内文档. 线性回归主要用来做预测模型. 1.准备数据集: X Y 0.10 42.0 0.1 ...
R语言分类算法之随机森林
R语言分类算法之随机森林 1.原理分析: 随机森林是通过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,然后根据自助样本集生成k个决策 ...
R语言神经网络算法
人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经网络由大量的人工神经元联结进行计算.大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自 ...
R语言、02 案例2-1 Pelican商店、《商务与经济统计》案例题
编程教材 <R语言实战·第2版>Robert I. Kabacoff 课程教材<商务与经济统计·原书第13版> (安德森) P48.案例2-1 Pelican 商店 PS C: ...

随机推荐

洛谷P1074 靶形数独【dfs】【剪枝】
题目:https://www.luogu.org/problemnew/show/P1074 题意: 数独的分数如下.一个数独的总分数就是权值乘所填数字之和. 现在给一个未完成的数独,问分数最高的数独 ...
InputStream只能读取一次的解决办法 C# byte[] 和Stream转换
x 情景--->>> 导入文件的时候,前台传过来一个文件, 后台接到: HttpPostedFileBase file = Request.Files[];由于对这个文件后台处理比较 ...
所生成项目的处理器架构“MSIL”与引用“***”的处理器架构“x86”不匹配。这种不匹配可能会导致运行时失败。请考虑通过配置管理器...
警告:所生成项目的处理器架构“MSIL”与引用“***”的处理器架构“x86”不匹配.这种不匹配可能会导致运行时失败.请考虑通过配置管理器更改您的项目的目标处理器架构,以使您的项目与引用间的处理器架构 ...
【作业】用栈模拟dfs
题意:一个迷宫,起点到终点的路径,不用递归. 题解: #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdli ...
hive拉链表
前言本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理.设计.以及在我们大数据场景下的实现方式. 全文由下面几个部分组成:先分享一下拉链表的用途.什么是拉链表.通过一些小的使用场景来对拉链表做 ...
express 写一个简单的web app
之前写过一个简单的web app, 能够完成注册登录,展示列表,CURD 但是版本好像旧了,今天想写一个简单的API 供移动端调用 1.下载最新的node https://nodejs.org/zh- ...
转：Java properties | FileNotFoundException: properties (系统找不到指定的文件。)
原文地址:https://blog.csdn.net/cor_twi/article/details/44514871 web项目 (dynamic web project ) 读取propertie ...
xadmin与django-rest-framework的集成（1）
什么是xadmin?什么是django-rest-framework? xadmin是开源的一个类似于django自带的后台管理系统admin的开源模块,它基于bootstrap3框架,内置强大的插件 ...
洛谷P3960 列队 NOIp2017 线段树/树状数组/splay
正解:动态开点线段树解题报告: 传送门! 因为最近学主席树的时候顺便get到了动态开点线段树?刚好想起来很久很久以前就想做结果一直麻油做的这题,,,所以就做下好了QAQ 然后说下,这题有很多种方法, ...
Java 生成三位随机数
调用这个Math.Random()函数能够返回带正号的double值,该值取值区间是[0.0,1.0),注意,它是左闭右开区间.返回值是一个伪随机选择的数,在该范围内(近似)均匀分布. 如果生成三位随 ...

数据分析与挖掘 - R语言：贝叶斯分类算法（案例三）

数据分析与挖掘 - R语言：贝叶斯分类算法（案例三）的更多相关文章

随机推荐

热门专题