Weka 入门2】的更多相关文章

这次我们介绍Evaluation类.在上一次中我们只是单纯的预测了分类值,并没有其他评价数据.这场我们使用Evalution类.首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数.如果我们没有训练数据和测试数据,那么我们可以使用Cross Validation验证方式,即交叉验证.Cross ValidateModel方法的四个参数分别为,第一个是分类器,第二个是在某个数据集上评价的数据集,第三个参数是交叉检验的次数(…
现在我们介绍使用Weka来对数据进行分类.对数据进行分类,我们必须先指定那一列作为预测类别.因为数据文件格式的问题,类别一般都是最后一列属性.我们可以使用setClassIndex来设置类别.然后我们要选择分类器,分类器有很多,我们暂时使用J48分类器.对数据进行训练可以使用buildClassifier,然后我们可以用classifyInstance来查看训练数据预测的类别值.当然预测的类别会用数值表示,比如0,1,2....代表预测的值属于第几个类别.例如类别的值为{sunny,rainy}…
本人也是借鉴网上他人资料.主要介绍使用java调用Weka库. 首先介绍weka,Weka的全名是怀卡托智能分析环境,是基于开源环境的机器学习和数据挖掘软件.我们可以去weka官网下载最新的Weka软件,目前最新版本是3.7.9.默认安装会保存 在C:\Program Files\Weka-3-7目录下,目录下有一个data的文件夹,里面存放的是一些数据集,我们也可以把data文件拷到别的地方更方便调用,这里面的数据可以用于我们学习Weka的使用.我们以data文件夹中的一个.arff文件为例对…
每天都必须记录自己的一点一滴,不记录下来,过一段时间就会忘记,忘记了就等于没有经历过. 我不能每天这样浑浑噩噩的过下去.我要有计划,有梦想.追求卓越.成就不同. 我今天開始我的学习weka之路.学的时候我在质疑,我为什么要学weka?难道仅仅是为了在读研的同学面前炫耀:看我project做的不错,研究能力也不赖,哈哈!还是仅仅是追求潮流技术?还是仅仅是想证明自己还是优秀的.我和别人不一样?终于我的答案是假设不学.我什么也得不到,可是学了.假设实用,那么值了.就算没用,那我也避免了自己滑向堕落!…
https://www.youtube.com/user/WekaMOOC 大学公开课  视频教程 weka 入门教程 data Mining with Weka: Trailer  More Data Mining with Weka data Mining with Weka: Trailer  More Data Mining with Weka 用weka 进行数据挖掘 用weka 进行更多数据挖掘 https://www.youtube.com/watch?v=LcHw2ph6bss&…
目录: 1. 简介 2.界面初识 3.数据格式 4.数据准备 5.关联规则 6.分类与回归 7.聚类分析 8.Weka相关资料 9.Weka二次开发 10.Weka源代码导入 1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到.同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰.是一款免费的,非商业化(与之…
1 功能角度 weka是机器学习方面的工具(开源).spss是数学工具(商业工具). 具体的说,weka的主要功能是模式分类,或者模式识别或者回归.包括特征的降维(PCA),特征选择,训练模型以及对测试样本进行分类测试,几乎包含了机器学习中的所有常用分类器.当然还有聚类以及结果的图形可视化功能. spss,侧重统计分析.包括基础的数学运算,联合分析,时间序列分析,多元尺度方法等,当然它也有决策树,神经网络等类似于机器学习中的分类器功能. 相同点是都具有数据的回归功能,但是weka包含了机器学习的…
1 R的下载.安转   (转)R有很多的版本,支持目前主流的操作系统MAC.Linux和WINDOWS系列.因为我个人是在WINDOWS下用R的,所以在这里将只介绍WINDOWS下R的下载&安装. 下载R: 你可以从世界各地很多网站上下载到R,官方的中国下载点是: http://www.lmbe.seu.edu.cn/CRAN/bin/windows/base/ 在我写这篇文章的时候,最新的版本是R-2.2.1版. 在网络上有一篇被翻译过来的R入门教材,可以在这里找到 :R 導論(入門) 安装R…
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 .简介 1.1 Spark简介 年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处,Spark以其先进的设计理念,迅速成为社区的热门项目,围绕着Spark推出了Spark SQL.Spark Streaming.MLLib和GraphX等组件,也就是BDAS(伯克利数据分析栈),这些组件逐渐形成大数据处理一站式解决平台.从各方面报道来看Spark抱负并非池鱼,…
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的WEKA,实验内容主要有三部分,第一是分类挖掘(垃圾邮件过滤),第二是聚类分析,第三是关联挖掘. 3)本文由于过长,且实验报告内的评估观点有时不一定正确,希望抛砖引玉. (一)WEKA在Ubuntu下的配置 下载解压 下载和解压weka .下载: 创建目录:sudo mkdir /usr/weka. 解压weka到该目录:unzip weka-3-6-10.zip -d /us…