第一周-调用weka算法进行数据挖掘

简单数据集data.txt

@relation weather

@attribute outlook {sunny, overcast, rainy}

@attribute temperature numeric

@attribute humidity numeric

@attribute windy {TRUE, FALSE}

@attribute play {yes, no}

@data

sunny,85,85,FALSE,no

sunny,80,90,TRUE,no

overcast,83,86,FALSE,yes

rainy,70,96,FALSE,yes

rainy,68,80,FALSE,yes

rainy,65,70,TRUE,no

overcast,64,65,TRUE,yes

sunny,72,95,FALSE,no

sunny,69,70,FALSE,yes

rainy,75,80,FALSE,yes

sunny,75,70,TRUE,yes

overcast,72,90,TRUE,yes

overcast,81,75,FALSE,yes

rainy,71,91,TRUE,no

在eclipse中新建项目导入weka.jar包，调用weka中的一些算法。

package test;

import java.io.BufferedReader;

import java.io.FileNotFoundException;

import java.io.FileReader;

import weka.classifiers.Classifier;

import weka.classifiers.Evaluation;

import weka.classifiers.evaluation.NominalPrediction;

import weka.classifiers.rules.DecisionTable;

import weka.classifiers.rules.PART;

import weka.classifiers.trees.DecisionStump;

import weka.classifiers.trees.J48;

import weka.core.FastVector;

import weka.core.Instances;

@SuppressWarnings("deprecation")

public class WeakTest {

	public static BufferedReader readDataFile(String filename) {

		BufferedReader inputReader = null;

		try {

			inputReader = new BufferedReader(new FileReader(filename));

		} catch (FileNotFoundException ex) {

			System.err.println("File not found: " + filename);

		}

		return inputReader;

	}

	public static Evaluation classify(Classifier model,

			Instances trainingSet, Instances testingSet) throws Exception {

		Evaluation evaluation = new Evaluation(trainingSet);

		model.buildClassifier(trainingSet);

		evaluation.evaluateModel(model, testingSet);

		return evaluation;

	}

	public static double calculateAccuracy(FastVector predictions) {

		double correct = 0;

		for (int i = 0; i < predictions.size(); i++) {

			NominalPrediction np = (NominalPrediction) predictions.elementAt(i);

			if (np.predicted() == np.actual()) {

				correct++;

			}

		}

		return 100 * correct / predictions.size();

	}

	public static Instances[][] crossValidationSplit(Instances data, int numberOfFolds) {

		Instances[][] split = new Instances[2][numberOfFolds];

		for (int i = 0; i < numberOfFolds; i++) {

			split[0][i] = data.trainCV(numberOfFolds, i);

			split[1][i] = data.testCV(numberOfFolds, i);

		}

		return split;

	}

	public static void main(String[] args) throws Exception {

		BufferedReader datafile = readDataFile("E:\\yuce/data.txt");

		Instances data = new Instances(datafile);

		data.setClassIndex(data.numAttributes() - 1);

		// Do 10-split cross validation

		Instances[][] split = crossValidationSplit(data, 10);

		// Separate split into training and testing arrays

		Instances[] trainingSplits = split[0];

		Instances[] testingSplits = split[1];

		// Use a set of classifiers

		Classifier[] models = {

				new J48(), // a decision tree

				new PART(),

				new DecisionTable(),//decision table majority classifier

				new DecisionStump() //one-level decision tree

		};

		// Run for each model

		for (int j = 0; j < models.length; j++) {

			// Collect every group of predictions for current model in a FastVector

			FastVector predictions = new FastVector();

			// For each training-testing split pair, train and test the classifier

			for (int i = 0; i < trainingSplits.length; i++) {

				Evaluation validation = classify(models[j], trainingSplits[i], testingSplits[i]);

				predictions.appendElements(validation.predictions());

				// Uncomment to see the summary for each training-testing pair.

				//System.out.println(models[j].toString());

			}

			// Calculate overall accuracy of current classifier on all splits

			double accuracy = calculateAccuracy(predictions);

			// Print current classifier's name and accuracy in a complicated,

			// but nice-looking way.

			System.out.println("Accuracy of " + models[j].getClass().getSimpleName() + ": "

					+ String.format("%.2f%%", accuracy)

					+ "\n---------------------------------");

		}

	}

}

运行截图

第一周-调用weka算法进行数据挖掘的更多相关文章

第一周总结笔记 / 斯坦福-Machine Learning-Andrew Ng
课程主页:https://www.coursera.org/learn/machine-learning/home/welcome 收集再多的资料也没用,关键是要自己理解总结,做笔记就是一个归纳总结的 ...
Weka算法Classifier-tree-J48源代码分析（一个）基本数据结构和算法
大约一年,我没有照顾的博客,再次拿起笔不知从何写上,想来想去手从最近使用Weka要正确书写. Weka为一个Java基础上的机器学习工具.上手简单,并提供图形化界面.提供如分类.聚类.频繁项挖掘等工具 ...
20172328 2018-2019《Java软件结构与数据结构》第一周学习总结
20172328 2018-2019<Java软件结构与数据结构>第一周学习总结概述 Generalization 本周学习了软件质量.数据结构以及算法分析的具体内容,主要依托于所用教材 ...
20172306 2018-2019 《Java程序设计与数据结构》第一周学习总结
20172306 2018-2019 <Java程序设计与数据结构(下)>第一周学习总结教材学习内容总结第一章概述 (程序=数据结构+算法软件=程序+软件工程) 1.1 软件质量 ...
20172302 《Java软件结构与数据结构》第一周学习总结
2018下半年学习总结博客总目录:第一周教材学习内容总结第一章概述 1.软件质量软件工程(Software Engineering)是一门关于高质量软件开发的技术和理论的学科. 软件质量从以下 ...
20172308《Java软件结构与数据结构》第一周学习总结
教材学习内容总结第 1 章概述软件质量的特征:正确性.可靠性.健壮性.可用性.可维护性.可重用性(别人写的组件自己可以拿过来用).可移植性.运行效率数据结构:计算机存储.组织数据的方式程序 ...
20172329 2018-2019《Java软件结构与数据结构》第一周学习总结
2018-2019-20172329 <Java软件结构与数据结构>第一周学习总结在这学期就已经大二了,也已经步入了学习专业课的核心时间,在这个阶段,我们应该了解自己的学习情况,针对自己 ...
20172305 2018-2019-1 《Java软件结构与数据结构》第一周学习总结
20172305 2018-2019-1 <Java软件结构与数据结构>第一周学习总结教材学习内容总结本周内容主要为书第一章和第二章的内容: 第一章软件质量: 正确性(软件达到特定需 ...
在Eclipse中调用weka包实现分类
1.如题. 最近写了一个FCM的聚类算法,希望能够可视化结果,因此一个想法是调用weka中的包,使自己的程序可以可视化.这里参考了网络上的方法,首先实现在Eclipse中调用weka包实现分类的功能. ...

随机推荐

DNS服务搭建（正反向解析）
版权声明:本文为博主原创文章,支持原创,转载请附上原文出处链接和本声明. 本文地址链接:https://www.cnblogs.com/wannengachao/p/11954625.html 1.安 ...
洛谷 P5640 【CSGRound2】逐梦者的初心
洛谷 P5640 [CSGRound2]逐梦者的初心洛谷传送门题目背景注意:本题时限修改至250ms,并且数据进行大幅度加强.本题强制开启O2优化,并且不再重测,请大家自己重新提交. 由于Y校的 ...
WPF 动态生成对象属性（dynamic）
原文:WPF 动态生成对象属性 (dynamic) 项目中列行的数据都需要动态生成所以考虑到对象绑定可需要一个动态生成属性的意思缺点加载速度会慢很明显的慢解决办法尽量减轻动态属性的量 ...
<Stack> （高频）394 ( 高频)224
394. Decode String 四种情况: 1. 数字,把之前有的数字乘以10再加本数字 2. ' [ ', 入口, 把之前的数字压入栈中并num归零. 3. ' ] ' ,出口,归零.用dfs ...
webpack入门配置步骤详解
1.初始化 1.npm install webpack webpack-cli webpack-dev-server --g 全局安装必要的第三方插件 2.mkdir config dist src ...
Unity TextMeshPro 一键生成工具
本文参考了这片博客文章,在此基础上进行优化和改进: https://blog.csdn.net/akof1314/article/details/80868869 先截张效果图: TextMeshPr ...
json递归查询
主体: class json_search(): '''递归查询依赖key''' def search_key(self,data,key): self.data = data self.key_va ...
idea 方法注释live template
groovyScript("def result=''; def params="${_1}".replaceAll('[\\[|\\]|\\s]', '').split ...
点云3D 目标检测
点云点云是雷达采集到的信息. 关于点云基本介绍参考https://zhuanlan.zhihu.com/p/22581673 ros中的点云消息结构:http://docs.ros.org/jade ...
MySQL学习——存储引擎
MySQL学习——存储引擎摘要:本文主要学习了MySQL数据库的存储引擎. 什么是存储引擎数据库存储引擎是数据库底层软件组件,数据库管理系统使用数据引擎进行创建.查询.更新和删除数据操作.不同的存 ...

第一周-调用weka算法进行数据挖掘

第一周-调用weka算法进行数据挖掘的更多相关文章

随机推荐

热门专题