Weka-学习】的更多相关文章

转载自:https://blog.csdn.net/u011067360/article/details/20844443 数据挖掘开源软件:WEKA基础教程 本文档部分来自于网络,随着自己的深入学习,讲不断的修订和完善. 第一节   Weka简介: Weka是由新西兰怀卡托大学开发的智能分析系统(Waikato Environment for Knowledge Analysis)  .在怀卡托大学 以外的地方,Weka通常按谐音念成Mecca,是一种现今仅存活于新西兰岛的,健壮的棕色鸟, …
 Weka 简介   WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归.聚类.关联规则以及在新的交互式界面上的可视化. Weka是基于java,用于数据挖掘和知识分析一个平台.来自世界各地的java爱好者们都可以把自己的算法放在这个平台上,然后从海量数据中发掘其背后隐藏的种种关系:也许你只是出于对数据的狂热爱好,但也许你的发现会蕴含着无限的商机. 打开Weka,首先出现一个窗口.这是一个很简单的窗体,提供四个按钮:Simple…
代码整个运行流程 參数设置 input数据,设置数据格式 batchFinished(),处理数据(Tokenzier,Stemming,Stopwords) determineDictionary();  统计计算(TF,IDF) 归一化 output 一些变量和方法的作用 m_Dictionary , m_DocsCounts  变量与 m_OutputCounts变量 意义 public TreeMap m_Dictionary = new TreeMap(); //TreeMap类型成员…
步骤: (一) 选择数据源 (二)选择要分析的字段 (三)选择需要的关联规则算法 (四)点击start运行 (五) 分析结果 算法选择: Apriori算法参数含义 1.car:如果设为真,则会挖掘类关联规则而不是全局关联规则.2.classindex: 类属性索引.如果设置为-1,最后的属性被当做类属性.3.delta: 以此数值为迭代递减单位.不断减小支持度直至达到最小支持度或产生了满足数量要求的规则.4.lowerBoundMinSupport: 最小支持度下界.5.metricType:…
载入数据 (一)打开文件 (二) 打开url (三) 打开数据库 (四)从一些数据生成器(DataGenerators)中生成人造数据    这篇主要写(三)中的连接mySql          网上教程很多这里写个简单步骤 推荐一篇文章 http://blog.csdn.net/senaku/article/details/2225943 下载必要的工具 mysql驱动(有的就别下了) http://pan.baidu.com/share/link?shareid=2530503288&uk=…
一.说明 IG是information gain 的缩写,中文名称是信息增益,是选择特征的一个很有效的方法(特别是在使用svm分类时).这里不做详细介绍,有兴趣的可以googling一下. chi-square 是一个常用特征筛选方法,在种子词扩展那篇文章中,有详细说明,这里不再赘述. 二.weka中的使用方法 1.特征筛选代码 package com.lvxinjian.alg.models.feature; import java.nio.charset.Charset; import ja…
目录: 1. 简介 2.界面初识 3.数据格式 4.数据准备 5.关联规则 6.分类与回归 7.聚类分析 8.Weka相关资料 9.Weka二次开发 10.Weka源代码导入 1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到.同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰.是一款免费的,非商业化(与之…
一.前 沿 数据挖掘就是从大量的.不完全的.有噪声的.模糊的.随机的数据中,提取隐含在其中的.人们事先不知道的但又是潜在有用的信息和知识的过程.数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述性(Descriptive)模式.在应用中往往根据模式的实际作用细分为以下几种:分类,估值,预测,相关性分析,序列,时间序列,描述和可视化等. 数据挖掘涉及的学科领域和技术很多,有多种分类法.根据挖掘任务分,可分为分类或预测模型发现.…
import java.io.*;import weka.classifiers.*;import weka.classifiers.meta.Vote;import weka.core.Instance;import weka.core.Instances;import weka.core.SelectedTag;import weka.core.converters.ArffLoader;public class test { /** * @param args */ public stat…
链接:http://www.cs.waikato.ac.nz/ml/weka/index.html 一简介: WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归.聚类.关联规则以及在新的交互式界面上的可视化. >术语:WEKA所处理的数据集是一个二维的表格,表格里的一个横行称作一个实例(Instance),相…