LibSVM是weka3.5以后的版本新加的功能,使用这个算法必须自己下载jar包,配置进项目: LibSVM在weka可视化界面的使用,很多人写过,但在clipse下的调用资料却不多,试了很多都不能完成,报错 libsvm classes not in CLASSPATH LibSVM 下载地址:不需要翻墙    https://www.csie.ntu.edu.tw/~cjlin/libsvm/ github地址:https://github.com/cjlin1/libsvm 步骤:1)下…
weka中实现了很多机器学习算法,不管实验室研究或者公司研发,都会或多或少的要使用weka,我的理解是weka是在本地的SparkML,SparkML是分布式的大数据处理机器学习算法,数据量不是很大的时候,使用weka可以模拟出很好的效果,决定使用哪个模型,然后再继续后续的数据挖掘工作. 下面总结一个eclipse中调用weka的Classifier分类器代码的Demo,通过这个实例,可以进一步跟踪分类算法的原理,查看weka源码,下一节中,介绍最简单的IB1(1NN)算法源码的具体分析. 以下…
Eclipse中配置weka 1 找到weka的安装位置,寻找weka的压缩文件weka-src.jar,将压缩文件解压,解压出的文件夹weka-src. 2 打开Eclipse,新建Java project项目weka. 3 选中包src,右击导入,选择General,选择文件系统,选择程序(weka-src\src\main\java)所在的路径,然后再Java前打勾,点击完成. 4 此时有很多错误,这是因为缺少java-cup.jar,选中右击工程项目weka,选择属性,然后选择Java构…
能来看我这篇博客的朋友,想必大家都知道,Weka采用Java编写的,因此,具有Java“一次编译,到处运行”的特性.支持的操作系统有Windows x86.Windows x64.Mac OS X.Linux等.这里不多赘述.  Weka系统安装一共分为: 1.安装Weka所需系统要求 下表,列举了运行Weka的特定版本对Java版本的要求. Java 1.4 1.5 1.6 Weka <3.4.0 X X X 3.4.x X X X 3.5.x 3.5.0-3.5.2 >3.5.2 r289…
1.如题. 最近写了一个FCM的聚类算法,希望能够可视化结果,因此一个想法是调用weka中的包,使自己的程序可以可视化.这里参考了网络上的方法,首先实现在Eclipse中调用weka包实现分类的功能. 步骤如下: 1. 到weka官网下载weka安装程序,并安装: 2.在weka安装目录:(我的是C://Program Files//Weka-3-6)找到两个jar包:weka.jar 和 weka-src.jar,以供下面使用: 3.在Eclipse中新建一个工程,并新建class: 4.在新…
不多说,直接上干货! Weka中数据挖掘与机器学习系列之Weka系统安装(四) Weka中数据挖掘与机器学习系列之Weka3.7和3.9不同版本共存(七) 情况1 对于在Weka里,通过Weka  Package  Manager安装所需包时,其实,大部分情况下,直接选中All单选按钮,显示全部包,找到你要安装的包. 比如,大家,可以去尝试下wavelet这个包.我这里不多赘述了 然后,单击Install按钮进行安装.这时,Weka会弹出一个窗口请用户确认,单击“是(Y)”按钮确认自己的操作,在…
第一步:新建一个java工程,new->javaproject,假设工程名为wekatest 第二步:导入weka.jar 第三步:src关联 导入后有许多的.class文件,直接双击打开是看不到代码的,需要到weka文件夹中把一个叫做weka-src.jar压缩包解压    左图是导入后看到的.class文件 左图是按住Ctrl键点击任一个.class文件会弹出这个窗口,点击attached source键把weka-src.jar文件路径输入进去,点ok. ok之后再尝试Ctrl+点击.cl…
酒店评论情感分析系统(四)——LingPipe在Eclipse中的运行 本来打算在做这个项目的时候,使用基于语义的文本倾向性分析方法,即先通过对评论文本进行中文分析,去停用词,然后在倾向性语义模式库的帮助下对抽取出来的形容词或短语逐一进行倾向性判断并赋予一个倾向值,最后将上述所有倾向值累加起来得到文章的总体文本倾向性.但是由于在建语料库和倾向性字典那块没有找到好的方法,并在查阅相关资料的时候,了解到一款自然语言处理软件包LingPipe,故最终决定用基于机器学习文本倾向性研究方法.   一.Li…
有的项目引用了太多的jar包,或者反射生成了太多的类,异或有太多的常量池,就有可能会报java.lang.OutOfMemoryError: PermGen space的错误, 我们知道可以通过jvm参数 -XX:MaxPermSize=256m来配置这部分堆内存的大小. 在eclipse中如何配置tomcat的内存大小呢? 首先需要双击tomcat server,如下图所示: 双击上图后会出现,tomcat配置的界面: 然后再点击上图的,红色矩形框的链接,会弹出tomcat参数配置的节面,要选…
前言:       毕业两年了,之前的工作一直没有接触过大数据的东西,对hadoop等比较陌生,所以最近开始学习了.对于我这样第一次学的人,过程还是充满了很多疑惑和不解的,不过我采取的策略是还是先让环境跑起来,然后在能用的基础上在多想想为什么.       通过这三个礼拜(基本上就是周六周日,其他时间都在加班啊T T)的探索,我目前主要完成的是: 1.在Linux环境中伪分布式部署hadoop(SSH免登陆),运行WordCount实例成功. http://www.cnblogs.com/Pur…