Shogun网站上的关于主流机器学习工具包的比较:

http://www.shogun-toolbox.org/page/features/

  created last updated main language main focus
shogun 1999 10-2013 C++ General Purpose ML Package with particular focus on large scale learning; Kernel Methods; Interfaces to various languages
weka 1997 07-2013 java General Purpose ML Package
kernlab 04-2004 11-2013 R Kernel Based Classification/Dimensionality Reduction
dlib 2006 10-2013 C++ Portability; Correctness
nieme 09-2006 03-2009 C++ Linear Regression; Ranking; Classification
orange 06-2004 11-2013 python Visual Data Analysis
java-ml 08-2008 07-2012 java Feature Selection
pyML 08-2004 09-2013 C++; python Kernel Methods
mlpy 02-2008 03-2012 python Basic Algorithms
pybrain 10-2008 02-2013 python Reinforcement Learning
torch7 01-2002 11-2013 C++;lua Neural Networks
scikit-learn 2007 08-2013 python; cython General Purpose with simple API and numpy / scipy idioms
   
shogun
weka
kernlab
dlib
nieme
orange
java-ml
pyML
mlpy
pybrain
torch3
scikit-learn
                         
General Features Graphical User Interface
  One Class Classification
  Classification
  Multiclass classification
  Regression
  Structured Output Learning
  Pre-Processing
  Built-in Model Selection Strategies
  Visualization
  Test Framework
  Large Scale Learning
  Semi-supervised Learning
  Multitask Learning
  Domain Adaptation
  Serialization
  Parallelized Code
  Performance Measures (auROC etc)
  Image Processing
                           
Supported Operating Systems Linux
  Windows
  Mac OSX
  Other Unix
                           
Language Bindings Python
  R
  Matlab
  Octave
  C/C++
  Command Line
  Java
  C#
  Lua
  Ruby
                           
SVM Solvers SVMLight
  LibSVM
  SVM Ocas
  LibLinear
  BMRM
  LaRank
  SVMPegasos
  SVM SGD
  other
                           
Regression Kernel Ridge Regression
  Support Vector Regression
  Gaussian Processes
  Relevance Vector Machine
                           
Multiple Kernel Learning MKL
  q-norm MKL
  multiclass MKL
                           
Classifiers Naive Bayes
  Bayesian Networks
  Multi Layer Perceptron
  RBF Networks
  Logistic Regression
  LASSO
  Decision Trees
  k-NN
  Gaussian Process Classification
                           
Linear Classifiers Linear Programming Machine
  LDA
                           
Distributions Markov Chains
  Hidden Markov Models
                           
Dimension Reduction PCA
  Kernel PCA
  Isomap
  Multidimensional scaling
  Sammon mapping
  Locally Linear Embedding
  Diffusion Map
  Local Tangent Space Alignment
  Laplacian Eigenmaps
  Barnes-Hut t-SNE
                           
Independent Component Analysis FIXME
                           
                           
Kernels Linear
  Gaussian
  Polynomial
  String Kernels
  Sigmoid Kernel
  Kernel Normalizer
                           
Feature Selection Forward
  Wrapper methods
  Recursive Feature Selection
                           
Missing Features Mean value imputation
  EM-based/model based imputation
                           
Clustering Hierarchical Clustering
  k-means
                           
Optimization BFGS
  conjugate gradient
  gradient descent
  bindings to CPLEX
  bindings to Mosek
  bindings to other solver
                           
Structural Output Learning Label Sequence Learning
  Factor Graph Learning
  SO-SGD
  Latent SO-SVM
                           
Supported File Formats Binary
  Arff
  HDF5
  CSV
  libSVM/ SVMLight format
  Excel
  Protobuf
                           
Supported Data Types Sparse Data Representation
  Dense Matrices
  Strings
  Support for native (e.g. C) types (char, signed and unsigned int8, int16, int32, int64, float, double, long double)

Shogun网站上的关于主流机器学习工具包的比较的更多相关文章

  1. 机器学习实战笔记一:K-近邻算法在约会网站上的应用

    K-近邻算法概述 简单的说,K-近邻算法采用不同特征值之间的距离方法进行分类 K-近邻算法 优点:精度高.对异常值不敏感.无数据输入假定. 缺点:计算复杂度高.空间复杂度高. 适用范围:数值型和标称型 ...

  2. java机器学习工具包

    下面是25个Java机器学习的工具&&库列表: 1. Weka 是一个数据挖掘任务机器学习算法的集合.这些算法可以直接应用于数据集或者在你自己的Java代码中调用.Weka 包含 数据 ...

  3. 淘宝网站上的 HTTP 缓存问题两则

    在阅读本文前推荐你先阅读我的前两篇文章< 扼杀 304,Cache-Control: immutable>和<关于缓存和 Chrome 的“新版刷新”>:下面要说的两个问题是在 ...

  4. python机器学习工具包scikit-learn

    scikit-learn这个非常强大的python机器学习工具包 http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.ht ...

  5. 2.在约会网站上使用k近邻算法

    在约会网站上使用k近邻算法 思路步骤: 1. 收集数据:提供文本文件.2. 准备数据:使用Python解析文本文件.3. 分析数据:使用Matplotlib画二维扩散图.4. 训练算法:此步骤不适用于 ...

  6. 还原网站上压缩的js代码

    还原网站上压缩的js代码 我们经常可以看到一些网站,把所需的javascript代码压缩成一行,就像下图这样 这种代码浏览器能读懂,但正常人是没法阅读的. 既然浏览器能读,浏览器当然也能还原这段代码. ...

  7. python爬虫学习-爬取某个网站上的所有图片

    最近简单地看了下python爬虫的视频.便自己尝试写了下爬虫操作,计划的是把某一个网站上的美女图全给爬下来,不过经过计算,查不多有好几百G的样子,还是算了.就首先下载一点点先看看. 本次爬虫使用的是p ...

  8. 【转】常见的python机器学习工具包比较

    http://algosolo.com/ 分析对比了常见的python机器学习工具包,包括: scikit-learn mlpy Modular toolkit for Data Processing ...

  9. 你是否经常忘记网站上的各种密码?分享个密码管理软件LastPass

      现在网络那么发达,我们上网的每个人势必会在各个网站上登陆,那势必会有一堆密码需要管理,那怎么能记住那么多网站的密码呢?我之前的做法是设置几个常用的密码,好多不重要的网站用一个,重要的网站用一个,然 ...

随机推荐

  1. linux文件系统节点详解

    linux文件系统有两层结构,逻辑结构和物理结构.也就是inode和block. 每个文件都有一个inode, 记录文件属性:权限,时间还有最重要的block号码. block是实际存放文件内容的地方 ...

  2. 享元模式(Flyweight Pattern)

    一.引言 在软件开发过程,如果我们需要重复使用某个对象的时候,如果我们重复地使用new创建这个对象的话,这样我们在内存就需要多次地去申请内存空间了,这样可能会出现内存使用越来越多的情况,这样的问题是非 ...

  3. UML类图分析

    继承: 实现: 关联: 依赖: 组合: 聚合:

  4. 16个常用IO流

    在包java.io.*:下 有以下16个常用的io流类: (Stream结尾的是字节流,是万能流,通常的视频,声音,图片等2进制文件, Reader/Writer结尾的是字符流,字符流适合读取纯文本文 ...

  5. eclipse android sdk content loader一直显示0%的问题解决

    今天上班启动eclipse,发现eclipse 一直卡在android sdk content loader的地方,一直显示为0%.百度后发现很多都是一下解决方法:  关闭Eclipse,删掉Ecli ...

  6. mysql 5.7修改密码

    关闭正在运行的 MySQL : [root@www.woai.it ~]# service mysql stop 运行 [root@www.woai.it ~]# mysqld_safe --skip ...

  7. 编写一个Singleton程序(单例)

    public class Test { private static Test test = new Test(); private Test(){}//构造方法私有化 private static ...

  8. Oracle索引失效问题:WHERE C1='' OR C2 IN(SubQuery),并发请求时出现大量latch: cache buffers chains等待

    问题描述: 项目反馈某功能响应时间很长,高峰期时系统整体响应很慢... 获取相应的AWR,问题确实比较严重,latch: cache buffers chains等待,因为这些会话SQL执行时间太长, ...

  9. 【SharePoint学习笔记】第2章 SharePoint Windows PowerShell 指南

    快速了解Windows PowerShell     从SharePoint 2010开始支持PowerShell,仍支持stsadm.exe工具:     可以调用.NET对象.COM对象.exe文 ...

  10. S5Time BCD码存储

    ,时基为1秒. 当使用S5TIME时,定义数值的范围为0~999,而且要指明使用的时基.时基指定了时间单位. S5TIME时基及相应的时间范围如下: 时基 BCD码 时间范围 10 ms 00 10 ...