上海交大模式分析与机器智能实验室 LIBSVM

2024-10-19

【libsvm学习】

参考: http://www.cnblogs.com/bigshuai/articles/2883256.html http://www.cnblogs.com/tornadomeet/archive/2012/04/12/2443993.html

原文:http://blog.csdn.net/flydreamgg/article/details/4470121 其实,在之前上海交大模式分析与机器智能实验室对2.6版本的svm.cpp做了部分注解,(在哪里?google一下你就知道).但是,这个注释只是针对代码而注释,整篇看下来,你会发现除了理解几个参数的含义,还是会对libsvm一头雾水.当然作为理解程序的辅助材料,还是有很大用处的.特别是,对几个结构体的说明,比较清楚.但是要清楚程序具体做了什么,还是要追踪程序中去. 由于svm涉及的

LibSVM学习详细说明

代码文件主要针对Matlab进行说明,但个人仍觉得讲解的支持向量机内容非常棒,可以做为理解这一统计方法的辅助资料; LibSVM是台湾林智仁(Chih-Jen Lin)教授2001年开发的一套支持向量机的库,这套库运算速度还是挺快的,可以很方便的对数据做分类或回归.由于libSVM程序小,运用灵活,输入参数少,并且是开源的,易于扩展,因此成为目前国内应用最多的SVM的库. 这套库可以从http://www.csie.ntu.edu.tw/~cjlin/免费获得,目前已经发展到2.89版.下载.z

libsvm的安装，数据格式，常见错误，grid.py参数选择，c-SVC过程，libsvm参数解释，svm训练数据，libsvm的使用详解，SVM核函数的选择

直接conda install libsvm安装的不完整,缺几个.py文件. 第一种安装方法: 下载:http://www.csie.ntu.edu.tw/~cjlin/cgi-bin/libsvm.cgi?+http://www.csie.ntu.edu.tw/~cjlin/libsvm+tar.gz 在/home/common/anaconda3/lib/python3.6/site-packages下创建一个libsvm文件夹,并将libsvm.so.2复制到到libsvm文件夹中(lib

nlp总结

中科院nlpir和海量分词(http://www.hylanda.com/)是收费的. hanlp:推荐基于CRF的模型的实现~~要看语料,很多常用词会被分错,所以需要词库支撑.目前最友好的开源工具包应该是HanLP,基于词典,对各种实体词汇做了HMM,也提供了CRF模型.工程实现也不错,性能不是瓶颈.代码有相对完备的注释,文档也比较全,各种算法原理实现也有对应blog,自己研究和做二次开发都比较方便. 最近写了一款分词器,调研了不少文章的开源实现.最终定的方案是 Language Model

【NLP】Python NLTK获取文本语料和词汇资源

Python NLTK 获取文本语料和词汇资源作者:白宁超 2016年11月7日13:15:24 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集.模型上提供了全面.易用的接口,涵盖了分词.词性标注(Part-Of-Speech tag, POS-tag).命名实体识别(Named Entity Recognition, NER).句法分析(Syntactic Parse)等各项 NLP 领域的功能.本文主要介绍NLTK(Na

利用更快的r-cnn深度学习进行目标检测

此示例演示如何使用名为“更快r-cnn(具有卷积神经网络的区域)”的深度学习技术来训练对象探测器. 概述此示例演示如何训练用于检测车辆的更快r-cnn对象探测器.更快的r-nnn [1]是r-cnn [2]和快速r-nnn [3]对象检测技术的引伸.所有这三种技术都使用卷积神经网络(cnn).它们之间的区别在于它们如何选择要处理的区域以及如何对这些区域进行分类.r-cnn和快速r-概算在运行美国有线电视新闻网之前使用区域建议算法作为预处理步骤.提议算法通常是技术例如edgox [4]或选择性搜

2018年终总结之AI领域开源框架汇总

2018年终总结之AI领域开源框架汇总 [稍显活跃的第一季度] 2018.3.04——OpenAI公布 “后见之明经验复现(Hindsight Experience Reply, HER)”的开源算法,这个新的算法保证人工智能可以像人类一样从自己的错误中汲取教训. 2018.3.13——第四范式免费对外开放旗下“第四范式智能客服平台”,这是智能客服市场的首款免费产品. 2018.3.18——Uber开源了神经进化算法开发的交互式可视化工具 VINE,该工具可以轻松实现神经网络群体的各种特定指标以

2018 AI产业界大盘点

2018 AI产业界大盘点大事件盘点 “ 1.24——Facebook人工智能部门负责人Yann LeCun宣布卸任 Facebook人工智能研究部门(FAIR)的负责人Yann LeCun宣布卸任,之后将担任Facebook首席人工智能科学家,保留对FAIR的研究方向的控制.同时,原工作将由新任负责人Jérôme Pesenti 接替,Facebook应用机器学习小组(AML)和Yann LeCun将同时向其汇报.而Jérôme Pesenti 将直接向Facebook CTO汇报

语音识别ASR - HTK(HResults)计算字错率WER、句错率SER

HResults计算字错率(WER).句错率(SER) 前言好久没发文,看到仍有这么多关注的小伙伴,觉得不发篇文对不住.确实好久没有输出经验总结相关的文档,抽了个时间,整理了下笔记,发一篇关于ASR常用测试指标.比如字错率.句错率指标,以及计算工具HResults的使用篇,后续慢慢找时间输出一些人工智能领域,小白可理解可用的基础知识,或者整理一些其他笔记发一发. 转载说明本文为原创文章,如需转载,请在开篇显著位置注明作者Findyou和出处一.基础概念 1.1.语音识别(ASR) 语音识别

图像处理、计算机视觉与模式识别“SCI期刊和顶级会议”总结

期刊: best (1) IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE模式分析与机器智能汇刊,简称PAMI,是IEEE最重要的学术性汇刊之一. (2) ACM Transactions on Graphics,美国计算机协会图形汇刊,简称TOG,该刊侧重于计算机图形的处理,影响因子在该领域也比较高. (3) International Journal of Computer Vision,该刊也是该领域的顶

NLTK与自然语言处理基础

NLTK (Natural Language Toolkit) NTLK是著名的Python自然语言处理工具包,但是主要针对的是英文处理.NLTK配套有文档,有语料库,有书籍. NLP领域中最常用的一个Python库开源项目自带分类.分词等功能强大的社区支持语料库,语言的实际使用中真是出现过的语言材料 http://www.nltk.org/py-modindex.html 在NLTK的主页详细介绍了如何在Mac.Linux和Windows下安装NLTK:http://nltk.org/

科研不是比赛，而是一种对未知和完美的自我追求——跟邢波（Eric Xing）面对面聊科研

编者按:6月26日,2014年国际机器学习大会(ICML)在北京国际会议中心完美落幕.作为机器学习领域两大顶尖年会之一,这是 ICML大会30多年来首次来到中国和远东,在国内的机器学习界震动不小.身为本次大会主席的卡耐基梅隆大学计算机系教授邢波(Eric Xing)为此做了诸多努力.作为在美国机器学习领域前沿为数不多的华人学者,许多国内计算机专业学生渴望投身其门下.借着此次大会的举办,我们也有幸和Eric坐下来,面对面的聊一聊他对科研的态度以及对后辈们的建议. 问:从生物学博士到计算机科学博士,

计算机视觉和模式识别领域SCI期刊介绍

原帖地址: http://blog.sciencenet.cn/blog-370458-750306.html 关于计算机视觉和模式识别领域的期刊并不是很多,下面我收集了一些该领域的代表性期刊,并介绍了他们的影响因子以及投稿难度和审稿周期.希望对大家有帮助吧,后期大家还有发现的可以留言,补充哦. 首先介绍计算机视觉领域的4个顶级代表性期刊吧. (1) IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE模式分析与机

ASR测试方法---字错率(WER)、句错率(SER)统计

一.基础概念 1.1.语音识别(ASR) 语音识别(speech recognition)技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR), 狭隘一点白话说:将语音转换为文字的技术. 维基百科:https://zh.wikipedia.org/wiki/语音识别 Findyou:一般使用ASR缩写. 1.2.句错率(SER) 句错误率:Sentence Error Rate 解释:句子识别错误的的个数,除以总的句子个数即为SER 计算公式:(

(十四)Android NDK混淆

1.ollvm下载编译我的是macbook环境. 参考obfuscator官网:https://github.com/obfuscator-llvm/obfuscator/wiki 执行下面的命令下载并编译: $ git clone -b llvm-4.0 https://github.com/obfuscator-llvm/obfuscator.git $ mkdir build $ cd build $ cmake -DCMAKE_BUILD_TYPE=Release ../obfusca

微软亚洲研究院研究员获选IEEE Fellow 和ACM Distinguished Member

年末将至,微软亚洲研究院喜讯连连.近日,IEEE(国际电气电子工程师学会)和ACM(美国计算机协会)先后公布了2017年度的院士名单(IEEE Fellow)和2016年度杰出会员名单(ACM Distinguished Member).其中,微软亚洲研究院共有四名研究员获选,他们分别是:刘铁岩博士获得IEEE Fellow和ACM Distinguished Member双重荣誉,华刚博士.梅涛博士以及郑宇博士荣获ACM Distinguished Member称号.这一殊荣代表着计算机学

谷歌2019 学术指标发榜：CVPR首次进入Top 10，何恺明论文引用最高！

[导读]今天,谷歌发布了2019最新版学术指标,对收录的会议和期刊的影响力进行排名.AI类的多个顶会进入榜单Top 100,CVPR更是进入前10,而何恺明的"深度残差网络"单篇引用次数高达25256次,引用量最高! 今天,谷歌正式发布了2019年版的学术指标(Scholar Metrics). 本次发布涵盖2014-2018年发表的文章,并包括了截至2019年7月在谷歌学术中被索引的所有文章的引用 . 最新版的谷歌学术指标有以下亮点: 两大自然科学顶刊Nature和Science分别

MOJITO 发布一周，爬一波弹幕分析下

MOJITO 最近一直啥都没写,追个热点都赶不上热乎的,鄙视自己一下. 周董的新歌「MOJITO」发售(6 月 12 日的零点)至今大致过去了一周,翻开 B 站 MV 一看,播放量妥妥破千万,弹幕破十万,这人气还真是杠杠的. 说实话, 「MOJITO」这个名字对我来讲有点超纲了,第一次见到完全不知道啥意思. 不过问题不大,没有什么是百度解决不了的,如果有,那就再加一个知乎. MOJITO 的中文名是莫吉托,百度百科上是这么介绍莫吉托的: 莫吉托(Mojito)是最有名的朗姆调酒之一.起源于

WEKA运行LIBSVM出现problem evaluating classifier：rand

原来这个实验已经做了的.也出现了些问题,但是上网找到了解决方法,那个时候是完成数据挖掘的课程论文,用WEKA运行LIBSVM,也没有很深入,简单跑出结果就算了. 这次想着研讨会就讲这个,想着深入进去,顺便看下用Java实现下算法,看下有没有可以深入的点,发篇中文核心. 但是上次是在实验室另一台机子上配置好的,换了个机子后,简单地装了下weka,没有把wlsvm.jar和libsvm.jar放到weka安装目录下,出现了libSVM classes not in CLASSPATH. 然后才想起原