HCIE数据挖掘笔记-005数据挖掘专业名词

【HCIE数据挖掘笔记-005数据挖掘专业名词】的更多相关文章

HCIE数据挖掘笔记-005数据挖掘专业名词

数据对象和属性类别: 数据一般有噪声,数量庞大,且来自不同的数据源数据集由数据对象组成,一个数据对象代表一个实体数据对象:样本.实例.数据点.对象数据对象以数据元组的形式存放在数据库中,数据库的行对应于数据对象,列对应于属性属性是一个数据字段,与维.特征.变量对应维用于数据仓库中特征用于机器学习中变量用于统计学中属性的类型值域属性有四大类: 标称属性:只代表某种类别,不具有意义的序(无排序)例如第一食堂.第二食堂这种也是不具有意义的序二元属性:标称属性的一种特殊情况 …

机器学习&数据挖掘笔记_14（GMM-HMM语音识别简单理解）

为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的.不得不说,网络上关于语音识别的通俗易懂教程太少,都是各种公式满天飞,很少有说具体细节的,当然了,那需要有实战经验才行.下面总结以下几点,对其有个宏观印象即可(以孤立词识别为例). 一.每个单词的读音都对应一个HMM模型,大家都知道HMM模型中有个状态集S,那么每个状态用什么来表示呢,数字?向量?矩阵?其实这个状态集中的状态没有具体的…

机器学习&数据挖掘笔记（常见面试之机器学习算法思想简单梳理）

机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 作者:tornadomeet 出处:http://www.cnblogs.com/tornadomeet 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越…

[转]机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）

机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 转自http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大…

javascript各种专业名词

刚开始学javascript经常看到各种专业名词,在此整理一下个人的学习笔记: 直接量直接量——就是程序中直接使用的数据值,如:88 //数字(String)"hello world" //字符串(Number)true //布尔值(Boobean)/[a-z][0-9]/ //正则表达式(RegExp)null //空值(null){x:1,y:2} //对象(Object)[1,2,3,4,5] //数组(Array) 标识符(变量名) 标识符——就是一个名字,用来…

Android开发专业名词及工具概述

前言: 系统的学习下Android开发中涉及到的一些专业名词和Android开发工具名词: 一.SDK(Software Development Kit) 软件开发工具包:一般都是一些软件工程师为特定的软件包.软件框架.硬件平台.操作系统等建立应用软件时的开发工具的集合. 二.API(Application Programming Interface) 应用程序接口,在Android中即sdk提供的方法(函数) 三..9.png “.9.png”是Andriod平台的应用软件开发里的一种特殊…

机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）

前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大. 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺少的,国内大点的公司里百度,阿里,腾讯,网易,搜狐,华为(华为的岗位基本都是随机分配,机器学习等岗位基本面向的是博士)等…

机器学习&数据挖掘笔记_25（PGM练习九：HMM用于分类）

前言: 本次实验是用EM来学习HMM中的参数,并用学好了的HMM对一些kinect数据进行动作分类.实验内容请参考coursera课程:Probabilistic Graphical Models 中的的最后一个assignmnet.实验用的是kinect关节点数据,由于HMM是一个时序模型,且含有隐变量,所以这个实验不是很好做.大家对HMM不熟悉的话可以参考网友的实验:code. kinect人体关节数据中, 每个关节点由3个坐标数据构成,多个关节点数据(实验中为10个)构成一个pose,多个…

机器学习&数据挖掘笔记_24（PGM练习八：结构学习）

前言: 本次实验包含了2部分:贝叶斯模型参数的学习以及贝叶斯模型结构的学习,在前面的博文PGM练习七:CRF中参数的学习中我们已经知道怎样学习马尔科夫模型(CRF)的参数,那个实验采用的是优化方法,而这里贝叶斯模型参数的学习是先假定样本符合某种分布,然后使用统计的方法去学习这些分布的参数,来达到学习模型参数的目的.实验内容请参考coursera课程:Probabilistic Graphical Models中的assignmnet 8,实验code可参考网友的:code 实验中所用到的bod…

机器学习&数据挖掘笔记_22（PGM练习六：制定决策）

前言: 本次实验是将一些简单的决策理论和PGM推理结合,实验内容相对前面的图模型推理要简单些.决策理论采用的是influence diagrams,和常见图模型本质一样, 其中的决策节点也可以用CPD来描述,做决策时一般是采用最大期望效用准则(MEU).实验内容参考参考的内容是coursera课程:Probabilistic Graphical Models中的assignment 5. 实验code可参考网友的:code. 实验中一些函数简单说明: Fnew = VariableElimina…