for i, (input, target) in enumerate(trainloader): # measure data loading time data_time.update(time.time() - end) input, target = input.cuda(), target.cuda() if i==2: def for_hook(module,input, output): print('output values:',output) handle2 = model.…
Caffe Python特征抽取 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ Caffe大家一般用到的深度学习平台都是这个,关于Caffe的训练通常一般都可以通过一些命令来执行,但是在deploy阶段,如果是做实际的工程,那么C++接口用得会相对比较多.但是Caffe是支持Python和Matlab接口的,所以用Python来做一些相关的特征的处理以及额外的任务比较方便 这里我主要是结合了Caffe官网的…
分块,根据句子的词和词性,按照规则组织合分块,分块代表实体.常见实体,组织.人员.地点.日期.时间.名词短语分块(NP-chunking),通过词性标记.规则识别,通过机器学习方法识别.介词短语(PP).动词短语(VP).句子(S). 分块标记,IOB标记,I(inside,内部).O(outside,外部).B(begin,开始).树结构存储分块.多级分块,多重分块方法.级联分块. 关系抽取,找出实体间关系.实体识别认知事物,关系识别掌握真相.三元组(X,a,Y),X.Y实体,a表达关系字符串…
1. 多值无序类数据的特征提取: 多值无序类问题(One-hot 编码)把“耐克”编码为[0,1,0],其中“1”代表了“耐克”的中 间位置,而且是唯一标识.同理我们可以把“中国”标识为[1,0],把“蓝色”标识为[0,1]. 然后把所有的数据编码拼接起来,[“耐克”,“中国”,“蓝色”]的最终编码结果就变为了 [0,1,0,1,0,0,1],这一组数据虽然很稀疏,但是可以带到算法中进行计算 无序类数据的特征提取:One-hot 编码解决多值无序类数据的特征提取问题. 2.文本提取特征:   由…
现代的机器学习系统均利用大量的数据,利用梯度下降算法或者相关的变体进行训练.传统上,最早出现的优化算法是SGD,之后又陆续出现了AdaGrad.RMSprop.ADAM等变体,那么这些算法之间又有哪些区别和联系呢?本文试图对比的介绍目前常用的基于一阶梯度的优化算法,并给出它们的(PyTorch)实现. SGD 算法描述 随机梯度下降法(Stochastic Gradient Descent,SGD)是对传统的梯度下降算法(Gradient Descent,GD)进行的一种改进.在应用GD时,我们…
1.介绍 在大部分传统机器学习场景里,我们先经过特征工程等方法得到特征表示,然后选用一个机器学习算法进行训练.在训练过程中,表示事物的特征是固定的. 后来嘛,后来深度学习就崛起了.深度学习对外推荐自己的一个很重要的点是--深度学习能够自动提取特征.如果你是从 DNN 开始了解深度学习,你会对 "深度学习能够自动提取特征" 很迷茫.但是如果你是从 CNN 开始了解深度学习的,你就会很自然地理解 "深度学习能够自动提取特征". 2.提取特征 CNN 网络主要有两个算子,…
一.决策树(类型.节点特征选择的算法原理.优缺点.随机森林算法产生的背景) 1.分类树和回归树 由目标变量是离散的还是连续的来决定的:目标变量是离散的,选择分类树:反之(目标变量是连续的,但自变量可以是分类的或数值的),选择回归树: 树的类型不同,节点分裂的算法和预测的算法也不一样: 分类树会使用基于信息熵或者gini指数的算法来划分节点,然后用每个节点的类别情况投票决定预测样本的分类:回归树会使用最大均方误差来划分节点,然后用每个节点中样本的均值作为测试样本的预测值: 2.决策树的算法:ID3…
模式识别课程的一次作业.其目标是对UCI的手写数字数据集进行识别,样本数量大约是1600个.图片大小为16x16.要求必须使用SVM作为二分类的分类器. 本文重点是如何使用卷积神经网络(CNN)来提取手写数字图片特征,主要想看如何提取特征的请直接看源代码部分的94行左右,只要对tensorflow有一点了解就可以看懂.在最后会有完整的源代码.处理后数据的分享链接.转载请保留原文链接,谢谢. UCI手写数字的数据集 源数据下载:http://oddmqitza.bkt.clouddn.com/ar…
本课内容: 1.线性回归 2.梯度下降 3.正规方程组   监督学习:告诉算法每个样本的正确答案,学习后的算法对新的输入也能输入正确的答案   1.线性回归 问题引入:假设有一房屋销售的数据如下: 引入通用符号: m =训练样本数 x =输入变量(特征) y =输出变量(目标变量) (x,y)—一个样本 ith—第i个训练样本=(x(i),y(i)) 本例中:m:数据个数,x:房屋大小,y:价格   监督学习过程: 1) 将训练样本提供给学习算法 2) 算法生成一个输出函数(一般用h表示,成为假…
识别算法概述: SIFT/SURF基于灰度图, 一.首先建立图像金字塔,形成三维的图像空间,通过Hessian矩阵获取每一层的局部极大值,然后进行在极值点周围26个点进行NMS,从而得到粗略的特征点,再使用二次插值法得到精确特征点所在的层(尺度),即完成了尺度不变. 二.在特征点选取一个与尺度相应的邻域,求出主方向,其中SIFT采用在一个正方形邻域内统计所有点的梯度方向,找到占80%以上的方向作为主方向:而SURF则选择圆形邻域,并且使用活动扇形的方法求出特征点主方向,以主方向对齐即完成旋转不变…