Knowledge Discovery in Databases (KDD) is an active and important research area with the promise for a high payoff in many business and scientific applications. One of the main tasks in KDD is classification. A particular efficient method for classif…
High Performance My SQL, Third Edition Date and Time Types My SQL has many types for various kinds of date and time values, such as YEAR andDATE. The finest granularity of time My SQL can store is one second. (Maria DB hasmicrosecond-granularity temp…
(一)一个基本概念 分贝(dB):按照对数定义的一个幅度单位.对于电压值,dB以20log(VA/VB)给出:对于功率值,以10log(PA/PB)给出.dBc是相对于一个载波信号的dB值:dBm是相对于1mW的dB值.对于dBm而言,规格中的负载电阻必须是已知的(如:1mW提供给50Ω),以确定等效的电压或电流值. (二)静态指标定义 1.量化误差(Quantization Error) 量化误差是基本误差,用简单3bit ADC来说明.输入电压被数字化,以8个离散电平来划分,分别由代码000…
信息熵与信息增益(IE, Information Entropy; IG, Information Gain) 信息增益是机器学习中特征选择的关键指标,而学习信息增益前,需要先了解信息熵和条件熵这两个重要概念. 信息熵(信息量) 信息熵的意思就是一个变量i(就是这里的类别)可能的变化越多(只和值的种类多少以及发生概率有关,反而跟变量具体的取值没有任何关系),它携带的信息量就越大(因为是相加累计),这里就是类别变量i的信息熵越大. 系统越是有序,信息熵就越低:反之,一个系统越乱,信息熵就越高.所以…
https://zh.wikipedia.org/wiki/%E5%88%86%E8%B2%9D 分贝(decibel)是量度两个相同单位之数量比例的单位,主要用于度量声音强度,常用dB表示. “分”(deci-)指十分之一,个位是“贝”或“贝尔”(bel),但一般只采用分贝. 分贝(dB)是十分之一贝尔(B): 1B = 10dB. 功率量 考虑功率或者强度(intensity)时, 其比值可以表示为分贝,这是通过把测量值与参考量值之比计算基于10的对数,再乘以10. 因此功率值P1与另一个功…
转至:http://blog.csdn.net/bitcarmanlee/article/details/51488204 在信息论与概率统计学中,熵(entropy)是一个很重要的概念.在机器学习与特征工程中,熵的概念也用得灰常多.今天就把跟熵有关的东东稍微整理一下,权当笔记. 1.信息熵 熵是神马东东?信息论的开山祖师爷Shannon(中文翻译过来一般叫香农,总觉得很多文字经过翻译就不对劲,就跟人家老外翻译贱人就是矫情一样,感觉怪怪的.所以咱们还是用英文了,偷偷装个小逼)明确告诉我们,信息的…
当我们需要对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设.在这种情况下,概率分布最均匀,预测的风险最小.因为这时概率分布的信息熵最大,所以称之为“最大熵法”.最大熵法在数学形式上很漂亮,但是实现起来比较复杂,但把它运用于金融领域的诱惑也比较大,比如说决定股票涨落的因素可能有几十甚至上百种,而最大熵方法恰恰能找到一个同时满足成千上万种不同条件的模型. 这里我们先不讨论算法(这里用的是ID3/C4.5),把一棵决策树建立起来再说.我们要建立的决…
assuming that you're using xgboost to fit boosted trees for binary classification. The importance matrix is actually a data.table object with the first column listing the names of all the features actually used in the boosted trees. The meaning of th…
clc; clear all; close all; addpath('E:\PhotoShop Algortihm\Image Processing\PS Algorithm'); Image=imread('4.jpg'); Image=double(Image)/255; % imshow(Image) % set the gain value 0-1 % set the bias value 0-1 gain=0.5; bias=0.25; % adjust the gain p=log…
// define head function #ifndef PS_ALGORITHM_H_INCLUDED #define PS_ALGORITHM_H_INCLUDED #include <iostream> #include <string> #include "cv.h" #include "highgui.h" #include "cxmat.hpp" #include "cxcore.hpp&quo…
1. 混淆矩阵 确定截断点后,评价学习器性能 假设训练之初以及预测后,一个样本是正例还是反例是已经确定的,这个时候,样本应该有两个类别值,一个是真实的0/1,一个是预测的0/1 TP(实际为正预测为正),FP(实际为负但预测为正),TN(实际为负预测为负),FN(实际为正但预测为负) 通过混淆矩阵我们可以给出各指标的值:查全率(召回率,recall):样本中的正例有多少被预测准确了,衡量的是查全率,预测对的正例数占真正的正例数的比率: 查全率=检索出的相关信息量 / 系统中的相关信息总量 = T…
前几期真相文章得到了读者积极的反馈,其中提问最多的就是这个公式: 首先,大家觉得这个公式太有用了.以前只能定性地评价图像质量,现在一下子就能直接算出信噪比,瞬间高大上了许多有木有.然而,杯具的现实是,95%的人都找不到相机的出厂报告,也就是说并不知道自己相机的 Gain 是多少.不知道 Gain, 那这个公式岂不就成了浮云啊! 别急,本期我们就来披露两分钟测算相机增益的秘笈,大家准备好打赏哈! 01公式推导 哈哈,公式是烦人的,但也是必须的. 我们知道,当相机工作在光子散粒噪声(Shot Noi…
决策树构建中节点的选择靠的就是信息增益了. 信息增益是一种有效的特征选择方法,理解起来很简单:增益嘛,肯定是有无这个特征对分类问题的影响的大小,这个特征存在的话,会对分类系统带来多少信息量,缺了他行不行? 既然是个增益,就是个差了,减法计算一下,谁减去谁呢? 这里就用到了信息熵的概念,放到分类系统里面,信息熵如何计算呢? 分类系统里面无非是样本xi以及样本的分类结果yi,假设这个分类系统有k类,那么作为训练集来说,分类情况基本就定了,是按照样本的各个特征定的.那么在这些样本的信息的前提下,分类器…
Estimation: Almost every is spent on ergod the text and build the dictionary. Gains: I have never used C# before. So This is a precious experience for me. I've learned the basic application of C#. I've tried my first time to write and the first time…
谈到放大器就必须先了解增益:一个小的信号Level(电平)经过放大电路成为大的信号Level ,也就是说由小变大之间的差异就叫增益,也叫放大率,反过来的叫衰减率.在音响系统内,一般以信号源的输入电平决定放大的增益,基本上分低电平输入及高电平输入两部分... 谈到放大器就必须了解增益所代表的意义,由一个小的信号Level(电平)经过放大电路成为大的信号Level ,也就是说由小变大之间的差异就叫增益,也叫“放大率”,反过来叫“衰减率”. 原则上,我们采用倍数来计算,不过因为常常会是好几万倍的情形下…
天线增益是指:在输入功率相等的条件下,实际天线与理想的辐射单元在空间同一点处所产生的信号的功率密度之比.它定量地描述一个天线把输入功率集中辐射的程度.增益显然与天线方向图有密切的关系,方向图主瓣越窄,副瓣越小,增益越高.天线增益是用来衡量天线朝一个特定方向收发信号的能力,它是选择基站天线最重要的参数之一.一般来说,增益的提高主要依靠减小垂直面向辐射的波瓣宽度,而在水平面上保持全向的辐射性能.天线增益对移动通信系统的运行质量极为重要,因为它决定蜂窝边缘的信号电平.增加增益就可以在一确定方向上增大网…
决策树在商品购买能力预测案例中的算法实现 作者:白宁超 2016年12月24日22:05:42 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归)非监督学习(…
Introduction Log files are files that contain messages about the system, including the kernel, services, and applications running on it. There are different log files for different information. For example, there is a default system log file, a log f…
[it-ebooks]电子书列表   [2014]: Learning Objective-C by Developing iPhone Games || Leverage Xcode and Objective-C to develop iPhone games http://it-ebooks.info/book/3544/Learning Web App Development || Build Quickly with Proven JavaScript Techniques http:…
note: Some articles are very good in http://www.electronics-tutorials.ws/,I share them in the Cnblog so that Chinese hardware engineers can enjoy and learn. ComeFrom:http://www.electronics-tutorials.ws/filter/filter_4.html   The cut-off frequency or…
十二年前,无论多么复杂的布局,在我们神奇的table面前,都不是问题:十年前,阿捷的一本<网站重构>,为我们开启了新的篇章:八年前,我们研究yahoo.com,惊叹它在IE5下都表现得如此完美:六年前,Web标准化成了我们的基础技能,我们开始研究网站性能优化:四年前,我们开始研究自动化工具,自动化测试,谁没玩过nodejs都不好意思说是页面仔:二年前,各种终端风起云涌,响应式.APP开发都成为了我们研究的范围,CSS3动画开始风靡:如今,CSS3动画.Canvas.SVG.甚至webGL你已经…
校对:伯乐在线 - 黄利民 链接: 1. Why do most of the developers in Silicon Valley prefer OS X over Linux or Windows? 2. Mike Mikowski's anwser 3. Garry Taylor's anwser 4. Ivan Appel's anwser 5. 为什么很多硅谷工程师偏爱 OS X,而不是 Linux 或 Windows? Why do most of the developers…
本篇是AFNetworking 3.0 源码解读的第五篇了. AFNetworking 3.0 源码解读(一)之 AFNetworkReachabilityManager AFNetworking 3.0 源码解读(二)之 AFSecurityPolicy AFNetworking 3.0 源码解读(三)之 AFURLRequestSerialization AFNetworking 3.0 源码解读(四)之 AFURLResponseSerialization 这次主要介绍AFURLSessi…
所有代码均在本地编译运行测试,环境为 Windows7 32位机器 + eclipse Mars.2 Release (4.5.2) 2016-10-17 整理 字符,字符串类问题 正则表达式问题 Java字符编码问题 字符串内存问题 简述String和StringBuffer.StringBuilder的区别? 比较初级的一个题目,而初级题目又是除高端职位外,笔试题海量筛人的首选,但是作为经典题目,还是入选了我的笔记,因为它能延伸的Java字符串的问题太多了--另一种延伸的高端问法就是套路你,…
Basis(基础): SSE(Sum of Squared Error, 平方误差和) SAE(Sum of Absolute Error, 绝对误差和) SRE(Sum of Relative Error, 相对误差和) MSE(Mean Squared Error, 均方误差) RMSE(Root Mean Squared Error, 均方根误差) RRSE(Root Relative Squared Error, 相对平方根误差) MAE(Mean Absolute Error, 平均绝…
"Life is short, you need Python!" Python (British pronunciation:/ˈpaɪθən/ American pronunciation:/ˈpaɪθɑːn/)), is an object-oriented computer programming language, literal translation, with nearly 20 years of development history. It contains a s…
Java I/O and NIO.2---Five ways to maximize Java NIO and NIO.2---Build more responsive Java applications with the New Input/Output APIs Java NIO -- the New Input/Output API package-- was introduced with J2SE 1.4 in 2002. Java NIO's purpose was to impr…
Protect applications and services by using a dedicated host instance that acts as a broker between clients and the application or service, validates and sanitizes requests, and passes requests and data between them. This can provide an additional lay…
已知:流感训练数据集,预定义两个类别: 求:用ID3算法建立流感的属性描述决策树 流感训练数据集 No. 头痛 肌肉痛 体温 患流感 1 是(1) 是(1) 正常(0) 否(0) 2 是(1) 是(1) 高(1) 是(1) 3 是(1) 是(1) 很高(2) 是(1) 4 否(0) 是(1) 正常(0) 否(0) 5 否(0) 否(0) 高(1) 否(0) 6 否(0) 是(1) 很高(2) 是(1) 7 是(1) 否(0) 高(1) 是(1) 原理分析: 在决策树的每一个非叶子结点划分之前,先…
微软在上月宣布组建自己的 AI 研究小组.该小组汇集了超过 5000 名计算机科学家和工程师,加上微软内部研究部门,将共同挖掘 AI 技术. 与此同时,亚马逊,Facebook,Google,IBM 还有微软联合宣布成立一个非盈利组织「人工智能合作伙伴」.该组织将致力于推进人工智能研究,树立开发新的人工智能技术准则,以及加强公众对人工智能的认识. 而巨头们也纷纷拿出了自己的看家本领,Apple 的 Siri 利用自然语言处理来识别语音命令:Facebook 的深度学习面部识别算法能够快速准确地识…