定量变量(Quantitative Variables):也称为数值型变量(Numerical Variables),可以用连续值或离散值表示.比如:气温(连续值),学生人数(离散值). 为什么要对定量变量进行转换?大多数情况下,我们可以直接使用定量变量.但是有时候,特征和目标之间不呈线性关系.比如说年龄和收入之间的关系,当人年轻时,收入通常会稳步上升,但到了一定年纪之后,收入便开始降低.我们当然可以用非线性模型来拟合数据,但是这样会把模型弄得很复杂.因此比较好的做法是在数据准备的阶段就对定量变…
探索性数据分析(Exploratory Data Analysis) 本节课程先从统计分析四步骤中的第二步:EDA开始. 课程定义了若干个术语,如果学习过机器学习的同学,应该很容易类比理解: population:上节课说过,整体数据集合被称作population individual:其中每个个体,课程里称之为individual,注意不仅仅指个人,也可以泛指其他集合的其中一条数据 variable:变量,即描述个体的某个特点,类比机器学习中的特征 dataset:从population中圈定…
在<定量变量和定性变量的转换(Transform of Quantitative & Qualitative Variables)>一文中,我们可以看到虚拟变量(Dummy Variable)与独热编码( One Hot Encoding)非常相似,其不同之处在于:在虚拟编码方案中,当特征具有 m 个不同类别标签时,我们将得到 m-1 个二进制特征,作为基准的特征被完全忽略:而在独热编码方案中,我们将得到 m 个二进制特征. 可以看到,独热编码( One Hot Encoding)比虚…
摘要: 本文是吴恩达 (Andrew Ng)老师<机器学习>课程,第二章<单变量线性回归>中第6课时<模型概述>的视频原文字幕.为本人在视频学习过程中逐字逐句记录下来以便日后查阅使用.现分享给大家.如有错误,欢迎大家批评指正,在此表示诚挚地感谢!同时希望对大家的学习能有所帮助. Our first learning algorithm will be linear regression. In this video (article), you'll see what…
在PyTorch中计算图的特点可总结如下: autograd根据用户对variable的操作构建其计算图.对变量的操作抽象为Function. 对于那些不是任何函数(Function)的输出,由用户创建的节点称为叶子节点,叶子节点的grad_fn为None.叶子节点中需要求导的variable,具有AccumulateGrad标识,因其梯度是累加的. variable默认是不需要求导的,即requires_grad属性默认为False,如果某一个节点requires_grad被设置为True,那…
转自:http://www.statisticshowto.com/explanatory-variable/ What is an Explanatory Variable? An explanatory variable is a type of independent variable. The two terms are often used interchangeably. But there is a subtle difference between the two. When a…
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang的个人笔记,为我做个人学习笔记提供了很好的参考和榜样. § 1.  单变量线性回归 Linear Regression with One Variable  1. 代价函数Cost Function  在单变量线性回归中,已知有一个训练集有一些关于$x$.$y$的数据(如×所示),当我们的预测值$h(x)$…
我们在Azure DevOps中设置参数的时候,可以使用build,release各自的variables,但是各自的变量不能共用.此时我们需要使用variable group,它允许跨Build和Release来共享公共变量. 我们常规是做法是手动创建一个variable group,然后手动添加name和value.如果变量很多的时候,这种手动操作繁琐并且有一定的风险.下面我会演示三个过程: 我的主要参考: https://www.danielstocker.net/updating-a-v…
title: [概率论]3-8:随机变量函数(Functions of a Random Variable) categories: Mathematic Probability keywords: The Probability Integral Transformation 概率积分变换 Simulation 仿真 Pseudo-Random Numbers 伪随机数 General Function toc: true date: 2018-03-16 09:49:24 Abstract:…
title: [概率论]4-1:随机变量的期望(The Expectation of a Random Variable Part I) categories: - Mathematic - Probability keywords: Expectation toc: true date: 2018-03-20 09:48:55 Abstract: 本文主要介绍期望的基础之知识,第一部分介绍连续和离散随机变量的期望. Keywords: Expectation 开篇废话 好像大家比较喜欢关于学习…
3.4 Descriptive Measures for Populations; Use of Samples For a particular variable on a particular population: 1.There is only one population mean—namely, the mean of all possible observations of the variable for the entire population. 2.There are ma…
Azure Data Factory传递参数的方式主要有两种,通过Pipeline的Parameter和Variable来传递参数,通过Activity的输出来传递参数.要在Activity中引用Parameter.Variable或活动输出的值,需要通过"Add dynamic content"来实现. Activity可以通过表达式获得动态上下文,使得Activity可以根据表达式的值得出不同的执行效果. 一,通过Parameter 和 Variable来传递参数 在Pipelin…
