Andrew Ng机器学习课程笔记（二）之逻辑回归

FANG_YANG 2024-10-18 12:24:00 原文

Andrew Ng机器学习课程笔记（二）之逻辑回归

版权声明：本文为博主原创文章，转载请指明转载地址

http://www.cnblogs.com/fydeblog/p/7364636.html

前言

学习了Andrew Ng课程，开始写了一些笔记，现在写完第5章了，先把这5章的内容放在博客中，后面的内容会陆续更新！

这篇博客主要记录了Andrew Ng课程第二章逻辑回归，主要介绍了梯度下降法，逻辑回归的损失函数，多类别分类等等

简要介绍：逻辑回归算法是分类算法，我们将它作为分类算法使用。有时候可能因为这个算法的名字中出现了回归”使你感到困惑，但逻辑回归算法实际上是一种分类算法，它适用于标签 y 取值离散的情况，如：1 0 0 1。比如对邮件进行分类，垃圾邮件用表示，非垃圾邮件用0表示。

实现算法：梯度下降算法

1. 建立逻辑回归假设

括号内的 x跟线性回归的一样，主要是套上g(x)，压缩它的函数值范围，方便分类判决。

g(x)的表达式如下：

根据这个函数特性，我们可以知道，g(z)的范围是在（0,1），函数图形如下：

当hθ大于等于0.5时，预测 y=1；当hθ小于 0.5 时，预测 y=0。

2.建立代价函数

对于线性回归模型，我们定义的代价函数是所有模型误差的平方和。理论上来说，我们也可以对逻辑回归模型沿用这个定义，但是问题在于，当我们将带入到这样定义了的代价函数中时，我们得到的代价函数将是一个非凸函数（ non-convex function）

如下图所示

这意味着我们的代价函数有许多局部最小值，这将影响梯度下降算法寻找全局最小值。所以需要定义新的代价函数

hθ(x)与 Cost(hθ(x),y)之间的关系如下图所示：

这样构建的Cost(hθ(x),y)函数的特点是：当实际的y=1且hθ也为1时误差为0，当y=1但hθ不为1时误差随着 hθ的变小而变大；当实际的
y=0 且hθ也为 0 时代价为
0，当 y=0 但 hθ不为0时误差随着 hθ的变大而变大。这样符合单调性，就可以使用梯度下降法。

于是代价函数定义如下

3. 参数更新迭代

这个与线性回归相同

4. 多类别分类：一对多

很多时候，我们分类的数目是多个的，这里介绍一个叫做"一对多" (one-vs-all) 的分类算法。

我们将多个类中的一个类标记为正向类（y=1），然后将其他所有类都标记为负向类，如图

在我们需要做预测时，我们将所有的分类机都运行一遍，然后对每一个输入变量，都选择最高可能性的输出变量。（就是比较图中三个hθ(x)，找到最大值，并判断为相应的类型）

Andrew Ng机器学习课程笔记（二）之逻辑回归的更多相关文章

Andrew Ng机器学习课程笔记--week3（逻辑回归&正则化参数）
Logistic Regression 一.内容概要 Classification and Representation Classification Hypothesis Representatio ...
Andrew Ng机器学习课程笔记（五）之应用机器学习的建议
Andrew Ng机器学习课程笔记(五)之应用机器学习的建议版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7368472.h ...
Andrew Ng机器学习课程笔记--汇总
笔记总结,各章节主要内容已总结在标题之中 Andrew Ng机器学习课程笔记–week1(机器学习简介&线性回归模型) Andrew Ng机器学习课程笔记--week2(多元线性回归& ...
Andrew Ng机器学习课程笔记（四）之神经网络
Andrew Ng机器学习课程笔记(四)之神经网络版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7365730.html 前言 ...
Andrew Ng机器学习课程笔记（三）之正则化
Andrew Ng机器学习课程笔记(三)之正则化版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7365475.html 前言 ...
Andrew Ng机器学习课程笔记--week1（机器学习介绍及线性回归）
title: Andrew Ng机器学习课程笔记--week1(机器学习介绍及线性回归) tags: 机器学习, 学习笔记 grammar_cjkRuby: true --- 之前看过一遍,但是总是模 ...
Andrew Ng机器学习课程笔记（六）之机器学习系统的设计
Andrew Ng机器学习课程笔记(六)之机器学习系统的设计版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7392408.h ...
Andrew Ng机器学习课程笔记（一）之线性回归
Andrew Ng机器学习课程笔记(一)之线性回归版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7364598.html 前言 ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 6_Logistic Regression 逻辑回归
Lecture6 Logistic Regression 逻辑回归 6.1 分类问题 Classification6.2 假设表示 Hypothesis Representation6.3 决策边界 ...

随机推荐

slice()
提取字符串中的一部分,并返回这个新的字符串 str.slice(beginSlice[, endSlice]) 参数 beginSlice 从该索引(以 0 为基数)处开始提取原字符串中的字符.如果值 ...
spring整合quartz时间任务调度框架
spring整合quartz框架 1.创建maven工程 2.导入jar包(pom.xml) <dependencies> <dependency> <groupId&g ...
web-day5
第5章WEB05- BootStrap篇今日任务使用JQuery完成表单校验使用BootStrap制作一个响应式页面使用BootStrap制作网站首页教学导航教学目标掌握什么是响应式及响 ...
poj 2352 stars 【树状数组】
题目题意:按y递增的顺序给出n颗星星的坐标(y相等则x递增),每个星星的等级等于在它左边且在它下边(包括水平和垂直方向)的星星的数量,求出等级为0到n-1的星星分别有多少个. 因为y递增的顺序给出, ...
simhash与Google的网页去重
前几天去吃葫芦头的路上,大飞哥给详细的讲解了他在比较文本相似度实验时对Google的simhash方法高效的惊叹,回来特意去找了原文去拜读. Simhash 传统IR领域内文本相似度比较所采用的经典方 ...
9.DataGrid数据表格
后台获取数据并将其转换为json数组格式: 前台获取数据并显示在数据表格中:
编程中常用的DOS命令
1. dir directory 无参数:查看当前所在目录的文件和文件夹. /s : 查看当前目录以及其所有子目录的文件和文件夹 /a :查看包含的隐含文件的所有文件. /ah :只显示出隐含文 ...
Java设计模式详尽资料
设计模式(Design Patterns) ——可复用面向对象软件的基础设计模式(Design pattern)是一套被反复使用.多数人知晓的.经过分类编目的.代码设计经验的总结.使用设计模式是为了 ...
5.Django高级
管理静态文件项目中的CSS.图片.js都是静态文件配置静态文件在settings 文件中定义静态内容 STATIC_URL = '/static/' STATICFILES_DIRS = [ o ...
python--求参赛两队所有可能的比赛组合情况
朋友遇到一个面试题,让我帮忙实现,题目如下: 红队有A1,B1,C1三名队员,蓝队有A2,B2,C2三名队员,每轮比赛各队出一名队员参加,一名队员只能参加一次比赛,假设A1不会和B2打,B1不会和B2 ...