Auto ML自动调参

本文介绍Auto ML自动调参的算法介绍及操作流程。

操作步骤

  1. 登录PAI控制台
  2. 单击左侧导航栏的实验并选择某个实验。

本文以雾霾天气预测实验为例。

  1. 在实验画布区,单击左上角的Auto ML > 模型自动调参
  2. 自动调参配置页面,选择需要调参的算法,单击下一步

说明 一个实验中有多个算法时请单选一个算法。

  1. 调参配置模块,选择调参方式,完成后单击下一步

阿里云机器学习提供如下调参方式供选择:

  • EVOLUTIONARY_OPTIMIZER
  1. 随机选定a个参数候选集(探索样本数a)。
  2. 取其中评估指标较高的n个参数候选集,作为下一轮迭代的参数候选集。
  3. 继续在这些参数周边的r倍(收敛系数r)标准差范围探索,以探索出新的参数集,来替代上一轮中评估指标靠后的a-n个参数集。
  4. 根据以上逻辑,迭代m轮(探索次数m),直到找到最优的参数集合。

根据如上原理,最终产生的模型数目为a+(a-n)*m 。

注意 n的第一个值为a/2-1,在迭代过程中默认为n/2-1(小数向上取整)。

  • 数据拆分比例:将输入数据源分为训练集和评估集。0.7表示70%的数据用于训练模型,30%用于评估。
  • 探索样本数:每轮迭代的参数集个数,个数越多越准,计算量越大,取值范围为5~30。
  • 探索次数:迭代次数,次数越多探索越准、计算量越大,取值范围为1~10。
  • 收敛系数:调节探索范围,越小收敛越快,但是可能会错过适合的参数,取值范围为0.1~1。
  • 自定义范围:输入每个参数的调节范围,如果未改变当前参数范围,则此参数按照默认值代入,不参与自动调参。
  • RANDOM_SEARCH

.  每个参数在所在范围内随机选取一个值。

  1. 将这些值组成一组参数进行模型训练。
  2. 如此进行m轮(迭代次数),训练产生m个模型并进行排序。

  • 迭代次数:表示在所配置的区间的搜索次数,取值范围为2~50。
  • 数据拆分比例:将输入数据源分为训练集和评估集,0.7表示70%的数据用于训练模型,30%用于评估。
  • 自定义范围:输入每个参数的调节范围,如果未改变当前参数范围,则此参数按照默认值代入,不参与自动调参。
  • GRID_SEARCH

.  将每个参数的取值区间拆成n段(网格拆分数)。

  1. 在n段里面各随机取出一个随机值。假设有m个参数,就可以组合出n^m组参数。
  2. 根据n^m组参数训练生成n^m个模型并进行排序。

  • 网格拆分数:表示拆分出的grid个数,取值2~10。
  • 数据拆分比例:将输入数据源分为训练集和评估集,0.7表示70%的数据用于训练模型,30%用于评估。
  • 自定义范围:输入每个参数的调节范围,如果未改变当前参数范围,则此参数按照默认值代入,不参与自动调参。
  • UserDefine

自定义范围:系统对枚举的参数取值范围进行全部组合尝试并打分,如果未输入按照默认参数执行。

说明 在2.0版本中调参算法种类从4个增加到7个,各算法详细说明如下:

  1. 调参模型输出选择模块,配置模型输出参数,完成后单击下一步

  • 评估标准:可选择 AUCF1-scorePrecisionRecall四个维度中的一个作为评估标准。
  • 保存模型数量:取值范围为1~5。根据所选择的评估标准,对模型进行排名,最终保存排名靠前的几个模型,数量对应所选择的保存模型数量
  • 模型是否向下传导:默认打开。如果开关关闭,则将当前组件的默认参数生成的模型,向下传导至后续组件节点;如果开关打开,则将自动调参生成的最优模型,向下传导至后续组件节点。
  1. 配置完成后,单击画布左上角的运行

此时画布上的对应算法已打开Auto ML 开关,后续也可以选择打开或关闭此开关。

  1. 可选:鼠标右键单击画布模型组件,选择编辑AutoML参数,修改AutoML配置参数。

执行结果

输出模型:

  1. 在调参过程中,鼠标右键单击目标模型组件,选择调参运行详情。在 AutoML-自动调参详情页面,单击指标数据,查看当前调参的进度、各模型的运行状态等信息。                                                                                                                                                                   
  2. 根据候选模型的指标列表(AUCF1-score准确率召回率)进行排序。
  3. 查看详情列单击日志参数,查看每一个候选模型的日志及参数。

调参效果展示:

可以通过超参迭代效果对比,查看每一轮参数更新后评估指标增长的趋势。

模型存储:

  1. 选择左侧导航栏的模型
  2. 单击实验模型,打开实验模型文件夹。
  3. 单击打开对应实验文件夹,查看Auto ML保存的模型。

Auto ML自动调参的更多相关文章

  1. hyperopt自动调参

    hyperopt自动调参 在传统机器学习和深度学习领域经常需要调参,调参有些是通过通过对数据和算法的理解进行的,这当然是上上策,但还有相当一部分属于"黑盒" hyperopt可以帮 ...

  2. 自动调参库hyperopt+lightgbm 调参demo

    在此之前,调参要么网格调参,要么随机调参,要么肉眼调参.虽然调参到一定程度,进步有限,但仍然很耗精力. 自动调参库hyperopt可用tpe算法自动调参,实测强于随机调参. hyperopt 需要自己 ...

  3. sklearn学习8-----GridSearchCV(自动调参)

    一.GridSearchCV介绍: 自动调参,适合小数据集.相当于写一堆循环,自己设定参数列表,一个一个试,找到最合适的参数.数据量大可以使用快速调优的方法-----坐标下降[贪心,拿当前对模型影响最 ...

  4. Auto ML自动特征工程

    Auto ML自动特征工程 特征工程是在做机器学习训练的过程中必不可少的环节,特征工程就是找出对模型结果有益的特征交叉关系,通常特征工程需要耗费算法工程师大量的精力去尝试.针对这样的场景,PAI推出智 ...

  5. 服务器创建tensorflow环境,nni自动调参记录

    一.anaconda安装记录 1.1 下载安装脚本:wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh 1.2 ...

  6. 多轴APM飞控调参

    调参步骤: 遥控器,电动机和电调对应的APM飞控连线——遥控器校准——电调行程校准——加速度计校准——磁罗盘校准——故障保护设定(遥控器和飞控)——飞行模式设定并调整——自动调参设定选项 APM飞控调 ...

  7. [调参]CV炼丹技巧/经验

    转自:https://www.zhihu.com/question/25097993 我和@杨军类似, 也是半路出家. 现在的工作内容主要就是使用CNN做CV任务. 干调参这种活也有两年时间了. 我的 ...

  8. Deep learning网络调参技巧

    参数初始化 下面几种方式,随便选一个,结果基本都差不多.但是一定要做.否则可能会减慢收敛速度,影响收敛结果,甚至造成Nan等一系列问题.n_in为网络的输入大小,n_out为网络的输出大小,n为n_i ...

  9. 机器学习笔记——模型调参利器 GridSearchCV(网格搜索)参数的说明

    GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数.但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果.这个时候就是需要动脑筋了.数据量比较大 ...

随机推荐

  1. 手动脱ORiEN壳实战

    作者:Fly2015 ORiEN这种壳之前没有接触,到底是压缩壳还是加密壳也不知道,只能试一试喽.需要脱壳的程序是吾爱破解脱壳练习第7期的题目. 首先对加壳程序进行查壳,这一步也是程序脱壳的必要的一步 ...

  2. 【转】如何用MTR诊断网络问题

    MTR 是一个强大的网络诊断工具,管理员能够用它诊断和隔离网络错误,并向上游提供商提供有关网络状态的有用报告.MTR 通过更大的采样来跟踪路由,就像 traceroute + ping 命令的组合.本 ...

  3. hdu 1298 字典树 + DFS (模拟T9文本输入)

    题意:       给你一些按键顺序,让你输出每一步中概率最大的那个单词,这里的概率计算方 法好好看看别弄错了,一开始就是因为弄错了,各种wa,比如 abc 1 ,ab 1,那么 ab 的概率就是2 ...

  4. Poj 3522 最长边与最短边差值最小的生成树

    题意:       让你求一颗生成树,使得最长边和最短边长度差值最小. 思路:      额!!!感觉这个思路会超时,但是ac了,暂时没什么别的好思路,那么就先说下这个思路,大牛要是有好的思路希望能在 ...

  5. CMS Joomla SQL注入漏洞练习(CVE-2017-8917 )

    0x01 原理 1.Joomla是内容管理的网站程序,也就是CMS.漏洞原理是com_fields组件,对请求数据过滤不严谨,从而导致sql注入.这个就是有问题的代码,可以看出sql根本没有过滤,通过 ...

  6. Windows PE 重定位表编程(枚举重定位地址)

    原理之前单独总结过,在这里: http://blog.csdn.net/u013761036/article/details/54051347 下面是枚举重定位信息的代码: // ReLocation ...

  7. Photoshop 第二课 工具-钢笔的使用

    钢笔的使用 钢笔→ 是一个非常实用(主要用于)但是非常难操作(会者不难哦~)的工具. 钢笔属性中有三种状态:1.路径:2.形状:3.像素.其中路径和形状是我们最常用的状态.路径是一条用来圈定需要操作的 ...

  8. Mybatis-Plus01 快速开始

    Mybatis-Plus虽然官网上有一个快速开始,但是实际操作有点问题,所以,自己写了一个. 版本说明 如果用其他软件版本可能会有部分差异 mybatis-plus:3.4.0 之前我是使用的是3.0 ...

  9. TortoiseGit生成.PPK拓展名的密钥

    在TortoiseGit 运行目录下找到puttygen.exe 工具 运行puttygen.exe genertate :代表动态生成新的内容 load :导入旧的密钥 save private k ...

  10. Class和ClassLoader的getResource方法对比

    最近在看写Spring的源代码,里面有好多地方都用到了Class和ClassLoader类的getResource方法来加载资源文件.之前对这两个类的这个方法一知半解,概念也很模糊,这边做下整理,加深 ...