Optaplanner逐步学习(0) : 基本概念 - Optaplanner,规划问题, 约束,方案
之前的文章中,分别从APS,排产到规划引擎叙述了一些理论基础;并介绍了一些Optaplanner大概的情况;并一步步将Optaplanner的示例运行起来,将示例源码导进Eclipse分析了一下它的Hello world入门示例,从本篇开始,我们将分步学习它的一些概念及用法。
什么是Optaplanner
其实这个名称是作者将这个引擎贡献给了Jboss社区后,才使用的名,之前叫做Drools planner。没错,它就是结合Drools(一个开源规则引擎)一起应用的(也可以单独使用),Drools在这里的作用主要是用来作编写计分脚本,事实上完全可以抛开Drools,直接使用Optaplanner自己的API,通过Java代码自己来计分,但这个难度就大得多。详细情况计到相应的章节再细说。
名称的前缀应该是Optimize的词根,或取近音吧,因为Optaplanner其实就是一个对待规划的方案组合进行优化的引擎。好了,关于它的名称就不花费太多的口水去深究,我们看看官方是怎么定义Optaplanner的。"OptaPlanner is a constraint solver. It optimizes business resource planning use cases, such as Vehicle Routing, Employee Rostering, Cloud Optimization, Task Assignment, Job Scheduling, Bin Packing and many more. " - Optaplanner 是一个约束解决器,它可以优化业务资源,规划各种案例,例如车间调度,职员排班,云优化,任务分配,工作排程,装箱等相关的问题,例如下图。
而我对Optaplanner的理解,它是一个Planning Engine - 规划引擎,针对各行各业的业务需求,开发人员需要将一些业务规则翻译成约束,并对业务场景中的实体进行抽象建模,规划引擎根据上述约束和模型对象进行规划,找出一个相对最优化的方案出来返回给用户。其实如果需要规划的业务对象不多(种类和数量都不多),规则不太复杂,人类是可以通过自己的经验、推算和规则运行,得到一个可行方案的,甚至当问题规模足够小的时候,是可以找到一个最优方案的。关于规划问题,大家可以参考这个系统文章中的一篇入门介绍《Optaplanner - 入门介绍》,里面讲到,规划问题其实就是数学上的NP问题或NPC问题,目前数据世界对于这种问题,是没有可用算法直接实现的,当问题足够大的时候,只能够通过一些寻优算法(例如爬山算法,模拟退火及遗传算法等)提高找到问题相对优解的机率。而Optaplanner正是一个集成了这类算法,实现快速赶寻找相对最优方案的引擎。它是一个轻量级的,可嵌入的规划引擎,也就是说你可以在自己的程序中通过Jar包直接和相关的配置项来直接使用Optapalnner. 当然,当你需要一个独立的,具有良好扩展性的规划服务组件时,可以直接使用Optaplanner建立自己的规划服务器,通过Spring等框架,对外提供规划服务。
Optaplanner是基于Apache Software License.协议的,你可以直接使用它作为商业用途。并且它是使用纯Java编写的,最低功能要求下,只需安装一个JVM即可以使用Optapalnner了。并且它所有的包都可以从Maven中央库中获得,即只需要建立一个Maven项目,简单配置好依赖项,就可以开始基于Optaplanner的开发了。
下面,就开始对Optaplanner中概念进行逐一讲解.
什么是规划问题(Planning Problem)
规划问题是 - 基于有限资源,及指定约束条件下达到优化目标(包括资源、排程安排等优化).,例如:
- 最大化利润
- 最小化对生态环境的影响
- 提高员工及客户的满意度
- ........
要实现这些目标,需要以下条件:
- 人员
- 时间
- 预算(资金)
- 物理资产(例如机台、汽车,电脑,建筑等等)
下图是Optaplanner官网对规划问题的定义:
上面是对官网的一些翻译。通俗地讲,规划问题就是:
1. 存在一堆对象,例如:任务、人员、资源等,以后称作规划实体 - 官方称planning entity;
2. 还存在一些条件规则,例如:任务最迟需要什么时候完成,人员每天最多只能上班8小时,在指定的时间段内资源是有限的。以后称约束 - 官方称Constraint
3. 根据上述第2点的条件,对第1点所述的规划实体进行资源分配和时间安排,例如,哪个任务应该安排在哪个机台上,在什么时候开始作业;哪个人员安排在哪个车间的哪个班次;哪种资源(例如:机台、原料等)需要确保在哪个时间送到哪个车间等。
上述第3点所做的工作就是一个规划的过程,也就是引擎会根据约束的限制和规划实体的特性,对这些规划实体进行时间或/和空间上的规划;这个就是规划过程。而我们面对的这些规划实体和这些约束的结合体,就称作规划问题。例如:排定下个学期每个年级的课程表,令每个课程的老师不会出现同一时候分配到不同的班级上课。现有一堆外卖,规划好各个骑手的取餐、送餐路线,令每个骑手都以尽量小的路程和时间成本送最多的单。这些都可以被视作规划问题。
规划实体与规划变量(Planning Entity & Planning Variable)
我们知道,规划问题,就是对一些规划实体进规划预计分配。例如编造排班表,是一个规划问题,那么抽象出来,一个工人就是一个规划实体(Planning Entity)了,它是被规划的对象。而工人在指定的时间在哪个车间上班,就是这个规划实体的规划变量(Planning vaiable)了。所以,其实解决这个规划问题的过程,就是针对每一个规划实体,根据约束及每个规划实体的情况,来给它的规划变量设置适当的值,令到所有规划实体的所有规划变量的组合达到整体最优。即是设定每个工人(规划实体),在哪个时间,去哪个车间上班(上班时间和车间就是规划变量)。
问题事实(Problem Fact)
问题事实是相对规则实体而言的,它也是一个业务实体,与规划实体不同的是,它只反映出业务情况,而在规划的过程中,不会被规划引擎进行修改。也就是说,问题事实只是用于提供资料,辅助规划引擎进行规划运算的。在整个规划过程,问题事实是只读的。例如规则班次计划的时间,其中的班次是在开始规则之前已经确定的,所以“班次”这个业务实体只会在规划过程中,提供每个班次具体的时间等信息,而不会改变的。那么“班次”这个业务实体,就是一个问题事实。
约束(硬约束与软约束)
上而我们把业务规则定义为约束,其实目前针对排程方面的规划问题,主要是通过约束进行评分机制的寻优方法。约束就是根据业务规则抽象出来,针对规划变量,在求解规划问题时候的一种限制,或惩罚机制。也就是说,约束是用来制约引擎对规划变量的赋值行为的。例如一个人不可能有超过24个小时的可用时间。
硬约束:硬约束是指那些不能违反的约束,违反了就会出现不符合常理,即业务可能出现绝不允许的情况出现。例如上面提高,一个人不可能有超过24小时的可用时间(常理);机台运行过程中,机修工不能进行维修工作(涉及安全生产问题,法律及业务有硬性要求。)。因此,硬约束可以被人视为是用于对规则行为进行定义的。
软约束:软约束是相对硬约束而言的,它是可违反的。设立软约束之目的并不是不允许它违反,而是定量地制约规划结果(结果,即是下面讲到的解或方案)的发展方向,起到对规划结果的偏向作用,即让规则结果尽量向指定的一个方向偏衙。也就是说在满足了硬约束的前提下,再对软约束进行判断,如果软约束能不违反就最好,要是必须违反,违反得越少,所得的方案就越好。例如成本高低就是一种软约束,生产运营中不可能不产生成本,那么如果成本越低,那么方案肯定越好,当然是在满足了硬约束的前提下。
规划问题其实是NP问题或NP-Hard问题
其实在《Optaplanner - 入门介绍》中已经有讲解过关于NP或NP-Hard(那讲到NPC问题),大家可以去参考一下那篇文章。这时概括地重述一下,NP或NP-Hard问题是问题以下条件的:
- 对于一个给定的规划的结果(官网中称作solution, 即是解),很容易在合理的时间内对其进行验证是否可行。例如:课程表编排得正不正确,可以根据约束来核对一下就可以确定了,例如有没有出现同一个时间内,一个老师被分配到不同的班级上课。
- 不存在一个可确定的方法,在合理的时间内找到一个最优解(这里指的是绝对最优解)。这个也不难理解,对于这种没有任何快捷方法找最优解的规划问题,我们唯一的办法就是把所有不同的组合情况全部排列出来,一个一个比较(即逐一枚举),那必然是可以找到最优解的。但是,因为这种方法其实是一种暴力穷举法,当问题非常复杂、且需要规划的实体数量非常多时,它的时间复杂度是随着组合情况的增加,逞指数式上升的,暴力穷举的方法是不可取的。
规划问题布在巨量搜索空间
搜索空间:因为目前针对规划问题,只能通过搜索的方式去寻找相对最优解,因为相对一些直接通过算法操作得到的办法而言,规划问题只能将它的解一个一个地对比,逐步收敛逼近的办法来得到相对最优解。所以,你可以认为规划问题的相对最优解是搜索出来的,而且每一步搜索都需要对约束进行运算;从所有经历过的解中,找到相对最优一个。所以规划问题存在一个搜索空间的问题,即有多少种可能的解,就表示搜索空间有多大。例如将3个任务分配到两个机台上,存在多少种可能?大家可以自己去算,其实就是排列组合问题。
而对实际问题时,稍复杂的约束,稍多一点的规划实体,最后得出的可能解的数量都是非常巨大的,很多问题其搜索空间轻易就是一个天文数字。所以,如果对于所有规则问题,都是使用这些暴力枚举的办法,以现有世界上的计算机的算力,很多问题是没办法找到最优解的。
规划问题的规模,即是规划实体及每个实体的规划变量的组合,例如时间、空间,及影响因素,及这些因素的所有情况组合。例如,如果上述所有实体,规划的变量和所有因素,展开后的数量是M,而一个解是对其中的N个变量进行规划,那么有多少个解呢?其实就是M到N的排列P(M->N).当遇到实际问题的,这些组合的数量就是天文数字了。
可能解,可行解,相对最优解与绝对最优解
在规则问题中,需要清楚解的概念,在Optaplanner里称作solution, 即方案。在本系列文章中,解与方案是相同的意义,请注意。本猿只是根据中文表达的习惯,在不同的场合以最顺口的方式,视情况确定到底应用用“解”,还是“方案”来表述。
在接下来的一系列文章中,我在讲解这些方案的过程中,会用到以下概念:
可能解:一个规划问题的任意一个解都称为可能解,也就是所有规则实体的所有规则变量,任意一个组合,都称作一个可能解。例如分配工人A,在1月20日晚班,到1号车间;分配工人A在1月20日晚班到2号车间;分别是两个不同的可能解,尽管它们的差别只是分配到不同的车间.而每个工人的每个班次的工作车间,正好是规划变量。所以任意一个规划变量的不同,都会产生不同的可能解。现在知道为什么规划问题存在巨量搜索空间了吧?
可行解:可行解就是那些完全符合硬约束的解。即若存在一个解,它对任何一个硬约束都是符合的,则称这个解为可行解。可行解是可能解的一个子集。可行解是可验证的,只要根据目前所有的硬约束,对解中的每一个规划实体中的每个规划变量,逐一核对,看是否符合所有硬约束,如果符合,那就表示这个解是可行解。
相对最优解:上面已经提,规划问题的搜索空间非常巨量,大多数情况下是不可能计算并比较所有解的值,再取得最佳方案(这个解就是绝对最优解)的。那以在我们固定的时间内,Optaplanner引擎帮我们找到的最优方案,就是称作相对最优解了。大家来思考一下,相对最优解必然是可行解吗?
绝对最优解:同样的上面提到,就是所有可能解中最优的那个解,目前是没有直接确定的算法,通过运算在合理的时间内去找到一个问题的绝对最优解的,所以要得到绝对最优解,只有一个办法,就是将所有可能解都遍历一次才能找到。当问题规模不算大的时候,以目前的CPU速度还是能实现的。但如果问题稍复杂一点,规划实体和规划变量稍多一点,那么可能解的数量就是一个天文数字了,这种情况下是没办法完全遍历的。所以,在我们现实中,我们是无法得到绝对最优解的。其实更贴切地说,我们所得到的相对最优解,我们不知道它是不是绝对最优解。因为现在数学上还没有办法(除了遍历)证明一个相对最优解是否绝对最优。
本篇先介绍一下上述两个概念,下一篇将我们再具体介绍其它概念。
Optaplanner逐步学习(0) : 基本概念 - Optaplanner,规划问题, 约束,方案的更多相关文章
- mangodb学习0.1 概念
摘自菜鸟教程
- OptaPlanner 7.32.0.Final版本彩蛋 - SolverManager之批量求解
上一篇介绍了OptaPlanner 7.32.0.Final版本中的SolverManager接口可以实现异步求解功能.本篇将继续介绍SolverManager的另一大特性 - 批量求解. 适用场景 ...
- OptaPlanner 7.32.0.Final版本彩蛋 - SolverManager之异步求解
因为工作和其它原因,很长一段时间没有出新的.关于OptaPlanner的文章了,但工余时间并没有停止对该引擎的学习.与此同时Geoffrey大神带领的KIE项目团队并没有闲下来,尽管在工业可用性.易用 ...
- Oracle RAC学习笔记:基本概念及入门
Oracle RAC学习笔记:基本概念及入门 2010年04月19日 10:39 来源:书童的博客 作者:书童 编辑:晓熊 [技术开发 技术文章] oracle 10g real applica ...
- Prolog学习:基本概念 and Asp.net与Dojo交互:仪器仪表实现
Asp.net与Dojo交互:仪器仪表实现 项目中需要用到仪器仪表的界面来显示实时的采集信息值,于是便遍地寻找,参考了fusionchart和anychart之后,发现都是收费的,破解的又没有这些功能 ...
- Python学习:基本概念
Python学习:基本概念 一,python的特点: 1,python应用场景多;爬虫,网站,数据挖掘,可视化演示. 2,python运行速度慢,但如果CPU够强,这差距并不明显. 3,严格的缩进式编 ...
- V-rep学习笔记:机器人路径规划2
路径规划问题是机器人学研究的一个重要领域,它是指给定操作环境以及起始和目标的位置姿态,要求选择一条从起始点到目标点的路径,使运动物体(移动机器人或机械臂)能安全.无碰撞地通过所有的障碍物而达到目标位置 ...
- Docker学习之基本概念
Docker学习之基本概念 作为一个后端noder,不了解docker有点说不过去,这节开始,学习一些docker层面的东西. 什么是docker Docker最初是dotCloud公司创始人Solo ...
- jQuery学习笔记之概念(1)
jQuery学习笔记之概念(1) ----------------------学习目录-------------------- 1.概念 2.特点 3.选择器 4.DOM操作 5.事件 6.jQuer ...
随机推荐
- python 单例模式的四种创建方式
单例模式 单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在.当你希望在整个系统中,某个类只能出现一个实例时,单例对象就能派上用场. ...
- istio入门(01)istio的优势在哪里?
Istio能做什么?Istio 试图解决微服务实施后面临的问题.Istio 提供了一个完整的解决方案,对整个服务网格行为洞察和操作控制,以满足微服务应用程序的多样化需求. Istio在服务网络中提供了 ...
- SpringBoot的HelloWorld 应用及解释
参考链接: Spring Data JPA - Reference Documentation Spring Data JPA--参考文档 中文版 纯洁的微笑:http://www.ityouknow ...
- SpringCloud的Archaius - 动态管理属性配置
参考链接:http://www.th7.cn/Program/java/201608/919853.shtml 一.Archaius是什么? Archaius用于动态管理属性配置文件. 参考自Gett ...
- hadoop2.7.3+spark2.1.0+scala2.12.1环境搭建(4)SPARK 安装
hadoop2.7.3+spark2.1.0+scala2.12.1环境搭建(4)SPARK 安装 一.依赖文件安装 1.1 JDK 参见博文:http://www.cnblogs.com/liugh ...
- Spring Security 入门(1-2)Spring Security - 从 配置例子例子 开始我们的学习历程
1.Spring Security 的配置文件 我们需要为 Spring Security 专门建立一个 Spring 的配置文件,该文件就专门用来作为 Spring Security 的配置. &l ...
- byte在计算机中的存储方式--Double.byteValue()的输出结果思考
先举三个栗子: 1. public static void main(String[] args) { Double d = new Double(123.56); byte b = d.byteVa ...
- 2.x与3.x差异、条件语句、数据类型、其他
一.输入(raw_input)=====>python2.x版本 #!/usr/bin/env python # -*- coding: utf-8 -*- # 将用户输入的内容赋值给 name ...
- 【深度学习】深入理解优化器Optimizer算法(BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam)
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
- tar命令-vi编辑器-磁盘分区及格式化-软链接及硬链接文件
一.tar命令 1.将用户信息数据库文件和组信息数据库文件纵向合并为一个文件/1.txt(覆盖) [root@localhost /] # cat /etc/passwd /etc/group ...