详解用python实现简单的遗传算法

今天整理之前写的代码,发现在做数模期间写的用python实现的遗传算法,感觉还是挺有意思的,就拿出来分享一下。

首先遗传算法是一种优化算法,通过模拟基因的优胜劣汰,进行计算(具体的算法思路什么的就不赘述了)。大致过程分为初始化编码、个体评价、选择,交叉,变异。

遗传算法介绍

遗传算法是通过模拟大自然中生物进化的历程,来解决问题的。大自然中一个种群经历过若干代的自然选择后,剩下的种群必定是适应环境的。把一个问题所有的解看做一个种群,经历过若干次的自然选择以后,剩下的解中是有问题的最优解的。当然,只能说有最优解的概率很大。这里,我们用遗传算法求一个函数的最大值。

f(x) = 10 * sin( 5x ) 7 * cos( 4x
),    0
<=  x <= 10

1、将自变量x进行编码

取基因片段的长度为10, 则10位二进制位可以表示的范围是0到1023。基因与自变量转变的公式是x = b2d(individual)
* 10 / 1023。构造初始的种群pop。每个个体的基因初始值是[0, 1, 0, 1, 0, 1, 0, 1, 0,
1]

2、计算目标函数值

根据自变量与基因的转化关系式,求出每个个体的基因对应的自变量,然后将自变量代入函数f(x),求出每个个体的目标函数值。

3、适应度函数

适应度函数是用来评估个体适应环境的能力,是进行自然选择的依据。本题的适应度函数直接将目标函数值中的负值变成0.
因为我们求的是最大值,所以要使目标函数值是负数的个体不适应环境,使其繁殖后代的能力为0.适应度函数的作用将在自然选择中体现。

4、自然选择

自然选择的思想不再赘述,操作使用轮盘赌算法。其具体步骤:

假设种群中共5个个体,适应度函数计算出来的个体适应性列表是fitvalue = [1 ,3, 0, 2, 4] ,totalvalue
= 10 ,
如果将fitvalue画到圆盘上,值的大小表示在圆盘上的面积。在转动轮盘的过程中,单个模块的面积越大则被选中的概率越大。选择的方法是将fitvalue转化为[1
, 4 ,4 , 6 ,10], fitvalue / totalvalue = [0.1 , 0.4 , 0.4 , 0.6 ,
1.0] . 然后产生5个0-1之间的随机数,将随机数从小到大排序,假如是[0.05 , 0.2 , 0.7 , 0.8
,0.9],则将0号个体、1号个体、4号个体、4号个体、4号个体拷贝到新种群中。自然选择的结果使种群更符合条件了。

5、繁殖

假设个体a、b的基因是

a = [1, 0, 0, 0, 0, 1, 1, 1, 0, 0]

b = [0, 0, 0, 1, 1, 0, 1, 1, 1, 1]

这两个个体发生基因交换的概率pc = 0.6.如果要发生基因交换,则产生一个随机数point表示基因交换的位置,假设point =
4,则:

a = [1, 0, 0, 0, 0, 1, 1, 1, 0, 0]

b = [0, 0, 0, 1, 1, 0, 1, 1, 1, 1]

交换后为:

a = [1, 0, 0, 0, 1, 0, 1, 1, 1, 1]

b = [0, 0, 0, 1, 0, 1, 1, 1, 0, 0]

6、突变

遍历每一个个体,基因的每一位发生突变(0变为1,1变为0)的概率为0.001.突变可以增加解空间

以目标式子 y = 10 * sin(5x) 7 * cos(4x)为例,计算其最大值

首先是初始化,包括具体要计算的式子、种群数量、染色体长度、交配概率、变异概率等。并且要对基因序列进行初始化

pop_size = 500  # 种群数量 

max_value = 10  #
基因中允许出现的最大值 

chrom_length = 10  # 染色体长度 

pc = 0.6   #
交配概率 

pm = 0.01   #
变异概率 

results = [[]]  #
存储每一代的最优解,N个二元组 

fit_value = []  # 个体适应度 

fit_mean = []  # 平均适应度 

pop = geneEncoding(pop_size, chrom_length)

其中genEncodeing是自定义的一个简单随机生成序列的函数,具体实现如下

def geneEncoding(pop_size, chrom_length): 

 pop = [[]] 

 for i in range(pop_size): 

  temp = [] 

  for j in
range(chrom_length): 

   temp.append(random.randint(0,
1)) 

  pop.append(temp) 

 return pop[1:]



编码完成之后就是要进行个体评价,个体评价主要是计算各个编码出来的list的值以及对应带入目标式子的值。其实编码出来的就是一堆2进制list。这些2进制list每个都代表了一个数。其值的计算方式为转换为10进制,然后除以2的序列长度次方减一,也就是全一list的十进制减一。根据这个规则就能计算出所有list的值和带入要计算式子中的值,代码如下

# 0.0 coding:utf-8 0.0 

# 解码并计算值 

import math 

def decodechrom(pop, chrom_length): 

 temp = [] 

 for i in range(len(pop)): 

  t = 0

  for j in
range(chrom_length): 

   t = pop[i][j] * (math.pow(2,
j)) 

  temp.append(t) 

 return temp 

  

  

def calobjValue(pop, chrom_length,
max_value): 

 temp1 = [] 

 obj_value = [] 

 temp1 = decodechrom(pop,
chrom_length) 

 for i in
range(len(temp1)): 

  x = temp1[i] * max_value / (math.pow(2,
chrom_length) - 1) 

  obj_value.append(10 * math.sin(5 * x) 7 *
math.cos(4 * x)) 

 return obj_value 

有了具体的值和对应的基因序列,然后进行一次淘汰,目的是淘汰掉一些不可能的坏值。这里由于是计算最大值,于是就淘汰负值就好了

# 0.0 coding:utf-8 0.0 

# 淘汰(去除负值) 

def calfitValue(obj_value): 

 fit_value = [] 

 c_min = 0

 for i in
range(len(obj_value)): 

  if(obj_value[i] c_min >
0): 

   temp = c_min
obj_value[i] 

  else: 

   temp = 0.0

  fit_value.append(temp) 

 return fit_value 

然后就是进行选择,这是整个遗传算法最核心的部分。选择实际上模拟生物遗传进化的优胜劣汰,让优秀的个体尽可能存活,让差的个体尽可能的淘汰。个体的好坏是取决于个体适应度。个体适应度越高,越容易被留下,个体适应度越低越容易被淘汰。具体的代码如下

# 0.0 coding:utf-8 0.0 

# 选择 

import random 

def sum(fit_value): 

 total = 0

 for i in
range(len(fit_value)): 

  total = fit_value[i] 

 return total 

def cumsum(fit_value): 

 for i in range(len(fit_value)-2, -1,
-1): 

  t = 0

  j = 0

  while(j <=
i): 

   t =
fit_value[j] 

   j = 1

  fit_value[i] = t 

  fit_value[len(fit_value)-1] = 1

def selection(pop, fit_value): 

 newfit_value = [] 

 # 适应度总和 

 total_fit =
sum(fit_value) 

 for i in
range(len(fit_value)): 

  newfit_value.append(fit_value[i] /
total_fit) 

 # 计算累计概率 

 cumsum(newfit_value) 

 ms = [] 

 pop_len = len(pop) 

 for i in range(pop_len): 

 
ms.append(random.random()) 

 ms.sort() 

 fitin = 0

 newin = 0

 newpop = pop 

 # 转轮盘选择法 

 while newin <
pop_len: 

  if(ms[newin] <
newfit_value[fitin]): 

   newpop[newin] =
pop[fitin] 

   newin = newin 1

  else: 

   fitin = fitin 1

 pop = newpop 



以上代码主要进行了3个操作,首先是计算个体适应度总和,然后在计算各自的累积适应度。这两步都好理解,主要是第三步,转轮盘选择法。这一步首先是生成基因总数个0-1的小数,然后分别和各个基因的累积个体适应度进行比较。如果累积个体适应度大于随机数则进行保留,否则就淘汰。这一块的核心思想在于:一个基因的个体适应度越高,他所占据的累计适应度空隙就越大,也就是说他越容易被保留下来。

选择完后就是进行交配和变异,这个两个步骤很好理解。就是对基因序列进行改变,只不过改变的方式不一样

交配:

# 0.0 coding:utf-8 0.0 

# 交配 

import random 

def crossover(pop, pc): 

 pop_len = len(pop) 

 for i in range(pop_len -
1): 

  if(random.random() <
pc): 

   cpoint =
random.randint(0,len(pop[0])) 

   temp1 =
[] 

   temp2 =
[] 

  
temp1.extend(pop[i][0:cpoint]) 

   temp1.extend(pop[i
1][cpoint:len(pop[i])]) 

   temp2.extend(pop[i
1][0:cpoint]) 

  
temp2.extend(pop[i][cpoint:len(pop[i])]) 

   pop[i] =
temp1 

   pop[i 1] =
temp2 



变异: 

# 0.0 coding:utf-8 0.0 

# 基因突变 

import random 

def mutation(pop, pm): 

 px = len(pop) 

 py = len(pop[0]) 

 for i in range(px): 

  if(random.random() <
pm): 

   mpoint = random.randint(0,
py-1) 

   if(pop[i][mpoint] ==
1): 

   
pop[i][mpoint] = 0

   else: 

   
pop[i][mpoint] = 1

整个遗传算法的实现完成了,总的调用入口代码如下 

# 0.0 coding:utf-8 0.0 

import matplotlib.pyplot as plt 

import math 

from calobjValue import calobjValue 

from calfitValue import calfitValue 

from selection import selection 

from crossover import crossover 

from mutation import mutation 

from best import best 

from geneEncoding import geneEncoding 

print 'y = 10 * math.sin(5 * x) 7 * math.cos(4 * x)'

# 计算2进制序列代表的数值 

def b2d(b, max_value, chrom_length): 

 t = 0

 for j in range(len(b)): 

  t = b[j] * (math.pow(2,
j)) 

 t = t * max_value / (math.pow(2, chrom_length) -
1) 

 return t 

pop_size = 500  # 种群数量 

max_value = 10  #
基因中允许出现的最大值 

chrom_length = 10  # 染色体长度 

pc = 0.6   #
交配概率 

pm = 0.01   #
变异概率 

results = [[]]  #
存储每一代的最优解,N个二元组 

fit_value = []  # 个体适应度 

fit_mean = []  # 平均适应度 

# pop = [[0, 1, 0, 1, 0, 1, 0, 1, 0, 1] for i in
range(pop_size)] 

pop = geneEncoding(pop_size, chrom_length) 

for i in range(pop_size): 

 obj_value = calobjValue(pop, chrom_length,
max_value)  # 个体评价 

 fit_value =
calfitValue(obj_value)  #
淘汰 

 best_individual, best_fit = best(pop,
fit_value)  # 第一个存储最优的解,
第二个存储最优基因 

 results.append([best_fit, b2d(best_individual,
max_value, chrom_length)]) 

 selection(pop, fit_value)  #
新种群复制 

 crossover(pop, pc)  #
交配 

 mutation(pop, pm)  #
变异 

results = results[1:] 

results.sort() 

X = [] 

Y = [] 

for i in range(500): 

 X.append(i) 

 t = results[i][0] 

 Y.append(t) 

plt.plot(X, Y) 

plt.show() 

最后调用了一下matplotlib包,把500代最优解的变化趋势表现出来。




以上就是本文的全部内容,希望对大家的学习有所帮助

详解用python实现简单的遗传算法的更多相关文章

  1. 第7.16节 案例详解:Python中classmethod定义的类方法

    第7.16节  案例详解:Python中classmethod定义的类方法 上节介绍了类方法定义的语法以及各种使用的场景,本节结合上节的知识具体举例说明相关内容. 一.    案例说明 本节定义的一个 ...

  2. 机器学习经典算法详解及Python实现--基于SMO的SVM分类器

    原文:http://blog.csdn.net/suipingsp/article/details/41645779 支持向量机基本上是最好的有监督学习算法,因其英文名为support vector  ...

  3. spring事务详解(二)简单样例

    系列目录 spring事务详解(一)初探事务 spring事务详解(二)简单样例 spring事务详解(三)源码详解 spring事务详解(四)测试验证 spring事务详解(五)总结提高 一.引子 ...

  4. Shodan搜索引擎详解及Python命令行调用

    shodan常用信息搜索命令 shodan配置命令 shodan init T1N3uP0Lyeq5w0wxxxxxxxxxxxxxxx //API设置 shodan信息收集 shodan myip ...

  5. 第7.20节 案例详解:Python抽象类之真实子类

    第7.20节 案例详解:Python抽象类之真实子类 上节介绍了Python抽象基类相关概念,并介绍了抽象基类实现真实子类的步骤和语法,本节结合一个案例进一步详细介绍. 一.    案例说明 本节定义 ...

  6. 第7.18节 案例详解:Python类中装饰器@staticmethod定义的静态方法

    第7.18节 案例详解:Python类中装饰器@staticmethod定义的静态方法 上节介绍了Python中类的静态方法,本节将结合案例详细说明相关内容. 一.    案例说明 本节定义了类Sta ...

  7. 第7.13节 案例详解:Python类变量

    第7.13节 案例详解:Python类变量 上节介绍了类变量的定义和使用方法,并举例进行了说明.本节将通过一个更完整的例子来说明. 一.    定义函数dirp def dirp(iter): ret ...

  8. 自然语言处理之中文分词器-jieba分词器详解及python实战

    (转https://blog.csdn.net/gzmfxy/article/details/78994396) 中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,在进行中文自 ...

  9. Java-单例模式详解(图文并茂,简单易懂)

    PS:首先我们要先知道什么是单例,为什么要用单例,用的好处是什么等问题来看. 1:java中单例模式是一种常见的设计模式,单例模式的写法有好几种,这里主要介绍两种:懒汉式单例.饿汉式单例单例模式有以下 ...

随机推荐

  1. MGR测试及搭建

    一.部署规划:本次布署使用单机多实例进行basedir: /usr/local/mysql端口号 数据目录 group_repplication通信端口3306 /data/mysql/mysql_3 ...

  2. sqlserver常用运维sql

    1. sqlserver 检测sql SELECT top 10 (total_elapsed_time / execution_count)/1000 N'平均时间ms' ,total_elapse ...

  3. SQL 删除重复记录,只保留一条记录

    DELETE FROM py_bond_shenzhen_exchange_opinion_2_1 WHERE id NOT IN (SELECT id FROM (SELECT min(id) AS ...

  4. 1、python--第一天练习题

    #1.使用while循环输入 1 2 3 4 5 6 8 9 10 k = 0 while k < 10: k += 1 if k == 7: continue print(k) #2.求1-1 ...

  5. Codeforces Round #590 (Div. 3)【D题:26棵树状数组维护字符出现次数】

    A题 题意:给你 n 个数 , 你需要改变这些数使得这 n 个数的值相等 , 并且要求改变后所有数的和需大于等于原来的所有数字的和 , 然后输出满足题意且改变后最小的数值. AC代码: #includ ...

  6. Shell 01 shell概述

    1.查看shells:/etc/shells /bin/sh /bin/bash /sbin/nologin /usr/bin/sh /usr/bin/bash /usr/sbin/nologin / ...

  7. ckeditor粘贴word图片自动上传功能

    由于工作需要必须将word文档内容粘贴到编辑器中使用 但发现word中的图片粘贴后变成了file:///xxxx.jpg这种内容,如果上传到服务器后其他人也访问不了,网上找了很多编辑器发现没有一个能直 ...

  8. Linux下的电路设计辅助软件

    造冰箱的大熊猫@cnblogs 2019/8/21 最近调研了以下开源的电路设计辅助软件(EDA),汇总如下 1.gEDA 官网:geda-project.org 老牌的开源EDA软件,诞生于上世纪9 ...

  9. csp-s模拟测试77+78(lrd day1&2)

    RP-=inf....... 一场考试把rp败光...由于本次考试本人在考试中乱说自己AK导致rp--,本人当选为机房倒数第二没素质 不过AK一次还挺开心的... 达哥出的题还是比较简单的. T1:考 ...

  10. 在windows10 Linux (centos7)中安装go golang (够浪) 并测试运行

    官方下载安装页面 https://golang.org/doc/install git主页 https://github.com/golang/go 相关下载地址 https://golang.org ...