遗传算法的数学基础

上传人:大米 文档编号:489496704 上传时间:2023-08-13 格式:DOC 页数:22 大小:227.03KB
返回 下载 相关 举报
遗传算法的数学基础_第1页
第1页 / 共22页
遗传算法的数学基础_第2页
第2页 / 共22页
遗传算法的数学基础_第3页
第3页 / 共22页
遗传算法的数学基础_第4页
第4页 / 共22页
遗传算法的数学基础_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《遗传算法的数学基础》由会员分享,可在线阅读,更多相关《遗传算法的数学基础(22页珍藏版)》请在金锄头文库上搜索。

1、第3章 遗传算法的数学基础 遗传算法在机理方面具有搜索过程和优化机制等属性,数学方面的性质可通过模式定理和构造块假设等分析加以讨论,Markov链也是分析遗传算法的一个有效工具。遗传算法的选择操作是在个体适应度基础上以概率方式进行的,在概率选择方式上与模拟退火法有些类似。 本章将较全局地介绍遗传算法的基础数学理论和分析工具,包括验证基础遗传算法(SGA)的有效性的模式定理,分析遗传算法过程的Walsh模式变换方法,遗传算法的欺骗问题以及遗传算法的动态分析工具Markov链分析。3.1 模式定理1. 模式我们将种群中的个体即基因串中的相似样板称为“模式”,模式表示基因串中某些特征位相同的结构,因

2、此模式也可能解释为相同的构形,是一个串的子集。在二进制编码中,模式是基于三个字符集0,1,*的字符串,符号* 代表0或1。例1 *1*表示四个元的子集010 011 110 111对于二进制编码串,当串长为L时,共有3L个不同的模式。例2 串长L=3,则其模式共有* *1* *0* *1 *0 1* 0* *10 *00 *01 1*1 1*0 0*1 0*0 11* 10* 01* 00* 111 110 101 011 001 010 100 000 共27个1+2*3+22*3+23=33遗传算法中串的运算实际上是模式的运算。如果各个串的每一位按等概率生成0或1,则模式为n的种群模式种类

3、总数的期望值为:种群最多可以同时处理个模式,见下例例 一个个体(种群中只有一个),父个体011 要通过变异变为子个体001,其可能影响的模式为:被处理的模式总数为8个,8=1*23如果独立的考虑种群中的各个串,则仅能得到n条信息,然而当把适应值与各个串结合考虑,发掘串群体的相似点,就可得到大量的信息来帮助指导搜索,相似点的大量信息包含在规模不大的种群中。2. 模式阶和定义距 定义1:模式阶 模式H中确定位置的个数成为模式H的模式阶,记作O(H) 例 O(011*1*0)=5定义2 定义阶 模式中第一个确定位置和最后一个确定位置之间的距离,记作 例 3. 模式定理 假定在给定时间步t(即第t代)

4、,种群A(t)中有m个个体属于模式H,记为m=m(H,t),即第t代时,有m个个体属于H模式。在再生阶段(即种群个体的选择阶段),每个串根据它的适应值进行复制(选择),一个串Ai被复制(选中)的概率为:n表示种群中个体总数当采用非重叠的n个串的种群替代种群A(t),可以得到下式:其中:,表示在t 时模式H的平均适应度若用表示种群平均适应度,则前式可表示为:上式表明:一个特定的模式按照其平均适应度值与种群的平均适应度值之间的比率生长,换句话说就是:那些适应度值高于种群平均适应度值的模式,在下一代中将会有更多的代表串处于A(t+1)中,因为在时有m(H,t+1)m(H,t) 假设从t=0开始,某一

5、特定模式适应度值保持在种群平均适应度值以上,c为常数c0, 则模式选择生长方程为:上式表明,在种群平均值以上(以下)的模式将按指数增长(衰减)的方式被复制。下面讨论交叉对模式H的影响:例:对串A分别在下面指定点上与H1模式和H2模式进行交叉 A 0111000 H1 *1*0 (被破坏概率:;生存率:1/6) H2 *10* (被破坏概率:;生存率:5/6)显然A与H1交叉后, H1被破坏,而与H2交叉时, H2不被破坏。一般地有 :模式H被破坏的概率为,故交叉后模式H生存的概率为()考虑到交叉本身是以随机方式进行的,即以概率Pc进行交叉,故对于模式H的生存概率Pc可用下式表示:同时考虑选择交

6、叉操作对模式的影响,(选择交叉互相独立不影响)则子代模式的估计:上式表明模式增长和衰减依赖于两个因素:一是模式的适应度值f(H)与平均适应度值的相对大小;另一个是模式定义阶的大小(当Pc一定, L一定时)。下面再考察变异操作对模式的影响:变异操作是以概率Pm随机地改变一个位上的值,为了使得模式H可以生存下来,所有特定的位必须存活。因为单个等位基因存活的概率为(1Pm),并且由于每次变异都是统计独立的,因此,当模式H中O(H)个确定位都存活时,这时模式H才能被保留下来,存活概率为:(为0.01以下)上式表明O(H)个定位值没有被变异的概率。由此我们可得到下式在t+1代种群中存在模式H的个体数目在

7、t代种群中存在模式H的个体数目在t代种群中包含模式H的个体平均适应度t代种群中所有个体的平均适应度个体长度交叉概率变异概率对于k点交叉时,上式可表示为:模式定理:在遗传算子选择、交叉和变异的作用下,具有低阶、短定义距以及平均适应度高于种群平均适应度的模式在子代中呈指数增长。4. 积木块假设(building block hypochesis) 遗传算法通过短定义距、低阶以及高适应度的模式(积木块),在遗传操作作用下相互结合,最终接近全局最优解。满足这个假设的条件有两个:(1)表现型相近的个体基因型类似(2)遗传因子间相关性较低积木块假设指出,遗传算法具备寻找全局最优解的能力,即积木块在遗传算子

8、作用下,能生成低阶、短距、高平均适应度的模式,最终生成全局最优解。模式定理还存在以下缺点:(1) 模式定理只对二进制编码适用(2) 模式定理只是指出具备什么条件的木块会在遗传过程中按指数增长或衰减,无法据此推断算法的收敛性(3) 没有解决算法设计中控制参数选取问题3.2 Walsh模式变换1980年,密歇根大学的A.D.Bethke博士论文“作为函数优化器的遗传算法”,首次应用Walsh函数进行遗传算法的模式处理,采用Walsh函数的离散形式有效地计算模式的平均适应度,从而对遗传算法的优化过程的特征进行分析。3.3 非均匀Walsh模式变换3.4 欺骗问题在遗传算法中,将所有妨碍评价值高的个体

9、生成,从而影响遗传算法正常工作的问题统称为欺骗问题(deceptive problem),根据模式定理,如果低阶、高适应度模式中包含了最优解的话,遗传算法就可能找出它来,但是如果低阶、高适应度模式中未包含最优串的具体取值,则遗传算法只能找出次优解。定义 竞争模式 若模式H和H中,*位置是完全一致的,但任一确定位的编码均不同,则称H和H互为竞争模式。例 10*与01*是竞争模式 10*与11*不是竞争模式定义 欺骗性 假定f(x)的最大值对应的x集合为x*,H为包含x*的m阶模式, H的竞争模式为H,而且f(H)f(H),则f为m阶欺骗。例 对于一个三位二进制编码的模式,如果f(111)为最大值

10、,下列12个不等式中任意一个不等式成立,则存在欺骗问题。 模式阶数为1时:f(*1)f(*0),f(*1*)f(*0*),f(1*)f(0*) 模式阶数为2时:f(*11)f(*00),f(1*1)f(0*0),f(11*)f(00*) f(*11)f(*01),f(1*1)f(0*1),f(11*)f(01*) f(*11)f(*10),f(1*1)f(1*0),f(11*)H(1*),则欺骗性存在。该条件可化为:下面以前一种为例进行讨论,设则有:r1:称为类欺骗问题,见图1,求最优化时较难c=2,N=2),然后将它们分成N个子种群,每个子种群包括n各样本,对每个子种群独立的运行各自的遗传算

11、法,记它们为GAi(i=1,2,.N)。这N个遗传算法最好在设置特性上有较大差异,这样就可以为将来的高层遗传算法产生更多种类的优良模式。在每个子种群的遗传算法运行到一定代数后,将N个遗传算法的结果种群记录到二维数组R1.N,1n中,则Ri,j(i=1N,j=1n)表示GAi的结果种群的第j个个体。同时将N各结果种群的平均适应度值记录到数组A1.N中,Ai表示GAi的结果种群平均适应度。高层遗传算法与普通遗传算法的操作相类似,也可以分为以下三个步骤:1.选择(种群之内选择)基于数组A1.N,即N个遗传算法的平均适应度值,对数组R代表结果种群进行选择操作,一些结果种群由于它们的平均适应度值高而被复制,甚至复制多次;另一些结果种群由于它们的种群平均适应度值低而被淘汰。2. 交叉(种群之间交叉)如果Ri,1.n和Rj,1.n被随机地匹配到一起,而且从位置x进行交叉()则Ri,x+1.n和R

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号