遗传算法课件第二章

上传人:wt****50 文档编号:50598021 上传时间:2018-08-09 格式:PPT 页数:24 大小:185KB
返回 下载 相关 举报
遗传算法课件第二章_第1页
第1页 / 共24页
遗传算法课件第二章_第2页
第2页 / 共24页
遗传算法课件第二章_第3页
第3页 / 共24页
遗传算法课件第二章_第4页
第4页 / 共24页
遗传算法课件第二章_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《遗传算法课件第二章》由会员分享,可在线阅读,更多相关《遗传算法课件第二章(24页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 模式理论模式理论指导遗传算法的基本理论,是J.H.Holland教授创立的模式理论。该理论揭示了遗传算法的基本机理。3.1 3.1 基本概念基本概念3.1.1 3.1.1 问题的引出问题的引出例: 求 max f(x)=x2 x 0,31分析 当编码的最左边字符为“1”时,其个体适应度较大,如2号个体和4号个体,我们将其记为 “ 1* ”;其中2号个体适应度最大,其编码的左边两位都是1,我们记为 “ 11* ”; 当编码的最左边字符为“0”时,其个体适应度较小,如1号和3号个体,我们记为 “ 0* ”。结论从这个例子可以看比,我们在分析编码字符串时,常常只关心某一位或某几位 字符

2、,而对其他字符不关心。换句话讲我们只关心字符的某些特定形式,如1*,11*,0*。这种特定的形式就叫模式。3.1.2 3.1.2 模式、模式阶及模式定义长度模式、模式阶及模式定义长度模式模式( (Schema)Schema)指编码的字符串中具有类类似特征的子集。以五位二进进制字符串为为例,模式 * *111111* * 可代表4个个体: 01110,01111,11110,11111;模式 *0000*0000 则则代表2个个体:10000,00000 。 个体是由二值字符集 V=0, 1 中的元素所组成的一个编码串; 而模式却是由三值字符集 V=0, 1,* 中的元素所组成的一个编码串,其中

3、“ * * ” 表示通配符,它既可被当作 “1” 也可被当作 “0”。模式阶模式阶 ( (SchemaSchema Order) Order)指模式中已有明确含意(二进制字符时指0或1)的字符个数,记做 o(s),式中 s 代表模式。例如,模式 ( 011*1* ) 含有4个明确含意的字符,其阶次是4,记作 o( 011*1* ) =4;模式 ( 0* ) 的阶次是1,记作 o( 0* ) =1。 阶次越低,模式的概括性越强,所代表的编码串个体数也越多,反之亦然;阶次越低,模式的概括性越强,所代表的编码串个体数也越多,反之亦然; 当模式阶次为零时,它没有明确含义的字符,其概括性最强。模式的定义

4、长度模式的定义长度( ( SchemaSchema Defining Length) Defining Length)指模式中第一个和最后一个具有明确含意的字符之间的距离,记作 (s)。例如,模式( 011*l* ) 的第一个字符为0,最后一个字符为l,中间有3个字符,其定义长度为4,记作 ( 011*l* ) = 4 ;模式 ( 0* ) 的长度是0,记作 ( 0* ) = 0 ; 一般地,有式子(s)b a式中 b模式s 中最后一个明确字符的位置;a模式s 中最前一个明确字符的位置。 模式的长度代表该模式在今后遗传操作模式的长度代表该模式在今后遗传操作( (交叉、变异交叉、变异) )中被破

5、坏的可能性:中被破坏的可能性:模式长度越短,被破坏的可能性越小,长度为模式长度越短,被破坏的可能性越小,长度为0 0的模式最难被破坏。的模式最难被破坏。3.1.3 3.1.3 编码字符串的模式数目编码字符串的模式数目(1) (1) 模式总数模式总数 二进制字符串假设字符的长度为l,字符串中每一个字符可取( 0, 1, * ) 三个符号中任意一个,可能组成的模式数目最多为:3 3 3 3 = (2+1)(2+1)l l 一般情况下,假设字符串长度为l,字符的取值为 k 种,字符串组成的模式数目 n1 最多 为: n1=(k+1)l(2) (2) 编码字符串(一个个体编码串)所含模式总数编码字符串

6、(一个个体编码串)所含模式总数 二进制字符串对于长度为l的某二进制字符串,它含有的模式总数最多为:2 2 2 2 = 2 2l l 注意 这个数目是指字符串已确定为0或1,每个字符只能在已定值 (0/1)或* 中选取;前面所述的 n1 指字符串未确定,每个字符可在0, 1, * 三者中选取。 一般情况下长度为l、取值有 k 种的某一字符串,它可能含有的模式数目最多为: n2 = kl(3) (3) 群体所含模式数群体所含模式数在长度为l,规规模为为M的二进进制编码编码 字符串群体中,一般包含有2l M 2l个模式。3.2 3.2 模式定理模式定理 由前面的叙述我们可以知道,在引入模式的概念之后

7、,遗传算法的实质可看作是对模式的一种运算。对基本遗传算法(GA)而言,也就是某一模式s 的各个样本经过选择运算、交义运算、变异运算之后,得到一些新的样本和新的模式。3.2.1 3.2.1 复制时的模式数目复制时的模式数目这里以比例选择算子为例研究。 公式推导公式推导 (1) 假设在第t次迭代时, 群体P(t)中有M个个体, 其中m个个体属于模式s, 记作m(s,t)。(2) 个体 ai 按其适应度 fi 的大小进行复制。从统计意义讲,个体ai被复制的概率pi是: (3) 因此复制后在下一代群体 P(t+1)中,群体内属于模式s(或称与模式s匹配) 的个体数目 m(s,t+1) 可用平均适应度按

8、下式近似计算:f(s)式中 第t代属于模式 s 的所有个体之平均适应度;M群体中拥有的个体数目 。f(s)(4) 设第t代所有个体(不论它属于何种模式)的平均适应度是 , 有等式:f(5) 综合上述两式,复制后模式s所拥有的个体数目可按下式近似计算:fff(s) 结论结论 上式说明复制后下一代群体中属于模式上式说明复制后下一代群体中属于模式s s 的个体数目,取决于该模式的平均的个体数目,取决于该模式的平均适应度适应度 与群体的平均适应度与群体的平均适应度 之比之比; ; 只有当模式只有当模式s s 的平均值的平均值 大于群钵的平均值大于群钵的平均值 时,时,s s模式的个体数目才模式的个体数

9、目才能增长。否则,能增长。否则,s s模式的数目要减小。模式的数目要减小。 模式s 的这种增减规律,正好符合复制操作的“优胜劣汰”原则,这也说明模式的确能描述编码字符串的内部特征。f(s)ff(s)f 进一步推导进一步推导 (1) 假设某一模式s 在复制过程中其平均适应度 比群体的平均适应度 高出一个定值 ,其中c 为常数,则上式改写为:ff(s)c f 结论结论 从数学上讲,上式是一个指数方程,它说明模式从数学上讲,上式是一个指数方程,它说明模式s s 所拥有的个体数目所拥有的个体数目在复制过程中以指数形式增加或减小。在复制过程中以指数形式增加或减小。fc ff += m( s, t ) (

10、1+c )(2) 从第一代开始,若模式s 以常数c 繁殖到第 t+1代,其个体数目为: m( s, t+1 ) = m( s, 1 ) (1+c )t3.2.2 3.2.2 交叉时的模式数目交叉时的模式数目这里以单点交叉算子为例研究。 举例举例 (1) 有两个模式 s1: “ * 1 * * * * 0 ”s2: “ * * * 1 0 * * ”它们有一个共同的可匹配的个体(可与模式匹配的个体称为模式的表示)a: “ 0 1 1 1 0 0 0 ”(2) 选择个体a 进行交叉(3) 随机选择交叉点s1: “ * 1 * * * * 0 ” 交叉点选在第 2 6 之间都可能破坏模式s1;s2:

11、 “ * * * 1 0 * * ” 交叉点在 第 4 5之间才破坏s2。 公式推导公式推导 (1) 交换发生在模式s 的定义长度 (s)范围内,即模式被破坏的概率是:例: s1 被破坏的概率为:5/6 s2 被破坏的概率为:1/6 l(2) 模式不被破坏,存活下来的概率为: (3) 若交叉概率为pc,则模式存活下来的概率为: 结论结论 模式的定义长度对模式的存亡影响很大,模式的长度越大,越容易被破坏。模式的定义长度对模式的存亡影响很大,模式的长度越大,越容易被破坏。(4) 经复制、交叉操作后,模式s在下一 代群体中所拥有的个体数目为:l-1l-1ff(s) l-13.2.3 3.2.3 变异

12、时的模式数目变异时的模式数目这里以基本位变异算子为例研究。 公式推导公式推导 (1) 变异时个体的每一位发生变化的概率是变异概率pm,也就是说,每一位存 活的概率是(1- pm)。根据模式的阶o(s),可知模式中有明确含意的字符有o(s)个,于是模式s 存活的概率是: (2) 通常 pm1,上式用泰勒级数展开取一次项,可近似表达为: ps 1 pm o(s) 结论结论 上式说明,模式的阶次上式说明,模式的阶次o(s)o(s)越低,模式越低,模式s s 存活的可能性越大,反之亦然。存活的可能性越大,反之亦然。 3.2.4 3.2.4 模式定理模式定理综合式、 可以得出遗传算法经复制、交叉、变异操

13、作后,模式s在下一代群体中所拥有的个体数目,如下式所示: 模式定理模式定理 适应度高于群体平均适应度的,长度较短,低阶的模式在遗传算适应度高于群体平均适应度的,长度较短,低阶的模式在遗传算法的迭代过程中将按指数规律增长。法的迭代过程中将按指数规律增长。模式定理深刻地阐明了遗传算法中发生“优胜劣汰”的原因。在遗传过程中 能存活的模式都是定义长度短、阶次低、平均适应度高于群体平均适应度的 优良模式。遗传算法正是利用这些优良模式逐步进化到最优解。ff(s) l-13.2.5 3.2.5 模式定理示例模式定理示例例: 求 max f(x)=x2 x 0,31个 体 变 化叉叉S1S2S3叉3.3 3.

14、3 建筑块假说建筑块假说3.3.1 3.3.1 模式对搜索空间的划分模式对搜索空间的划分 举例举例 以 max f(x)=x2 x 0,31 为例,图中:横坐标表示x,纵坐标代表适应度f(x)=x2,用千分数表示,弧线表示适应度曲线,网点区代表所有符合此模式的个体集合。模式1:1*模式2:10*模式3:*1*1 结论结论 模式能够划分搜索空间,而且模式的阶越高,对搜索空间的划分越细致。模式能够划分搜索空间,而且模式的阶越高,对搜索空间的划分越细致。3.3.2 3.3.2 分配搜索次数分配搜索次数模式定理告诉我们:GAGA根据模式的适应度、长度和阶次为模式分配搜索次数。根据模式的适应度、长度和阶次为模式分配搜索次数。为那些适应度较高,长度较短,阶次较低的模式分配的搜索次数按指数率增长为那些适应度较高,长度较短,阶次较低的模式分配的搜索次数按指数率增长 ; 为那些适应度较低,长度较长,阶次较高的模式分配的搜索次数按指数率衰减为那些适应度较低,长度较长,阶次较高的模式分配的搜索次数按指数率衰减 。3.3.3 3.3.3 建筑块假说建筑块假说前面我们已经介绍了GA如何划分搜索空间和在各个子空间中分配搜索次数,那么GA如何利用搜索过程中的积累信息加快搜索速度

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号