群集智能 (Swarm intelligence, SI)
目录 |
群集智能是指众多行为简单的个体相互作用过程中涌现产生的整体智能行为。
群集智能也存在如下3个方面的缺陷:
1.个体及其属性
对于同一个系统,从不同层面、不同粒度去描述和观察,会得到不同的结论。虽然蚂蚁既具有一系列的神经节和神经团块,又有像人类一样的蕈形体(蚂蚁的大脑),具有简单的生物智能,但在群集智能的研究层面对单个蚂蚁的这些生理特征做了简化,只是将其看作是具有简单学习能力的个体,而忽略蚂蚁大脑与神经的构造。当以揭示群集智能涌现的内在运行机制为目标时,将个体作为最小单元并对它的属性细节进行适当的简化是合理的,也是必要的。
在根据生物蚂蚁觅食行为构造蚁群系统模型时,研究人员抽象定义的人工蚂蚁具有以下功能和属性:人工蚂蚁能够识别环境(问题空间)中的信息激素及其变化,并做出不同的行为选择;人工蚂蚁有少量的记忆空间用来存储有关信息;人工蚂蚁的活动处在一个时间离散的环境中。
鸟类的个体生理结构和生物智能似乎比蚂蚁更复杂,但研究者在模仿鸟类觅食建立粒子群模型时,仅仅将每个鸟看作是有一定记忆能力并能够感知周围其他鸟的位置的个体粒子。
从总体组织结构上看,群集智能都具有无中央集中控制的体系结构。群集智能中个体的地位是平等的,个体之间不存在控制与被控制的关系。
2.个体的行为规则
生物系统中个体的行为规则极为复杂,而且要受诸多客观因素的综合影响。在群集智能的模型描述中需对个体的行为规则进行抽象和简化。
根据个体行为的状态转移确定性特征,可将行为规则分为确定性行为规则和基于概率的行为规则。确定性行为规则规定个体依据当前状态在有限种可能的行为中选择确定一个作为下一步的动作。例如蚁群墓地构造模型中,蚂蚁只能在棋盘格上根据周围8个方向上尸体的分布情况选择确定一个方向作为下一个要去的位置。基于概率的行为规则类似于遗传算法中的“选择”操作,利用条件概率、轮盘赌等方式选择下一步的行动方案。例如在蚂蚁觅食模型的As版本中,就采用轮盘赌的方式根据所要选择路径上的信息激素量和自启发量(如路径长度的倒数)随机确定下一个要游历的位置。另外,也有一些模型同时具有确定性和基于概率的混合行为规则,如在蚂蚁觅食模型的ACS版本中,当计算得到的概率大于某一阈值时,就按照确定性规则选择下一个位置;而小于这一阈值时,仍按概率进行选择。
根据个体行为是否具有主动性可分为刺激一反应的被动行为规则和基于学习的主动行为规则。对于刺激一反应的行为规则,只有当外界信号满足个体的特定条件时,个体才选择下一步的行动。例如在蚂蚁劳动分工的固定阈值模型中,当一给定任务的强度超过了某个蚂蚁对应的阈值时,它才开始执行该任务。对于基于学习的行为规则,由于个体具有不断地向其他个体或环境学习的能力,它会及时调整行为选择规则,进而根据新的规则进行选择。例如在蚂蚁劳动分工的时变阈值模型中,个体的学习可以降低其响应阈值,从而对选择概率产生影响。
3.个体间的交互和通讯方式
在具有群集智能涌现特性的生物系统中,个体之间是通过基于媒质的间接交互和短程作用来实现信息的传递和协调的。
根据生物学的观点,一般认为蚂蚁是由胡蜂衍变而来的,仅保留了微弱的视觉,能够辨认方向,观察到附近不远的地形,为寻找食物提供一定的帮助。事实上,蚂蚁用来交流信息的主要方式是借助信息激素(pheromone)完成的。信息激素乃是蚂蚁体内的一些腺体不断制造出来的一类化合物,在蚂蚁个体间起通讯联络作用,种类在55种以上;其中有一种主要的追踪激素,它是蚂蚁群体觅食、返巢、分工、构造墓地等活动的重要依据。生物蚂蚁个体通过将自身的信息激素分泌到环境中以便被其他的蚂蚁所感知而达到交流的目的。这是一种间接的通讯机制,是以信息激素为媒质的。
蚁群觅食模型都是采用这种以追踪激素为媒质的间接通讯方式为主,以基于能见度(visibility)的自启发因子为辅的混合行为选择策略。
鸟群觅食采用的是短程交互作用的方式来实现信息的传递和协调。每个鸟能够感知它周围一定范围内的其他鸟的状态和位置,并利用这些信息来指导自身下一步的行动。
系统中的反馈形式有正反馈和负反馈之分。正反馈是一个加强自身的过程,形象的说法是滚雪球效应。正反馈具有增补作用,能促进事物的发展。这里发展可以是进化、进步或退化、衰亡。负反馈是指利用误差进行控制使系统尽量按设定的轨迹运动的过程,其功能是起抑制作用。群集智能在总体上体现的是正反馈的强化效果,但在演化的环节中存在负反馈的调节作用。下面以蚁群系统为例加以说明。
蚂蚁觅食行为体现了正反馈的整体效应。研究者通过精心设计和量化个体的觅食行为规则、个体之间的信息交互及其运行环境,较好地解决了一些典型的优化问题。事实上,由于这种人工设计的蚁群系统及其运行环境采用的是一定的数学模型描述,系统演化的本质是在“数量空间”中的“寻优”。已有的实验表明,蚁群觅食模型在解决复杂问题时,具有与其他进化算法类似的高度“并行性”,这也是蚁群优化算法的高效率之源。蚁群觅食模型隐含的“并行寻优”机制在群体层次上显现出系统的整体特性。由于蚁群觅食模型是依照正反馈思想建立起来的,它在以迭代的方式进行复杂问题求解时,当前性能愈优的候选解(或构成候选解的组件)愈是被强化,这使得模型能在较短的时间内收敛到一些较为满意的解。但由此得到的结果往往是问题的局部最优解,而且随着迭代的继续,对这些解的强化越来越大,模型处于“早熟停滞”状态。为了在迭代的后期,算法仍有机会跳出局部最优并继续寻找更好的解,研究人员在算法实现上局部利用负反馈的抑制作用来控制信息激素的增长和个体的行为规则。
蚁群构造巢穴的行为体现了正反馈的放大效应。在构造巢穴时,每个蚂蚁只与其近邻的同伴交互,活动空间也被限制在一定的范围内。虽然每个蚂蚁并不知晓巢穴的全貌,但最终构造出来的巢穴却结构精良、因地制宜,能够满足不同的需要。这种局部的微观运作规则导致的宏观结构涌现正是群集智能的精妙所在。
蚁群社会的劳动分工行为体现出正反馈的长远效应。Deneubourg等人较早地运用非线性动力学的手段从宏观上解释了蚁群社会出现劳动分工的生态条件。事实上,蚂蚁的行为受劳动分工的制约乃是源于个体之间的“多重交互”,合作即是从系统的递推中演化出来的。“合作”现象普遍存在于各种复杂系统之中,因此揭示基于群集智能的复杂系统合作进化机制无疑具有重要的现实意义。
群集智能中负反馈采取的形式可能是饱和(saturation)、枯竭(exhaustion)和竞争。例如劳动分工是为了提高效率,但分工不均、回报不公(在蚁群系统中以信息激素的强弱表示)都会导致效率低下,直至群体发展走向两极:一部分任务因为回报较高而导致大量个体蜂拥而至,始终处于被执行的“饱和”状态;另一部分任务则由于回报较低而导致执行的个体很少,长期处于“饥饿”状态。利用负反馈的调节和抑制作用进行任务回报(信息激素的浓度)的调整使得个体选择处于“饱和”状态的任务的概率减小,从而其他任务被执行的概率就增加了,最终使任务分配达到动态平衡。负反馈的抑制作用尤其适合任务集本身不断变化的隋形。