- 相关推荐
基于解释性和精确性的模糊建模方法研究研究的目的与意义(一)
模糊建模的概念由Zadeh[1]提出后,在数据挖掘、模式识别、故障诊断、预测、监督与控制等方面得到了迅速的发展和应用,成为模糊理论与应用中重要的研究方向.模糊模型的特点在于它用模糊规则对知识进行表达,而且可以解决一些复杂的,非线性的,用传统的数学方法难以解决的问题.早期的模糊建模主要针对简单系统,采用总结专家经验的方式进行,因此得到的模糊模型必然是容易被人们所理解.但是对于复杂系统,由于难以获得完备的专家经验,而数据相对容易获得,因此近年来基于数据的模糊建模成为研究的热点[2],但目前大多数研究将模糊模型作为一种函数逼近器[3],追求模糊模型对实际系统的拟合程度,即以模型的精确性为建模目标,因此得到的模糊模型结构复杂且冗余量大,难于被人们所理解,即模型的解释性较差,从而将模糊模型等同于神经网络等黑箱模型.
与模糊模型的精确性等可以量化的特性不同,模糊模型的解释性[4-9]目前尚无明确的定义和标准,一般认为,模糊模型的解释性包括结构的解释性和规则解释性两层含义.结构的解释性是指模糊模型具有较少的模糊规则和输入变量数目,模糊规则之间不存在冗余和矛盾等.规则的解释性是指对单条规则,其前件的隶属函数是重叠和可区分的,易赋予相应的语义项,后件的结论根据不同的模型形式,是可以被理解的.
通过上述对模糊模型解释性的分析可知,一般情况下,若模糊模型的精确性较高,其解释性相对较差;而具备较高解释性的模糊模型,其精确性又较低.精确性与解释性较好折衷的模糊模型,具有简单的结构和较少的参数,运算量低,泛化能力强,并且使得人们可以通过对语义规则的理解,分析系统未知特性,获得对系统的进一步认识.具备精确性与解释性较好折衷的模糊模型在高层决策支持、知识发现与管理、系统内部机理分析、数据挖掘、控制等方面起着重要的作用,广泛应用于社会学、经济学、医学、生态学等各个方面.因此,模糊模型精确性与解释性的研究具有重要的理论和现实意义,并在近年来得到了极大的关注[10].
1.2国内外研究现状
目前国内外关于模糊模型的精确性和解释性的研究主要有三条途径:一是基于传统方法的模糊建模,此类方法的特点是首先构建精确性较高的初始模糊模型,对得到的初始模糊模型进行简化,提高模型的解释性;二是基于神经网络的模糊建模,此类方法的特点是将模糊模型等价为神经网络,采用神经网络学习算法,实现精确性与解释性的折衷;三是基于进化算法的模糊建模,此类方法的特点是将初始模糊模型编码为染色体的形式,以模糊模型的精确性和解释性的主要因素(如模糊规则数、模糊集合数等)为目标,采用进化算法同时优化该目标,获得精确性与解释性较好折衷的模糊模型.
1.2.1 基于传统方法的解释性与精确性模糊建模
传统方法的精确性与解释性模糊建模一般分为两个主要阶段[11],首先以模型的精确性为目标,构建初始模糊模型;然后对初始模糊模型进行简化,提高模型的解释性.本节介绍提高模型解释性的方法,主要包括正交变化法和基于相似性的模糊模型简化法.
1.2.1.1正交变化法(Orthogonal Transforms)
在构建初始模糊模型时,为了使得模型具有较高的精确性,可能产生无效或冗余规则,可以通过规则约简来解决.正交变化法是常用的规则约简方法[12-20],它们通过对每一条规则赋予相应的重要性测度,判断并决定是否保留或删除规则.正交变化法主要包括正交最小二乘法和奇异值分解法.
1. 正交最小二乘法(Orthogonal Least-Squares Method)
正交最小二乘法是将模糊规则的激励矩阵转换为一组正交基向量,通过计算每条规则对应的误差比率来确定每一条规则对模型输出的贡献.Wang[12]等人首先将正交最小二乘法应用于模糊规则的选择.Yen[13]等人在简化模糊规则时,指出正交最小二乘法没有考虑模糊规则的前件划分,因此有可能对冗余规则赋予较大的重要性测度,从而提出一种冗余模糊规则的简化方法.Mastorocostas[14]等人和Setnes[15]等人分别采用改进的正交最小二乘法简化模糊规则.Abonyi[16]等人采用模糊聚类算法辨识初始的模糊模型,利用正交最小二乘法简化模糊规则,提高模糊模型的解释性.王[17]等人通过改进的模糊聚类方法确定模糊模型的前件,并对模糊推理关系矩阵进行正交最小二乘估计,通过分析正交向量在模型中贡献的大小确定聚类规则的有效性,然后采用基于UD分解的最小二乘法确定模糊模型的后件,实现模糊模型的结构和参数的优化.
2. 奇异值分解法(Singular Value Decomposition)
奇异值分解法是将模糊规则的激励矩阵进行奇异值分解,通过激励矩阵的奇异值确定相应模糊规则的重要性.Mouzouris[18]等人首先采用奇异值分解法确定最重要的模糊规则.Yen[19]等人采用奇异值分解法(SVD)缓解了高维问题的"维数灾难"问题.祖[20]等人采用减法聚类构造初始模糊系统的结构,采用奇异值分解算法对模糊规则加以分析,根据规则在整个系统中的累积贡献率对模糊结构进行精简和优化,从而提高了模糊模型的解释性.
1.2.1.2基于相似性的模糊模型简化
对于已构建的初始模糊模型,基于相似性的模糊模型简化是另外一种应用较多的提高模糊模型解释性的方法[21-34].其具体过程可分为两个阶段:(1)初始模糊模型中的模糊集合可能存在冗余,表现为模糊集合间存在过度的交叉或重叠,从而难以赋予相应的语义值,因此需要对每个变量的隶属函数进行相似性分析和融合[21-28].(2)对每个变量的隶属函数进行相似性融合后,可能导致模糊规则库中出现冗余的模糊规则,因此需要对规则库中的模糊规则进行相似性分析和融合[29-34].
Setnes[21]等人首先提出了模糊集合相似性分析和融合的方法,并将其应用于提高模糊模型的解释性.Min[22]等人,Roubos[23]等人,Setnes [24]等人和童[25]等人采用模糊聚类算法辨识初始的模糊模型,通过模糊集合相似性分析和融合对初始模糊模型进行简化,提高模糊模型的解释性.Abonyi[26]等人采用决策树算法辨识初始的模糊模型,利用模糊集合相似性分析和奖励遗传算法简化初始模型,获得精确性与解释性较好折衷的模糊模型.郭[27]等人利用模糊软划分得到最佳分类数目和初始模糊模型,并转化为神经网络,利用模糊集合相似性分析提高规则的解释性.Xing[28]等人采用聚类有效性指标函数确定初始的模糊规则数,利用一种改进的模糊聚类算法和最小二乘法确定精确性较高的模糊模型,然后采用正交最小二乘法和模糊集合相似性融合简化模糊模型,提高模型的解释性,最后利用LM算法整体优化模糊模型.
Setnes[29]等人提出经过模糊集合相似性分析和融合后,可能出现相同的模糊模型规则前件,可以通过模糊规则前件的相似性分析和融合的方法,提高模糊模型的解释性.Jin[30]等人在模糊集合相似性分析和融合的基础上提出了模糊规则相似性分析和融合的方法.Wang[31,32]等人采用分层遗传算法优化模糊模型时,利用模糊集合与模糊规则的相似性分析和融合保证模糊模型的解释性.王[33]采用多目标遗传算法进行精确性与解释性较好折衷的模糊模型设计,利用模糊集合与模糊规则的相似性分析和融合保证模糊模型的解释性.李[34]在采用遗传算法优化多维模糊分类器时,利用模糊集合与模糊规则的相似性分析和融合使得种群保持多样性,从而有效地避免了遗传算法收敛到局部最优解的问题.
除了上述提高模糊模型解释性的方法之外,Ishibuchi[35]等人采用栅格划分法初始化模糊模型,提出了变量无关项(don't care)的概念,从而有效地降低了模糊模型中的模糊集合总数,提高了模糊模型的解释性.在文献[26,31,32,33]中引入变量无关项,并分别结合上述模糊模型简化的方法,使模型的解释性得到进一步提高.
1.2.2 基于神经网络的解释性与精确性模糊建模
近年来,神经网络与模糊逻辑的结合是软计算这一研究领域中的研究热点[36-40],原因在于二者之间的互补性.模糊逻辑是一种处理不确定性、非线性问题的有力工具.其推理方式类似于人的思维方式,但其缺乏有效的自学习和自适应能力.神经网络具有并行计算、分布式信息存储和自适应学习能力强等优点;但其知识表达能力较差.融合模糊逻辑与神经网络的系统可以有效地保持各自的优点,弥补相互的缺陷.
为了构建精确性与解释性较好折衷的模糊模型,将模糊模型等价为神经网络[37-40],利用神经网络的学习算法优化模糊模型.目前,神经网络的学习算法一般分为结构学习算法和参数(权值)学习算法.梯度下降搜索法和随机概率搜索法是常用的神经网络权值学习算法,前者中有典型的BP算法[41],后者则包括模拟退火算法[42]和遗传算法[43]等;这些传统的神经网络学习算法,一般是只追求模型的精确性,从而使学习后的神经网络成为一个黑箱模型.为提高神经模糊系统的解释性,需要对神经网络的拓扑结构进行学习.而神经网络的结构学习则比较复杂,目前的结构学习算法主要分为两类:(1)首先根据先验知识,给定一个较大的神经网络规模,然后逐次减小网络规模,提高神经模糊系统的解释性[47-50].(2)给定一个较小规模的神经模糊系统,然后逐次增大系统规模,提高神经模糊系统的精确性[51].
Juang[44]采用模糊聚类算法辨识初始神经网络的结构,利用在线BP算法优化神经网络的权值.Paiva[45]采用减法聚类辨识初始的模糊模型,然后转化为四层的模糊神经网络,采用约束的参数学习算法,提高规则的解释性.贾[46]等人基于两级聚类法辨识初始神经网络的结构,采用梯度下降法提高神经模糊系统的精确性.上述文献的共同点是:首先通过聚类算法等确定神经网络的结构,然后采用神经网络权值学习算法提高神经网络的精度.但在神经网络的学习过程中未涉及结构的学习.
Nauck[47]将模糊模型等价为神经网络后,采用输入变量选择与规则约简等算法实现神经网络结构的简化,利用约束学习算法提高规则的解释性,但不足之处是该方法在学习过程中需要专家的参与.Castellano[48]利用神经模糊系统进行模糊模型的设计,首先采用模糊决策树法或模糊聚类法确定一个较大规模的初始神经网络,然后考虑神经模糊系统的解释性和精确性,逐次递减网络规模.Castellano[49,50]等人采用栅格划分法初始化模糊模型,预先采用修剪算法获得较小规模的神经网络结构,然后对于隶属函数节点层的参数加以限制,并利用该方法构建解释性较高的T-S模糊模型和模糊分类系统.Royas等人[51]等人把模糊建模的过程分为三个阶段,第一阶段构建一个简单的规则库;第二阶段动态地增加模糊规则和模糊集合;第三阶段在不同的模型结构中选择一个精确性和解释性较好折衷的模糊模型.
在神经模糊系统的结构学习过程中,一方面结构简单的神经网络,由于其有限的信息处理能力,难以提供精确性较高的神经模糊系统;另一方面,结构复杂的神经网络,容易出现过度学习,并可能产生不必要的冗余,降低了神经模糊系统的解释性和泛化能力.因此,如何在神经模糊系统的学习中,同时实现网络拓扑结构和权值的优化设计,有待于进一步的研究.
1.2.3 基于进化计算的解释性与精确性模糊建模
模糊逻辑与进化计算的融合是软计算这一研究领域中的另一研究热点[52,53],其原因在于模糊逻辑的知识表达能力与进化计算的全局自学习能力的互补性.进化计算和模糊系统的结合通常称为进化模糊系统.由于遗传算法是进化计算理论体系中最具代表性、最基本的算法[54],因此进化模糊系统通常又被称为遗传模糊系统[52,53](Genetic Fuzzy Systems-GFSs).
基于遗传算法构建精确性与解释性较好折衷的模糊模型,包括模糊模型结构的优化和参数的优化.根据遗传算法不同层次的计算复杂度,可以将基于遗传算法的模糊模型设计分为四种方式:(1)基于遗传算法优化模糊模型隶属函数的参数;(2)基于遗传算法优化模糊模型的规则;(3)基于遗传算法分阶段优化模糊模型结构和参数;(4)基于遗传算法同时优化模糊模型的结构和参数.
1.2.3.1基于遗传算法优化隶属函数的参数
基于遗传算法优化隶属函数的参数,是在预先设定模糊模型结构的情况下,以模糊模型的精确性为目标,采用遗传算法优化隶属函数的参数.因为模糊模型的结构,即输入变量数、输入变量的模糊划分和规则库中模糊规则的个数预先设定,所以此时遗传算法中染色体的长度一般是固定的.采用遗传算法优化隶属函数的参数,其计算复杂度较低.Karr[55],Park[56]等人,Cordon[57]等人,Kinzel[58]等人,Herrera[59]等人,Karr[60],Gurocak[61],Hanebeck[62]等人在确定模糊模型结构的基础上,分别采用遗传算法对三角形(对称三角形和不对称三角形),梯形和高斯型等隶属函数的参数进行优化,提高了模糊模型的精确性.Satyadas[63]等人和Liska[64]等人分别采用二进制和实数编码方式的遗传算法优化隶属函数的参数.Roubos[23]等人,Setnes[24]等人和Abonyi[26]等人分别采用模糊聚类/决策树算法辨识初始的模糊模型,利用模糊集合相似性分析与融合简化初始模型,提高其解释性,再通过惩罚遗传算法优化模糊模型的隶属函数参数,提高其精确性.刑[65]等人采用聚类有效性指标函数确定初始的模糊规则数,利用模糊GK聚类算法初始化模糊模型,把初始的模糊模型编码为染色体,采用遗传算法优化隶属函数的参数,在算法运行中,采用模糊集合相似性融合简化模糊模型,提高模型的解释性.黄[66]等人利用模糊聚类算法和局部最小二乘法获得初始模糊模型,采用实数编码的遗传算法优化模糊模型的隶属函数的参数,提高模型的精确性.
采用遗传算法仅优化隶属函数的参数是遗传算法在模糊建模方面较简单的应用.为了获得精确性和解释性较好折衷的模糊模型,虽然在设计过程中加入了模糊集合相似性分析和融合的内容,但对模糊模型解释性的提高是有限的.
1.2.3.2基于遗传算法优化模糊模型的规则
基于遗传算法优化模糊模型的规则,是在预先设定每一输入变量的模糊划分以及模糊集合参数的情况下,对每个模糊集合赋予一个固定的语言标号,把由语言标号组成的模糊规则编码为染色体,采用遗传算法优化模糊模型的规则库.
目前遗传算法优化模糊模型的规则,典型的方式主要有两种: Pittsburgh型[67-71]和Michigan型[35,72].Delgado[67]等人和Ishibuchi[68]等人采用栅格划分法初始化模糊模型,以模糊规则数目、输入变量数目、隶属函数数目和模糊模型的精确性为目标,采用固定/动态权值法,将上述多目标优化转化为单目标优化,将模糊模型编码为染色体,采用Pittsburgh型遗传算法优化初始模糊模型.Chang[69]等人为了克服上述固定权值法的缺点,利用模糊专家系统评估模型的解释性和精确性,但基于经验构造的专家系统,其可靠性有待提高.除此之外,尚有部分学者研究如何在细节上进一步提高模型的精确性.如Casillas[70]等人在模糊模型中引入遗传算法整定的语言界限和非线性比例因子,用来改变隶属函数的形状,使得模型隶属函数的参数在限定的范围内进行调整,可以赋予更合适的语义项,使得模糊模型的精确性和解释性得到更好的折衷.Alcala[71]等人采用栅格划分法初始化模糊模型,采用一种特殊的规则表达式,使得隶属函数的参数可以在一定的范围内进行调整,通过Pittsburgh型遗传算法优化初始模型的结构,最终获得精确性较高、解释性较好的模糊模型.Ishibuchi[35]等人采用栅格划分法初始化模糊分类系统,把由语言标号组成有的模糊规则编码为染色体,采用Michigan型遗传算法优化模糊模型的结构.Bonarini[72]采用Michigan型遗传算法优化模糊分类系统,通过规则之间的相互竞争和协作关系,获得精确性较高的模糊分类系统.
上述模糊模型初始化的方法一般采用栅格法,由于栅格法对输入变量进行较好的模糊划分,使得初始模型的解释性较好,精确性较差,采用遗传算法优化模糊模型的规则库,使得模型的精确性和解释性均得到有效的提高.为了保证模糊模型的解释性,模糊集合的参数在模型的规则优化阶段保持不变.虽然文献[70,71]对模糊集合的参数进行调整,但其调整范围较小.
1.2.3.3基于遗传算法分阶段优化模糊模型的结构和参数
基于遗传算法分阶段优化模糊模型的结构和参数,其框架如图1.1所示.一般把模糊模型结构和参数的优化分为两个或者三个阶段.Karr[73]和Papadakis[74]等人把模糊模型结构和参数的优化分为两阶段处理,第一阶段考虑模糊模型的精确性与解释性,采用遗传算法对模糊模型进行结构优化;第二阶段考虑模糊模型的精确性,采用遗传算法优化隶属函数的参数.Cordon[57]等人与Kinzel[58]等人把模糊模型结构和参数的优化分为三阶段处理:预先确定一系列模糊规则;利用遗传算法在此模糊规则集中随机选取若干条模糊规则进行组合优化,获得结构简单、精确性较高的模糊模型;最后以模糊模型的精确性为目标,利用遗传算法调节隶属函数的参数,进一步提高模糊模型的精确性.Chung[75]等人研究了另一种三阶段混合学习算法,第一阶段采用聚类算法获得初始模糊模型;第二阶段利用遗传算法优化模糊规则库;第三阶段利用梯度下降法优化隶属函数参数.最近Chiou[76]等人采用一种新的分层迭代遗传算法,上层算法进化模糊模型的规则库,下层算法调节隶属函数的参数,在算法运行中上下层之间相互联系,且算法中给出了一种隶属函数参数的新的编码方式.Pablo [77]等人对高维分类系统进行建模,考虑到模糊模型的精确性和解释性,分阶段优化模糊模型,首先利用Relief算法对高维分类问题进行降维,然后采用遗传算法对模糊规则进行优化,获得精简的模糊规则;最后利用遗传算法对模糊规则库进行优化,获得精确性高和解释性好的模糊模型.
模型的规则库和数据库是模糊模型中相互依赖的两部分,通过对上述文献[57-58,73-76]的分析可知,同时优化模糊模型的结构和参数是较合理的方法.
1.2.3.4 基于遗传算法同时优化模糊模型的结构和参数
近几年来同时优化模糊模型的结构和参数成为模糊建模领域新的研究热点[31,32,78-82].Wang[31,32]等人分析了模糊模型解释性的主要因素,利用模糊聚类构造初始的模糊模型,以模糊规则作为控制基因,以规则前件参数作为参数基因,采用模糊集合与模糊规则的相似性融合简化模糊模型,基于分层遗传算法同时优化模糊模型的结构和参数,获得解释性和精确性较好折衷的模糊模型.Homaifar [78]等人利用遗传算法同时优化模糊模型结构和隶属函数的参数,提高了模型的精确性.Pena-Reyes[79]等人采用栅格法构造初始模糊分类系统,利用协同进化算法同时优化模型的结构和参数,最终获得解释性和精确性较好折衷的模糊分类系统.阎[80]等人对于模糊模型的解释性作了分析,适应度函数考虑模型的精确性和解释性,采用进化策略同时优化模糊模型的结构与参数.刘[81]等人采用协同进化算法对模糊模型的结构的参数同时进行优化,协同进化算法将模糊模型分解编码为两个种群,利用遗传算法和遗传规划分别进化模糊模型结构种群和参数种群,但此文献最后的仿真结果过于简单.上述文献[31-32,78-81]均以维数较低的问题作为仿真算例,而对高维复杂系统没有涉及.对于高维复杂系统,利用遗传算法同时优化模糊模型结构和隶属函数参数的文献尚不多见,Ho[82]等人提出了一种智能遗传算法,将输入变量数与模糊规则数、隶属函数参数等编码为染色体,以模糊模型的精确性指标与解释性的主要因素(如输入变量数、模糊规则数等)为目标函数,构造了具备较高解释性且具有较高精度的模糊分类系统.但该方法对模糊分类系统的所有相关参数均采用二进制编码,使得染色体编码过长,搜索空间过大;同时其语义词与隶属函数之间不是严格的一一对应关系,存在多个隶属函数同属一个语义词的可能.
采用遗传算法同时优化模糊模型结构和参数的方法存在两个难题:(1)根据模糊模型结构和参数的不同特点,模型的结构染色体与参数染色体一般采用不同的编码方式;由于染色体中的结构部分与参数部分编码的不同,提高了遗传算法的计算复杂性;(2)随着建模问题的维数与复杂性的提高,模型结构和参数的同时优化易造成遗传算法中染色体编码长度的增长,降低遗传算法的性能.
目前针对模糊模型的解释性的研究,众多的文献中尚没有形成统一的定义和标准,而根据模糊模型不同的应用领域,人们往往提出不同的建模要求,所以基于解释性和精确性模糊建模方法的研究,尚需要进一步的完善以满足模糊模型不同应用领域的需求.这些方法的研究将使解释性和精确性较好折衷的模糊建模得到更进一步的发展,并在实际应用中发挥更大的作用.
1.3 本文的主要内容和安排
针对上述精确性和解释性模糊建模问题及其主要研究的内容,本文作了较为深入的探讨,通过对典型Benchmark问题进行建模研究,并与国内外相关文献中的结果进行比较,验证方法的有效性.论文的主要内容及其安排如下:
第一章对精确性和解释性模糊建模的目的与意义进行了简要的回顾,综述了精确性和解释性模糊建模研究的主要内容和方向.
第二章介绍了模糊系统的基本结构,以及T-S模糊模型和模糊分类系统,最后从模糊模型结构的解释性和模糊规则的解释性两个方面对模糊系统的解释性进行了直观分析.
第三章分别利用决策树法和模糊聚类算法初始化模糊模型,采用实数编码的遗传算法对初始模糊模型进行优化,在优化过程中利用模糊集合与模糊规则的相似性分析和融合对模糊模型进行约简,获得精确性和解释性较好折衷的模糊模型.
第四章研究了一种基于协同进化算法的模糊模型设计方法.该方法将模糊建模的主要因素,如隶属函数参数、模糊规则的前件和模糊规则数等编码为不同的种群,利用协同进化算法同时优化模糊模型的结构与参数.协同进化算法的适应度函数同时考虑模型的精确性和解释性,采用分量加权求和法将多目标优化转化单目标优化.对于高维复杂问题,通过Simba算法计算每一输入变量的重要性来进行变量的选择.将该方法用于T-S模糊模型与模糊分类系统的建模仿真研究,仿真结果验证了本文方法的有效性.针对模糊模型的结构参数与协同进化算法的参数,定性的分析了它们对模糊建模的影响,为后续的研究奠定了基础.
第五章在第四章模糊建模方法的基础上,研究了一种基于Pareto协同进化算法的多目标模糊建模方法.提出一种基于非支配排序的多种群合作策略,从而避免了第四章协同进化算法中适应度函数加权因子的设定问题,且算法运行一次可以获得一组不同精确性和解释性的模糊模型.
第六章提出一种基于混合协同进化算法的模糊分类系统设计方法.该方法综合了Michigan型遗传算法与Pittsburgh型遗传算法的优点,采用Michigan型算法获得一系列优化的模糊规则,然后利用基于Pittsburgh编码方式的Pareto协同进化算法对模糊分类系统进行优化.该混合协同进化算法具有Michigan型算法的局部优化能力和Pittsburgh型算法的全局寻优能力.
第七章总结了本文所做的主要工作和取得的成果,并对基于解释性和精确性模糊建模的未来研究方向进行了展望,提出了若干需要解决和研究的问题.
【基于解释性和精确性的模糊建模方法研究研究的目的与意义(一)】相关文章:
发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)03-07
论文研究的目的及意义04-01
基于内容的模糊图像检索技术研究03-18
基于网格的聚类方法研究03-13
基于模糊综合评价的企业危机评价及决策研究02-27
基于GIS和神经网络的超市选址方法研究11-22
品牌权益综合模糊测评研究方法探讨03-07
民事诉讼目的的概念及研究意义03-25