- 相关推荐
发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)
摘 要 提出了一种基于两级聚类算法的可解释性模糊建模方法。首先指出模糊模型可解释性的重要地位,分析影响可解释性的主要因素;然后利用减法聚类和加权模糊C均值聚类算法辨识初始模糊模型,紧密/分离性函数确定最优划分和模糊集合的相似性融合约简初始模糊模型,从而提高其可解释性;最后采用约束优化算法整体优化模型,提高其精度。通过对Box-Jenkins火炉数据的模糊建模,验证了该方法的有效性。
关键词 模糊建模,可解释性,减法聚类,加权模糊C均值聚类
Key words fuzzy modeling, interpretability, subtraction clustering, weighted fuzzy c-means algorithm
引言
近些年来,基于规则的模糊建模以其众多优点成为一个活跃研究的领域,并在仿真、分类、数据挖掘、模式识别、预测及控制等方面得到广泛的应用。与神经网络等模型不同,模糊模型的知识表达形式和推理机制符合人的思维习惯,可为人们所理解,成为模糊模型最显著的特征。
在模糊建模中,一般要求所建立的模型既要有较好的拟合精度,又要有较简单的模糊结构。目前,众多聚类算法在模糊逻辑系统的结构辨识中得到了广泛的应用,据此而得到的模糊结构往往以拟合精度作为指标,从而得到的模糊模型含有大量的冗余信息,泛化能力差,不具备可解释性。
为了提高模糊模型的可解释性,诸多学者进行了相关研究.文献[7-11]给出了模糊模型可解释性的一些必要条件。文献[12-18]给出了提高模糊模型可解释性的一些具体方法,包括模糊集合的相似性度量、正交变换和遗传算法的规则约简,全局与局部学习算法等。文献[6]利用模糊聚类辨识含有冗余的模型,然后利用模糊集合相似性度量和相似性奖励遗传算法对模型进行迭代简化,最后利用相似性惩罚遗传算法整体优化模型。文献[19]提出了一种新分级聚类算法,利用最近领域聚类算法和加权模糊C均值聚类算法辨识出较少的模糊规则,但没有考虑模糊集合的相似性融合,同时最近领域聚类算法对于高维系统易产生维数灾难。
本文提出了一种基于两级聚类的可解释性模糊建模方法。首先利用减法聚类算法对输入输出数据进行预处理;然后将一次聚类的聚类中心作为二次FCM聚类的样本,并由紧密/分离性函数(XB)确定最优划分,模糊集合的相似性融合约简所得的初始模糊模型;提高其可解释性;最后采用梯度下降算法整体优化模型。Box-Jenkins火炉数据的模糊建模,验证了该方法的有效性。
预备知识
TS模型
Takagi和Sugeno[22]于1985 年提出了著名的TS模糊模型,是一种被广泛使用的模糊模型,其典型规则形式如下:
(1)
其中Ri表示第i条模糊规则,xj为输入变量,Aij为定义在输入论域中的隶属函数,可以取三角形、高斯型、梯形或者钟型等.本文采用高斯型隶属函数:
(2)
其中分别代表函数的中心和方差.
TS模型的输出为所有规则输出的加权平均:
(3)
其中pi是第i条规则的激励强度:
(4)
对于数据{xk, yk | k=1, …, N},式(3)可以写为线性回归方程:
(5)
其中为规则后件参数矩阵,e为误差矩阵.
TS模糊模型规则前件是模糊变量,而规则后件是输入输出线性函数,它以局部线性化为基础,通过模糊建模实现了全局的非线性,能克服以往模糊模型的高维问题,已经成为一种被广泛使用的模糊模型.
模糊模型的可解释性
模糊模型的可解释性问题在九十年代末期,开始得到部分研究学者的重视[7-21]。2000年4月,在ERUDIT“关于模糊系统与技术的未来”专题学术讨论会上,Babuska R等人建议将模糊建模研究的焦点由精确性转移到可解释性上,标志着模糊模型可解释性研究的重要里程碑[24]。
模糊模型的可解释性是指模型的输入输出接口形式、模型结构形式、数据处理形式等符合人的思维,可以直接或者通过简单分析来表达和洞察系统内部的运行机理,从而获得对系统深入的认识。
一般认为,模糊模型的可解释性,与模型结构、输入变量和模糊规则数目、隶属函数特性等密切相关,现将主要因素陈述如下[7-11]:
1) 输入变量数目:人们很难通过高维模糊模型来分析系统行为,因此模糊模型应该采用尽可能少的输入变量.
2) 模糊规则数目:模型的规则数目越多,其可解释性越低.经验认为,可解释的模糊模型,其规则数目不超过10个,这是由人在理解、推理时的思维能力所决定的.
3) 模糊规则库的完整性、一致性和精简性:模糊规则要完整覆盖输入论域,对每一有效的输入变量组合,至少有一条模糊规则被激励,即完整性。模糊规则之间必须相容而不能有任何两条规则相互矛盾,即一致性。在规则数目尽可能小的前提下,不能包含冗余规则,如某规则的前件是另一规则的子集等,即精简性。
4) 隶属函数的特性:隶属函数必须是凸和正规的,常用的三角函数、高斯函数等都满足这两个要求。隶属函数划分必须是完备的,即对于任何的输入变量,在其论域内的任何值,至少有一个隶属函数相对应,在形式上表现为隶属函数之间存在位置的交叉隶属函数划分必须是可区分的,即对于同一变量,隶属函数之间存在明显的位置区别,以便赋予一定的语义项。
可解释性模糊建模
一次聚类
本文提出了一种基于两级聚类的可解释性模糊建模方法。首先利用减法聚类算法对输入输出数据进行预处理,起到精简样本,滤去样本中重复信息的作用,减少了二次聚类算法中的迭代次数;然后将一次聚类的聚类中心作为二次加权FCM聚类的样本,并由紧密/分离性函数(XB)确定最优划分,模糊集合的相似性融合约简所得的初始模糊模型;提高其可解释性;最后采用梯度下降算法整体优化模型。
减法聚类算法思想为:考虑维空间的个数据点,不失一般性,假定数据点已归一化到一个超立方体中。每个数据点都是聚类中心的候选者,则数据点处的密度指标定义为:
(6)
如果一个数据点有多个邻近的数据点,则该数据点具有高密度值,半径定义了该点的一个邻域,半径以外的数据点对该点的密度指标贡献甚微。在计算每个数据点指标后,选择具有最高密度指标的数据点为第一个聚类中心,令为选中的点,为其密度指标。的密度指标可用下式修正:
(7)
显然,靠近第一个聚类中心的数据点的密度指标将明显减少,从而使这些点不太可能选为下一个聚类中心。修正了每个数据点的密度指标后,选定下一个聚类中心,再次修正数据点的所有密度指标。当新聚类中心对应的密度指标与相比小于某个给定值时
(8)
则聚类过程结束,提取聚类中心聚相应的密度指标。
二次聚类
使用模糊C均值聚类算法进一步处理由一次聚类产生的聚类中心,因为这些聚类中心是由相应的密度指标所决定,所以在最后的模糊分区划分时应考虑到相应样本的密度指标的不同,为解决这个问题,使用加权模糊C均值聚类算法处理由一次聚类产生的聚类中心,相应的加权模糊C均值的目标函数为:
(9)
其中为最终的聚类数,为分区矩阵,是最后的聚类中心矢量,为模糊加权指数,是与初始聚类中心相关的加权量,由下式表示:
(10)
聚类的准则为取的极小值且约束条件为,最后所求的聚类中心和相应的隶属度函数可用下式表示:
(11)
(12)
高斯型隶属函数的方差可以通过计算模糊协方差矩阵来获得:
(13)
(14)
一旦确定了模糊模型前件的参数,即可利用最小二乘法估计模糊模型的后件参数。
加权FCM算法:
Step1:选择聚类数,加权指数,和聚类中心的初始值。
Step2:使用公式(12)计算隶属度函数值。
Step3:利用公式(11)计算更新聚类中心的值。
Step4:如果,则停止,否则转到Step2。
模糊规则数目的确定,即在模糊聚类中确定聚类的数目,是模糊建模的一个首要问题。聚类有效性分析就是寻找最优的聚类数目,文献[30]提出的紧密/分离性函数(XB:Xie-Beni index)利用了隶属函数信息和数据本身的信息,本文使用加权紧密/分离性函数,其最小值对应最优的聚类数目,对模糊指数m的鲁棒性强,融合了数据的几何结构信息:
(15)
模糊集合的相似性融合
经过两级聚类算法和最小二乘估计得到的初始模糊模型,其隶属函数(模糊集合)可能存在冗余,表现为模糊集合间存在过度的交叉或重叠,从而难以赋予相应的语义值,降低了模型的可解释性,因此需要对每个变量的隶属函数进行相似性分析和融合.
模糊模型的隶属函数存在三种类型的冗余:第一种是两个隶属函数相似,这是最常见的模糊集合冗余形式;第二种是隶属函数以较大值覆盖整个论域;第三种是隶属函数接近于单点集合。
第三种的隶属函数冗余,由于其不存在可解释的实际意义,一般在对应的规则前件中直接去除即可。对于第二种的隶属函数冗余,在去除该规则后,建模误差在允许范围内,则为了提高可解释性,可将该规则删除,实现规则约简,否则保留该规则。
第一种冗余,本文采用相似性测度来评判两个隶属函数的相似性。对模糊集合A和B,其相似性测度定义如下[34]:
(8)
其中表示集合的基数,和算子分别表示集合的交和并。
对于离散论域X={xk | k=1, …, N},式(22)表述如下:
(9)
其中和分别为最小最大算子。S为定义在[0,1]间的相似性测度,S=1表示两个集合完全相等,而S=0意味着两个集合没有交叉或重叠.
如果两个模糊集合A和B的相似性测度大于预先设定的阈值,那么集合A和B可以融合为新的集合C.对于不同形式的隶属函数,确定集合C的具体方法不同,但其共同遵循的原则是集合C的支集是集合A与B的并集,集合C的核是集合A与B核的加减聚合.如对于梯形隶属函数A(a1,a2,a3,a4)和B(b1,b2,b3,b4),融合生成的新的模糊集合为C(c1,c2,c3,c4):c1=min(a1,b1),c2=0.5(a2+b2),c3=0.5(a3+b3),c4=max(a4+b4) .
对于本文所采用的高斯型隶属函数,由集合A和B融合生成的新集合C的参数如下:
(10)
阈值的大小直接影响模糊模型的性能,阈值越小,得到的模型的精度越低而可解释性越高,一般阈值取[0.4 – 0.7],具体可根据实际系统的要求选择。
模糊集合融合过程需要反复迭代进行.在每一次迭代过程中,对每一个变量的所有模糊集合进行两两相似性分析,相似性测度大于阈值的两个模糊集合融合为新的集合.迭代反复进行,直到没有任何两个模糊集合的形似性测度大于阈值,然后再将第二类和第三类模糊集合删除,从而完成整个模糊集合的相似性融合过程。
模糊模型的整体优化
初始模糊模型集合相似性融合,提高了模型的可解释性,但同时降低了模型的精确性,因此采用梯度下降优化算法,提高模型的精度,为保持模型的可解释性,对梯度下降优化算法施加搜索空间约束。前件参数的变化范围为,以保证隶属函数的可区分性,后件参数变化范围为,以保证模型的局部可解释性不变。在优化过程中,当模型的参数大于其最大值(或小于其最小值)时,则将该参数强迫限定为其最大值(或最小值).参数变化范围的确定,根据经验,一般取4-15%之间。
【发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)】相关文章:
法学研究生发表论文的方法07-26
论文发表技巧及投稿方法09-01
在期刊上成功发表论文的方法08-15
博士研究生论文发表规定08-08
基于战略治理的企业环境风险研究08-28
基于BP网遥感影像分类研究与应用08-10
工程类论文发表要求及注意事项09-04
基于军网的雷达远程诊断技术研究08-10
基于web的异地并行设计与制造系统研究06-02