
基金項(xiàng)目:遼寧省博士啟動(dòng)基金項(xiàng)目(項(xiàng)目號(hào):20071096)。
摘要:提出了一種利用遺傳算法來優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的倒立擺智能控制, 利用RBF神經(jīng)網(wǎng)絡(luò)與模糊推理過程具有函數(shù)等價(jià)性, 設(shè)計(jì)了基于模糊系統(tǒng)的RBF網(wǎng)絡(luò)結(jié)構(gòu)。同時(shí)采用改進(jìn)的遺傳算法優(yōu)化了神經(jīng)網(wǎng)絡(luò)的參數(shù)和權(quán)值。其中利用一種動(dòng)態(tài)的交叉率和變異率,有效地加快了收斂的速度。最后,利用Matlab軟件對倒立擺進(jìn)行仿真,仿真結(jié)果表明,該控制具有較好的通用性和控制效果。
關(guān)鍵詞:遺傳算法;RBF神經(jīng)網(wǎng)絡(luò);動(dòng)態(tài)的交叉率和變異率;仿真
Abstract: One type of intellectual control of the inverted pendulum which is using genetic algorithm to optimize fuzzy-neural network is presented in this paper. The RBF network structure based on fuzzy system is designed by functional equivalence between RBF neural network and fuzzy reasoning process. Simultaneously, the parameters and weights of neural network are optimized by utilizing the improved genetic algorithm. The speed of convergence is improved efficiently by using dynamic crossover and mutation. Finally, the inverted pendulum is simulated by Matlab. The simulation results show its effectiveness and availability.
Key words: Genetic Algorithm; RBF Neural Network; Dynamic Crossover and Mutation; Simulation
神經(jīng)網(wǎng)絡(luò)是對生物神經(jīng)網(wǎng)絡(luò)系統(tǒng)的模擬,它具有并行計(jì)算、分布式信息存儲(chǔ)、容錯(cuò)能力強(qiáng)以及聯(lián)想記憶功能,同時(shí)還具有較強(qiáng)的自適應(yīng)、自學(xué)習(xí)能力等一系列的優(yōu)點(diǎn),因此神經(jīng)網(wǎng)絡(luò)的研究受到廣大學(xué)者的關(guān)注。另一方面,模糊系統(tǒng)具有能處理不確定性、非線性等問題的能力,其推理方式類似于人類的思維方式。上述兩者具有很好的互補(bǔ)性,其相互結(jié)合構(gòu)成的控制具有很強(qiáng)的自適應(yīng)能力。
遺傳算法(GA)作為一種基于自然遺傳學(xué)機(jī)理的優(yōu)化方法,通過采用隨機(jī)但有向的搜索機(jī)制來尋找全局最優(yōu)解。采用遺傳算法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)結(jié)構(gòu)和參數(shù)的快速、全局尋優(yōu)。模糊系統(tǒng)、神經(jīng)網(wǎng)絡(luò)和遺傳算法被認(rèn)為21世紀(jì)人工智能界最具有發(fā)展前途的三個(gè)重要領(lǐng)域,它們構(gòu)成了所謂的智能計(jì)算或稱軟計(jì)算。
本文設(shè)計(jì)了一種基于改進(jìn)遺傳算法的模糊神經(jīng)網(wǎng)絡(luò)對倒立擺的控制。其網(wǎng)絡(luò)結(jié)構(gòu)是基于徑向基函數(shù)的神經(jīng)網(wǎng)絡(luò),并利用GA對所有的高斯型隸屬函數(shù)和權(quán)值進(jìn)行了優(yōu)化。該控制的優(yōu)點(diǎn)在于結(jié)構(gòu)簡單,實(shí)現(xiàn)了自學(xué)習(xí)、自適應(yīng)控制。
1模糊神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)
RBF神經(jīng)網(wǎng)絡(luò)是在借鑒生物局部調(diào)節(jié)和交疊接受區(qū)域知識(shí)的基礎(chǔ)上提出的一種采用局部接受域來執(zhí)行函數(shù)映射的人工神經(jīng)網(wǎng)絡(luò)。跟傳統(tǒng)的BP網(wǎng)絡(luò)相比,其優(yōu)勢在于學(xué)習(xí)過程收斂速度快,網(wǎng)絡(luò)連接權(quán)值與輸出呈線性關(guān)系,具有唯一最佳逼近的特性,并且不存在陷入局部最優(yōu)的問題。更為重要的是,采用RBF設(shè)計(jì)模糊神經(jīng)網(wǎng)絡(luò)的最大優(yōu)勢在于RBF網(wǎng)絡(luò)與模糊推理過程具有函數(shù)等價(jià)性,這個(gè)等價(jià)性將兩種不同構(gòu)造的系統(tǒng)在函數(shù)上統(tǒng)一起來,使網(wǎng)絡(luò)的參數(shù)和運(yùn)算有了明確的物理意義。文中設(shè)計(jì)了一種基于模糊神經(jīng)網(wǎng)絡(luò)的RBF網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 RBF網(wǎng)絡(luò)結(jié)構(gòu)
其中,RBF神經(jīng)網(wǎng)絡(luò)是一個(gè)三層前向輸出網(wǎng)絡(luò),輸入層與隱層直接連接。輸入層的輸入變量為系統(tǒng)的狀態(tài)反饋量,其中


其中m是隱含層節(jié)點(diǎn)個(gè)數(shù);C 為第i個(gè)基函數(shù)的中心向量,其元素個(gè)數(shù)與X相同, 是一個(gè)數(shù)量值,它決定了該基函數(shù)圍繞中心的寬度。 是向量 的歐氏范數(shù),它表示X和C 之間的距離,采用2-范數(shù)進(jìn)行計(jì)算。g (X)在C 處有唯一的最大值,隨著 的增大,g (X)迅速衰減到零,對于給定的輸入X,只有一小部分靠近X的中心被激活。
每個(gè)模糊規(guī)則的控制強(qiáng)度則由隱層和輸出層的權(quán)值給出。RBF結(jié)構(gòu)用模糊控制規(guī)則可表示為:
IF

其中,W 是對應(yīng)于第m個(gè)輸出變量的第i個(gè)控制規(guī)則的權(quán)值。
輸出層則是控制對象的控制信號(hào)( Y ……Y )。從隱層到輸出層是線性映射,對于第m個(gè)輸出變量Y ,可按以下公式計(jì)算:

根據(jù)上述三式,很容易看出,每個(gè)RBF網(wǎng)絡(luò)的隱元按照一個(gè)徑向?qū)ΨQ函數(shù)計(jì)算其輸出,輸入離隱元的中心越近,獲得的輸出也越大。
2基于改進(jìn)遺傳算法的設(shè)計(jì)
2.1遺傳算法簡介
遺傳算法是由Holland教授提出的模擬生物在自然環(huán)境中的遺傳和進(jìn)化過程而形成的一種自適應(yīng)全局優(yōu)化概率搜索算法,是一種宏觀意義下的仿生算法。其對于多變量、目標(biāo)函數(shù)不可微或不確定問題解的尋優(yōu),比傳統(tǒng)的優(yōu)化方法有著更廣泛的適應(yīng)性。由于遺傳算法在搜索時(shí)不依賴于梯度信息,這就使得它可以高效率地發(fā)現(xiàn)全局最優(yōu)解或接近最優(yōu)解,因此非常適合于對模糊控制隸屬函數(shù)的調(diào)節(jié)和神經(jīng)網(wǎng)絡(luò)權(quán)值的優(yōu)化。
GA的基本操作算子有三個(gè):選擇(selection)、交叉(crossover)和變異(mutation)。選擇即從當(dāng)前群體中選擇適應(yīng)值高的個(gè)體以生成交配池(mating pool)的過程。通常采用的方法有輪盤賭法、聯(lián)賽選擇、排序選擇。交叉是把兩個(gè)父代個(gè)體的部分結(jié)構(gòu)加以替換重組而生成新個(gè)體的操作。一般有一點(diǎn)交叉、兩點(diǎn)交叉和多點(diǎn)交叉這三種。變異是模擬自然界生物體進(jìn)化中染色體上某位基因發(fā)生的突變現(xiàn)象,從而改變?nèi)旧w的結(jié)構(gòu)和物理性狀。
2.2利用遺傳算法對倒立擺控制尋優(yōu)的主要步驟
2.2.1倒立擺參數(shù)的編碼策略
仿真的控制對象為一級倒立擺模型,設(shè)計(jì)一個(gè)兩輸入,單輸出的控制系統(tǒng)。輸入變量為小車的位置誤差跟小車擺角的誤差,輸出為小車的控制力。高斯型隸屬函數(shù)輸入變量分為7個(gè)模糊子集,而每一個(gè)高斯隸屬函數(shù)的輸入都有中心和寬度兩個(gè)參數(shù),因此總共有2×2×7=28個(gè)參數(shù)。模糊控制規(guī)則數(shù)為49,取隱層神經(jīng)元個(gè)數(shù)等于模糊控制規(guī)則個(gè)數(shù),則相應(yīng)有49個(gè)隱層神經(jīng)元個(gè)數(shù),即需49個(gè)權(quán)值W 用來連接隱層單元到輸出節(jié)點(diǎn),假設(shè)為

2.2.2遺傳算法的參數(shù)尋優(yōu)過程
在尋優(yōu)過程的開始,初始種群包含了分布于整個(gè)搜索空間的一些染色體。在仿真中,隨機(jī)產(chǎn)生60個(gè)染色體作為初始種群。在每一個(gè)染色體被評估和分配了適應(yīng)值之后,當(dāng)前的種群開始進(jìn)行選擇,來產(chǎn)生下一代種群。采用輪盤賭法來決定新種群的個(gè)數(shù)。在新種群建立之后,交配池形成,而后進(jìn)行交叉、變異。每產(chǎn)生一代種群,評估、選擇、交叉、變異都要被進(jìn)行,直到最終條件被滿足。
采用二點(diǎn)交叉法進(jìn)行交叉,而且不同于一些論文中采用的自適應(yīng)交叉率和變異率,而是采用了一種動(dòng)態(tài)的交叉率和變異率,如圖2所示。并且,還利用最優(yōu)保留策略進(jìn)行選擇操作,即讓具有最好適應(yīng)值的前3個(gè)染色體直接復(fù)制到下一代。采用上述的方法作用可以使種群更快的收斂。對于適應(yīng)度函數(shù)的選擇,按照下式進(jìn)行:

其中,f為適應(yīng)度,F為目標(biāo)函數(shù),g是影響性能曲線的一個(gè)常量,A是一非負(fù)常量,它須較合理的選擇,以免f太小。其中,N為當(dāng)前迭代數(shù),M為最大迭代數(shù)。

圖2 動(dòng)態(tài)的交叉率和變異率
3仿真
倒立擺作為一個(gè)實(shí)驗(yàn)裝置,是一個(gè)高階次、不穩(wěn)定、多變量、非線性的系統(tǒng),具有形象直觀、結(jié)構(gòu)簡單、構(gòu)件組成參數(shù)和形狀易于改變等特點(diǎn)。對倒立擺的研究可歸結(jié)為對非線性、多變量、絕對不穩(wěn)定系統(tǒng)的研究,它在控制過程中能有效地反映控制中的許多關(guān)鍵問題,如非線性問題、系統(tǒng)的魯棒性問題、隨動(dòng)問題、鎮(zhèn)定問題及跟蹤問題等。因此對倒置系統(tǒng)的研究具有深遠(yuǎn)的意義。
倒立擺系統(tǒng)的小車可自由地向左或向右運(yùn)動(dòng),同時(shí)擺可在垂直平面內(nèi)自由運(yùn)動(dòng)。該系統(tǒng)的動(dòng)力學(xué)方程為:

在仿真時(shí),重力加速度





控制力u在[-6,+6]上連續(xù)取值,然后控制小車在盡量短的時(shí)間內(nèi)回到中心,并且擺角為垂直。其仿真如圖4和圖5所示,控制效果令人滿意。


圖3 小車的速度和位移示意圖

圖4 小車的控制力示意圖
4 結(jié)論
利用RBF神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)和逼近任意函數(shù)的能力以及其等價(jià)于模糊推理的特性,設(shè)計(jì)了基于遺傳的模糊神經(jīng)網(wǎng)絡(luò)對倒立擺控制,并采用具有動(dòng)態(tài)交叉率和變異率的遺傳算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù)和權(quán)值。仿真結(jié)果表明,基于動(dòng)態(tài)遺傳算法的模糊神經(jīng)網(wǎng)絡(luò)有一定的通用性和較好的控制效果。
參考文獻(xiàn)
[1] Siddique M. N. H, Tokhi M. O. GA-based neuro-fuzzy logic controller for flexible-link manipulator[J]. IEEE, 2002,(9).
[2] Ovidiu Popvoci Vlad, Toshio Fukuda. Neuro-fuzzy motion controller design using improved simple genetic algorithm[J]. IEEE, 2003, (7).
[3] 王學(xué)雷,邵惠鶴,李亞芬.一種徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)在線訓(xùn)練算法及其在非線性控制中的應(yīng)用[J].信息與控制,2001,(6): 249-253.
[4] 張智星,孫春在,水谷英二[日].神經(jīng)-模糊和軟計(jì)算[M].西安:西安交通大學(xué)出版社,2002.
[5] 叢爽.徑向基函數(shù)網(wǎng)絡(luò)的功能分析與應(yīng)用的研究[J].計(jì)算機(jī)工程與應(yīng)用,2002,(3):85-87.
[6] 楊國軍,崔平遠(yuǎn),李琳琳.遺傳算法在神經(jīng)網(wǎng)絡(luò)控制中的應(yīng)用與實(shí)現(xiàn)[J].系統(tǒng)仿真學(xué)報(bào),2001,(9): 567-570.
[7] 李國勇.智能控制及其MATLAB實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.
[8] 韓敏,孫燕楠,許士國.一種模糊邏輯推理神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及算法設(shè)計(jì)[J].控制與決策, 2006(21):415-416.
其他作者:
王艷秋(1955-),女,教授,遼寧工業(yè)大學(xué)信息科學(xué)與工程學(xué)院院長,博士,碩士研究生導(dǎo)師,研究方向:近代交流調(diào)速系統(tǒng);智能控制。