學(xué)習(xí)控制系統(tǒng)是智能控制Z早的研究領(lǐng)域之一。在過去十多年中,學(xué)習(xí)控制用于動態(tài) 系統(tǒng)(如機(jī)器人操作控制和飛行器制導(dǎo)等)的研究,已成為日益重要的研究課題。已經(jīng)研究 并提出許多學(xué)習(xí)控制方案和方法,并獲得更好的控制效果。這些控制方案包括:
1)基于模式識別的學(xué)習(xí)控制;
2)反復(fù)學(xué)習(xí)控制;
3)重復(fù)學(xué)習(xí)控制;
4)連接主義學(xué)習(xí)控制,包括再勵(強化)學(xué)習(xí)控制;
5)基于規(guī)則的學(xué)習(xí)控制,包括模糊學(xué)習(xí)控制;
6)擬人自學(xué)習(xí)控制;
7)狀態(tài)學(xué)習(xí)控制。
學(xué)習(xí)控制具有4個主要功能:搜索、識別、記憶和推理。在學(xué)習(xí)控制系統(tǒng)的研制初 期,對搜索和識別的研究較多,而對記憶和推理的研究比較薄弱。學(xué)習(xí)控制系統(tǒng)分為兩 類,即在線學(xué)習(xí)控制系統(tǒng)和離線學(xué)習(xí)控制系統(tǒng),分別如圖5-24a 和圖5-24b 所示。圖中, R 代表參考輸入;Y 為輸出響應(yīng);u 為控制作用;s 為轉(zhuǎn)換開關(guān)。當(dāng)開關(guān)接通時,該系統(tǒng) 處于離線學(xué)習(xí)狀態(tài)。
離線學(xué)習(xí)控制系統(tǒng)應(yīng)用比較廣泛,而在線學(xué)習(xí)控制系統(tǒng)則主要用于比較復(fù)雜的隨機(jī)環(huán) 境。在線學(xué)習(xí)控制系統(tǒng)需要高速和大容量計算機(jī),而且處理信號需要花費較長時間。在許 多情況下,這兩種方法互相結(jié)合。先,無論什么時候只要可能,先驗經(jīng)驗總是通過離線 方法獲取,然后再在運行中進(jìn)行在線學(xué)習(xí)控制。
模糊控制提供一種實現(xiàn)基于知識(基于規(guī)則)的甚至語言描述的控制規(guī)律的新機(jī)理,由模糊化接口、知識庫、 推理機(jī)和模糊判決接口4個基本單元組成
一個典型的和廣泛應(yīng)用的基于知識的控制系統(tǒng)包含知識庫、推理機(jī)、控制規(guī)則集和/或控制算法等;推理機(jī)用于記憶所采用的規(guī)則和控制策略,根據(jù)知識進(jìn)行推理,搜索并導(dǎo)出結(jié)論
遞階智能控制是按照精度隨智能降低而提高的原理(IPDI) 分級分布的,由三個基本控制級構(gòu)成的,系統(tǒng)的輸出是通過一組施于驅(qū)動器的具體指令來實現(xiàn)的
雷伯特-克雷格位置/力混合控制器為R-C 控制器,P(q) 為機(jī)械手運動學(xué)方程;T 為力變換矩陣; 操作空間力和位置混合控制系統(tǒng),末端工具的動態(tài)性能將直接影響操作質(zhì)量
每個關(guān)節(jié)所需要的力或力矩 T, 是由五個部分組成的,第一項表示所有關(guān)節(jié)慣量的作用,各個 關(guān)節(jié)的慣量被集中在一起,存在有關(guān)節(jié)間耦合慣量的作用,第三項和第四項分別表示向心力和哥氏力的作用
有個光學(xué)編碼器,以便與測速發(fā)電機(jī)一起組成位置和速度反饋,是一種定位裝置,它的每個關(guān)節(jié)都有一個位置控制系統(tǒng);對機(jī)器人的關(guān)節(jié)坐標(biāo)點逐點進(jìn)行定位控制
機(jī)器人位置控制有時也稱位姿控制或軌跡控制,主要有兩種機(jī)器人的位置控制結(jié)構(gòu)形式,即關(guān)節(jié)空間控制結(jié)構(gòu)和直角坐標(biāo)空間控制結(jié)構(gòu);機(jī)器人的伺服控制結(jié)構(gòu)有集中控制、分散控制和遞階控制等
液壓傳動機(jī)器人具有結(jié)構(gòu)簡單、機(jī)械強度高和速度快等優(yōu)點;一般采用液壓伺服控制閥和模擬分解器實現(xiàn)控制和反饋,省去中間動力減速器,從而消除了齒隙和磨損問題
機(jī)器人控制器具有多種結(jié)構(gòu)形式,包括非伺服控制、伺服控制、位置和速度反饋控制、力(力矩)控制、基于傳感器的控制、非線性控制、分解加速度控制、滑?刂、最優(yōu) 控制、自適應(yīng)控制、遞階控制以及各種智能控制等
電機(jī)與減速器是構(gòu)成機(jī)器人關(guān)節(jié)驅(qū)動系統(tǒng)的核心機(jī)電組件;傳感器與感知模組用于實時獲取機(jī)器人自身狀態(tài)及與環(huán)境交互信息的感知單元;機(jī)器人大腦系統(tǒng)負(fù)責(zé)感知和規(guī)劃決策
頻譜圖法將語音信號的頻譜沿著時間軸加以展開,識別精度一般;LPC法是對語音信號抽取LPC系數(shù);隱藏式馬可夫模式用于非特定人的語音識別,建立語音的狀態(tài)轉(zhuǎn)移模式
機(jī)器人通過攝像頭這些外設(shè)獲得圖像之后,利用某種算法來進(jìn)行圖像之間的變換,對圖像進(jìn)行各種操作以達(dá)到所需要實現(xiàn)的功能;點運算改善圖像的顯示效果