• 沒有找到結果。

1

1.1 研究動機與目的

所謂的串結式機器人(chain-type robot),係由多個單節履帶機器人串結而 成。相較於單節機器人,串結式機器人可以藉由單節間的推、拉,以及抬舉關節、

旋轉關節等較單節機器人多的自由度,克服更複雜的地形,因此可用於救援、搜 索、監控等領域。

本論文的研究目的為設計串結式機器人的控制策略,以加速度計資訊、馬達 回傳資料等感測資訊,偵測機器人的姿態,及其與環境的互動狀況,讓機器人可 以由這些輸入資訊,自主決定相對應的動作,以克服台階、斜坡上的台階、階梯 以及崎嶇地形。

同時,由於在複雜地形上,距離感測器或接觸感測器容易在機器人與環境的 碰撞時損壞,因此設計控制策略的另一重點即為,如何在缺乏距離感測器或接觸 感測器的情況下,讓機器人仍得以順利克服地形。最後,將於實際搭建的台階、

斜坡上的台階、階梯以及崎嶇地形中,展示與驗證本論文所提出策略的可行性。

1.2 研究背景與發展現況

串結式機器人(chain-type robot)屬仿蛇機器人(snake-inspired robot[1])的其中 一類。自然界中的蛇由於具有良好的攀爬或跨越障礙物能力、穩定的姿態(由於 跟地面具有多點接觸)、多自由度(即使其中一個關節失去效用,依然可以運動) 等優點,因此啟發了很多模仿蛇的機器人研究。仿蛇機器人依其機構設計,主要 可分為三大類:(1)具有被動輪的機器人[2-4]、(2)具有主動輪的機器人[5-7]、(3) 具有主動式履帶的機器人[8-12]。

其中(3)具有主動式履帶的機器人,由於履帶可以提供給機器人相對平坦的 接觸面,同時履帶又具有主動驅動力,因此可適應極端崎嶇複雜的地形。基於此 優點,本論文所使用的串結式機器人,即採用此種機構設計。

雖然串結式機器人具備先天機構上的優越克服地形能力,但多節機構使得機 器人與環境的互動複雜,造成了控制的困難性。針對此控制困難性,過去的研究 者大致提出以下方法。

Wang et al.[13]建構了分散式的串結機器人機構,各個單節的履帶機器人可 以獨立運作,也可以經由電腦操控,組合而成三節的機器人。這篇論文利用紅外 線測距儀、GPS、陀螺儀、影像處理模組等感測器,讓機器人可以偵測環境的狀 態以及自身的姿態。這篇論文僅簡單描述了克服台階地形、從傾倒狀態回復的運 動步驟,但對於如何根據感測資訊,進行進一步的姿態調整,甚至於策略的適應 性,都沒有深入討論。

GAO et al.[14]利用力感測器的回授,機器人得以自主調整姿態,執行跨越高 突的障礙物、攀爬階梯與鑽過牆上的洞等任務。Hutchison et al.[10]利用基因演算

陳俊傑[15]利用擾動觀測器,僅需過馬達的速度與電流,就能估測外界地形 施於機器人的干擾扭矩,設計 admittance 控制器,完全不需外加任何感測器,即 能調整關節馬達轉速,克服步階、斜坡,與複雜地形。這給了本論文利用馬達資 訊偵測機器人與環境互動關係的靈感,但與[15]不同的是,本論文又賦予了串結 式機器人自主學習的能力,機器人透過在運動過程中的試誤學習,得以更穩健、

更有效率地的克服地形。

1.3 問題描述

1、如何利用單節之間的合作協調克服地形

當遭遇到複雜地形時,往往需要將機器人從單節擴充為多節,以增進克服地 形能力。此時,機器人該如何透過單節之間的合作協調,成功地克服複雜地形?

2、如何透過學習,增進機器人克服地形的效率

面對複雜地形,機器人與外界環境的互動模型往往複雜難解,設計者預先藉 由經驗法則設計好的策略,不見得是最能適應環境的策略,此時機器人該如何在 運動過程中,自主調整控制策略,增進克服地形的效率?

1.4 研究方法

1、如何利用單節之間的合作協調克服地形

針對此問題,本論文提出了分散式行為模式多單元控制(distributed multi-unit behavior-based control),藉由 master 角色與 slave 角色的合作:master 執行攀爬 豎板(riser climbing)與登上踏板(tread landing)行為,slave 遵從 master 的命令,達 到運動的協調合作,以克服複雜地形。同時模組化的架構,使得未來可輕易地增 添新的決策角色或軟體模組,具有良好的擴充性。

2、如何透過學習,增進機器人克服地形的效率

本論文引入螞蟻演算法(ant colony optimization,ACO[20]),進行強化式學習 (reinforcement learning[16])。所謂的強化式學習,係透過嘗試動作,並經由外界 環境對於該動作的反饋,判斷這個動作是否恰當,不斷修正策略,更穩健地、更 有效率地克服地形。而螞蟻演算法則將候選動作的機率分布以費洛蒙(pheromone) 濃度表示,執行完動作後,利用環境的反饋更新費洛蒙,亦即更新候選動作的機 率分布,經由反覆迭代運算後,可漸漸逼近最能適應環境的機率分布。螞蟻演算 法在資料開採(data mining)、網路連線建立(networking)、計算機網路的工作排 程、感測器的自我組織(self-organization of sensors),甚至於機器人的避障學習 等,都能發揮良好的效果,但未曾應用於串結式機器人的適應地形控制。因此本 論文將螞蟻演算法,於串結式機器人進行嶄新的應用。機器人藉由偵測馬達扭矩 判斷是否困住,以此作為學習的反饋訊號,透過試誤學習,漸漸習得最能適應環 境的策略。並提出序列訓練(sequential training),以預先定義好的行為序列,取代

1.5 論文架構

本論文共分為五章,第一章旨在簡述研究動機、目的、背景與發展,並陳述 所要研究的問題、方法。第二章介紹機器人平台,並說明整體系統架構,包含使 用的控制核心、周邊電路與感測資訊。第三章描述串結式多單元分散式控制,包 含各單元的運動控制、單元間的溝通與協調。第四章描述螞蟻演算法學習,及提 出改善學習的方法。第五章為實驗結果,讓兩節機器人在台階、斜坡上的台階,

及階梯地形上,驗證比較原始螞蟻演算法,與加入自行提出的改善學習方法,對 於克服地形效率的影響,最後將機器人擴充成三節,驗證分散式架構的擴充性,

並克服階梯與崎嶇地形所組成的複雜地形。第六章對本論文做一個結論,並提出 未來可以再發展之方向。

相關文件