{战略管理}足球机器人之策略及路径设计

上传人:精****库 文档编号:141301503 上传时间:2020-08-06 格式:PPTX 页数:50 大小:1.68MB
返回 下载 相关 举报
{战略管理}足球机器人之策略及路径设计_第1页
第1页 / 共50页
{战略管理}足球机器人之策略及路径设计_第2页
第2页 / 共50页
{战略管理}足球机器人之策略及路径设计_第3页
第3页 / 共50页
{战略管理}足球机器人之策略及路径设计_第4页
第4页 / 共50页
{战略管理}足球机器人之策略及路径设计_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《{战略管理}足球机器人之策略及路径设计》由会员分享,可在线阅读,更多相关《{战略管理}足球机器人之策略及路径设计(50页珍藏版)》请在金锄头文库上搜索。

1、足球機器人之策略及路徑設計,研究生:王國揚 指導教授:邱俊賢博士,Proceedings of 2006 CACS Automatic Control Conference St. Johns University, Tamsui, Taiwan, Nov. 10-11, 2006,Robotic Interaction Learning Lab,1,大綱,摘要 前言 研究動機與目的 文獻探討 足球機器人之策略設計 廣義預測控制應用 結論及未來發展 參考文獻,Robotic Interaction Learning Lab,2,摘要,本文主要探討足球機器人策略以及路徑設計與研究。提出使用模糊控

2、制的方法快速分配每個機器人角色及職責的方法。 其中,模糊控制器是根據我方機器人到達目標的距離及角度決定每一支機器人的角色及任務。在策略方面我們將提出射門模式以及避障模式來幫助我方機器人得分。 在路徑規劃上,提出一套以支援向量機為理論修正我方機器人路徑,並且使用同樣的方法修正我方機器人到達目標的最佳速度。 最後加入廣義預測控制來幫助我方機器人預估目標下一次的位置或動作來幫助整個策略更加完善。,Robotic Interaction Learning Lab,3,前言,在生產製造業裡,單一機器人可以取代人力是無庸置疑,但是在複雜的工作環境下,多重式機器人合作工作方式會比單一機器人來操控所有的工作來

3、的有效率但也較為複雜,例如在系統架構中如何決定角色分配,當系統不理想時如何調整角色分配。 多重式機器人系統近年來為許多科學家所深入討論以及研究,足球機器人就是多重式機器人的一種,所涉及領域包含控制理論、影像處理、人工智慧、感測訊號等。,Robotic Interaction Learning Lab,4,研究動機與目的,機器人足球賽的構想起源於加拿大哥倫比亞大學Alan Mackworth教授發表的一篇”On Seeing Robots”1的論文,之後受到學者熱烈的迴響,認為足球機器人比賽跨多種學術領域整合了機器人學、通訊與電腦技術、決策與對策,模糊神經網路、人工智慧控制等。 它最終目標在公元

4、2050年的世界盃足賽,發展出能贏人類足球員的人型足球機器人。,Robotic Interaction Learning Lab,5,文獻探討1,黃玉翰,機器人足球賽兩階段控制策略之設計與研究,國立成功大學電機工程學系碩士論文,2005。,Robotic Interaction Learning Lab,6,文獻探討2,陳建成,以適應性 Q-Learning 為基礎發展足球機器人合作策略,國立中正大學電機工程研究所碩士論文,2002。,Robotic Interaction Learning Lab,7,文獻探討3,陳柏堯,機器人足球員之硬體製作、路徑規畫與競爭策略,國立雲林科技大學電機工程學

5、系碩士論文,2000。,Robotic Interaction Learning Lab,8,足球機器人之策略設計,支援向量機說明 支援向量機修正機器人角度 支援向量機修正機器人速度 角色分配 射門角度 避障模式,Robotic Interaction Learning Lab,9,支援向量機說明,支援向量機(Support Vector Machine,簡稱SVM)由貝爾實驗室Vapnik博士於1990年依統計學習理論為基礎,而發展出來的機器學習系統。其基本思維為建構樣本堅或特徵空間中的最優超平面,使得超平面與不同類別的樣本集之間的距離為最大。支援向量機是一個有效訓練的機器學習系統。首先,我

6、們將討論支援向量分類。,Robotic Interaction Learning Lab,10,支援向量分類,支援向量機的目的主要是設計一個容易計算的機器學習方法,在高維度的特徵空間裡面找到分類超平面並找出其最佳歸納的方式,同時,它具備處理大約十萬個訓練樣本的能力。這個歸納的方法主要是清楚地引導如何提升控制能力以及防止在所控制的超平面中超越最大極限,最佳化的方法就是利用數學技巧去尋找SVM的最佳超平面,不同的歸納法將會有不同的限制,就像以下這種演算法:就是極限最大化,極限所分類的就是支援向量的個數,接下來我們將介紹最大極限分類的方法。,Robotic Interaction Learning

7、Lab,11,最大極限分類,最大極限方類法主要是在最大分類超平面上分離資料,並且判定範圍並不能依靠維度空間,這個分離的方法將會在核函數歸納找到其特徵空間,支援向量機所使用的第一個策略就是最大極限分類法,那就是在核函數歸納的特徵空間中找到其最大極限超平面。這個策略將會減少系統的凸面問題,使在線性不等式的約束情況中的二次函數縮減到最小。,Robotic Interaction Learning Lab,12,支援向量機修正機器人角度 1/9,在足球機器人中,路徑選擇扮演相當重要的角色。我們希望機器人能在最短時間內到達目標點,因此我們設計一套以支援向量機為基礎的最佳路徑設計,以確保能在最短時間及最佳

8、路徑到達目標。支援向量機的方法是從線性可分情況下的最優分類超平面發展而來,所謂的最優分類面就是要求分類面不但能將兩類樣本正確分開,而且使分類間隔為最大。如圖1所示:,Robotic Interaction Learning Lab,13,支援向量機修正機器人角度 2/9,圖1:支援向量機示意圖,Robotic Interaction Learning Lab,14,支援向量機修正機器人角度 3/9,Step 1.由圖2我們可以計算出機器人與必需航向目 標的角度:,圖1:機器人到達目標的距離與機器人轉向目標的夾角示意圖,Robotic Interaction Learning Lab,15,支援

9、向量機修正機器人角度 4/9,Step 2. 假設訓練數據為: Step 3.為了找出分割超平面,需求解下面的二次 規劃問題,其中約束條件為:,Robotic Interaction Learning Lab,16,支援向量機修正機器人角度 5/9,並求解下列函數的最小值: Step 4.由於上式為二次方程式,而限制式為線性方 程式,此形式屬於典型的二次規劃問題,因 此使用日格朗乘子解決這個具有線性約束的 二次規劃問題,可得:,Robotic Interaction Learning Lab,17,支援向量機修正機器人角度 6/9,Step 5.但是如此的模式在使用支援向量機時,仍不 易求出最

10、佳解,解決的方法是找出其對偶問 題: Step 6.代入之後可以求得新的為:,Robotic Interaction Learning Lab,18,支援向量機修正機器人角度 7/9,Step 7.在求對偶問題的最佳解時,每一個日格朗係 數都會對應到每一筆訓練資料;如果代表該 資料是此問題的支援向量,會落在區分平面 的邊界上。最後可得到最終的分類函數:,Robotic Interaction Learning Lab,19,支援向量機修正機器人角度 8/9,圖4:使用支援向量機時機器人到達目標路徑,圖3:未使用支援向量機時機器人到達目標路徑,Robotic Interaction Learni

11、ng Lab,20,支援向量機修正機器人角度 9/9,圖6:使用支援向量機時機器人到達目標路徑,圖5:未使用支援向量機時機器人到達目標路徑,Robotic Interaction Learning Lab,21,支援向量機修正機器人速度 1/6,首先,我們將設計一個模糊控制器去設計足球機器人左右輪的速度,並且使用支援向量機來改善模糊控制器,使模糊控制器的輸出是最佳值。我們將使用與前面相同的數學結構支援向量機來幫助我們找尋到最佳的機器人速度。,Robotic Interaction Learning Lab,22,支援向量機修正機器人速度 2/6,首先,我們可以設計一個任意的模糊控制器。並且任意

12、定義規則庫。,圖7:距離歸屬函數,圖8:角度歸屬函數,Robotic Interaction Learning Lab,23,支援向量機修正機器人速度 3/6,輸出經由模糊規則庫解模糊化計算出左右輪個別轉速,此規則庫具有49條規則,如表1所示。接著將使用重心解模糊化法來計算機器人左右輪個別轉速。,表1:模糊規則庫,Robotic Interaction Learning Lab,24,支援向量機修正機器人速度 4/6,接著我們定義一個簡單的運動方程式來幫助支援向量機的分類及訓練:,Robotic Interaction Learning Lab,25,支援向量機修正機器人速度 5/6,定義狀態

13、變數為: 我們可以得到狀態方程式: 最後可得到:,Robotic Interaction Learning Lab,26,支援向量機修正機器人速度 6/6,圖9:使用SVM得到的速度,圖10:使用一般FLC得到的速度,Robotic Interaction Learning Lab,27,修正角度及速度結果,Robotic Interaction Learning Lab,28,角色分配 1/3,在足球機器人比賽當中,任務分配扮演相當重要的角色。五個足球機器人中,指派一機器人為守門員,另一機器人為防守員,其餘三個機器人當為攻擊角色。但是當三個機器人同時追球時,反而不會產生好的效果,所以我們希望

14、只利用一機器人當主攻擊者角色,其它兩個機器人當作助攻者角色。因此我們三個攻擊機器人的任務不是固定的,而是隨著球在場地上不同的情形,主、助攻的角色將會隨時轉換。,Robotic Interaction Learning Lab,29,角色分配 2/3,我們可以把模糊規則定義如下:,輸出w代表經由模糊運算得到的權重值,Robotic Interaction Learning Lab,30,角色分配 3/3,在一般區域裡,我們再比較三個機器人的值,就可以把最小值的機器人定義為主要追逐球的角色,其餘的兩個機器人則扮演幫助的角色。 在防守區域裡,除了守門員及防守者之外,其餘我方的機器人也必須扮演攔截球以

15、及妨礙對方機器人射門的動作,也藉由判斷三個機器人的值來決定最小值的我方機器人作攔截球的動作其餘兩個機器人則扮演妨礙對方機器人射門的任務。,Robotic Interaction Learning Lab,31,射門角度 1/3,當我方機器人把球帶到敵方球門區域時,為了增加得分的機會,在射門時不希望我方機器人只是盲目的攻擊,所以我們增加一個射門角度的判斷來幫助得分的能力。如圖11所示:,Robotic Interaction Learning Lab,32,射門角度 2/3,圖11:射門角度示意圖,首先我們可以知道,,而且可以知道,Robotic Interaction Learning Lab

16、,33,射門角度 3/3,圖12:到達攻擊點射門角度示意圖,Robotic Interaction Learning Lab,34,射門角度結果,Robotic Interaction Learning Lab,35,避障模式 1/4,當我方機器人在場上執行追球的動作時,如果有敵方機器人位於我方路徑上,那麼我方機器人將無法準確到達目標而會產生碰撞,所以我們必須設計一避障規劃,已使機器人在到達目標的過程中不會有所阻礙如圖13所示:,Robotic Interaction Learning Lab,36,避障模式 2/4,圖13:避障示意圖,Robotic Interaction Learning Lab,37,避障模式 3/4,1. 我們可以得知,2. 給定,線段長度為,:,可求得:,Robotic Interaction Learning Lab,38,避障模式 4/4,3. 給定,以及,線段長度為,:,我們就可以得到,Robotic Interaction Learning Lab,39,避障結果,Robotic Interaction Learning L

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号