代理人和环境

上传人:博****1 文档编号:569258723 上传时间:2024-07-28 格式:PPT 页数:38 大小:384KB
返回 下载 相关 举报
代理人和环境_第1页
第1页 / 共38页
代理人和环境_第2页
第2页 / 共38页
代理人和环境_第3页
第3页 / 共38页
代理人和环境_第4页
第4页 / 共38页
代理人和环境_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《代理人和环境》由会员分享,可在线阅读,更多相关《代理人和环境(38页珍藏版)》请在金锄头文库上搜索。

1、大綱代理人和環境理性PEAS(Performance measure, Environment, Acturators, Sensors)環境類別代理人類別1代理人定義:任何的東西,可以經由感應器感受到環境,經由行動器來對環境做出反應。人類代理人:眼睛,耳朵,(其他的器官,可以來作為感應的。)手,腳(其他的器官,可以來作為行動器官的。)機器代理人:攝影機,溫度計,(可以來作為感應的。 )機器手臂,輪子(可以來作為行動器官的。 )2理性代理人3代理人的架構代理人的功能和程式:1.代理人是以代理人功能(agent function)為其特徵的,此function將感知轉換為行動2.一個代理人的功能

2、是理性的(rational)3.目標:找出一個方法來將理性代理人的功能正確的實作出來4代理人和環境代理人函數將感知到的歷史對應到行動。 F:P*A代理人程式執行在實際的設備中以產生F帶5查表代理人缺點:1.巨大的表格2.建表所要花的時間需要很大3.沒有自動化4.甚至若是需要學習,也要花很多時間來看表格6智慧代理人的結構代理人=硬體結構+程式代理人程式:將函數:感知行動實做出來.硬體結構:一個設備能夠執行代理人程式的7代理人型態基本的型態:1.簡單反射的代理人2.模型基礎的反射代理人3.目標基礎的代理人4.效能基礎的代理人5.學習代理人8反射代理人反射代理人:沒有記憶動作:根據目前的狀態來決定要

3、採取的行動.9反射代理人10反射代理人11反射代理人例如:1.吸塵器2.自動駕駛計程車問題:人類的所作的動作是基於學習後的反應或是自然的反射動作?12反射代理人反射代理人的動作雖然很簡單.但是彼此間的互相的反應會造成複雜的模型.好處:快速.健全挑戰:夠複雜?智慧?13反射代理人問題:將自動吸塵器的位置感應器移除後.會發生什麼?(在不同的環境中)14模型基礎的反射代理人紀錄一些內部狀態(已過已經發生的.或之前所採取的行動)需要紀錄兩種的知識在代理人的實作方法:1.在這世界中發生的事.和代理人是有間接相關的2.代理人所採取的行動會對世界造成怎樣的影響.15模型基礎的反射代理人16模型基礎的反射代理

4、人17目標基礎的代理人代理人需要有一些目標排序的資訊.例如:自動駕駛計程車(如何使得長期目標能達到.小目標的做法的選擇.)18目標基礎的代理人19目標基礎的代理人挑戰:是否夠好了?20效能基礎代理人目標基礎代理人不夠好.因為其無法產生出高品質的行為.例如:自動駕駛計程車.除了要達到目的地外.還要考慮什麼因素?目標基礎代理人使用了2分法來作判斷?21效能基礎代理人效能基礎代理人將一個狀態對應到真實的數字.來代表該目標能被滿足的程度.22效能基礎代理人23學習代理人四種組成元素:1.評論者2.學習元素3.表現元素4.問題產生器24學習代理人25行動代理人行動代理人是一種程式.能從一個機器上移植到另

5、一個機器上.可以在跨平台的環境上執行.例如:JAVA需要有代理人能夠執行的環境26行動代理人好處:1.減少溝通的花費2.非同步的計算27行動代理人兩種類型:1.單點行動代理人(從一地移植到另一地)2.多點行動代理人(在網路上的漫遊)28行動代理人應用:1.分散式資料擷取2.Voip29行動代理人30PEASPEAS: Performance measure(表現評量), Environment(環境), Actuators(行動器), Sensors(接收器)例如:考慮taxi driver:Performance measureEnvironmentActuatorsSensors31PEA

6、SConsider, e.g., the task of designing an automated taxi driver:Performance measure: Safe, fast, legal, comfortable trip, maximize profitsEnvironment: Roads, other traffic, pedestrians, customersActuators: Steering wheel, accelerator, brake, signal, hornSensors: Cameras, sonar, speedometer, GPS, odo

7、meter, engine sensors, keyboard32PEASAgent: Medical diagnosis systemPerformance measure: Healthy patient, minimize costs, lawsuitsEnvironment: Patient, hospital, staffActuators: Screen display (questions, tests, diagnoses, treatments, referrals)Sensors: Keyboard (entry of symptoms, findings, patient

8、s answers)33PEASAgent: Part-picking robotPerformance measure: Percentage of parts in correct binsEnvironment: Conveyor belt with parts, binsActuators: Jointed arm and handSensors: Camera, joint angle sensors34PEASAgent: Interactive English tutorPerformance measure: Maximize students score on testEnv

9、ironment: Set of studentsActuators: Screen display (exercises, suggestions, corrections)Sensors: Keyboard35Environment types(全域觀察)Fully observable (vs. partially observable): 一個agent的接收器是否可以一次就可以看完所有的環境狀態 (可決定的)Deterministic (vs. stochastic): 環境的下一個狀態完全是根據於目前的狀態以及目前所採取的行動 ,不會受到其他agent的影響。(片段的)Episod

10、ic (vs. sequential): 一個agent的經驗可以被分成多個片段,而agent要做決定時,只需要根據根據這個片裡的感知來做就好了。36Environment types(靜態的)Static (vs. dynamic): 當一個agent在思考說下一步要如何做的時候,環境在此時是不會改變的。(離散的)Discrete (vs. continuous): 有限數目的不同,清楚的感知和行動。 (單一代理人)Single agent (vs. multiagent)37Environment typesChess with Chess without Taxi driving a c

11、locka clockFully observableYesYesNo DeterministicStrategicStrategicNo Episodic NoNoNo Static SemiYes No DiscreteYes YesNoSingle agentNoNoNo The environment type largely determines the agent designThe real world is (of course) partially observable, stochastic, sequential, dynamic, continuous, multi-agent38

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号