物体与场景知觉

上传人:小** 文档编号:54563530 上传时间:2018-09-15 格式:PPT 页数:107 大小:7.76MB
返回 下载 相关 举报
物体与场景知觉_第1页
第1页 / 共107页
物体与场景知觉_第2页
第2页 / 共107页
物体与场景知觉_第3页
第3页 / 共107页
物体与场景知觉_第4页
第4页 / 共107页
物体与场景知觉_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《物体与场景知觉》由会员分享,可在线阅读,更多相关《物体与场景知觉(107页珍藏版)》请在金锄头文库上搜索。

1、Chapter 5,物體與場景知覺,Computer perception system The Defense Advanced Research Projects Agency (DARPA) The March/2004 race (142 miles across the Mojave Desert)1 million prize,The October/2005 race (132 miles) 2 million prizewinner,“Now we need to teach them how to drive in traffic.” - Gary Bradski, Inte

2、l Corporation as quote in the October 17, 2005 issue of the EE Times,Urban challenge race Victorville, CA, Nov 3, 2007 55 mile course that resemble city streets and other moving vehicles $2 million 1st place winnder averaged approximately 14 mph throughout the course http:/ http:/ 知覺組織(perceptual or

3、ganization) 視覺系統如何把龐雜環境刺激組織成為物體? 圖形-背景(Figure-ground) 視覺系統如何把龐雜環境刺激中的一部分歸為背景,一部份歸為圖形?,知覺機器(人,車)面對的挑戰 網膜刺激型態未必能代表環境刺激 3-D 2-D,反向映射問題(inverse projection problem),物體部分被遮蔽或者影像模糊,Fig. 5-4, p. 96,由不同角度觀看時,同一物體的影像不同 -能認出不同觀看角度的影像為同一物體稱為具有方位不變性(viewpoint invariance),Fig. 5-7, p. 97,哪兩張臉是同一人?,影像中產生亮度改變的原因經常無

4、法確定,不同材質,陰影有無,格式塔學派對知覺組織的研究取向,對結構主義(structuralism)的反動 結構主義是馮特(Wundt)等人開始建立(20世紀初期) 知覺是由感覺因子結合而成 心理化學(mental chemistry) Max Wertheimer 覺得似動運動(apparent movement)否定了結構主義 AM,所以和K.Kofka, I.Kohler從事格式塔心理學的研究 結構主義也不容易解釋錯覺輪廓(illusory contour)ic,back,黑色圓形是牆上的洞錯覺輪廓消失,格式塔學派因而拒絕了結構主義(知覺是感覺的總和),而主張整體不等同於部分的總和,並開

5、始注重知覺組織的問題,知覺組織的格式塔定理 完形律(law of Pragnanz)=law of good figure, law of simplicity 刺激型態的知覺以產生最簡結構為原則,相似律 相近的物體會被組織在一起,Fig. 5-15, p. 100,Fig. 5-16, p. 100,連續律(law of good continuation) 傾向將可形成直線或平滑曲線的點連接起來,形成具有平滑路徑的線條型態,接近律(law of proximity) 空間鄰近的物體會被組織在一起,共同命運(common fate) 以相同方向運動的物體會被組織在一起 熟悉度 能共同構成熟悉

6、型態的影像成分會被組織在一起,13 faces,格式塔以外的知覺組織原則(Palmer & Rock) 共同區域(common region) 落入共同區域的元素會被組織在一起 元素連結(element connectedness) 連結的物體會被組織在一起 同步性(synchrony) 同時發生的視覺事件會被組織在一起,connectednesssynchronycommon region,這些格式塔定律的地位是什麼? 定理 (law) vs. 原則 (principle) vs. 經驗法則 (heuristics) 經驗法則(Heuristics) vs. 算則 (algorithm) T

7、hey are best-guess rules that do not work every time. But, when they do, they work very fast.,圖形背景(figure-ground)分離,格式塔學派 可逆圖形(reversible figure)vase 圖形及背景的成立要件 圖形比較像東西,位於背景之前 front 對稱的比較可能是圖形 sy 佔據面積較小的比較可能是圖形 small 水平或垂直方位的比較可能是圖形 vertical 有意義的物體比較可能是圖形meaning 下方的比較可能是圖形,左右沒有差異Vecera et al. (2002)

8、,back,Figure 5.24 A version of Rubins reversible face-vase figure.,back,back,Figure 5.27 (a) Stimuli from Vecera et al. (2002). (b) Percentage of trials on which lower or left areas were seen as figure,Vecera 用了二種方法: 1) 判斷那一邊是圖形 2) 30秒期間,根據知覺到的圖形(非背景)是哪一個而按鍵,結果下方的有84%的時間被知覺為圖形,RBC theory (recognitio

9、n by components),如何由不同觀看角度辨認物體? 結構描述(structural description)模型 將物體表徵為部件以及部件之間的空間關係D Marr (1982) 部件為柱狀的,具有體積的單元,部件為幾何子(geons) 為數不多的幾何子(及其間的空間關係)即可用以代表大量的物體,幾何子最重要的特性是它的解析不受觀看角度影響(view invariant) 因為幾何子是由非偶發特性(non-accidental property, NAP)所界定的 2-D影像中的特性,其實就是3-D物體的實際特性,平行性,彎曲性,這是特例,少數的組成幾何子就足以代表一個物體概念,只

10、要界定幾何子的重要特徵仍然保留,就不太受雜訊影響,可以用以表徵許多類型的物體 但無法解釋一般人何以能區辨細節不同的物體,影像描述(image description)模型 觀看角度不變性(view invariance)未必成立,所以辨認歷程將影像與儲存的各種觀看角度表徵作比較,Perceiving Scenes,What is a scene ? 包括背景與物體(以有意義的方式安排在一起),Perceiving Scenes,The gist of a scene is perceived rapidlyuse of masks phenomenological method - Li (2

11、007)Gists are reported very early.,為何場景的gist 那麼容易被辨認? 快速處理整體影像特徵(global image features) 某些可以快速被偵測的整體特徵與場景的類型有相關 自然度(naturalness) 有質理的區塊,波浪狀的輪廓 開放性(openness) 水平線,物體少 崎嶇度(roughness) 元素小而複雜 開闊度(expansion) 平行線向遠方匯聚 特徵色彩,high low Degree of naturalness: forest vs. street Degree of openness : beach vs. for

12、est Degree of roughness : forest vs. beach Degree of expansion : railroad vs. street Color: blue sky; green forest,如oblique effect (知覺系統對於垂直以及水平的刺激特別敏感)可能是因為我們的自然環境中充斥垂直與水平的輪廓,環境規律性造成經驗引發的可塑性(experience dependent plasticity) back,水平線條環境,垂直線條環境,Gestalt law “uniform connectedness” 物體的各部分往往有相同的顏色,材質等,所

13、以具有一致性的往往來自同一物體 back,Figure 5.46 (a) Some of these discs are perceived as jutting out, and some are perceived as indentations. (b) Light coming from above will illuminate the top of a shape that is jutting out, and (c) the bottom of an indentation.,Shape from shading,Light-from-above heuristics,Figu

14、re 5.47 Why does (a) look like indentations in the sand and (b) look like mounds of sand? See text for explanation.,back,場景影像特徵反映環境中的規律性(regularities)1.物理規律性(physical regularities) 視覺環境中垂直與水平方位的輪廓比例高投影片 58 格式塔定律 ”uniform connectedness”投影片 60 Light-from-above heuristic投影片 582.意義規律性(semantic regularit

15、ies) 與場景類型相關的場景功能性組件與安排 如:特定物體在特定場景中的位置有規律性,Figure 5.45 Stimuli used in Palmers (1975) experiment. The scene at the left is presented first, and the observer is then asked to identify one of the objects on the right.,知覺的推論歷程 推論歷程以無意識方式影響知覺 von Helmholtz (1866/1911)無意識推論理論(theory of unconscious inference) 有些知覺經驗源自我們對於環境的無意識假設 -可能性原則(likelihood principle) 我們知覺到的物體是在造成網膜上2-D型態的所有可能性中,最有機會出現的刺激型態,為何人的物體知覺表現超越機器甚多?,知覺刺激是不明確的(ambiguous) 人類知覺透過利用環境規律性作推論來解決知覺問題 機器視覺需要能夠學習環境規律性,並能利用規律性來作推論 Boss的例子 Boss 所假設的規律性(知識) 動的東西很可能是車子 如果對方是紅燈則他應該會停下來 未能設計在Boss中的規律性,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 宣传企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号