《第四章模式识别》由会员分享,可在线阅读,更多相关《第四章模式识别(93页珍藏版)》请在金锄头文库上搜索。
1、第四章第四章模式识别模式识别第一节第一节知觉理论概述知觉理论概述一、知觉概述 关于知觉的传统观点关于知觉的传统观点l知觉是在刺激作用下即刻产生的,而且似乎是自动的 l常人意识不到知觉的过程 l某些空间特性的知觉受先天制约,不依赖于过去的经验或者学习 l某些几何错觉甚至不依赖于人掌握的有关概念 传统的观点认为,知觉是一种消极被动的接受刺激的过程; 现代观点则认为,知觉是主动和富有选择性的构造过程。 黄希庭:“知觉是直接作用于感觉器官的事物的整体在脑中的反映,是人对感觉信息的组织和解释的过程。” 梁宁建:“知觉是人脑对客观事物的各种属性、各个部分及其相互关系的综合的整体的反映,它通过感觉器官,把从
2、环境中得到的各种信息,如光、声音、味道等转化为对物体、事件等的经验的过程。” 知觉知觉l 现代认知心理学认为,知觉是确定人们所感受的刺激物的意义的过程。或者说,知觉是解释刺激信息,从而产生模式和意义的过程。 知识经验在知觉中的作用l因素恢复实验因素恢复实验 (Warren 1970 )l已有知识对句子知觉的作用已有知识对句子知觉的作用 (Miller&Isard ,1963) l视知觉研究的证据视知觉研究的证据 (Biederman,1972) 二、知觉理论二、知觉理论(一)(一)直接知觉理论(直接知觉理论(Direct perception) l以Gibson为代表,认为环境可提供的信息足以
3、产生知觉,知觉并不需要内部过程和表征的参与。刺激眼睛的光线模式是一个结构性的光学分布; 这种分布能提供空间中目标分布特征的明确或恒定信息; 知觉在很少或没有信息加工参与的 情况下,可以通过共振直接从光学 分布中提取各种丰富信息。线条透视结构密度遮盖关系(二)建构性知觉理论(Constructiveperception)l知觉是一个积极的和建构的过程知觉并不是由刺激输入直接引起的,而是所呈现刺激与内部假设、期望、知识以及动机和情绪因素交互作用的产物知觉有时可受到不正确的假设和期望影响,因而也会发生错误邻近物体大小对大小知觉的影响对对两种知觉观的评论两种知觉观的评论l建构知觉观建构知觉观强调人主观
4、能动性人的知觉常常是错误的吗?大多数实验和演示都用了人工或非自然刺激直接知觉观强调环境信息真的不需要假设内部表征来理解知觉吗?“看见”与“看成”是两个不同的过程视觉模式识别视觉模式识别眼睛构造与视神经通路主观组织(三)(三)格式塔理论格式塔理论l格式塔学派认为思维是整体的、有意义的知觉,而不是联结起来的表象的简单集合;主张学习是在于构成一种完形。 知觉相似律封闭性原则知觉接近律知觉接近律返回 尽管这些点没有用线段连接起来,但仍能看到一个三角形和一个长方形。闭合性法则闭合性法则完形法则完形法则l 相近(Proximity) 距离相近的各部分趋于组成整体。 l 相似(Similarity) 在某一
5、方面相似的各部分趋于组成整体。 l封闭(Closure) 彼此相属、构成封闭实体的各部分趋于组成整体。 l 简单(Simplicity) 具有对称、规则、平滑的简单图形特征的各部分趋于组成整体。 典型表象(典型表象(canonicperspectives)l指能对物体作出最佳表征的形象,或回忆一个形状时最先想起的表象。 l典型表象可能是对同一范畴中相似成员(成为样例)的经验的产物。l格式塔心理学的理论核心是整体决定部分的性质,部分依从于整体。他们通过实验的方式证明感知运动不等于实际运动,也不等于若干的单一刺激,而是与交互作用的刺激网络相关,整体不等于各部分简单相加之和。 三、知觉信息加工过程l
6、自下而上(自下而上(bottom-upbottom-up)加工加工: 指由外部刺激开始的加工,通常是说先对较小的知觉单元进行分析,然后再转向较大的知觉单元,经过一系列连续阶段的加工而达到对感觉刺激的解释。又称之为数据驱动加工数据驱动加工(Data-Driven ProcessingData-Driven Processing) 自上而下(top-down)加工:l由有关知觉对象的一般知识开始的加工,由此可以形成期望或对知觉对象形成假设,这种期望或假设制约着加工的所有阶段或水平。又称之为概念驱动加工概念驱动加工(Concept-Driven ProcessingConcept-Driven Pr
7、ocessing) TulvingTulving, , MandlerMandler & & BaumalBaumal的实验的实验l 自变量自变量l上下文情况:无上下文、4字上下文、8字上下文(考察自上而下加工)l靶子词呈现的时间:0140ms,以20ms变化(考察自下而上加工)l 因变量:因变量:l靶子词识别率l 结果:结果:l随呈现时间增加,靶子词识别率上升。l有上下文的始终优于无上下文的,但两者差距随呈现时间延长而缩小(二)整体加工和局部加工整体加工与局部加工的实验整体加工与局部加工的实验a a(NavonNavon,19771977) 视觉材料80ms 40ms听觉材料300ms 自变
8、量:总体的一致性关系与局部的一致性关系 因变量:反应时间(按键判断听到的是哪一个字母,按键作反应) 实验结果: 总体的一致性关系有主效应总体的一致性关系有主效应: 一致无关冲突 局部的一致性关系无主效应局部的一致性关系无主效应:一致无关冲突整体加工与局部加工的实验整体加工与局部加工的实验b b(NavonNavon,19771977)l自变量:两个l不同指导语(注意整体、注意局部)l大字母与小字母的一致性关系(冲突、无关、一致)l实验程序: 预警信号视觉刺激(40ms)掩蔽反应l实验结果实验结果:l大字母识别快于小字母l在注意整体的指导语下,小字母是否与大字母冲突并不影响反应时,冲突无关一致l
9、在注意局部的指导语下,大字母是否与小字母冲突则会影响到反应时,两者冲突时,对小字母的反应时最慢。STROOP效应效应lSTROOP效应是指字义对命名的干扰效应。一般认为,念字和命名是两个不同的认知过程。Stroop于1935年做了一个实验,他使用的刺激字与书写它所用的颜色相矛盾,结果发现,说字的颜色时会受到字义的干扰,但在用一年级小学生做实验时却没有发现这种现象。l红l红l蓝l绿l蓝l绿 一般认为,STROOP效应是由于念字自动化造成的。人们对字加工快,而对颜色加工慢,因此,当要说颜色时,就会受到字义的干扰,而反过来,念字却不会受颜色的干扰。第第二二节节 模模式式识识别别及及其其理论模型理论模
10、型一、概述l从广义上说,一个模式(patternpattern )就是一组刺激或刺激特性,它们按一定关系(如空间、时间)构成一个有结构的整体。 l从狭义上说,模式仅指视觉刺激物的整体结构。 l模式:模式:l指有若干元素或成分按一定关系形成的某种刺激结构,也可以说是刺激的组合。不同形状的椅子返回模式识别(Pattern RecognitionPattern Recognition )l当人能确认他所知觉的某个模式时,将它与其他模式区分开来,就是模式识别。 l模式识别是指人把输入刺激模式的信息与长时记忆中的信息进行匹配,并辨认出该刺激属于什么范畴的过程。 (梁宁建) 模式识别的意义二、模式识别过程
11、l分析 l比较 l决策 三、模式识别理论(一)模板说(模板匹配理论(一)模板说(模板匹配理论 template-matching theorytemplate-matching theory) 模板(template):存在于人的长时记忆中的、与外部刺激具有一一对应关系的外部模式的小复本。模板匹配说模板匹配说 模板匹配的基本思想:模式的识别需要刺激与模板相匹配,而这种匹配要求两者有最大程度的重叠。(二)、特征分析说(二)、特征分析说1.1.基本思想基本思想 特征分析说试图将模式分析为组成它们的各种特征(feature),模式识别时需要对刺激的特征进行分析,将之与长时记忆中的各种刺激特征进行比较
12、,一旦获得最佳的匹配,外部刺激就得以识别。2. 2. “泛魔堂泛魔堂”模型(模型(“魔城魔城”模型)模型)通过特征分析识别一个字母R3.3.特征分析的生理学依据特征分析的生理学依据 1981年诺贝尔医学奖获得者:Hubel & Wiesel4.4.特征分析的行为学证据特征分析的行为学证据 Neisser(1964)英文字母扫描实验 固定影像与静止影像的实验5.5.特征分析说的评论特征分析说的评论 优点:避开预加工、减轻记忆负担、带有学习色彩 缺点:缺乏自上而下的过程(三)、原型说(三)、原型说(prototype theory) 1.1.基本思想基本思想l原型原型(prototype)(pro
13、totype):头脑中存储着的代表一组物体、一个类别或范畴内所有个体关键特征的表征,它反映的是一类物体所具有的基本特征。原型不仅是对一类刺激的概括,也是这类刺激在头脑中的最优代表。2.2.原型存在的原型存在的证据证据3.3.原型的构成原型的构成趋中或特征频率趋中或特征频率4.4.伪记忆伪记忆for(四)、几何离子理论 Biederman(1987)认为:物体是由一些基本形状(shapes)或成分(components),也就是几何子(geon; geometric ion几何离子)组成的。通过把复杂对象的结构拆分为简单的部件形状,就可以进行模式识别。 几何离子理论几何离子理论l成分识别(成分识
14、别(Recognition by componentsRecognition by components)lP109P109图图4.94.9 对给定物体的识别是由贮存表征(包对给定物体的识别是由贮存表征(包含相关几何离子特征、朝向、大小等方面的含相关几何离子特征、朝向、大小等方面的信息)能否与源自物体的成分或几何离子信信息)能否与源自物体的成分或几何离子信息进行最佳匹配决定的。息进行最佳匹配决定的。 几何离子大约有36种,包括方块(block)、圆锥(cylindrer)、球面(sphere)、圆弧(arc)和楔子(wedge)。 根据Biederman的理论,物体识别依赖于边缘信息而不是表面
15、信息(如颜色)。 启动效应启动效应(primingeffects)l指先前呈现的刺激项目对随后该刺激项目或与其相关的刺激项目进行某种加工所产生的易化现象,表现为启动刺激(prime)对目标刺激(target)在反应时上的促进作用。 启动效应的分类启动效应的分类l启动效应按照启动词和目标词间字形、语音、语义间的相似程度分为重复启动和相似启动。 依据对语义加工的依赖程度和是否具有知觉特异性效应(perceptual-specific effects),分为物体(知觉)启动和语义(概念)启动。 语义启动语义启动(semantic priming)l指先前的语义加工使得随后的语义性任务操作的反应时间缩
16、短、准确率提高。 例如,在词汇判断任务中,将“医院”作为启动刺激时,它会促进被试对目标刺激“医生”的判断反应。又如:当前面呈现的词是“面包”时,比是“护士”时对目标词“黄油”的反应要快。 Marr 的计算理论的计算理论 (computational theory)l初级素描初级素描 (primal sketch)(primal sketch):这一表征对视觉输入的主要光强变化进行二维描述,包括关于边缘、轮廓和墨块的信息。l2 1/2 -D 2 1/2 -D 素描素描 (2 1/2 -D sketch)(2 1/2 -D sketch):这一表征通过利用由阴影 (shading)、纹理(text
17、ure)、运动 (motion)、双眼视差 (binocular disparity) 等提供的信息,对可视表面深度和方位进行描述,此表征依赖于观察点。l3-D 3-D 模型表征模型表征 (3-D model (3-D model representation)representation):这一表征描述物体形状的三维特征,以及它们的相对位置,而不依赖于观察点。Marr的计算理论的计算理论物体识别的三种表征过程物体识别的三种表征过程拓扑学理论(topological theory)l上上世世纪纪8080年年代代初初,陈陈霖霖提提出出视视觉觉拓拓扑扑学学理理论论。该该理理论论认认为为,在在视视觉
18、觉处处理理的的早早期期阶阶段段,人人的的视视觉觉系系统统首首先先检检测测图图形形的的拓拓扑扑性性质质;它它对对图图形形的的大大范范围围拓拓扑扑性性质质敏敏感,而对图形的局部几何性质不敏感。感,而对图形的局部几何性质不敏感。 图形的拓扑性质(topological properties)l指在拓扑变换下图形保持不变的性质和关系,如连通性(connectedness)、封闭性(closedness)、洞(hole),都是典型的拓扑性质,而大小、角度、平行性等几何性质则不是拓扑性质。 陈霖,认知科学和实验心理学家。1945年生于四川成都。1970年毕业于中国科技大学。任中国科学院研究生院和生物物理研
19、究所认知科学重点实验室教授、主任,中国科学院-北京医院脑认知成象研究中心主任。2003年当选为中国科学院院士。1982年他在科学杂志上原创性地提出了“拓扑性质初期知觉”的理论,向半个世纪以来占统治地位的理论提出了挑战。随后20多年的时间里,在与国际上持不同学术观点的学者的争论与交流中,他以令人信服的系列科学实验不断地完善和论证着这一假说,使之成为被越来越多的国际同行所接受的学说,进而成为有国际影响力的理论,他的成果也被科学、美国科学院院报等著名学术刊物多次刊登。2004年,著名知觉杂志Visual Cognition以专辑的形式刊载了陈霖教授的成果并配发了大量国际著名学者的评论性文章。Lin
20、Chen. The topological approach to perceptual organization. VISUAL COGNITION (2004).Lin Chen, Shaowu Zhang, Mandyam V. Srinivasan. Global perception in small brains: Topological pattern recognition in honeybees. P NATL ACAD SCI USA 100(11),6884-6889 (2003).Chen, L. Topological structure in visual per
21、ception.SCIENCE 218, 699-700 (1982).实验证据l被试先注视屏幕上的一个注视点。l用速示器呈现三对实验图形(5毫秒)。被试注视成对图形并作出反应。(同-异判断)。 专家的模式识别专家的模式识别l国际象棋研究中的常用指标:复盘时间、正确复位数 l为什么象棋大师的复盘情况优于新手?lChase & Simon (1973): 实际样本的复盘与凭记忆复盘3种棋艺水平下的扫描时间和复盘时间 正确复位的棋子数是棋艺水平的函数 早在二十世纪60 年代,研究者就对婴儿的面孔偏好进行了一系列研究, 在30 多年的研究中,研究者达成一致的看法,认为出生几小时甚至几分钟的婴儿都表现
22、出对面孔的偏好。之后,大量研究验证了这个观点,Morton 发现,出生30 分钟的婴儿对面孔注视的时间长于非面孔刺激,这种兴趣出现于任何经验与学习之前。Bruce and Young model of face recognition (1986)TheIACmodeloffacerecognitionBurtonBruce(1993).lInteractive Activation and Competition (IAC)lFace Recognition Units (FRU)lPerson Identity Nodes (PIN)lSemantic Information Units
23、(SIU)lName Recognition Units (NRU)lWord Recognition Units (WRU)Haxby et al (2000)多级整合模型(汪亚珉, 傅小兰.2005)认知神经科学研究成果认知神经科学研究成果l面孔刺激在下颞叶后部的外侧梭状回引起明显的fMRI信号的增强,提示梭状回参与完成面孔加工,梭状回也因此被称为梭状回“面孔区”。l在枕区和下颞叶的交界处、V4区之前有一个脑区的fMRI信号与面孔刺激存在密切相关,因此被认为也参与面孔加工,并被称为枕区“面孔区”。l彭小虎,王国锋,罗跃嘉. 面孔认知及神经机制的独特性J. 心理科学, 2002, 25 (4
24、) : 488-490.l李琰琰,钱秀莹 面孔识别真的具有特殊性吗? J.人类工效学,2006,12(2):62-64面孔识别的独特性面孔识别的独特性Farah 提出了三个衡量面孔识别与物体识别差异的标准:l 脑定位标准: 参与面孔识别与物体识别的脑结构与脑机制不同; l加工系统标准: 即每个系统独立运作而不依靠另外一个系统; l信息处理方式标准: 两个系统按照不同的方式来处理信息。l面孔神经元对面孔有着强烈的反应而对非面孔物体表现出微弱的反应或不反应。l患有面孔失认症的病人对面孔识别有着特别的困难。他们识别熟悉的面孔主要依靠非面孔线索,如嗓音、衣服或发型等。但这些病人对其他物体的识别却毫无困
25、难或只有很少的困难。对面孔失认症最直截了当的解释是面孔识别系统与物体识别系统是相互独立的。 面孔识别主要定位在腹侧颞叶和枕叶皮层,所以在这些区域内无论前后部分损伤只要大小足够就会导致面孔失认。 一般认为面孔识别是“格式塔(gestalt) ”式或“整体的( holistic) ”。在物体识别中,整个物体外形常常被表征为各部件的外形;而在面孔识别中,面孔常常被表征为一个整体。到目前为止,已有很多心理学实验证实,面孔的表征很少是基于部分的,更多的是基于整体的。面孔识别真的具有特殊性吗面孔识别真的具有特殊性吗?l面孔的各个部分以“粘着”的方式表征,人们对面孔的加工更倾向整体的、结构的编码;而普通物体的识别则基于局部、特征的分析。l然而,这种“特殊性”近来受到了专家系统论支持者的质疑。他们认为,除了物理结构特征外,面孔还在以下三方面不同于普通物体: 不同面孔的基本成分和基本结构相同; 面孔都在个体水平上区分; 人们都是面孔识别的专家。人脸识别技术人脸识别技术l人脸识别技术就是利用计算机分析人脸图像,通过检测对比人脸数据库中的所有已知原型人脸图像来达到“辨认”身份的目的。l人脸识别技术在视频监控、访问控制等领域有着广阔的应用前景。