本部《无线射频识别技术与应用》大作业

上传人:飞*** 文档编号:15388081 上传时间:2017-11-04 格式:DOC 页数:14 大小:84.50KB
返回 下载 相关 举报
本部《无线射频识别技术与应用》大作业_第1页
第1页 / 共14页
本部《无线射频识别技术与应用》大作业_第2页
第2页 / 共14页
本部《无线射频识别技术与应用》大作业_第3页
第3页 / 共14页
本部《无线射频识别技术与应用》大作业_第4页
第4页 / 共14页
本部《无线射频识别技术与应用》大作业_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《本部《无线射频识别技术与应用》大作业》由会员分享,可在线阅读,更多相关《本部《无线射频识别技术与应用》大作业(14页珍藏版)》请在金锄头文库上搜索。

1、无线射频识别技术与应用大作业题 目 RFID 复杂事件处理技术学生姓名 周宏豪学 号 20121375025学 院 计算机与软件学院 专 业 12 物联网工程 1 班指导教师 张小瑞二一 五 年 五 月 四 日RFID 复杂事件处理技术周宏豪南京信息工程大学计算机与软件学院,南京 210044摘要:随着 RFID 技术的发展,RFID 应用正无所不在。通过对 RFID 数据的深入处理和分析,可以发现更复杂的复合事件和隐含知识,从而有效地支持事件监控、事件预警等先进应用。由于 RFID 的特殊性,依靠现有的主动数据库技术和数据流管理技术难以实现高效的 RFID 事件检测和处理。分析了 RFID

2、数据的特点,归纳和总结了 RFID 复杂事件处理的最新技术,讨论了一些新问题,主要有 RFID 数据清洗方法、以数据为中心的检测技术、以事件为中心的检测技术,以及复杂事件处理系统等,并对今后的研究重点进行展望。关键词:RFID 技术;数据清洗;复杂事件处理;数据流技术1 引言无线射频识别(Radio Frequency Identification,RFID)技术是一种自动识别和数据获取技术。RFID 的基本工作原理是,首先由阅读器向 RFID 标签发送能量,标签向阅读器返回数据,阅读器解码并向主机返回数据。这种标签也称为无源的被动式标签。高级的 RFID 标签是有源的主动式标签,其感应距离可

3、以更远(超出 10 m),也可以是可读写的,能够将有关数据写回标签。RFID 标签具有低成本、寿命长、不怕污染和适应恶劣环境等特点,有望在将来替代目前流行的条码。国际标准委员会制定的电子产品代码 EPC,为每个产品定义全球唯一的 ID,使每个标签对象携带有唯一的识别码。一个通用的 RFID 应用系统的组成。RFID 技术的早期应用是为了识别物品、计算数据。例如,在物流配送系统中,当物品带上标签后,可以从一大批物品中快速地追踪和定位目标,并统计数量;在门禁安检系统中,可以快速、准确地识别和统计出入人数。实际上,RFID 支持事件监控等更高级的应用,这些动态的 RFID 数据的产生代表着某种基本事

4、件的发生,通过模式匹配、异常发现、关联分析等智能推理手段,可以检测和发现更复杂的事件,即复合事件。例如,在物流配送系统中,可以实时监控物品丢失、配送阻塞等事件;在门禁安检系统中,可以发现异常活动和潜在的不安全因素等;甚至在智能医院中,用于跟踪医生、病人、医疗设备和药品。因此,实际应用中迫切需要开发支持这些复杂 RFID 应用的事件处理技术。2 RFID 数据清洗技术在 RFID 系统中,由于射频干扰和标签读取结构等诸多原因,数据读取的可信度较低,这严重影响了 RFID 技术在各领域中的用途(比如精确的存货跟踪,严格的病人监护等),因此,系统中必须增加对 RFID 数据的预处理环节,使阅读器读取

5、来的数据,无论从时间序列还是从数值上,尽可能地接近真实数据。2.1 数据清洗的内容RFID 数据读取的低可信度主要与其采用的无线射频信号相关,它们极易受环境影响,而且相互干扰,尤其当标签和阅读器数量多时,信号干扰加强,但这属于电磁波的物理特性,很难改变,只能从其他方面加以考虑。RFID 源数据的不准确性,主要归结为下面 3 点:(1)漏读:当一个标签在一个阅读器阅读范围之内时,该阅读器没有读到该标签。这种情况可能发生在同一时间段内,某个阅读器同时读多个标签时,某些标签被遗漏。经调查表明,通常情况下,阅读器只能读到在它感应范围内60%70%的标签数据,即至少有 30%的标签数据读取时被遗漏。在

6、RFID 应用中,数据漏读现象比较严重,应重点解决。这种错误也称为拒真(false negative)。(2)多读:指当一个标签在一个阅读器阅读范围之外时,该阅读器仍然读到了该标签。这种情况主要因为多个阅读器同时存在时的电磁波的干扰,随机性很大。这种错误也称为纳伪(false positive)。(3)脏数据:指一个标签在一个阅读器阅读范围之内时,该阅读器感应到该标签存在,但读出的 EPC 值不正确。上面总结的 3 点主要是从数据的准确性方面考虑的,除此之外,还有两个方面需要考虑,即时序性和精简性。RFID 应用对数据的时序性要求很高,而数据在传输过程中,乱序现象比较严重,数据应该按时间戳大小

7、有序输出;而精简性是指消除数据冗余,避免造成存储空间浪费和出现二异性。目前,对 RFID 应用中数据清洗技术的研究已经取得了一定的进展,对上面提出的问题也有了不同的解决方法,但解决问题的类型主要分为两类,即主要只针对漏读现象的解决办法和针对各类问题的适应性解决办法,下面分别介绍。2.2 数据漏读的清洗策略目前,针对数据漏读现象,已经有了许多解决方法,如建立概率模型、建立 SQL 查询模型以及利用机器学习方法建模等,下面依次介绍。大部分的 RFID 中间件系统采用了“平滑过滤器”策略,即设定一个固定窗口大小用以填补漏读数据,但由于窗口大小固定不变,致使窗口过小会产生拒真数据,窗口过大会产生纳伪数

8、据,由此可见,大小固定的窗口不能根据数据的特点精确地添补数据,美国加州大学 Berkeley 分校则提出了一种改进方法,即基于概率模型 SMURF 的适应性数据清洗方法。该方法主要考虑到了两个因素,完整性和标签动态变化性。完整性是指确保在阅读器阅读范围之内的所有标签都能被读到,平滑窗口应该足够大以保证完整性。但是设置一个大的滑动窗口,有可能探测不出窗口内标签移动,即当标签已经离开阅读器的阅读范围之内时,它仍被错误地探测到,这样会产生大量的纳伪数据,不能保证标签动态变化性。由此可见,窗口大小的调整十分关键,既要保证完整性又要保证标签动态变化性。确保完整性的因素主要是阅读器的阅读速率,它主要受阅读

9、器、标签的类型和周围物理环境影响。而确保标签动态变化性的因素主要是标签的移动特性,它主要跟应用类型有关,如放在固定货架和传送带上的两个标签会表现出截然不同的移动特性。SMURF 模型是在一种新的转换思路基础之上建立起来的,将 RFID 数据流看作统计学中的随机事件,即读出一个标签看作是发生一个随机事件,标签的读出频率看作是事件发生的概率,在平滑窗口内的探测值看作是多次重复随机事件的结果。在此基础上提出了两个概率模型:二项分布和 - estimator。伯努利二项分布模型用来解决单个阅读器探测单个标签的情况。在平滑窗口内读到标签的次数 N 满足伯努利二项分布 B(wi ,pavgi ),wi 是

10、在平滑窗口内阅读器探测周期 epoch 的次数(窗口大小),即重复试验的次数,pavgi 是在平滑窗口内标签的平均读出频率,即事件发生概率。当置信度为 时,保证完整性的充分条件是:wiln(1/)pavgi,当前窗口小于 wi 时,适当扩大窗口大小;而探测到标签动态变化时的条件是:|Si|- wi pavgi |2 wi pavgi (1- pavg i ),其中,|Si|表示在平滑窗口内,探测到某标签的次数,此时适当减小窗口大小。由此根据标签当前信息,适应性地调整窗口大小,可以保证较准确的填充数据。- estimator 模型用来解决单个阅读器探测多个标签聚合的情况,以准确地探测某个时间段内

11、标签的个数。在平滑窗口内,存在的标签个数之和为 N! W=iSW $ 1i,其中 i=1- (1- pavgi )w,表示在窗口内标签 i 的读出概率,pavgi 是平均标签的平均读出频率。保证完整性的充分条件与二项分布模型的相同。探测到标签动态变化条件是:|NW- NW |2( VarNW +VarNW ),其中 NW 和 NW分别表示在当前窗口 W=(t- w,t和当前二分之一窗口 W= (t- w2,t内,存在标签的个数之和。针对这两个条件的相应具体操作与解决单个标签的情况类似。与静态窗口填补算法相比,适应性调整窗口大小的填补算法有着明显的优势。但此概率模型只解决了单个阅读器探测的问题,

12、没有考虑空间布置多个阅读器探测的情况。基于 SQL 查询模型的方法主要提出了一种 ESP 机制,可以用来清洗来自不同接收器的数据,并且针对各类型错误数据的各自特点进行清洗,RFID 错误数据主要是漏读数据。该机制是一个描述性的查询处理工具,设计成管道结构,便于处理数据和建模,其中每一步带有典型描述性查询。该管道结构由 5 部分连接组成,分别是 Point,Smooth ,Merge ,Arbitrate 和 Virtualize。它们是ESP 机制清洗数据的 5 大步骤,每个步骤有各自的清洗任务。针对不同的应用,采取的具体清洗技术也不同,不一定实现每个步骤。下面进行具体介绍。Point:该步骤

13、主要对来自同一个传感器的源数据流中的单个数据进行清洗,去掉异常数据,如 RFID 中错误的标签数据、噪声数据,然后将满足过滤条件的数据输出。Smooth:该步骤主要根据数据之间的时间相关性对漏读数据进行填补或探测噪声数据。该方法定义了时间粒度概念,它是处理数据的时间单位,如在数据流上定义与之相等的时间窗口(窗口大小由用户需求决定),然后在窗口上进行各种聚合操作,并输出结果。Point 和 Smooth 步骤均可以下推到有处理能力的接收器节点上执行。Merge:该步骤主要根据数据的空间相关性对数据进行清洗。该方法定义了空间粒度概念,它是处理数据的空间单位,每次将接收到的来自于多个接收器的数据按事

14、先定义好的空间粒度进行分组,然后逐个处理并输出。Arbitrate:多个接收器接收的数据可能会产生冲突,例如,同一数据被位于不同区域的两个接收器同时读到时,该步骤负责判断应该属于哪个接收器。Virtualize:某些应用可能会用到来自不同类型接收器的数据或者已存储的数据。该步骤通过对各种数据的 Join 操作,提供所要求的数据。连接属性可以是时间戳、ID 或者其他相同属性等。这 5 个步骤的数据清洗层次逐渐升高,由对单个接收器数据的清洗,扩展到对多个接收器的处理;由对来自同种类型接收器数据的清洗,扩展到来自不同种类型接收器的处理,解决数据清洗的范围很广。另外,该模型处理问题十分灵活,针对不同的

15、应用,可采用不同的步骤。该模型主要根据数据具有的时间相关性和空间相关性对数据进行清洗,考虑范围比较宽广,但时间粒度和空间粒度如何设置,一旦设置可否适应地改变,如何改变等问题仍在研究中。上述两种清洗策略的主要衡量标准是准确性,即清洗后的数据中,准确数据所占比例。但是当某个 RFID 应用布置规模极大时,如涉及到数千个阅读器、数万个标签,这时衡量标准就不能只考虑数据的准确性了,还要考虑到算法的时间开销问题。因而,文献提出了以机器学习为背景的清洗算法。它提出了一个清洗框架,包含大规模的 RFID 数据集和一系列数据清洗策略,并分析了各个策略对应的清洗开销,提了一个适应性调整时间开销和准确性的总体优化

16、算法。该算法所考虑的开销主要包括三个部分:一是机器学习中,每个元组的训练开销;二是存储开销和运行开销;三是分类错误时所需的开销。清洗方法是指以标签实例(EPC,t,f1,f2 , ,fk)作为输入的一个方法分类器 M。fi 是指用来描述标签的各个属性或所处物理环境的特征。共有 4 种特征:(1)标签特征,描述标签属性,如通信协议、销售商、价格、历史探测数据等等;(2)阅读器特征,描述阅读器属性,包括天线数量、协议、价格等等;(3)位置特征,描述该观测值被读出时标签所处位置,如货架、传送带等等;(4)标签所附物体特征,如该物体组成(金属或水质)、物理方位或是否为一容器。这些特征都可以用来作为方法分类的标准,但最终的标准选取需要从训练集数据中学习获得。具体的清洗方法主要为静态平滑窗口填补方法和动态平滑窗口填补方法,还可以是用户自定义的方法。清洗规则可以具体

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号