2020(档案管理)房产档案数字化清理整合方案

上传人:精****库 文档编号:134000693 上传时间:2020-06-01 格式:DOC 页数:64 大小:351.72KB
返回 下载 相关 举报
2020(档案管理)房产档案数字化清理整合方案_第1页
第1页 / 共64页
2020(档案管理)房产档案数字化清理整合方案_第2页
第2页 / 共64页
2020(档案管理)房产档案数字化清理整合方案_第3页
第3页 / 共64页
2020(档案管理)房产档案数字化清理整合方案_第4页
第4页 / 共64页
2020(档案管理)房产档案数字化清理整合方案_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《2020(档案管理)房产档案数字化清理整合方案》由会员分享,可在线阅读,更多相关《2020(档案管理)房产档案数字化清理整合方案(64页珍藏版)》请在金锄头文库上搜索。

1、房产档案数字化清理方案西安必特思维软件某公司二一一年七月目 录1 需求11.1 政策需求11.2 现实需求21.2.1 贵单位档案现状21.2.2 档案现存问题21.3 项目实施效益32 分析42.1 我们对数据清理的理解42.1.1 数据清理的定义42.1.2 数据清理的实现方式62.1.3 数据清理和档案数字化加工的区别72.1.4 技术路线82.2 数据清理重点和难点92.2.1 数据清理重点92.2.2 数据清理难点102.3 数据清理关键技术应用112.3.1 人工智能112.3.2 语义分析132.3.3 档案分形133 总体设计173.1 总体架构183.2 技术特点213.3

2、性能指标214 技术方案224.1 档案数字化加工224.1.1 档案整理224.1.2 档案扫描234.1.3 数据录入244.2 建立逻辑幢394.2.1 数据移植404.2.2 分词处理414.2.3 分形处理444.2.4 分形后处理464.3 建立自然幢及房屋落地504.3.1 分幅编幢514.3.2 外业调查554.3.3 自然幢录入664.3.4 关联落地734.4 成果利用784.4.1 质量检查784.4.2 生成登记簿784.4.3 数据利用785 项目实施方案795.1 项目实施计划795.2 项目管理计划815.3 项目成果移交825.4 项目管理825.4.1 项目整

3、合管理825.4.2 项目范围管理835.4.3 项目时间管理835.4.4 项目进度控制计划845.4.5 项目成本管理855.4.6 项目质量管理855.4.7 质量控制的难点及重点865.4.8 项目小组人员配备875.4.9 项目设备的组织885.4.10 项目安全管理901 需求1.1 政策需求随着我国城镇住房制度改革的深化、住房建设步伐的加快和住房消费的有效启动,我国房地产行业得到了飞速发展,在国民经济建设中发挥着巨大的带动作用,且已成为了我国的重要支柱行业。房屋权属登记档案是房地产行政管理部门在房产登记、调查、测绘、产权转移、房屋变更等房产权属管理工作中直接形成的,有保存价值的文

4、字、图表等不同形式的历史记录,是房屋权属登记管理工作的真实记载和重要依据。记载房屋物权归属和内容的权属档案,具有法律效力,是房地产管理部门和人民法院确认房屋产权、处理房屋纠纷的重要依据。2007年10月1日,对房地产权属登记行为、登记信息系统都影响深远的中华人民共和国物权法(后简称物权法)正式执行,其中,第十八条规定权利人、利害关系人能够申请查询、复制登记资料,登记机构应当提供。2008年,为了贯彻落实物权法,规范房屋登记行为,建设部下发了房屋登记办法(建设部令第168号),指出“县级之上人民政府建设(房地产)主管部门应当加强房屋登记信息系统建设,逐步实现全国房屋登记簿信息共享和异地查询。”

5、为房屋权籍档案的利用提出了新的要求。为抑制过快上涨的房价,国务院再出房地产调控重拳,2009年12月14日,温家宝总理主持召开国务院常务会议上,就促进房地产市场健康发展提出增加供给、抑制投机、加强监管、推进保障房建设等四大举措,简称“国四条”。2010年4月17日,国务院关于坚决遏制部分城市房价过快上涨的通知(国发201010号,简称“新国十条”)出台。在重申加强房地产市场监管、维护正常房地产市场秩序等要求的同时,首次提出了要根据购房人家庭当前拥有房屋套数,执行差别化的信贷政策要求,且在通知中提出“加快个人住房信息系统的建设”。2010年6月24日,在“加快推进全国个人住房信息系统建设”会议上

6、,齐骥副部长发表的讲话中提出“要充分认识加快个人住房信息系统建设的重要性和紧迫性,且且要理清工作思路,明确工作目标和任务,狠抓落实,扎实推进个人住房信息系统的建设。”个人住房信息系统建设的数据基础就是各城市通过数字化清理形成的业务历史数据库,因此,进行房产档案数字化清理也是建设个人住房信息系统的需要。1.2 现实需求1.2.1 贵单位档案现状目前贵单位现存纸质档案万卷,约万宗。其中万宗档案进行了扫描;档案数据存储在系统中,约万。1.2.2 档案现存问题1.2.2.1 档案系统信息不完整由于在当时办理业务时,没有严谨的录入规范,导致档案系统中很多信息没有录入,致使信息且不完整。1.2.2.2 档

7、案系统记载和实际不符在档案系统中,存在有些信息和纸质档案信息不一样的情况。1.2.2.3 档案系统数据录入不规范同样由于业务办理时没有统一严格的录入规范,致使档案系统中的数据相当的不规范。1.2.2.4 档案系统数据前后不一致在档案系统中,同样存在数据前后不一致的情况,如同样一套房子,前一手和后一手在办理业务时录入的信息不完全一致。1.2.2.5 档案本身记载信息有误上面介绍的都是档案系统信息的缺失、不完整、不一致等问题。其实除了档案信息系统的问题以外,档案本身也存在着很多问题。由于档案是业务办理的结果,每个时期业务办理的规则也不尽相同。而且早时期都采用的手工办案方式,因此难免会产生一些错误。

8、如此种种,在手工办案时代,由于房产权属业务的复杂性,导致档案本身发生错误的情况屡见不鲜。1.3 项目实施效益 有利于贯彻落实“个人住房信息系统”的建立; 有利于个人所得税、房产税的征收; 有利于解决历史遗留问题掌握现实状况; 有利于贯彻房屋登记办法和建立房屋登记簿; 有利于贯彻宏观调控政策; 有利于提高工作效率; 有利于降低登记风险; 有利于加强规范化管理; 有利于协助房屋普查工作; 有利于方便群众、服务社会; 有利于和金融部门协同工作。2 分析2.1 我们对数据清理的理解2.1.1 数据清理的定义随着计算机技术的飞速发展和信息技术的深入应用,信息量急剧膨胀,用户积累了大量的电子数据,这些数据

9、记录了用户的工作成果,非常珍贵。由于录入错误、部门合且以及业务规则随着时间的推移而改变等因素,都会影响数据的质量。根据“垃圾进,垃圾出”的原理,为了支持正确的分析决策,就要求原始数据完整准确。数据清理就是为了解决数据质量问题而提出的。数据清理在不同应用领域的要求不完全相同,很难有一致的定义,但总的来说,数据清理的目的是检测数据中存在的错误和不一致,剔除或者改正它们,以提高数据的质量。在通常的信息系统开发项目中,数据质量往往只被理解为控制错误数据的输入,即在数据输入程序程序中加入检查和防范机制,保证进入系统的输入都是合法的数据值。但数据质量的真正含义远不止此。从语义角度而言,数据是事实及意义的结

10、合体,数据质量能够通过正确性、准确性、不矛盾性、一致性、完整性、集成性等几个元素来描述。按照广义的数据质量定义,高质量的数据就是指那些适合于用户使用的数据。常见有质量问题的数据主要包括不完整数据、错误数据和重复数据三类。不完整数据的特征是一些应有的信息缺失,如产权人身份证号空缺等。错误数据产生的原因是业务系统不够健全,在接收输入后没有进行判断而直接写入后台数据库。错误值包括输入错误和错误数据,输入错误是由原始数据录入人员疏忽而造成的,而错误数据大多是由一些客观原因引起的,例如业务类型定义不规范等。异常数据是指所有记录中如果一个或几个字段间绝大部分遵循某种模式,其它不遵循该模式的记录,如身份证字

11、段输入信息位数不足或超出规定的长度等。重复数据也就是“相似重复记录”,指同一个现实实体在数据库集合中用多条不完全相同的记录来表示,由于它们在格式、拼写上的差异,导致数据库系统不能正确识别。从狭义的角度见,如果俩条记录在某些字段的值相等或足够相似,则认为这俩条记录互为相似重复。数据质量的问题且不会突然之间显现出来,很多是历史遗留问题,加上一些主观或客观因素所造成的,诸如系统平台的不一致,缺乏规范的操作流程和标准,数据处理人员水平的差异,组织缺乏数据质量监督管理措施等。基于之上概念我们能够给出广义的数据清理的定义:利用相关信息技术如数理统计、人工智能、数据分形等预定义清理规则,对数据源进行处理,补

12、充完整缺失数据,规范不一致数据,清除错误数据和重复数据,从而提高数据的质量。具体到房产档案数据清理,包括档案数字化、输入、处理和输出三部分。档案数字化:房屋登记和交易的纸质档案通过整理、扫描、录入的方式,生成电子图片、非结构化数据,且为后续清理工作提供基础数据。输入:把档案数字化生成的数据移植到中间库;处理:1、在中间库,采用智能算法(分词、分形等)生成楼盘表和基于楼盘表的案例上下手关系、权利人和物权(所有权、抵押权、用益权和限制权);2、采用地理信息技术(GIS)对照档案数据到现场进行实地勘察,实现楼栋落地。输出:把楼盘表、楼盘表和宗地的关系导出到业务库和档案库。2.1.2 数据清理的实现方

13、式数据清理的实现方式通常有以下几种:2.1.2.1 手工实现通过人工检查,理论上只要投入足够的人力、物力、财力和时间,也能发现所有错误,但效率低下。尤其在大数据量的情况下,几乎是不可能的。2.1.2.2 定制开发专用的数据清理软件目前,国内外针对数据清理已提出了一些有效的清理算法,或根据某种算法针对特定应用领域开发出一些专门的清理软件。可是,由于数据清理的复杂性,对不同的数据源,要求数据清理适应不同的数据类型、数据数量及具体业务。这种方法能解决某个特定的问题,但不够灵活,特别是清理过程需要反复进行多次(一般来说,数据清理一遍就达到要求的很少),导致程序复杂。清理过程变化时,工作量大,而且这种方

14、法也没有充分利用目前数据库提供的强大数据处理能力。2.1.2.3 基于开放式框架的数据清理平台如何把数据质量问题和用户业务领域知识结合起来,设计一个能够把数据清理和特定业务领域知识结合起来的模型框架已势在必行,人工智能的发展则给这个领域带来了新的生机。必特思维基于长达二十年的房地产管理信息系统开发经验和取自数百家用户的房地产管理专业知识,集合人工智能、语义分析、档案分形等国际最前沿的IT技术,创新性的开发出了国内第一个专门针对房地产管理领域的开放式的数据清理平台。该平台利用专家系统的外壳,便于规则的表示和利用,规则库和算法库是其核心。在对数据源进行数据处理之前,通过预定义清理规则和选择合适的算

15、法,使平台具有较强的通用性和适应性。在数据清理过程中,由于很多错误不可预料,不可能所有错误都被自动清理,人工交互是必要的。当数据清理过程中出现异常错误时,系统会给出相应的警告信息,提示用户手工处理。另外,基于开放式框架的数据清理平台仍具有开放的规则库和算法库,可不断扩充新的数据清理算法,且可根据具体业务定义所需的清理规则,能够大大提高数据清理的工作效率。2.1.3 数据清理和档案数字化加工的区别综上所述,数据清理是一项复杂的系统工程,它的专业性和技术性要求不言而喻,然而在实际工作中且没有得到足够的重视。有些人认为数据清理是一个需要大量劳动力的过程,往往容易将它和档案数字化加工这一劳动密集型工作混淆起来,而忽视了其中所蕴含的技术含量。其实不然,档案数字化加工的主要目的是通过扫描、录入等方式将用户的纸质档案转化为电子影像档案,方便查询。虽然在这一过程中也会借助于一些简单的软件工具来进行数据输入输出处理,但数据质量基本上仍是靠人工检

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号