构建广西地税征管数据质量管理系统研究

上传人:桔**** 文档编号:564403595 上传时间:2023-02-15 格式:DOC 页数:22 大小:865KB
返回 下载 相关 举报
构建广西地税征管数据质量管理系统研究_第1页
第1页 / 共22页
构建广西地税征管数据质量管理系统研究_第2页
第2页 / 共22页
构建广西地税征管数据质量管理系统研究_第3页
第3页 / 共22页
构建广西地税征管数据质量管理系统研究_第4页
第4页 / 共22页
构建广西地税征管数据质量管理系统研究_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《构建广西地税征管数据质量管理系统研究》由会员分享,可在线阅读,更多相关《构建广西地税征管数据质量管理系统研究(22页珍藏版)》请在金锄头文库上搜索。

1、构建广西地税征管数据质量管理系统研究内容提要:广西地税从2009年开始大力推进征管数据自治区局大集中项目,该项目以广西地税信息系统征管数据地级市局集中处理为基础,通过数据复制、清洗、转化、抽取等技术实现征管数据的自治区局大集中。推进该项目遇到的一个主要问题是数据质量,由于各市数据质量在准确性、一致性和及时性等方面都存在一些问题,使得数据自治区大集中的数据整合及分析利用都受到严重影响,大集中系统展现的数据可信度受到了很大质疑。本文着眼于提高税收征管数据质量,对如何构建广西地税税收征管数据质量管理系统进行研究,内容包括:税收征管数据质量的内涵和外延,广西地税征管数据质量现状评估,广西地税征管数据质

2、量问题原因分析,提升广西地税征管数据质量应采取的措施,构建广西地税征管数据质量管理系统的方法与途径,如何建立健全广西地税征管数据质量管理机制等等。关键词:税务征管数据质量一、税收征管数据质量的内涵和外延税收信息化建设过程中,税收征管数据质量的高低既是各方关注的热点、又是信息化应用工作的难点,可称之为税收征管信息系统的“生命线”。数据质量是指数据的优劣程度,或指数据的准确度和可信度,它代表税收征管数据对税收征管工作的可满足程度。无论税收收入会统核算,还是稽查选案、收入预测、纳税评估等都需依赖数据质量。税收征管数据是税收征管应用系统的初始原料和最终产品,经过应用程序的组织,提供给税务人员和有关方面

3、使用。税收征管数据作为数据的一种,在反映客观世界、完成信息传递功能的同时,具备一般数据的基本属性。下面结合数据的基本属性对税收征管数据质量标准作一些说明。(一)一致性。数据的一致性是指对数据的解释只有一个标准,即数据指标的标准化,在不同的数据表中针对同一种事物的同一属性应该只有一种约定。譬如,在广西地税信息系统中,不同数据表描述纳税人的识别号和微机代码只能是同一个数据。数据指标的标准化是确保数据质量的基础性工作,也是衡量数据质量高低的基础性指标。(二)正确性。用正确性来表示数据库中的数据与客观世界的符合程度。例如,纳税人更改了公司名称或者联系方式后,应该对纳税人基本信息表中相应记录进行更新,否

4、则就会得到不正确的数据。(三)完整性。用完整性来表示信息的完整程度。完整性包括三个方面,分别是实体完整性、引用完整性和域完整性。实体完整性要求一个表中的每一行必须是唯一的;引用完整性定义了一个关系数据库中不同的表的相关列的之间的引用关系;域完整性要求表的某一列的数值在该列的合法的数值范围内。(四)及时性。用及时性来考察数据的时间特性对应用的满足程度。数据从产生、发展,到消亡,有一个相对的有效期。譬如,在广西地税信息系统中申报数据是否在限定期限内征收或转欠税,征收数据是否在限定时间内入库或作废等。(五)逻辑性。数据的逻辑性是考察关联数据之间的是否符合逻辑关系。譬如,广西地税信息系统中申报主表的欠

5、税额这个指标应该满足下列关系:QSE=SNSE-KPS.二、广西地税税收征管数据质量现状评估自治区地税局自2009年10月份开展数据大集中项目建设,在项目实施过程中,发现各地应用广西地税信息系统存在较为严重的数据不完整及指标项错漏等数据问题,这些数据问题不但造成广西地税信息系统查询统计和报表数据的不准确,影响系统的正常使用,还会使自治区地税局数据大集中系统无法有效开展数据分析利用,阻碍广西地税以大集中系统为工作平台推进“信息管税”和“扁平化”管理的进程。为此,自治区地税局组织开展了征管数据质量调研分析工作,利用技术手段与人工比对相结合的办法,对全区的征管数据进行检查。检查内容包括:严格按照直接

6、从征管系统取数来重新生成计统报表;比对国库报表和征管系统中的原始数据,分析存在差距的原因;全面检查户籍、申报数据;检查征管系统数据的完整性、一致性和逻辑性;检查征管系统中的垃圾数据等。数据检查的具体技术手段为:(一)SQL语句检查。检查的基本原理是:根据业务规则定义检查规则,检查规则的核心是SQL中的select查询语句,即通过select查询找出、发现业务系统中的数据质量问题。展现的内容与SQL语句select的字段有关,逻辑关系与where子句有关。譬如,检查税务登记表(SWDJB)中行业(HY)值是否为空或存在非法代码,我们采用的语句为:SELECT * FROM SWDJB WHERE

7、 HY = NULL OR HY NOT IN (SELECT DM FROM systbaseDMB WHERE DMBMC =“HY”)。(二)编写程序检查。检查的范围是通过一条SQL语句不能完成检查的数据指标。检查原理是,通过编写程序对同一表的不同指标的或者不同表间相关指标的逻辑性进行检查。譬如,检查一条申报记录在申报主表(SBZBJG)和税款征收表(SJYDB)之间的数据是否符合业务逻辑。2009年9月30日检查的部分结果如下:三、影响广西地税征管数据质量的原因分析经对错误数据进行充分的分析,将产生错误数据的原因分为业务型、操作型、程序型、混合型等4类问题进行归纳,共整合问题70条,分

8、类汇总如下:分析上述问题产生的原因,主要有以下几个方面:(一)软件各地应用差异导致数据不够一致由于2006年以来,广西地税核心征管系统广西地税信息系统采取的是分布式集中,征管数据首先集中在地级市地税局的生产数据库中,再通过数据抽取、转换、加载(ETL过程)工具集中到广西地税的大集中数据库中。由于各地级市各征收单位的代码库是没有关联的,由各地级市地税局技术人员自行维护。因此,各地的数据指标标准不一,在数据自治区大集中过程中产生了大量的不匹配数据,导致数据质量不高、数据可利用率较低。(二)征管业务流程不够规范统一广西地税各地的征管模式存在一定差异,有些征管事项的管理模式还不够明确,导致税收征管系统

9、在各地的使用情况存在差异,从而导致部分数据的缺失,影响了数据的统计分析。譬如,备案类减免税的资料采集,有的地级市录入系统,有的没有录入系统,导致在统计这部分减免税时数据出现不准确。(三)征管数据采集不够规范严谨一是在数据采集环节。由于纳税人文化程度和业务水平参差不齐,有相当一部分人对税务登记表、纳税申报表等数据信息采集表格填报口径不一致,不能正确填写纳税基础信息,加之一些税务管理人员对数据采集工作重视程度不够、责任心不强,缺乏严谨的工作态度,对纳税人填报的采集数据没有实地调查、审核不严、更正不够等因素,因此,从源头上形成了垃圾数据。二是征管数据录入环节。由于征管数据是通过手工输入微机的,一些纳

10、税户递交申报的原始资料原本就不够完整、准确,在手工输入微机时又发生一些错误,由此导致数据信息存在一定程度的失真或不全的情况。再者,税务机关数据录入人员往往只注意数据采集表中的数据和信息,而忽视各种数据指标的逻辑关系审核。在日常工作中,数据录入主要体现在为纳税户办理税务登记、征收期受理纳税申报和发票销售及核销环节,这些繁锁的手工操作过程,不仅要求数据录入人员有熟练的计算机操作技能,更要有较强的工作责任心。如果责任心不强,就容易出现下列情况:发现纳税人填写的数据错误或填写不清,却嫌数据采集表退回登记流程的手续繁琐,大都采用猜测代填数据的处理方法;为了省事,只录入系统数据保存时必要的项目,对纳税人填

11、写的附表或其他指标,许多没有录入;对纳税人减免税不按规范要求录入减免税额,而是直接抵减申报额,造成统计汇总结果出现严重偏差等。三是初始数据核定环节。初始数据核定管理薄弱,每天征管信息系统的运行都会产生大量新的数据,由于负责初始税务登记、申报纳税的核定人员对业务标准理解程度参差不齐,在新办税务登记、申报及纳税核定时,对纳税户所属行业、应纳税种和预算科目核定的随意性大,造成其中一部分错误信息源源不断地进入征管信息系统。四是征管数据质量监督环节。在广西地税过去一个时期的信息化建设中,征管数据质量缺乏系统、持续的监督控制措施,导致数据质量的监督控制往往是意识上很重要但实际工作中又极易被疏忽。在征管数据

12、信息采集、录入及核定的流程中,各地普遍只采取办税厅岗位审核或一次性交叉审核方法,没有建立后续必要的数据质量监督控制机制,各个环节出现错误的数据因此得不到及时有效的更正,其数据信息质量就更加无法得到保证。(四)征管软件开发设计存在缺陷在软件开发中,科学的业务需求是第一位的。当前在软件工程中已经分离出了需求工程,而需求是源于管理的需要,管理水平的高低直接影响需求的制定和完善水平。尽管需求要在原有基础上进行管理流程的重新界定和调整,而当前广西地税的征收管理模式、业务流程整体上还处于探索、完善阶段,并缺乏全面、系统、科学的梳理,实际工作中又经常发生局部变化,不时出现需求体系的整体与局部、局部与局部之间

13、的不协调一致,因此一直没有制定出一套科学有效的核心征管系统业务需求体系。同时,在数据库设计中,数据库中存放的数据之间的相关性很强,相关性不仅表现在数据依存的时间、地点(部门)、类型、名称等原始属性上,还会在数据的转移过程中,产生再生的相关性。而且希望从数据中发现的东西越多,相关性的要求就越高。而应用需求的不够明确,必然影响数据的完整、准确。在征管软件系统开发完成后,不断冒出的新的要求,并且这些需求有时又缺乏深入的论证,为了适应形势的发展,修改、完善周期往往拖得很长,这样的征管信息系统开发、完善格局,肯定会影响系统数据的质量和利用效率。(五)适应新形势发展要求,干部整体素质和责任心有待进一步提高

14、当前,广西地税系统既精通税收业务又熟悉计算机应用的复合型人才严重缺乏。一些干部由于掌握的业务知识不尽合理、信息化基础知识缺乏,计算机操作中经常出现失误,致使错误数据产生频率偏高。一些干部工作责任心不强,对待一些简单重复性工作缺乏耐心,致使错误数据屡屡出现,如不能正确设置税务登记岗位的税种、税款入库预算级次和税款缴纳期限等,给受理税款申报、征收、入库岗位或环节的工作带来不利影响,造成混淆入库级次和积压税款等错误。(六)数据收集手段落后,采集纳税人涉税数据缺乏主动、全面只有综合、多维的涉税数据信息才能真实、准确反映税收活动的过程。电子数据采集是信息管理和应用的基础性工作,但在当前的广西地税工作中,

15、数据采集不全问题比较突出。当前,广西地税系统的现状是:大多依靠纳税人自行申报途径采集涉税信息据以实施征收管理行为,数据信息来源面狭窄,获取信息手段落后,致使数据质量受到影响。比如,在综合征管软件等系统中,目前普遍重视对纳税人的税务登记、纳税申报表、财务报表等数据的收集,但对纳税人经营规模、收入变化、普通发票使用等动态数据采集不全,这是不能真实、及时、准确掌握纳税人实际经营状况和应纳税额的重要原因所在。(七)受各种主客观因素的制约,涉税数据信息共享度低就广西地税系统内部讲,税收管理信息化是一个一个专题、领域来做的,单个信息系统的分头开发和部署推广,难免造成各单项征管软件之间数据结构的不一致,形成

16、影响数据信息顺利交换的信息“孤岛”,致使数据信息共享度差,信息资源无法得到充分有效利用。受各种主客观条件、环境等因素的制约,广西地税、国税、工商、银行等部门间信息化发展水平各不相同,加上缺乏强有力信息共享协调机制作用的发挥,地税与其不能实现更加有效、广泛的电子信息交流共享,影响了对广西纳税人信息的全面掌握和涉税信息的高效利用。(八)受各种主客观因素的制约,全区尚未真正建立数据质量监控考核工作机制2010年,由自治区地税局计算机信息管理中心牵头并与有关业务部门配合,虽然组织开展了一系列的征管数据质量考核技术、业务准备,个别地方,如河池市地税局也组织开展了相关工作。但受各种主客观条件的制约,目前广西地税系统在征管数据质量日常监控考核指标体系建设、部门分工协作关系、监控考核业务流程、通报制度建设等问题上,目前都尚未真正准备好;不同地方、业务部门对数据质量的重视程度不一、日常管理的力度

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号