数据分析处理技术

上传人:人*** 文档编号:508357151 上传时间:2023-04-12 格式:DOCX 页数:28 大小:55.01KB
返回 下载 相关 举报
数据分析处理技术_第1页
第1页 / 共28页
数据分析处理技术_第2页
第2页 / 共28页
数据分析处理技术_第3页
第3页 / 共28页
数据分析处理技术_第4页
第4页 / 共28页
数据分析处理技术_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《数据分析处理技术》由会员分享,可在线阅读,更多相关《数据分析处理技术(28页珍藏版)》请在金锄头文库上搜索。

1、数据分析处理技术主讲教师简介:郑军,女,辽宁税专第一教学部教师,副教授。导论一、 什么是统计学1、统计是处理数据的一门科学。2、统计学是关于数据的科学,它所提供的是一套有关数据收 集、处理、分析、解释并从数据中得出结论的方法。3、数据分析所用的方法可分为 描述统计方法 和推断统计方 法。二、理解统计对每个人都是必要的。第一部分 数据的整理与图示一、数据的类型 按照采用的计量尺度不同,可以将数据分为 分类数据、顺序 数据和数值型数据。1、分类数据:是只能归于某一类别的非数字型数据,它是对 事物进行分类的结果,数据表现为类别,用文字来表述。如: 企业按行业分类等。为便于统计处理,对于分类数据可以用

2、 数字代码表示各类别,如用 1表示制造业,2表示建筑业等。2、顺序数据:是只能归于某一有序类别的非数字型数据。顺 序数据虽然也有类别,但这些类别是有序的。如将产品分为 一等品、二等品、三等品、次品等。同样,对顺序数据也可 以用数字代码来表示。3、数值型数据:是按照数字尺度测量的观测值,其结果表现 为具体的数值。现实中所处理的大多数都是数值型数据。品质数据(分类数据和顺序数据、定性数据) 数量数据(数值型数据、定量数据)4、区分数据的类型十分重要。因为对不同类型的数据,需要 采用不同的方法来处理和分析。二、数据的搜集1、数据的来源(数据的间接来源、直接来源)2、调查数据(概率抽样、非概率抽样)。

3、概率抽样(即随机抽样):常用的方式有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样。非概率抽样:常用的方式有方便抽样、判断抽样(重点抽样、典型抽样)、自愿样本、滚雪球抽样3、搜集数据的基本方法(自填式、面访式、电话式、)。4、数据的误差(抽样误差、非抽样误差)。 抽样误差(由于抽样的随机性引起的样本结果与总体真值间 的误差)非抽样误差(回答误差、调查员误差等)三、数据的图表展示(一)、数据的预处理(审核、筛选、排序等)。(二)、分类汇总与数据透视表(数据的全新整理分析方法)(三)、品质数据的整理与展示。1、分类数据的整理与图示(频数与频数分布)2、顺序数据的整理与图示(累计频数和累计频

4、率、环形图)(四)、数值型数据的整理与图示(数据分组、直方图)。(五)合理使用图表(一)、数据的预处理:是在对数据分类或分组前所做的必要 处理。内容包括数据的审核、筛选、排序等。1、数据审核:对原始数据审核其完整性和准确性;对二手数据审核其适用性和时效性。2、数据筛选:根据需要找出符合特定条件的某类数据。3、数据排序:按一定顺序将数据排列,以便通过浏览数据 发现明显的特征或趋势等。(二)、数据透视表(数据的全新整理分析方法) 为了从复杂的数据中提取有用的信息,可以利用 Excel 提供的【数据透视表】工具。利用数据透视表,可以对数据表 的重要信息按使用者的习惯或分析要求进行汇总和作图,形成 一

5、个符合要求的交叉表(列联表)。在利用数据透视表时,数 据源表中的首行必须有列标题。(三)、品质数据的整理与展示 数据经过预处理后,可根据需要进一步做分类或分组。对品 质数据主要做分类整理,对数值型数据主要是做分组整理。1、分类数据的整理与图示(频数与频数分布) 分类数据本身即是对事物的一种分类。在整理时首先列出所分 的类别,然后计算出每一类别的频数、比例等,即可形成一张频 数分布表,最后根据需要选择适当图形进行展示,以便对数据及 其特征有一个初步了解。分类数据的图示(条形图、帕累托图、饼图等)2、顺序数据的整理与图示(累计频数和累计频率、环形图)四)、数值型数据的整理与图示(数据分组、直方图)

6、第二部分数据的概括性度量(集中趋势、离散程度、偏态与峰态的度量)一、总量指标分析二、相对指标分析三、集中趋势度量四、离散程度度量五、偏态与峰态度量一、税收总量指标分析(一)、税收总量指标的分析要求对总量指标的分析和描述应简洁、明了、突出其主要数量特征, 给人以深刻印象。例:“十五”期间,我市税收从 2000年的561,484万元增 加到 2005年的 1,203,402万元,年均增长16.47%,为我市经 济和社会的发展提供了有力的财力保障。二)、税收总量指标的图表描述总量指标在 Excel 中的图表具体可描述为折线图、条形图(横置或纵置)等。(条形图纵置时也称为柱形图)二、税收相对指标分析在

7、税收数据分析中,方法最简便、应用最广泛的就是相对指 标的计算与分析,因其概念比较清晰,这里只对其计算方法作一 介绍。相对指标是两个有联系的指标对比的比值,反映事物的数量 特征和数量关系。随着税收分析目的的不同,两个相互联系的指标数值对比, 可以采取不同的比较标准(即对比的基础),而对比所起的作用 也有所不同,从而形成不同的相对指标。归纳起来有两类:一是 同一总体内部之比,二是两个总体之间对比。(一)、属于同一总体内部之比的相对指标 属于同一总体内部之比的相对指标有:计划完成程度相对指标、 结构相对指标、比例相对指标、动态相对指标四种。1、计划完成程度相对指标(分析计划完成情况及计划进度执行 情

8、况等)。、一 亠、实际完成数计划完成程度相对指标=计划数 X 100%2、结构相对指标。例:分税种结构分析。总体部分数值结构相对指标=总体总量 X 100%3、比例相对指标。例:两税收入中消、增两税之比。比例相对指标=税收总量中某部分数值占X100%税收总量中另一部分数值4、动态相对指标。例:不同时间的税收指标之比。动态相对指标=报告期水平X100%基期水平(二)、属于两个总体之间对比的相对指标 属于两个总体之间对比的相对指标有:比较相对指标和强度相对 指标。5、比较相对指标。例:两地区税收之比。(较少用绝对量比)比较相对指标二某条件下某类税收指标另一条件下同类税收指标X100%6、强度相对指

9、标。例:每百元GDP税收含量。强度相对指标=某-现象税收指标另一有联系而性质不同现象的税收指标例: X 市“十五”时期税收发展情况报告一、“十五”时期X市税收发展总体情况1、增长速度加快,总量节节攀升。“十五”期间我市税收从 2000 年的561,484万元增加到 2005 年的 1,203,402 万元(图表),增长了 114.33%,翻了一番还 多,每年增收额都在 10亿元以上,年均增长 16.47%,比“九五”期间921%的年均增长率高出726个百分点,比我市14%的GDP 年均增长率高出 2.47 个百分点。2、一产比重下降,二产比重提高,三产基本持平。年度第一产 业第二产业第三产业小

10、计采掘 业制造业电煤气 水建筑业小计交运仓 储邮电批发零 售金融保 险房地产其它行 业20022111821286523791045008951970355411395878167334628141335402186702003243092588682964111096122331325756081045188752941672561823802536402004136733132766240144335121111505907008716908153397807032438632538272005801936343511315160528142741773188319497611158267

11、88505318618290448平均 增长 率-27.619.5268.1715.3816.8322.2615.42&99-4.712.1133.629.92从三次产业的静态结构看,第三产业为税收的主要来源。“十五”期间三次产业在税收中的比重分别为1 86%、29 3%和 6884%,税收的三分之二以上来自第三产业。(图表)从三次产业的动态结构看,第一产业税收比重下降,第 二产业比重提高,第三产业比重基本持平。 2002 年我市税收三 次产业税收收入比例为 272:2746:6982,到 2005 年演变为 067:3020:6913。税收贡献率和税收拉动作用百分点的计算。三、集中趋势度量

12、应用平均指标分析总体数量方面一般特征的方法。平均指标是社 会经济分析中常用的综合指标。(静态、动态均值)常用的平均指标1、静态均值x=Yf1)算术平均数 Y xx =n2)、调和平均数H =丄Ymx3)众数 4)中位数2、动态均值几何平均数(平均比率、平均速度) 反映一个时期内事物发展的快慢程度,一般用百分数表示 简单几何平均数:G = % x x x = n x12n加权几何平均数:G = Yf x /1 x /2 x fn = Yf n xf12n四、离散程度度量1、反映各变量值之间差异或离散程度的指标称为变异指标。以绝对数形式表现的变异指标有全距、平均差和标准差,以相对数 形式表现的变异

13、指标有全距系数、平均差系数和标准差系数,其 中最常用、最重要的是标准差和标准差系数。2、全距计算简单、容易理解,但受极端值影响较大。3、平均差和标准差的意义基本相同,都是各变量值与算术平均 数的平均离差,但在数学处理上有所不同。平均差是采用取绝对 值的方法消除离差正负,而标准差是采用平方的方法消除离差的 正负。由于标准差具有优良的数学性质,因此它是测定离散程度 最重要的指标。工(X X)2 f Yt4、变异系数消除了变量值水平高低和计量单位不同的影响,是反映离散程度的相对指标。因为实际工作中,经常要对不同水平 或不同计量单位的现象进行研究,所以变异系数是衡量离散程度 最普遍使用的指标。cV 二

14、 X 100 % c x“标准差”和“离散系数”这两项指标可应用于行业税负分析 中,当一个行业税负标准差和离散系数越大,说明这个行业企业 间的税负差异越大。这种差异可能受两个方面因素的影响,一是 企业增值幅度不同产生的税负差异;二是企业申报质量和税收征 管力度强弱不同产生的差异。行业税负1、行业税负涵义行业税负一般是指某一行业税收总量与税源总量之间的比例关系,是一项反映行业税收经济关系的数据指标,是一个行业税负 的平均值。它可以是一个行业所有税种税收总量负担概念,也可 以是该行业一个税种税收总量负担的概念。口径定义可依据研究 目的不同自行定义。行业税负的计算公式某一行业税收总量行业税负业计税收入或所得2、行业税负分析的意义 按照税收征管法实施细则第四十七条有关规定,行业税负测 算标准可以用于企业纳税评估和企业税负水平核定工作。 税收负担是经济结构、税收政策和税收征管等多种因素综合作用 的结果。由于这多种因素的影响,所以,地区间、行业间或企业 间的税负是不可比的。但具体到同一行业的企业时,由于同一产 品或服务的生产技术、加工工艺和原材料、能源消耗相近,适用 的税收政策也相同,研究分析同一行业内的企业税负,就可以消 除经济结构和税收政策的影响,找出影响行业税负形成的特征规 律和建立行业税负的客观标准,为税收征管征收力度考核提供数 据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号