大数据在CPI统计中的应用研究

上传人:g**** 文档编号:55698244 上传时间:2018-10-04 格式:PPT 页数:36 大小:1.53MB
返回 下载 相关 举报
大数据在CPI统计中的应用研究_第1页
第1页 / 共36页
大数据在CPI统计中的应用研究_第2页
第2页 / 共36页
大数据在CPI统计中的应用研究_第3页
第3页 / 共36页
大数据在CPI统计中的应用研究_第4页
第4页 / 共36页
大数据在CPI统计中的应用研究_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《大数据在CPI统计中的应用研究》由会员分享,可在线阅读,更多相关《大数据在CPI统计中的应用研究(36页珍藏版)》请在金锄头文库上搜索。

1、,大数据在CPI统计中的应用以1号店价格指数为例,2018/10/4,2,主要内容,城乡居民购买并用于日常生活消费的商品和服务项目的价格。调查内容按用途划分为八大类、262个基本分类。包括食品、烟酒、衣着、家庭设备用品及维修服务、医疗保健和个人用品、交通和通信、娱乐教育文化用品及服务、居住。,2018/10/4,3,居民消费价格(CPI)统计简介,调查内容,分类固定国家规定 代表品抽样地方自定,消费量较大的消费项目。价格变动具有较强的代表性。同基本分类下代表品异质性越大越好。合格产品。注册商标、产地、规格等级等标识齐全。,2018/10/4,4,居民消费价格(CPI)统计简介,抽样原则,201

2、4年,上海CPI代表品共抽选1300多种,调查方法:采用定人、定点、定时的方法直接采集代表品价格。调查频率:与居民生活密切相关、价格变动频繁的商品,五天一次。一般性商品(服务),每月2-3次。政府统一定价或价格稳定的商品(服务),每月一次。报告周期:月度,每月10日前公布上月数据。,2018/10/4,5,居民消费价格(CPI)统计简介,方法频率,2014年,上海每月采集价格笔数为35000多笔,权数测算:主要根据居民家庭消费支出资料,辅以典型调查。权数五年固定不变。计算方法:先计算代表品月度时点平均价格变动幅度,代表品之间几何平均得出基本分类月度变动幅度,基本分类以上按逐级拉氏加权平均得出各

3、级分类月度变动幅度。,2018/10/4,6,居民消费价格(CPI)统计简介,计算方法,抽样代表性:代表品、网点抽选仍以重点、典型性为主。抽多少,怎么抽?权数变动性:五年固定,拉氏加权计算。消费结构变动如何体现?计算科学性:代表品之间几何平均计算。相当与等权计算?数据及时性:月度指数存在滞后性。如何反映短期波动?,2018/10/4,7,居民消费价格(CPI)统计简介,疑惑和挑战,2018/10/4,8,大数据物价统计的应用现状及比较,应用现状,每日网上价格指数:美国麻省理工学院对全世界海量网上零售价格进行价格指数计算,每天抓取70多个国家的50万条价格信息。淘宝网价格指数:阿里巴巴公司基于淘

4、宝网、天猫网、支付宝等网络平台的数据,推出网络购物消费价格指数。谷歌搜索数据CPI:国内学者通过谷歌搜索平台选取对CPI相关系数高的几十个关键词,跟踪测算出搜索CPI指数。,2018/10/4,9,大数据物价统计的应用现状及比较,应用比较,统计方法比较,2018/10/4,10,大数据物价统计的应用现状及比较,应用比较,统计功能比较,2018/10/4,11,大数据物价统计的应用现状及比较,应用比较,不足比较,以现行CPI编制框架为基础,确保数据可比性和衔接性充分利用大数据,改进现行CPI不足:抽样代表性? 代表品抽选更有依据 权数变动性? 权数设置更为灵活 计算科学性? 计算方法更加多样 数

5、据及时性? 指数周期更趋高频 ,2018/10/4,12,1号店价格指数编制方法及实例,编制思路,2018/10/4,13,1号店价格指数编制方法及实例,分类体系,方法:以1号店现有的后台商品分类体系(三级分类目录)为基础两大原则:代表性 体现营运状况及线上销售特点稳定性 不应频繁变动,确保指数延续性,实例:分类筛选过程:第三级目录数量较大(1500多个)、稳定性不高 不符基本要求的分类,如集团消费、团购消费、购物卡、礼品等 消费未成气候的分类,如生鲜食品、服装、交通工具、珠宝饰品等 消费量大、有特色分类,如休闲速食食品、进口食品、母婴产品、厨卫清洁 、家居用品等 研究初期,不宜纳入过大规模的

6、分类目录,2018/10/4,14,1号店价格指数编制方法及实例,分类体系,实例: 分类筛选结果:10个一级分类45个二级分类,2018/10/4,15,1号店价格指数编制方法及实例,分类体系,2018/10/4,16,1号店价格指数编制方法及实例,代表品选取,方法:将各二级分类下所有在报告期有销售的商品按销售额大小排序几种方案:全部选取 可比性问题,带入奇异值 固定数量 排位前n个的选取为代表品固定金额 累加销售额达到该类别总销售额固定比例的前n个选取为代表品,实例:使用固定金额的方法,比例定为七成。优点:有足够的代表性有足够的稳定性留出一定数量作为备用最终选取结果:各二级分类下的平均代表品

7、数量在 100个左右,食品、厨卫清洁等商品繁多的分类在200-300个。,2018/10/4,17,1号店价格指数编制方法及实例,代表品选取,2018/10/4,18,1号店价格指数编制方法及实例,权数设置,方法:代表品权数:该商品在报告期或基期的销售额占同分类下所有代表品销售额的比重分类权数:该分类在报告期或基期的销售额占上级分类总销售额的比重,2018/10/4,19,1号店价格指数编制方法及实例,计算过程,方法:代表品平均价格 : ,t期均价=销售总额/销售量代表品环比指数: ,t期指数=t期均价/t-1期均价,2018/10/4,20,1号店价格指数编制方法及实例,计算过程,方法:基本

8、分类环比指数 : 派氏指数,报告期权数拉氏指数,基期权数费雪指数,综合权数,2018/10/4,21,1号店价格指数编制方法及实例,计算过程,方法:逐级分类环比指数: 派氏指数,报告期权数拉氏指数,基期权数费雪指数,综合权数,实例:,2018/10/4,22,1号店价格指数编制方法及实例,计算过程,代表品 环比 权数 拖把 92.3 40 百洁布 101.5 15 扫帚 100.2 25 脸盆 103.4 10 浴帘 104.8 10,几何平均 100.3,2018/10/4,23,1号店价格指数编制方法及实例,计算过程,方法:链式法推算其他指数定基指数t-1期定基指数 t期环比指数同比指数t

9、期定基指数 / t-x期定基指数, x为周期,2018/10/4,24,1号店价格指数编制方法及实例,数据筛选,方法:指标筛选产品编码、分类编码、商品名、计量单位、规格信息销售时间、销售价格、销售量奇异剔除赠品价格、极低极高价格等,2018/10/4,25,1号店价格指数编制方法及实例,数据处理,方法:主要是代表品缺失或变动时的价格延续性处理,一般需要寻找新代表品继续进行价格跟踪,但新老代表品间的价格需要进行过渡处理。现行CPI统计中常用方法:替代法、备用虚拟法大数据物价统计方法:后备代表品更替法其他方法:主要特征折算法、成本因素分解法、 Hedonic回归法等,实例: 现行CPI备用虚拟法,

10、2018/10/4,26,1号店价格指数编制方法及实例,数据处理,实例: 1号店价格指数后备代表品更替法,2018/10/4,27,1号店价格指数编制方法及实例,数据处理,签署战略合作协议,数据保密协议。统计局提供编制方法,1号店负责实际测算操作。测算结果由统计局负责评估。定期以1号店名义发布指数,统计局协助数据分析,宣传推广。,2018/10/4,28,数据比较评估,合作模式,利用1号店的销售数据测算8个月有关商品分类的环比价格指数。分别使用拉氏指数、派氏指数、费雪指数方法测算出三套结果。其中乳制品、饮料、厨房调料、大家电、奶粉系列等12类与现行CPI口径一致,可进行比较。,2018/10/

11、4,29,数据比较评估,测算情况,拉氏和派氏指数结果比较,2018/10/4,30,数据比较评估,指数比较,波动一致性很高,涨跌一致性不高,拉氏指数权数固定为基期,无法体现权数结构变化。派氏指数使用报告期权数,结构变化较大时会影响指数平稳性。费雪指数综合使用基期和报告期权数,充分汲取两者优势。,2018/10/4,31,数据比较评估,指数比较,拉氏、派氏、费雪指数与CPI差异度比较,2018/10/4,32,数据比较评估,指数评估,1号店分类指数与CPI的差异度较小,与CPI衔接性较强。费雪指数优于拉氏、派氏指数。样本量偏少,无法深入评估。,2018/10/4,33,数据比较评估,指数评估,长期数据测算,加入同比指数,更好的比较评估。加快测算周期频率,加入旬指数、周指数,甚至日指数。扩大分类体系,关注网络新兴消费领域和服务项目。推广至更多网络销售平台。研究如何将网络价格纳入CPI统计中。,2018/10/4,34,数据比较评估,后期方向,大数据应用应从点上突破,先行先试,后图推广。大数据统计方法研究应注意与传统方法衔接。数据研究过程:,2018/10/4,35,数据比较评估,心得体会,谢谢!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号