《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)

上传人:sat****105 文档编号:290121332 上传时间:2022-05-09 格式:PPT 页数:29 大小:2.48MB
返回 下载 相关 举报
《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)_第1页
第1页 / 共29页
《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)_第2页
第2页 / 共29页
《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)_第3页
第3页 / 共29页
《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)_第4页
第4页 / 共29页
《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)》由会员分享,可在线阅读,更多相关《《R语言商务数据分析实战》教学课件—10餐饮企业综合分析(1)(29页珍藏版)》请在金锄头文库上搜索。

1、第第10章章 餐餐饮饮企企业综业综合分析一合分析一R语言商务数据分析实战语言商务数据分析实战1统计餐饮菜品数据目目录录了解餐饮企业分析需求2使用ARIMA算法预测销售额3餐饮行业作为我国第三产业中的一个传统服务性行业,始终保持着旺盛的增长势头,取得了突飞猛进的发展,展现出繁荣兴旺的新局面。与此同时,我国餐饮业发展的质量和内涵也发生了重大变化。根据国家统计局数据显示,如图所示。餐饮行业餐费收入从2006到2015年都处于增长的趋势,但是同比增长率却有很大的波动。分析餐分析餐饮饮企企业现业现状与需求状与需求20062007200820092010201120122013201420150%5%10

2、%15%20%25%30%35%40%0500100015002000250030003500400045005000收入(亿元)同比增长餐饮企业正面临着以下几个问题。房租价格高、人工费用高。人力成本和房租成本的上升已成为必然趋势。原材料成本高。餐饮企业业务环节多,原材料种类繁多且用量不稳定,成本控制困难,现金流量大,给手工操作带来了很大的难度。服务工作效率低。采用原始点餐模式“服务员拿着一支笔和一张纸给客户点菜、下单、结账”,不能准确地将客户喜欢的菜品推荐给客户,降低了客户的就餐体验,同时也增加了财务的工作量,而且速度慢,准确率低。分析餐分析餐饮饮企企业现业现状与需求状与需求某餐饮企业的系统

3、数据库中积累了大量的与客户用餐相关的数据,包含菜品详情表、订单表、订单详情表等。客户信息表(users)的数据说明如表所示。了解餐了解餐饮饮企企业业数据基本状况数据基本状况名称含义名称含义USER_ID客户IDDESCRIPTION备注MYID客户自编码QUESTION_ID问题代码ACCOUNT账号ANSWER回复NAME姓名ISONLINE是否在线ORGANIZE_ID组织代码CREATED创造日期ORGANIZE_NAME组织名称LASTMOD修改日期DUTY_ID称位代码CREATER创建人TITLE_ID职等代码MODIFYER修改人PASSWORD密码TEL电话EMAIL电子邮箱s

4、tuNo学号LANG语言qqQQTHEME样式weixin微信FIRST_VISIT第一次登录meal_arithmetic_id算法IDPREVIOUS_VISIT上一次登录arithmetic_name算法名称LAST_VISITS最后一次登录sex性别LOGIN_COUNT登录次数poo籍贯ISEMPLOYEE是否是职工address地址STATUS状态age年龄IPIP地址订单表(meal_order_info)的数据说明如表所示。了解餐了解餐饮饮企企业业数据基本状况数据基本状况名称含义名称含义info_id订单IDlock_time锁单时间emp_id客户IDcashier_id收银

5、IDnumber_consumers消费人数pc_id终端IDmode消费方式order_number订单号dining_table_id桌子IDorg_id门店IDdining_table_name桌子名称print_doc_bill_num打印doc账单的编码expenditure消费金额lock_table_info桌子关闭信息dishes_count总菜品数order_status0:未结算;1:结算;2:已锁单accounts_payable付费金额phone电话use_start_time开始时间name名字check_closed支付结束订单详情表(meal_order_deta

6、il)的数据说明如表所示。了解餐了解餐饮饮企企业业数据基本状况数据基本状况名称含义名称含义info_id订单IDlock_time锁单时间emp_id客户IDcashier_id收银IDnumber_consumers消费人数pc_id终端IDmode消费方式order_number订单号dining_table_id桌子IDorg_id门店IDdining_table_name桌子名称print_doc_bill_num打印doc账单的编码expenditure消费金额lock_table_info桌子关闭信息dishes_count总菜品数order_status0:未结算;1:结算;2:

7、已锁单accounts_payable付费金额phone电话use_start_time开始时间name名字check_closed支付结束熟悉餐熟悉餐饮饮企企业业数据分析的步数据分析的步骤骤与流程与流程1统计餐饮菜品数据目目录录了解餐饮企业分析需求2使用ARIMA算法预测销售额3统计每日用餐人数与销售额有两种方法,即分组聚合法和透视表法。分组聚合是对二维结构化数据中的某个字段(或多个字段)分组,并对组内字段进行汇总的算法。透视表是一种交互式的表,可以进行某些计算,如求和与计数等。统计统计每日用餐人数与每日用餐人数与销销售售额额实现分组聚合有两种方法,使用aggregate函数,或者使用spl

8、it-lapply-cbind模式(分组处理模式)。(1)aggregate函数分组汇总aggregate函数首先将数据进行分组,然后对每一组数据进行函数统计,最后把结果组合成表格并输出。其基本语法如下。aggregate(x, by, FUN)aggregate函数的常用参数及其说明,如表所示。统计统计每日用餐人数与每日用餐人数与销销售售额额1. 分组聚合参数说明x接收聚合的数据对象。表示进行分组的数据。无默认。by接收分组元素的list。表示进行分组的依据。无默认。FUN接收function。表示用于对数据进行汇总统计。无默认,必须要指定。(2)split-lapply-cbind模式分组

9、处理模式split函数把要处理的数据分割成小片断,语法格式如下。split(x, f, drop = FALSE, .)split函数的常用参数及其说明,如表所示。统计统计每日用餐人数与每日用餐人数与销销售售额额1. 分组聚合参数说明x接收vector或data frame。表示待分组的对象。无默认。f接收分组因素。表示进行分组的依据。无默认。(2)split-lapply-cbind模式分组处理模式lapply函数对每个小片断独立进行操作,语法格式如下。lapply (x, FUN, .)lapply函数的常用参数及其说明,如表所示。统计统计每日用餐人数与每日用餐人数与销销售售额额1. 分组

10、聚合参数说明x接收聚合的数据对象。表示进行分组的数据。无默认。FUN接收function。表示用于对数据进行汇总统计。无默认,必须要指定。(2)split-lapply-cbind模式分组处理模式cbind函数把处理后的片断横向合并成新的矩阵,语法格式如下。cbind (x, deparse.level = 1)cbind函数的常用参数及其说明,如表所示。统计统计每日用餐人数与每日用餐人数与销销售售额额1. 分组聚合参数说明x接收待合并的数据对象。表示进行合并的数据。无默认。透视表中所进行的计算与数据在数据透视表中的排列有关。之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照不

11、同方式分析数据,也可以重新安排行号、列标和页字段。每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。统计统计每日用餐人数与每日用餐人数与销销售售额额2. 透视表在R语言中,数据透视表功能主要由reshape2包中的melt和dcast这两个函数实现的。数据整形(reshape)的过程和揉面团有些类似,先将数据通过melt函数将数据揉开,然后再通过dcast函数将数据重塑成想要的形状。melt函数是把宽格式数据转化成长格式数据,其语法格式如下。melt (data, ., na.rm = FALSE, value.name = value)melt函数的常用参数及其说明,如表 所示

12、。统计统计每日用餐人数与每日用餐人数与销销售售额额2. 透视表参数说明data接收data frame、array或list。表示需要转换的对象,不同的对象有不同的转换转换参数。无默认。na.rm接收logical。表示是否从数据集中删除缺失值。默认FALSE。dcast函数是把长格式数据转化成宽格式数据,还可以对数据进行整合,其语法格式如下。dcast (data, formula, fun.aggregate = NULL, ., margins = NULL, subset = NULL, fill = NULL, drop = TRUE, value.var = guess_value

13、(data)dcast函数的常用参数及其说明,如表所示。统计统计每日用餐人数与每日用餐人数与销销售售额额2. 透视表参数说明data接收经melt处理后的data frame。表示转换的对象。无默认。formula接收function。表示进行转换的公式。无默认。根据订单表的数据,统计2016年8月的每日用餐人数与每日销售额,随着日期的改变用餐人数呈现出周期性的变化,观察可知每7天为一个周期。此外,销售额也随着用餐人数的变化而发生增减变化。统计统计每日用餐人数与每日用餐人数与销销售售额额3. 统计结果分析每日用餐人数每日销售额热销度即在一定时间内产品销量的程度。根据订单详情的数据,计算菜品热销

14、度,求得热销度最高的前10个菜品,并得到条形图。统计统计菜品菜品热销热销度度毛利率(Gross Profit Margin)是毛利与销售收入(或营业收入)的占比,其中毛利是菜品单价和与菜品相对应的成本之间的差额。根据菜品详情的数据,计算菜品的毛利率,得出部分菜品的毛利率系数,如表所示。统计统计菜品菜品热销热销度度菜品单价成本毛利率啤酒鸭48250.48清蒸海鱼78550.29辣炒鱿鱼58350.4小炒羊腰36200.44香烤牛排55300.4553度茅台128650.49番茄炖牛腩35200.43培根花菜35150.57油焖麻辣虾65430.341统计餐饮菜品数据目目录录了解餐饮企业分析需求2

15、使用ARIMA算法预测销售额3选取2016年8月1日到2016年8月28日的数据,针对销售额的特征,以天为单位,绘制时序图判断序列的平稳性,如图所示。序列呈上升趋势,且有一定的周期性,属于非平稳序列。检验检验平平稳稳性和性和纯纯随机性随机性1. 平稳性检验对每日销售额序列绘制自相关图,如图所示,可以看出表现出周期性的波动,以7天为周期,数据稳定的上下波动。检验检验平平稳稳性和性和纯纯随机性随机性1. 平稳性检验对每日销售额序列进行一次差分,使其变为平稳的时间序列,并对差分后的序列绘制自相关图,如图所示。可以看出,数据的周期性已消失,自相关系数大部分都在置信区间内,该数据自始至终都在零轴附近波动

16、,属于平稳序列。检验检验平平稳稳性和性和纯纯随机性随机性1. 平稳性检验纯随机序列从统计分析的角度而言,没有任何分析价值,因此需要确定原序列是否为纯随机序列,如表所示。可以看出,因为P值小于显著性水平0.05,所以该序列为非纯随机序列,可以用于建模分析。检验检验平平稳稳性和性和纯纯随机性随机性2. 纯随机性检验检验类型检验函数P值结论纯随机性检验Box.test0.03947该序列不是纯随机序列采用BIC准则进行定阶,绘制原序列的BIC图如图所示。构建构建ARIMA模型模型1. 模型定阶绘制差分后序列的BIC图如图所示。构建构建ARIMA模型模型1. 模型定阶根据BIC图构建90个时间序列模型后,分别用这90个ARIMA模型预测未来3天的数据,并计算平均误差,取平均误差较小的10个模型,每个模型的评价指标如表所示。构建构建ARIMA模型模型2. 模型检验与评估pdqPDQ残差P值平均误差AICBIC2010130.75160.140118409.6212416.93290010130.72510.151768405.8949411.11752011130.68590.151918411

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号