第三讲-逻辑回归

上传人:pu****.1 文档编号:567591426 上传时间:2024-07-21 格式:PPT 页数:33 大小:851.51KB
返回 下载 相关 举报
第三讲-逻辑回归_第1页
第1页 / 共33页
第三讲-逻辑回归_第2页
第2页 / 共33页
第三讲-逻辑回归_第3页
第3页 / 共33页
第三讲-逻辑回归_第4页
第4页 / 共33页
第三讲-逻辑回归_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《第三讲-逻辑回归》由会员分享,可在线阅读,更多相关《第三讲-逻辑回归(33页珍藏版)》请在金锄头文库上搜索。

1、第三讲二项逻辑回归以上市企业特别处理以上市企业特别处理STST为例为例一、二项逻辑(BinaryLogisitic)回归 二二项项逻逻辑辑斯斯蒂蒂回回归归是是可可以以用用来来预预测测具具有有两两分分特特点点的的因因变变量量概概率率的的统统计计方方法法,它它适适用用于于判判断断一一些些事事情情将将是是发发生生还还是是不不发发生生,某某个个候候选选人人将将当当选选还还是是不不当选,某个人容易患某种病还是不容易患该病等等。当选,某个人容易患某种病还是不容易患该病等等。 与与前前面面线线性性回回归归和和方方差差分分析析中中因因变变量量为为数数值值型型变变量量不不同同,二二项项逻逻辑辑回回归归中中的的因

2、因变变量量具具有有两两分分特特点点。即即:因因变变量量只只有有两两个个值值发发生生(是是)或或不不发发生生(否)。(否)。 数据要求数据要求 因变量应具有二分特点,保证因变量的取值为因变量应具有二分特点,保证因变量的取值为0 0或或1 1; 自自变变量量可可以以是是分分类类变变量量或或数数值值变变量量,如如果果为为分分类类变变量量,应应为为二二分分变变量量或或被被重重新新编编码码的的指指示示变变量量,如如果果为为数数值值变变量量,最最好为多元正态分布。好为多元正态分布。LogisticLogistic模型模型 预测观测量相对于某一事件的发生概率:预测观测量相对于某一事件的发生概率: 某一事件不

3、发生的概率:某一事件不发生的概率:prob(no event)=1-prob(event)prob(no event)=1-prob(event)LogisticLogistic回归系数回归系数 模型回归使用极大似然比法和迭代方法模型回归使用极大似然比法和迭代方法评价模型评价模型判断拟合的优劣判断拟合的优劣 1. 1.模型的拟合度模型的拟合度 2. 2.系数检验系数检验 3. 3.影响点的查找影响点的查找 4. 4.交互项交互项二、案例背景介绍 特特别别处处理理(special special treatment,STtreatment,ST)政政策策是是我我国股市持有的一项旨在保护投资者利益

4、的政策。国股市持有的一项旨在保护投资者利益的政策。 被被特特别别处处理理的的股股票票每每日日涨涨跌跌幅幅度度是是受受到到限限制制的的,对对被被特特别别处处理理的的股股票票证证监监会会要要求求在在原原股股票票名名称称之之前前加上加上“STST”, ,以作提醒。以作提醒。上上海海证证券券交交易易所所股股票票上上市市规规则则关关于于特特别别处处理理的的详细规定:详细规定:相关参考文献相关参考文献ST政策的后果股票涨跌幅度被限制在股票涨跌幅度被限制在5%5%以内;以内;持续亏损可能会被退市;持续亏损可能会被退市;误导投资者误导投资者影响企业正常经营影响企业正常经营我们更关心:我们更关心: 企业怎么避免

5、由于被企业怎么避免由于被STST面临着的退市风险?面临着的退市风险? 投资者怎么能察觉什么样的企业更有可能被投资者怎么能察觉什么样的企业更有可能被ST?ST?三、数据介绍我国股市的我国股市的STST状况状况大股东占款行为同企业大股东占款行为同企业STST的关系的关系数据说明数据说明 数据来源于某商业数据库;数据来源于某商业数据库; ST ST的样本是在第的样本是在第t t年被年被STST的深沪两市公司;的深沪两市公司; 相相应应的的财财务务指指标标(解解释释变变量量)取取自自于于第第t-3t-3年年,即被即被STST之前第三年的数据之前第三年的数据因因变变量量为为该该企企业业的的STST状状态

6、态,即即STST或或非非STST。(二二分分特点)特点) 定义定义Y=0Y=0表示非表示非ST,ST,定义定义Y=1Y=1表示表示STST。 如如果果因因变变量量是是取取值值多多个个的的定定性性变变量量,逻逻辑辑回回归归不不再适用,应该考虑多分变量的逻辑斯谛回归。再适用,应该考虑多分变量的逻辑斯谛回归。四、指标设计1.ARA1.ARA(X X1 1) 应收账款与总资产的比例,反映盈利质量;应收账款与总资产的比例,反映盈利质量;2.ASSET2.ASSET(X X2 2) 对数变换后的资产规模,反映公司规模;对数变换后的资产规模,反映公司规模;3.ATO3.ATO(X X3 3) 资产周转率,量

7、化一个企业对资产的利用效率;资产周转率,量化一个企业对资产的利用效率;4.ROA4.ROA(X X4 4) 资资产产收收益益率率,反反映映每每单单位位资资产产能能够够给给企企业业带带来来的利润如何;的利润如何;5.GROWTH5.GROWTH(X X5 5) 销售收入增长率,反映企业的增长速度;销售收入增长率,反映企业的增长速度;6.LEV6.LEV(X X6 6) 债债务务资资产产比比率率,也也称称杠杠杆杆比比率率。反反映映企企业业总总资资产中来自于债权人的比率;产中来自于债权人的比率;7.SHARE7.SHARE(X X7 7) 企企业业第第一一大大股股东东的的持持股股比比率率,反反映映该

8、该企企业业的的股权结构。股权结构。统计数据五、描述分析单变量描述分析单变量描述分析变量分组对比的描述分析(盒状图)变量分组对比的描述分析(盒状图)分类表分类表(a)(,)(b)ST已观测0步骤 0ST0648136报告报告STARAASSETATOROAGROWTHLEV0均值9.06034667762E-22.0773459460E1.5254105.66334496049E-21.23044284216E-14.01843469995E-1N648648648648648648标准差.0867357096138.32429628045E-1.3676712.037417359210.299

9、471209170.164487412034中值6.63429700000E-22.0688101150E1.4345505.20196415000E-21.06396773000E-14.02690387000E-1极小值.00000000018.66070036.0028.000081700-.950727316.018431070极大值.63468424924.017610753.1513.311129979.998556503.9803217521均值1.75077078583E-12.0856945577E1.4183144.21299924167E-2-2.49055246111E

10、-24.82025133222E-1N363636363636标准差.1420789105518.61102914854E-1.2424995.054591871362.400322588476.172601603908中值1.39242836500E-12.0816099460E1.3911002.56733655000E-2-1.18810779000E-15.04284161500E-1极小值.01191061519.07363796.0824.001052306-.816703929.138105086极大值.53359089323.48809660.9212.235083859.89

11、9764378.793781313总计均值9.50494463450E-22.0777853466E1.5197745.58701097529E-21.15257452173E-14.06063557534E-1N684684684684684684标准差.0922893115688.33523222911E-1.3628265.038593910305.307020050078.165763968255中值6.83271815000E-22.0700502790E1.4334005.12579800000E-21.02282637500E-14.06739738000E-1极小值.00000

12、000018.66070036.0028.000081700-.950727316.018431070极大值.63468424924.017610753.1513.311129979.998556503.980321752六、统计模型STST概率概率似然函数似然函数方方 程程 中中的变量的变量BS.E,WalsdfSig.步骤 1aARA4.8801.49210.6901.001ASSET.247.2241.2111.271ATO-.507.657.5961.440ROA-.6376.224.0101.919GROWTH-.833.5672.1601.142LEV2.3541.2013.840

13、1.050SHARE-.011.011.9931.319常量-8.8694.6363.6601.056a. 在步骤 1 中输入的变量: ARA, ASSET, ATO, ROA, GROWTH,LEV, SHARE.统计学推断统计学推断全局检验:全局检验: 离差(离差(DEVDEV), ,似然比检验(卡方分布)似然比检验(卡方分布)局部检验:局部检验:七、预测评估预测模型预测模型预测评估预测评估最优预测规则最优预测规则分分类表表a 已观测已观测已预测已预测 ST百分比校百分比校正正 01步步骤 ST0647199.813512.8总计百分比总计百分比 94.7a. 切割值为切割值为0.5TPR

14、和和FPR如如何何平平衡衡不不是是一一个个容容易易的的问题,需需要要根根据据实际工工作作需要需要选取适当的取适当的临界界值,使得,使得总损失最小化失最小化分分类表表a 已观测已观测已预测已预测 ST百分百分比校比校正正 01步步骤 ST046418471.61112569.4总计百分总计百分比比 71.5a. 七、分析报告课后练习移动通信客户流失规律分析移动通信客户流失规律分析1.1.研究目的研究目的 通通过过对对某某移移动动通通信信公公司司客客户户的的流流失失数数据据分分析析,了了解解客客户户流失规律,建立流失预警系统,为客户关系管理服务。流失规律,建立流失预警系统,为客户关系管理服务。2.2.数据介绍数据介绍 某某年年度度随随机机抽抽取取的的10001000个个移移动动通通信信客客户户。因因变变量量时时他他们们来来年年的的流流失失行行为为。采采集集指指标标:客客户户等等级级:1,2,3,41,2,3,4;主主叫叫次次数数(% %):7 7日日内内日日均均主主叫叫次次数数/90/90日日内内日日均均主主叫叫次次数数;被被叫叫次次数数(% %);通话时长();通话时长(% %);费用();费用(% %)3.3.作业要求作业要求 理理解解客客户户流流失失对对企企业业的的重重大大意意义义,做做完完整整的的逻逻辑辑回回归归分分析析,汇总成简短研究报告汇总成简短研究报告

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号