基于随机森林的上市公司财务风险预警分析报告

上传人:汽*** 文档编号:561707141 上传时间:2022-08-22 格式:DOC 页数:22 大小:379KB
返回 下载 相关 举报
基于随机森林的上市公司财务风险预警分析报告_第1页
第1页 / 共22页
基于随机森林的上市公司财务风险预警分析报告_第2页
第2页 / 共22页
基于随机森林的上市公司财务风险预警分析报告_第3页
第3页 / 共22页
基于随机森林的上市公司财务风险预警分析报告_第4页
第4页 / 共22页
基于随机森林的上市公司财务风险预警分析报告_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《基于随机森林的上市公司财务风险预警分析报告》由会员分享,可在线阅读,更多相关《基于随机森林的上市公司财务风险预警分析报告(22页珍藏版)》请在金锄头文库上搜索。

1、 基于随机森林的上市公司财务危机预警分析中央财经大学 翰林、王开骏、幽篁摘要 本文在现有对上市公司财务分析技术的基础上,借助于杜邦分析系统的思路,对影响上市公司运营状况的财务变量进行了系统的分析和筛选。通过随机森林算法建立了对上市公司财务危机预测(以ST为标志)的模型,并对两类分类误差的权衡进行了分析,给出了变量对分类的重要性排序。其次分类效果的反馈验证了财务变量选取的有效性。同时,相比于国学者类似研究,本文在分类误差上得到了更高的精度。在灵敏度分析中,针对两类误差权重设定、训练集合样本数量、两类样本抽样比率对分类精度的影响进行了深入的讨论,并给出了有助于提高分类精度的适应性方法。最后通过GI

2、CS对划分行业后的样本进行了分类,对不同行业单独应用随机森林算法,得出了更好的分类精度,验证了行业的差异性以与行业划分的必要性。关键字:财务危机 ST 随机森林 一、 引言市场经济作为竞争型的经济制度,在优胜劣汰的规律下,促进了企业生产、经营的效率和效益,同时也加速了落后企业的破产。这种竞争机制从宏观层面看,通过淘汰在当下经济环境里无法适应市场需求和发展的企业,从而成就了资源的效率最大化。但从微观层面看,若企业在竞争中出于劣势或与市场规律不兼容,企业往往陷入财务危机,由此引发的破产风险也意味着利益相关者的损失。因此基于市场经济导向性,企业经营风险以与其利益相关者的考虑,资本市场有必要发展一种自

3、我评估技术以分析企业的经营能力。对企业自身来说,一种有效的分析和预警机制可以管理和控制风险并对企业经营策略进行与时的调整与改进;对投资者而言,投资者可以以此技术分析对上市公司的投资风险,确保投资盈利;对银行等债权人而言,可以评估借款企业的信用风险、确定借款利率并跟踪贷款公司违约风险。一般来说,财务危机是指企业无力按时偿还到期的无争议的债务的困难与危机。Altman (1968)认为“企业失败包括在法律上的破产、被接管和重组等”,其实质是把财务危机等同于企业破产,这是最准确也是最极端的标准;Beaver (1966)认为“银行透支、未支付优先股鼓励、债券违约”为财务危机之标志;Carmichae

4、l (1972)认为企业财务危机是由于流动性不足、权益不足、债务拖欠等因素;而Ross等人则认为“财务危机指企业经营性现金流量不足以抵偿到期债务”。总上所述,企业陷入财务困境的主要原因是盈利能力不足,可持续经营能力下降从而导致企业违约可能性增加。我国学者以与法律法规对财务危机没有像上述如此鲜明的定义和界定。其次,由于信息不对称,即管理者与企业自身信息、投资者、债权人与管理者的获取信息差异,企业在何时、何种情况下发生财务危机也不得而知。同时,企业陷入财务困境是一个动态、连续的过程而并非简单地划分为陷入财务困境和没有陷入财务困境两种类别。再次,中国资本市场发展较晚,还没有形成自己的规律和特点,导致

5、学者无法准确挖掘中国企业财务危机的本质。在本篇实证研究论文中,我们需要可以观测到的标准来确定样本属性,即某一时刻的某一上市公司的财务状况以与是否发生财务危机。鉴于定义财务危机的困难以与所得上市公司年度财务数据的属性,我们认为财务危机的标志为沪深两市的上市公司因财务状况异常而被“特别处理(ST)”。这样界定财务危机的具体原因是:我国资本市场尚无一家上市公司破产清算,以外国部分学者提出的以破产为标准不合适;上市公司是否被ST具有可测性,信息来源可靠;被ST的绝大数上市公司是因为连续两年在年度报表中表现出连续亏损或最近一年的每股净资产低于每股面值,或者同时出现两种情况,这说明是否ST对上市公司的财务

6、状况有非常良好的概括性和解释能力,在很大程度上度量了财务危机。因此本文对财务危机的研究也以被ST的上市公司展开。这种对财务危机的界定方式在国类似分析中比较主流,如静(1999),玲(2000),鸣(2005)等。国外学者对财务危机的分析研究主要基于财务报表分析,其具体方法是研究会计变量、会计比率对公司财务的影响。研究结果发现财务危机是否会发生很大程度体现在财务比率上,如Smith and Winakor。一般国外的方法如下:(1)单变量分析:Fitzpartrick(1932)应用单个财务比率将样本划为破产和非破产两组并将其配对,最终发现判别能力最高的是权益收益率(ROE)和资本结构(权益负债

7、率)两个会计指标。(2)一元判别分析:Beaver对1954-1964年间的79家财务失败企业和79加持续经营的企业的30个财务比率进行了研究,并认为:现金债务比、资产收益率、资产负债率对预测财务危机是有效的,而现金债务比预测效果最好,预测的准确率达80%以上。但该指标对持续经营企业预测的准确率高于财务失败企业,在一定程度上影响了模型的优越性。(3)多元判别分析:Altman选取了1946-1965年间规模相似的的33家破产和持续经营公司为样本并配对从企业变现能力、偿债能力、盈利能力、发展能力、变现能力五个方面的的财务比率中选取了营运资本/总资产、留存收益/总资产、息税前收益/总资产、股票市值

8、/负债账面价值和销售收入/总资产五个指标建立了Z-Score模型,并在1977提出改进的ZETA模型。ZETA模型选用了资产收益率(ROA)、盈利波动率、流动比率、资本化率和总资产作为指标,分别表示企业的各种特征,最终ZETA模型得到广泛的认可和应用。(4)Logit模型:Ohlson(1980)采用Logit模型,应用Logistic函数进行回归分析,并引进了与公司特征有关的哑变量。他的具体做法是通过回归分析得出公司财务危机的概率测度,并通过此概率判断公司的经营风险。此模型在预测能力和稳健性具有显著的优越性。国学者使用的研究方法主要与国外的方法一样,主要差别是选取的财务指标不同。具体所选指标

9、如下表1所示。表1 历史研究中选取的指标一览 学者 财务指标静(1999)玲(2000)吴世农(2001)薛峰(2003)每股净利润每股净资产资产收益率权益报酬率*主营业务利润率总资产周转率资产负债率总资产增长率流动比率长期负债/股东权益营运资本/总资产盈利增长指数留存收益/总资产*在不同学者的研究中,同一财务指标的计算方法、名称可能不同。二、 本文研究方法介绍(一) 随机森林综述在本文的研究中,使用数据挖掘技术中的随机森林算法。随机森林方法本质是根据训练集合种植大量的决策树,并对所有决策树的预测结果进行投票从而选出被最高频率预测到的结果。在建立决策树过程中,属性的选择指标设定为Gini指标。

10、Gini指标所谓决策树创造的基本思想是:在对所有属性遍历的可能的分割方法中,若一种方法能使得Gini最小,就选择该分割方式作为此节点的分割标准,并在进行分割以后生成的节点根据每一个属性创建树枝,直至满足条件为止。随机森林的特点是建立多株决策树时,为第k棵决策树生成随机向量,且独立同分布于前面的随机向量,。用训练集和随机向量生成一棵决策树,得到分类模型h(X,),其中X为输入变量(自变量)。通过上述方法构造不同训练集增加分类模型间的差异,可提高组合分类模型的外推预测能力。k轮训练后,可以得到一个分类模型序列(X),(X),(X),再用它们构成一个多分类模型系统,该系统的最终分类结果采用简单多数投

11、票法。最终的分类决策:其中,表示组合分类模型,是单个决策树分类模型,Y表示输出变量(或称目标变量),I()为示性函数。该式说明了使用多数投票决策的方式来确定最终的分类。可以证明,随机森林的预测误差(其中X,Y表示是在X,Y测度上的分布;mg为投票的边际函数,为实际应分到的类别所得票数与最大票数的差)会收敛到:该预测误差PE=由切比雪夫不等式可知其中s被定义为分类器组合的强度,),并最终可以证明PE的最大值不超过,其中为随机向量间的相关系数。随机森林算法的优点有:精度高、能处理大量数据;在分类过程中给出变量优越性的估计;存在大量的数据缺失时仍保证精度;运算速度快、不会产生过度拟合。在分析财务危机

12、时,随机森林算法需要的数据有:1998年到2009年混合行业的被ST和正常经营的上市公司;将上市公司分成五个主要行业类别,1998年到2009年的被ST和正常经营的上市公司(用于行业分类下的随机森林算法)。基于对前人研究的思考和我们的分析和财务观点,本文选取了一组不同层次的财务指标作为数据集合。所谓不同层次,即反映整体运营水平的一般性指标和反映运营细节的具体指标。财务指标的选取在下文有详细的分析。(二) 财务指标选取前人研究财务危机时,主要用到财务比率对公司财务状况(是否ST, 在国外的研究中则是是否破产)的回归分析,其选取的指标,根据归纳,基本是反映上市公司总体经营状况的传统财务比率,如资产

13、利润率、权益报酬率、资产负债率等。前人通过对这些指标与公司财务危机的关系的研究,都得到了很好的预测精度。这些指标在公司陷入财务危机时能以很高的正确率将财务异常公司从正常公司中区分出来,因为这些指标与上市公司是否被ST有非常强的相关性。比如,根据ST的定义,连续两个会计年度亏损的上市公司会被ST。这就说明收益指标与公司是否被ST有直接关系。因此,在我们的分析模型中,这些传统指标也优先纳入考虑。在本文的研究中,称这一类指标为一级指标。通过进一步研究发现:虽然上市公司陷入财务危机的原因基本一样(流动性危机、盈利能力下降等),但仅仅依靠少数反映总体情况的财务指标是难以解释上市公司财务危机的。即使个别指

14、标可以有效地将被ST上市公司与正常上市公司区分开来,这些指标也会由于过于笼统而出现解释能力不足的情况。比如若我们只选用资产利润率(衡量单位资产盈利能力的财务比率),我们可以得到较准确的分类,但由于这个指标具有很强的概括性和标志性,我们无法得知某个特定上司公司经营状况的细节,也无法预知这个上市公司在生产运营中的缺陷,比如销售利润率过低,资金周转率低等。同时,这些传统指标也会无法蕴含充分的公司财务信息,无法将上市公司运营的具体情况表现出来。因此,当这种情况存在于某一上市公司时,早期表面的盈利很可能会隐藏企业营运中存在的风险(流动性风险、营业成本过高等),而忽略这些细节将使我们因为未发掘公司潜在的营

15、运风险而牺牲了自己的投资。对于这个问题,国的学者目前还没有过充分的研究。在我们的分析中,基于杜邦分析系统的思想,我们将这些反映总体经营水平的指标按一定方法分解为一些反映公司运营情中体现具体某一个方面的指标,增加体现公司财务状况的信息量。我们称这一类指标为二级指标。从指标象征属性的方面考虑,国主流的研究仅仅考虑“静态”的财务比率,如资产负债率等,而忽略“流量”等统计数据,如现金比率、营运资本等;从会计实务角度来看,我国从1998年才引进现金流量表。而Deakin(1972)研究发现与现金流等动态财务数据的指标也对公司财务状况分析起着重要的作用。Gentry, Newbold和Whiteford (GN&W)基于传统静态财务指标和现金流指标建模并得到同样的结论。我们的分析认为动态指标意味着公司的运转效率,在某些方面比静态财务指标有更强的解释和预警能力。因此,在国学者的基础上,我们也将这些指标纳入模型。具体指标分类见表2与表3。表2 指标按等级分类指标性质一级指标二级指标偿债能力资产负债率、资本结构现金比率、流动比率、速动比率、权益乘数经营效率总资产周转率净营运资本/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号