一个医保基金风险防控平台中的数据挖掘技术

上传人:第*** 文档编号:32840930 上传时间:2018-02-12 格式:DOC 页数:3 大小:638.50KB
返回 下载 相关 举报
一个医保基金风险防控平台中的数据挖掘技术_第1页
第1页 / 共3页
一个医保基金风险防控平台中的数据挖掘技术_第2页
第2页 / 共3页
一个医保基金风险防控平台中的数据挖掘技术_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《一个医保基金风险防控平台中的数据挖掘技术》由会员分享,可在线阅读,更多相关《一个医保基金风险防控平台中的数据挖掘技术(3页珍藏版)》请在金锄头文库上搜索。

1、一个医保基金风险防控平台中的数据挖掘技术摘要 针对医保基金管理的关键环节和基金风险的主要因素,从医保业务出发,开 发了相应的数据挖掘算法,构建医保基金风险防控的模型库和方法库,实现政策 风险、运 营风险、供需矛盾风险和违规欺诈风险防控。通过实施验证、不断修正并 应用、影响于医保业务系统,从而全面建立与医保改革和管理相适应的医保基金风险防控机制,与日常运行的医保 业务系统共同构成了基金运营、监 控的良性循环, 为医保基金 风险防控系统的建设、实施奠定基础并提供借鉴意义。关键词 数据挖掘 医保 风险防控The Application and Realization on a Medical-Ins

2、urance-Fund Risk-Prevention Data Mining TechniquesAbstract Aiming at the key steps of medical-insurance-fund management and critical factors of risk, this paper constructs a new medical-insurance-fund risk prevention platform. In this platform, we realized the collection and integration of multiple

3、data sources in medical-insurance area, built a data warehouse for fund risk prevention, and developed data mining algorithms. The practical application shows that the platform is effective and efficient for risk prevention. Keywords Data Mining Medical-Insurance Risk-Prevention0 引言社会医疗保险制度作为社会保障体系的

4、有机组成部分之一,对保障公民基本医疗、促进社会公平和维护社会稳定有着重要意义。随着国民收入的增加和医疗保险覆盖面的扩大,医保基金规模不断增大。医疗保险由于其自身特点,逐渐面临着一系列突出问题,如我国人口老龄化、疾病谱改变、新医疗技术的采用和医疗需求的增长等原因造成医疗费用增长迅速,对医保基金形成了较大压力。然而,医保特有的复杂的委托代理关系和严重的信息不对称,使医疗费用控制难度加大,医保基金被浪费、骗取、挪用等现象不同程度地存在,损害了医保基金的使用效果和效率。因此,为维护参保人的基本医疗保险权益,减少浪费,促进医保制度可持续发展,加强医保基金支付控制、增强医保基金风险监控已成为非常紧迫的现实

5、问题。医保基金管理是一项复杂的工程,涉及面广、数据量大,除管理参保人,还涉及各级医疗机构;要负责个人账户的建立和使用,还要负责基本医疗保险费的征收、管理和支付,并对基金的使用进行监督1。如何从复杂的海量数据中得到有价值的信息,从而指导决策是需要解决的关键问题。本文针对医保基金管理的主要环节,研究医保基金风险的主要影响因素,设计实现了多种数据挖掘算法,建立了相应的数据挖掘方法库/模型库,使医保基金风险防控从过去的事后稽查变为“事前预测、事中监控、事后稽查”全过程的控制,对有效防范医保基金风险起到支撑作用,为有效控制基金风险提供指导,对医保基金的运营和监控具有重要作用。 1 相关工作控制医疗保险基

6、金风险是世界各国一直努力解决的难题。发达国家的医疗保险基金风险控制工作起步较早,例如德国在80 年代建立了医保预测预警系统,由于建立时间长,覆盖范围广,征缴严格,基金收入环节存在的问题相对较少,预测预警的重点主要集中在支出上2。但最为关键的是借助计算机应用系统开展实时监测和预警分析。我国社会医保工作开展较晚,从某种意义上讲,对医保基金的管理缺乏一定的理论指导。受认识、技术以及数据等方面限制,国内在这方面的研究不多,更没有成熟的软件开发和应用3 。国内目前已有的研究,主要从医保基金收支监测、简单指标预警等方面开展基金风险管理工作,在医保基金预测预警建模方面,仍处于起步阶段,一些相关研究缺乏系统性

7、和深度。目前有些地区也开发了一些控制或监控费用的系统,虽然部分实现了费用监控功能,但仍存在一些不足:1)由于系统建设的目的并不主要是费用监控,监控的效果非常有限。2)采用的实现技术并不适合医保费用监控业务。从长远看,医保基金管理仍面临着巨大压力,潜在因素主要有:1)医疗服务需求随经济增长水平而大幅度提升,当经济增长趋缓时,医疗需求增长的刚性仍然不变;2)新技术运用对医疗卫生费用增长的作用凸显;3)城市人口老龄化趋势越趋明显;4)医疗价格的增长和医院的利益驱动,造成医疗费用持续增长。针对医保基金风险防控问题,上海已积累约10 年的基础业务数据;医药机构对医保中心系统账务的可信性和数据采集代码规范

8、性的认可程度较高,形成上海地区医疗卫生行业信息处理事实上的部分规范和标准;已建立了一套基础性的统计分析报表体系、数据随机查询功能,审核监督已依托计算机筛选数据展开运作。因此,我们已经具有了丰富的数据基础和业务领域知识,为有效利用数据资源,减缓医保基金风险管理的压力,我们采用数据挖掘技术,针对风险防控需求收稿日期: 2010-03-31。上海市科委科研计划基金项目(08511500203) ,上海市重点学科建设项目(B114)。高臻耀,主任,主要研究领域:数据挖掘,数据仓库2:一个医保基金风险防控平台中的数据挖掘技术和数据特点设计并实现了医保基金风险防控平台中的数据挖掘方法库/模型库。实际应用表

9、明,其对防控医保基金风险取得了良好效果。2 医保基金风险防控平台医保基金面临的风险因素多种多样,主要包括政策因素、运营因素、供需矛盾因素、违规欺诈因素和运行支撑因素等。针对以上风险因素,医保基金风险防控平台主要涉及政策风险、运营风险、供需矛盾风险、违规欺诈风险防控四个方面。医保基金风险防控平台针对监控对象设置预警、报警规则,建立预警、报警系统,使业务人员和决策层及时了解基金收支、基金运营中潜在的风险,提高监控效率。其主要功能有:1) 在数据仓库逻辑模型上,设计业务数据到“业务大集中库”再到数据仓库的 ETL 过程的调整及优化,在实施上探索在部分数据集市上做到实时或准实时(T+0,或仅相差几小时

10、)动态数据仓库。在线分析业务从高层次的汇总表到具体明细数据的连结。2) 加强基金运营风险的管理,在收入分析方面,在考虑人口变动(不同险种、不同人群筹资比例,含人口老龄化预测)、收入预测(宏观经济),退休政策变动(退休年龄,在职退休比)等影响因素的的基础上,对筹资进行分析及预测;在支出分析方面,根据以收定支的原则,对医保基金支付趋势及预测、逐月的医保支付、缓付的计算、医保基金支付预警、基金支付方式分析、测算、各种支付方式的分析。3) 针对部分医疗机构、医师、参保人员由于利益驱动造成医保医药费用浪费等违规欺诈行为,监控其在门急诊、住院挂号、用药、检查、治疗、收费等可能存在漏洞指标数据,建立各种违规

11、筛选模型,为审核监督提供重点监督管理对象,提高审核监督力度和效率。同时,建立参保者个人、定点医药机构、定点医生相关信息档案,并进行综合评分,为充分了解不同参保人员的情况,选择定点医药机构及其医生提供科学依据。4) 为医保政策调控提供模拟测算平台,主要针对现有政策调整(微调):帐户注入定额、三条线调整、支付比例调整等的测算。使决策层充分了解政策调控所涉及的人群、费用、医疗等多方面的信息,为政策调控提供可靠依据。5) 客户管理及信息评估。对参保个人考虑医保待遇、缴费情况、健康状况、违规行为评估等指标;对定点医药机构考虑服务范围、服务量、服务能力、服务质量、违规评估等指标;对定点医生考虑服务能力、服

12、务质量、违规情况评估等指标。3 医保基金风险防控数据挖掘模型与算法针对医保基金风险防控管理的需求,结合医保行业的领域知识、经验以及特殊的数据分析需求,我们设计和实现了具有针对性的医保基金风险防控数据挖掘算法,构建针对医保基金风险防控的数据挖掘方法库/模型库,实现对医保数据的挖掘分析,有效支持医保基金风险防控平台的预测和处理,有利于医保基金风险防控平台对日常业务数据进行更有效的实时监控。 医保结算费用预测模型采用时间序列预测方法-ARIMA(AutoRegression Integrated Moving Average,自动回归整合移动平均)模型,建立医保结算费用预测模型,实现对医保结算总费用

13、的预测,并能详细到各区县,各级别医院医保结算费用的预测,为医保基金监管提供方向。医保结算费用预测数据模型导入的数据包括各医院每月结算费用、医保支付费用和总控内医保支付费用。在预测过程中实施平稳性检测、差分处理、白噪声检测、拟合预测模型、序列预测几个关键技术,实现对未来三期的时间序列预测。具体实施分以下步骤:i.从数据仓库应用数据模型中获取医保结算费用的时间序列数据;ii.对医保结算费用时间序列做平稳性检测,若无法通过平稳性检测,则对结算费用序列实施差分处理,即转步骤 iii),否则进行白躁声检测,即转步骤 iv);iii.对结算费用序列作差分处理直到序列平稳化;iv.对差分后序列进行白噪声检测

14、。通过白噪声检测则生成模型,否则使用模型建摸,即转步骤 v);v.使用 ARMA 模型建模非白噪声序列;vi.生成 ARIMA 拟合预测模型;vii. 根据最终拟合模型对医保结算费用进行预测。医保风险评估(参保人类别管理)模型设计聚类算法实现对参保人的经济情况、健康状况和信用情况聚类,为参保人的分类提供依据。并且,随着参保人数据的更新,需要多次应用该模型进行聚类以调整类别信息。我们选择的聚类方法有 K-均值(Means)和 K-中心点(Centroid)方法。这些方法均可指定生成簇个数的区间。最终通过实验验证,选择了适合医保数据的实际情况,并且聚类结果较好的 Ward 聚类算法。根据医保数据实

15、验结果表明,由于数据量大,数据点十分密集,平均值点和中心点差别非常小,Ward 方法是改进的 k 中心点方法,将医保参保人聚合成多个簇,其中每个簇中参保人具有较大的相似特征,而分属不同簇的参保人则存在明显的特征差异,成簇效果佳,用户容易解释。医保信用评估模型在对参保人的经济情况、健康状况和信用情况聚类完成后,利用聚类结果作为训练集,构建参保人分类模型,生成分类规则,实现对参保人所属类别的确定,即指定该参保人所属的健康、经济类别以及按信用情况划分的信用等级等等。我们采用决策树算法,算法采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,最后在决策树

16、的叶结点得到结论。因此从根到叶结点的一条路径就对应着一条合取规则,而整棵决策树就对应着一组析取表达式规则。考虑到随着时间的变化,参保人数据的更新,分类规则不会一成不变,即聚类结果的不同造成训练集的变化,需要重新建立参保人分类模型以产生新的分类规则,达到对参保人新的经济、健康和信用等级进行有效分类。就医聚集行为挖掘医保就医聚集行为通常表现为在医院就医时,多张医保卡过于频繁地同时同地消费。这种就医聚集现象可能是由于某些特殊人群如某些慢性病人需要频繁就医造成的自然聚集现象,也有可能存在违规的倾向:某人持多张医保卡同时消费。找出这些具有就医聚集行为的人群一方面能够对特殊疾病人群提供针对性的管理和服务,另一方面能有效提高对违规人群的监督力度。我们可以将就医聚集行为的表现形式简化为某种一致性:在就医时多张医保卡在同一时间段内(我们细化为一天)在同一个医保基金风险防控平台中的数据挖掘技术 3一家医院就医。这些医保卡若一致性消费过于频繁则可以认为是一种异常现象,将被列为重点监管对象。我们设计一个一致行为挖掘算法实现此类人群。算法采用模式

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号