数据挖掘技术在再就业管理中的应用研究

资源描述

《数据挖掘技术在再就业管理中的应用研究》由会员分享，可在线阅读，更多相关《数据挖掘技术在再就业管理中的应用研究（49页珍藏版）》请在金锄头文库上搜索。

1、河北大学硕士学位论文数据挖掘技术在再就业管理中的应用研究姓名：孟媛媛申请学位级别：硕士专业：计算机应用技术指导教师：王煜20100601摘要 I摘要随着信息技术在劳动力市场和社会保障管理方面的广泛应用，各地劳动保障系统中积累了大量的劳动力就业、失业、求职和招工的数据。这些数据是大量的、不完全的，但同时又是非常有用的。数据挖掘技术可以对这些数据进行有效的分析整理，为数据使用者提供及时、有用的信息。本文针对数据挖掘技术如何应用于再就业管理进行了探讨。本文首先介绍了“某市再就业管理系统”的实现，该系统实现了对失业人员、企业、招工等信息的管理；并通过使用 ART 算法和 EM 算法对该系统的

2、数据进行分析，从数据中挖掘出有用的信息。ART 算法是针对连续值预测的回归算法，它将数据分解成主要趋势成分和时间变化成分。应用 ART 算法对 2006 年至 2009 年某市行业招工的时间序列数据进行分析，预测某些行业的劳动力需求趋势。该预测模型可以帮助掌握这些行业对劳动力资源的需求规律，从而有针对地开展职业技能培训，缩小劳动力供需结构的差异，实现劳动力资源的合理优化配置。EM 聚类算法是一种流行的迭代求精算法，可以看作是 k 均值算法的一种扩展，该算法根据对象与簇之间的隶属关系发生的概率来分配对象。本文从某市2007-2008 年登记的失业人员数据中随机选取了 2753 个样本，采用

3、EM 算法聚类对其聚类，并总结不同类别的显著特征。根据这些特征，制定针对性再就业帮扶政策，从而能有的放矢地帮助失业人员实现再就业。本文的分析数据证明了将数据挖掘技术应用于再就业管理的意义，通过数据挖掘获得的预测和分析的结果可以为劳动保障部门制定再就业扶持政策提供前瞻的数据支持。关键词再就业数据挖掘 ART 算法 EM 算法Abstract IIAbstract As information technology is widely applied to labor market and social security management, a large amount of dat

4、a concerning employment, unemployment, job-hunting as well as recruitment, has been accumulated in social security system of various regions. These data are numerous and incomplete, while at the same time they are very useful. Data mining could analyze and sort out these data systematically and effe

5、ctively, providing users with useful and timely information they need. The thesis aims to investigate the issue of how to apply data mining to re-employment management. It firstly introduces “the Re-employment Management System of XX City” which successfully manages data about unemployed people, ent

6、erprises along with recruitment for workers and so forth; by means of ART algorithm and EM algorithm, the system conducts analysis about data from which useful information has be singled out. ART algorithm, a kind of regression algorithm targeting successive value prediction, breaks down the data in

7、to major trend elements and time-variation elements. Through the application of ART algorithm into the analysis of the time sequence data of recruitment in XX City from 2006 to 2009, the trends of labor demand in certain industries can be predicted. This prediction model could help these industries

8、understand the law of demand regarding labor resources, which would facilitate the provision of specific vocational skills training, the addressing of differences between labor supply and demand as well as the optimizing of labor resource distribution. EM clustering algorithm is a popular iterative

9、refinement algorithm which can be regarded as an extension of K-means algorithm. Based on the probability of the occurrence of subordination between objects and clusters, the objects can be allotted by this algorithm. 2753 samples were randomly selected from the data of unemployed people registered

10、from 2007 to 2008 in XX City. As to these samples, EM algorithm is used for clustering and distinct features of different categories are also summed up. With reference to these features, specific polices in relation to re-employment facilitation will be formulated, which would help unemployed people

11、 for re-employment with well-defined objectives. Through the analysis of data in this thesis, the significance of data mining in re-employment management is persuasively illustrated. Moreover, aided by the prediction and findings obtained via data mining, data support could be provided for labor and

12、 social security Abstract IIIdepartment to formulate re-employment facilitation policies. Keywords Re-employment Data Mining ART algorithm EM algorithmhttp:/ 1 章绪论 1第 1 章绪论 1.1 研究背景与研究意义失业是由于劳动力供给与劳动需求在总量和结构上的失衡所形成的，失业是指具有劳动能力并有就业愿望的劳动者处于没有就业岗位的状态。失业作为现代社会中客观存在的经济现象，是市场经济运行过程中资源优化配置的必然结果。当今中

13、国正在进行经济体制转轨和产业结构升级，并且我国经济融入国际化的步伐也进一步加快，由此决定我国未来的失业压力和就业形势将会变得更加严峻。就业问题是关系到我国经济发展和社会政治稳定的一个重大战略问题。随着信息技术在劳动力市场和再就业管理方面的广泛应用，各地劳动系统中积累了大量的劳动力就业、失业、求职和招工的数据。这些数据大部分都没有用武之地，处于闲置不用的状态，浪费人力、物力、财力。如何应用这些大量的历史数据，从中挖掘出有用的知识，应用到再就业工作中是目前迫切需要的。以往关于再就业方面的研究大多集中在社会保障制度层面，忽略了微观应用层面的研究。目前已有人在这方面进行了探索性的研究，但方法

14、还不成熟，应用面也较窄。将先进的数据挖掘技术应用到再就业指导工作中，探索更有效的分析预测方法显得十分必要。本课题以某市再就业管理系统数据为基础，应用数据挖掘技术在对行业劳动力需求预测和失业人员类别分析这两方面作出了尝试。为优化再就业资源配置、再就业政策的制定和实施提供了前瞻的数据支持。 1.2 研究现状目前使用的劳动力需求预测方法可分为定性预测法和定量预测法。定性预测法就是以给定的概念、原理为基础，分析并推断所预测对象的性质、特点以及未来发展的一般趋势。定性预测法主要有专家调查法、类比法、主观概率法等1。专家调查法(Delphi method)是收集整理专家们对同一问题的意见，根据这些意

15、见判断并作出决策的一种系统分析方法，也叫做德尔斐法。这种方法提及的专家是指有那些具有理论知识和实践经验的各方面专家。这种方法主要靠主观判断和粗略估计来确定问题，适合于研究资料较少、而未知因素又多的情况，较多地应用于长期预测和动态预测。专家调查法的主要缺点是过程比较复杂，花费时间较长。类比法(analogy)是指根据不同事例的异同而就事例http:/ 2的相同或类似方面所进行的推理，即类比推理。任何两个事物即使是相同的一类它们也会有不同之处，因此从它们的已知的相同或类似方面去断定某一未知方面的相同或类似，得到的结构不是必然的。因此这种类比有的时候会得到证实，有的时候就会被推翻。所以，类比

16、推理一般不能提供确实可靠的论据或前提。主观概率法(Subjective probability)是以一定条件为前提，对未来事件发生可能性大小的一种主观相信程度的度量。人们根据长期积累的经验和对预测事件的了解，对发生的可能性的大小可以作出一种主观估计。将各种预测意见进行集中整理，得出综合性预测结果的方法就是主观概率预测法。以上这些方法简单，预测费用比较低，但预测精度不高，效果不好。定量预测法主要是通过预测变量的数值测度来说明预测对象的未来发展。在引导失业人员再就业过程中，有必要对各行业劳动力需求走势进行分析预测，进而引导失业人员再就业方向。将定量预测应用于劳动力需求预测中，能深入反映产业结构内部的、复杂的、动态的变化特征。能为就业决策提供确切的数量界限和科学根据。目前有一些使用数据挖掘的方法对这方面的研究2，但是方法还不成熟，应用范围也不广泛。需要投入更多的技术力量对其进行研究

展开阅读全文