大规模招生考试相关数据分析总体上数据分析维度有科类、科目(组)、性别、阶层、地区、城乡、中学(星级)、批次、分数(段、等级)、年龄、学历、职业等,视具体招考类型和主题而定一、普高招生考试可以录取系统数据库为基准,系统中 t_库为事实表,td_ 库为维表考生主题(考生库或考籍库):报名信息(含从基教学籍系统提取的数据)、参加各类考试的信息(含缴费)、诚信考试情况、指纹,考试推荐考生数量发展主题:主要用于从各个角度分析考生的发展情况,可用的源数据主要为考生基本信息,涉及到的度量值有考生人数,各类不同社会属性(性别、区域、城乡、科类)人数比重.命题主题:信度、难度、区分度、效度以及所反映的科学性、公平性、平稳性,内容/能力双向细目表,预估/实测(题目、题型、内容)难度结构,题目特征曲线,选做题按要求作答比例选做题、选择题选择比例分布为建立题库所需的各项数据考生成绩分析主题:在不同的考试阶段对考生的成绩进行分析,可用的源数据主要为考生成绩信息,涉及到的度量值有最高分、最低分、平均分、标准差、差异系数、分数频率、贡献率等展现方式有按报考人数(总人数、男、女、科目组)、分数(文、理、各科、性别、阶层、地区、中学)、各类比例(文、理、男、女、一本、二本、得 A 率)、各类交叉表(性别/选科、等级/分数、科目组/分数、选科/等级),以及考生某项考试缺考分析、考生学习能力分析、考生平时成绩、综合素质情况、成绩证明。
院校计划分析主题:用于从不同角度展示院校的计划情况,主要考查的指标有计划人数,计划执行数,计划差额数,计划差额率,各类计划的变化趋势情况志愿分析主题:用于从不同的角度分析考生的志愿数据,可用源数据主要为考生志愿信息,主要关注的指标有填报人数,报考热度,录取最低分等"考生成绩、性别、户口类型、考生地域、科类等学生基本属性对于专业志愿选择结果的影响各维度有性别、农村城市、应届往届、成绩、地区、经济状况、父母学历、招生宣传方式对学校与专业报考热度的影响,其中报考热度=维度.志愿填报计数:/维度.计划人数录取分析主题:主题分析的目的在于从各个角度展示录取库中的数据,可用源数据主要为录取信息,涉及到的分析指标有录取人数,最低录取分,最高录取分,平均分院校录取几率(省内省外);院校录取放弃率、复读率(专业志愿、性别、农村城市、应往届、成绩、地区、经济状况、父母学历、招生宣传方式)、投档录取率(本科、专科、文科、理科、男生、女生)、自主招生考试达到省控线情况、各批次录取人数情况、录取(落榜)考生等级分数交叉表二、其他各类考试成高录取人数、成绩(学习形式、层次、专业、招生省份、性别、年龄段、学历、职业类别)、报到分析(专业、性别、农村城市、应届往届、成绩、地区)。
另一角度的成人高考主题域:1)考生志愿分析主题、2)考生学习形式分析主题、3)考生质量分析主题、4)考生生源分析主题、5)录取专业分析主题专转本与中考:形成教育考试的完整履历,前后阶段考试的结合分析,教育考试评价的智能报表自考可分为:考生考籍、专业计划与教材、命题、考务安排与纪律、档案转移、成绩管理、主考校和助学单位等主题其中自考成绩应有:小题分、还应考多少门社考计算机化考试数据流的回收、结果评判、语音识别三、内部管理招考队伍管理主题:监考记录、考核、奖惩考务管理主题:考点、考场、考风考纪、考试时间、费用、考场所在地、报名考试流程、上一次考试总体通过率、考试成绩等财务收费管理数据、考试招生宏观数据电子政务档案管理、教材征订、固定资产、仓储管理、硬软件管理、合同管理数据部分合作单位的现有系统考虑到的有:① 考试结果统计 能够统计全年级的学生的各科分数和总分情况 能够统计全年级各班级的各科分数和总分情况 能够对考试各科目的平均分、排名、 选择率、正确率、最高分、最低分、标准差、区分度、 难度、信度、分数分布、名次分布等进行统计,并以通俗易懂的可视化形式展现 能够统计试卷客观试题的作答结果情况分布数据。
能够统计试卷主管试题的作答分数情况分布数据① 考试结果诊断评价 系统分析后的结果,对于年级内的班级学习状况具有一定的诊断评价作用 系统分析后的结果,对于学生个体具有一定的诊断评价作用① 以往成绩对比 系统可以展现本次考试各个班级与以往考试的对比情况或变化曲线 系统可以展现本次考试学生个体与以往考试的对比情况或变化曲线四、命题评价专题(13 年初由命题中心提供)(1)对内命题管理征题系统(定向秘密征题)无纸化命题系统,与其他系统隔绝,可进行归类归指标小型考试网上评卷系统,最好能切割自考试卷命题管理系统目前自考无小题分,难以掌控命题参数命题内容的难度估计与控制2)对外评价服务为地方教育行政部门服务希望能成为相对柔性的系统,目前只国家教育考试评价研究院有此类系统可以先买一个现成的评价系统(如教育版 Spass)面向考生的发展性评价类似于教育部“云海工程”,为学生专用选择提供参考评价要兼顾价值导向与能力导向,需要与学生交互;能力与态度相结合评价指标 90%以上是经常性的指标,还有一些领导提出的探索性的指标3)供自身与领导使用的数据分析希望能够了解考生应试的反应与生源结构(如年龄、学历、职业等)的变化。
希望能拥有市、县、校的模拟考试情况,以了解应届考生的实际情况,同时便于查近期的重题统计的数据要依据一定的教学理论与基础需要有考生的背景数据,学校的数据,有自定义的、半定制化的报表(由于有些数据比较敏感或需求较个性化)希望能形成一个学科秘书工作的云平台教育似乎在走下坡路?用标准化测试来检验学生的表现和评定对老师或学校的奖惩是否合理?考试是否能全面展示一个学生的能力?是否能有效检测教学质量?是否能反映出一个有创造力、适应能力强的现代师资队伍所需要的品质?这些都饱受争议谷歌公司的创始人拉里·佩奇和谢尔盖·布林一直强调要得到每个应聘者申请大学时的 SAT 成绩以及大学毕业时的平均绩点他们认为,前者能彰显潜能,后者则展现成就尽管公司内部研究早就表明,工作表现和这些分数根本没有关系,谷歌依然冥顽不化谷歌本应该懂得抵制数据的独裁考试结果可能一生都不会改变,但是它并不能测试出一个人的知识深度,也展示不出一个人的人文素养学习技能之外,科学和工程知识才是更适合考量的这是数据独裁放大了的写照事实上,真的不是每一个复杂的人类情况都能简化为曲线图上的线条、图表上的百分点或者资产负债表上的数字但是如果不对可量化的事物进行量化,我们就会失去全面了解该事物的机会。
只要得到了合理的利用,而不单纯只是为了“数据”而 “数据”,大数据就会变成强大的武器如果大数据分析完全准确,那么我们的未来会被精准地预测,因此在未来,我们不仅会失去选择的权利,而且会按照预测去行动如果精准的预测成为现实的话,我们也就失去了自由意志,失去了自由选择生活的权利当然,精准的预测是不现实的大数据分析只能预测一个人未来很有可能进行的行为 --《大数据时代》部分参考文献:1. 基于 OLAP 和数据挖掘技术的高考志愿填报方式分析评估方法曾铮)2. 高考考生志愿数据分析与挖掘研究(殷员分)效率:是否保护了高分考生高分低就”是低效率的公平:考生填报志愿与录取的匹配情况3.大数据时代。