《交通流量预测》由会员分享,可在线阅读,更多相关《交通流量预测(58页珍藏版)》请在金锄头文库上搜索。
1、. . . . . .“交通流量预测” 讲评毛紫阳 ()国防科大数学系2013-07-08毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-081 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难的题目。 困难之处主要在于:预测类的问题, 一般都很难做到准确预测。 数据量普遍较大 数据的噪声、 干扰也相应较多 没有明显的模式或规律, 模型隐藏在大量的数据之 中。 没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。 数据挖掘类的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流
2、量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难的题目。 困难之处主要在于: 预测类的问题, 一般都很难做到准确预测。数据量普遍较大 数据的噪声、 干扰也相应较多 没有明显的模式或规律, 模型隐藏在大量的数据之 中。 没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。 数据挖掘类的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难
3、的题目。 困难之处主要在于: 预测类的问题, 一般都很难做到准确预测。 数据量普遍较大数据的噪声、 干扰也相应较多 没有明显的模式或规律, 模型隐藏在大量的数据之 中。 没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。 数据挖掘类的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难的题目。 困难之处主要在于: 预测类的问题, 一般都很难做到准确预测。 数据量普遍较大 数据的噪声、 干扰也相应较多没有明显
4、的模式或规律, 模型隐藏在大量的数据之 中。 没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。 数据挖掘类的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难的题目。 困难之处主要在于: 预测类的问题, 一般都很难做到准确预测。 数据量普遍较大 数据的噪声、 干扰也相应较多 没有明显的模式或规律, 模型隐藏在大量的数据之 中。没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。 数据挖掘类
5、的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难的题目。 困难之处主要在于: 预测类的问题, 一般都很难做到准确预测。 数据量普遍较大 数据的噪声、 干扰也相应较多 没有明显的模式或规律, 模型隐藏在大量的数据之 中。 没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评201
6、3-07-082 / 18简介这是一道预测类的数据挖掘题目 (另外一大类是分 类问题) , 是相对比较难的题目。 困难之处主要在于: 预测类的问题, 一般都很难做到准确预测。 数据量普遍较大 数据的噪声、 干扰也相应较多 没有明显的模式或规律, 模型隐藏在大量的数据之 中。 没有通用方法, 需要根据问题的背景、 数据的特点 选择合适的方法。 数据挖掘类的题目在竞赛中出现的比较少, 大家对 此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18解决此类问题的一般步骤. . .1对数据进行预处理。 一般包括清理数据, 对数据的 形式做必要的
7、转换, 集成多个数据源中的数据等。 . . .2数据可视化。 便于观察, 有利于发现规律。 人的模式 识别能力非常强, 但是并不是每一次观察都有收获。 . . .3选择模型, 使用训练集训练模型, 确定相关参数。 可以综合多种模型的结果, 取得更好的结果。 . . .4检验模型效果。 可以随机将训练集分为两部分, 一 部分用于确定模型参数, 一部分用于检验模型效 果。 或者训练集同时做测试集。 . . .5可能需要进行后处理。 包括还原结果的实际意义, 结果的可视化, 模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .
8、1对数据进行预处理。 一般包括清理数据, 对数据的 形式做必要的转换, 集成多个数据源中的数据等。. . .2数据可视化。 便于观察, 有利于发现规律。 人的模式 识别能力非常强, 但是并不是每一次观察都有收获。 . . .3选择模型, 使用训练集训练模型, 确定相关参数。 可以综合多种模型的结果, 取得更好的结果。 . . .4检验模型效果。 可以随机将训练集分为两部分, 一 部分用于确定模型参数, 一部分用于检验模型效 果。 或者训练集同时做测试集。 . . .5可能需要进行后处理。 包括还原结果的实际意义, 结果的可视化, 模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2
9、013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。 一般包括清理数据, 对数据的 形式做必要的转换, 集成多个数据源中的数据等。 . . .2数据可视化。 便于观察, 有利于发现规律。 人的模式 识别能力非常强, 但是并不是每一次观察都有收获。. . .3选择模型, 使用训练集训练模型, 确定相关参数。 可以综合多种模型的结果, 取得更好的结果。 . . .4检验模型效果。 可以随机将训练集分为两部分, 一 部分用于确定模型参数, 一部分用于检验模型效 果。 或者训练集同时做测试集。 . . .5可能需要进行后处理。 包括还原结果的实际意义, 结果的可视化, 模
10、型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。 一般包括清理数据, 对数据的 形式做必要的转换, 集成多个数据源中的数据等。 . . .2数据可视化。 便于观察, 有利于发现规律。 人的模式 识别能力非常强, 但是并不是每一次观察都有收获。 . . .3选择模型, 使用训练集训练模型, 确定相关参数。 可以综合多种模型的结果, 取得更好的结果。. . .4检验模型效果。 可以随机将训练集分为两部分, 一 部分用于确定模型参数, 一部分用于检验模型效 果。 或者训练集同时做测试集。 . . .5可能
11、需要进行后处理。 包括还原结果的实际意义, 结果的可视化, 模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。 一般包括清理数据, 对数据的 形式做必要的转换, 集成多个数据源中的数据等。 . . .2数据可视化。 便于观察, 有利于发现规律。 人的模式 识别能力非常强, 但是并不是每一次观察都有收获。 . . .3选择模型, 使用训练集训练模型, 确定相关参数。 可以综合多种模型的结果, 取得更好的结果。 . . .4检验模型效果。 可以随机将训练集分为两部分, 一 部分用于确定模型参数, 一部分
12、用于检验模型效 果。 或者训练集同时做测试集。. . .5可能需要进行后处理。 包括还原结果的实际意义, 结果的可视化, 模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。 一般包括清理数据, 对数据的 形式做必要的转换, 集成多个数据源中的数据等。 . . .2数据可视化。 便于观察, 有利于发现规律。 人的模式 识别能力非常强, 但是并不是每一次观察都有收获。 . . .3选择模型, 使用训练集训练模型, 确定相关参数。 可以综合多种模型的结果, 取得更好的结果。 . . .4检验模型效果。 可
13、以随机将训练集分为两部分, 一 部分用于确定模型参数, 一部分用于检验模型效 果。 或者训练集同时做测试集。 . . .5可能需要进行后处理。 包括还原结果的实际意义, 结果的可视化, 模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18本题的特点数据方面:数据是软件模拟得到的, 错误较少。 一般还应进行 简单的检验, 确保数据质量。 数据采样精度较高, 可以适当加工。 比如将原始数 据按每 10 分钟一组进行加工。 一方面可以减少运 算量, 另一方面也减少每分钟数据振荡引起的随机 误差, 使流量数据的规律更明显。毛紫阳 (国防科大数学系)“交通流量预
14、测” 讲评2013-07-084 / 18本题的特点数据方面: 数据是软件模拟得到的, 错误较少。 一般还应进行 简单的检验, 确保数据质量。数据采样精度较高, 可以适当加工。 比如将原始数 据按每 10 分钟一组进行加工。 一方面可以减少运 算量, 另一方面也减少每分钟数据振荡引起的随机 误差, 使流量数据的规律更明显。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-084 / 18本题的特点数据方面: 数据是软件模拟得到的, 错误较少。 一般还应进行 简单的检验, 确保数据质量。 数据采样精度较高, 可以适当加工。 比如将原始数 据按每 10 分钟一组进行加工。 一方面可以
15、减少运 算量, 另一方面也减少每分钟数据振荡引起的随机 误差, 使流量数据的规律更明显。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-084 / 18本题的特点模型方面:针对单一序列的预测方法比较多, 也比较常见。 但 是针对高维向量, 特别是多输出的预测方法比较少, 一般也更复杂。 可以认为 10 条道路上的车流量符合相似的规律, 可以使用相同的模型、 不同的参数进行描述。 本题中训练集与测试集的数据不完全一致。 道路的其他信息可以不考虑。 比如车道数、 平均速 度、 路网的拓扑信息以及各条道路的相对位置关系 等。 至少, 在开始的时候可以先不考虑。毛紫阳 (国防科大数学系
16、)“交通流量预测” 讲评2013-07-085 / 18本题的特点模型方面: 针对单一序列的预测方法比较多, 也比较常见。 但 是针对高维向量, 特别是多输出的预测方法比较少, 一般也更复杂。可以认为 10 条道路上的车流量符合相似的规律, 可以使用相同的模型、 不同的参数进行描述。 本题中训练集与测试集的数据不完全一致。 道路的其他信息可以不考虑。 比如车道数、 平均速 度、 路网的拓扑信息以及各条道路的相对位置关系 等。 至少, 在开始的时候可以先不考虑。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-085 / 18本题的特点模型方面: 针对单一序列的预测方法比较多, 也比较常见。 但 是针对高维向量, 特别是多输出的预测方法比较少, 一般也更复杂。 可以认为 10 条道路上的车流量符合相似的规律, 可以使用相同的模型、 不同的参数进行描述。本题中训练集与测试集的数据不完全一致。 道路的其他信息可以不考虑。 比如车道数、 平均速 度、 路网的拓扑信息以及各条道路的相对位置关系 等。 至少, 在开始的时候可以先不考虑。毛紫阳 (国防科大