交通流量预测－金锄头文库

资源描述

《交通流量预测》由会员分享，可在线阅读，更多相关《交通流量预测（58页珍藏版）》请在金锄头文库上搜索。

1、. . . . . .“交通流量预测” 讲评毛紫阳 ()国防科大数学系2013-07-08毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-081 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流

2、量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难

3、的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显

4、的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类

5、的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评201

6、3-07-082 / 18简介这是一道预测类的数据挖掘题目（另外一大类是分类问题），是相对比较难的题目。困难之处主要在于：预测类的问题，一般都很难做到准确预测。数据量普遍较大数据的噪声、干扰也相应较多没有明显的模式或规律，模型隐藏在大量的数据之中。没有通用方法，需要根据问题的背景、数据的特点选择合适的方法。数据挖掘类的题目在竞赛中出现的比较少，大家对此类题目的特点和常用方法不熟悉。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-082 / 18解决此类问题的一般步骤. . .1对数据进行预处理。一般包括清理数据，对数据的形式做必要的

7、转换，集成多个数据源中的数据等。 . . .2数据可视化。便于观察，有利于发现规律。人的模式识别能力非常强，但是并不是每一次观察都有收获。 . . .3选择模型，使用训练集训练模型，确定相关参数。可以综合多种模型的结果，取得更好的结果。 . . .4检验模型效果。可以随机将训练集分为两部分，一部分用于确定模型参数，一部分用于检验模型效果。或者训练集同时做测试集。 . . .5可能需要进行后处理。包括还原结果的实际意义，结果的可视化，模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .

8、1对数据进行预处理。一般包括清理数据，对数据的形式做必要的转换，集成多个数据源中的数据等。. . .2数据可视化。便于观察，有利于发现规律。人的模式识别能力非常强，但是并不是每一次观察都有收获。 . . .3选择模型，使用训练集训练模型，确定相关参数。可以综合多种模型的结果，取得更好的结果。 . . .4检验模型效果。可以随机将训练集分为两部分，一部分用于确定模型参数，一部分用于检验模型效果。或者训练集同时做测试集。 . . .5可能需要进行后处理。包括还原结果的实际意义，结果的可视化，模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2

9、013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。一般包括清理数据，对数据的形式做必要的转换，集成多个数据源中的数据等。 . . .2数据可视化。便于观察，有利于发现规律。人的模式识别能力非常强，但是并不是每一次观察都有收获。. . .3选择模型，使用训练集训练模型，确定相关参数。可以综合多种模型的结果，取得更好的结果。 . . .4检验模型效果。可以随机将训练集分为两部分，一部分用于确定模型参数，一部分用于检验模型效果。或者训练集同时做测试集。 . . .5可能需要进行后处理。包括还原结果的实际意义，结果的可视化，模

10、型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。一般包括清理数据，对数据的形式做必要的转换，集成多个数据源中的数据等。 . . .2数据可视化。便于观察，有利于发现规律。人的模式识别能力非常强，但是并不是每一次观察都有收获。 . . .3选择模型，使用训练集训练模型，确定相关参数。可以综合多种模型的结果，取得更好的结果。. . .4检验模型效果。可以随机将训练集分为两部分，一部分用于确定模型参数，一部分用于检验模型效果。或者训练集同时做测试集。 . . .5可能

11、需要进行后处理。包括还原结果的实际意义，结果的可视化，模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。一般包括清理数据，对数据的形式做必要的转换，集成多个数据源中的数据等。 . . .2数据可视化。便于观察，有利于发现规律。人的模式识别能力非常强，但是并不是每一次观察都有收获。 . . .3选择模型，使用训练集训练模型，确定相关参数。可以综合多种模型的结果，取得更好的结果。 . . .4检验模型效果。可以随机将训练集分为两部分，一部分用于确定模型参数，一部分

12、用于检验模型效果。或者训练集同时做测试集。. . .5可能需要进行后处理。包括还原结果的实际意义，结果的可视化，模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18解决此类问题的一般步骤. . .1对数据进行预处理。一般包括清理数据，对数据的形式做必要的转换，集成多个数据源中的数据等。 . . .2数据可视化。便于观察，有利于发现规律。人的模式识别能力非常强，但是并不是每一次观察都有收获。 . . .3选择模型，使用训练集训练模型，确定相关参数。可以综合多种模型的结果，取得更好的结果。 . . .4检验模型效果。可

13、以随机将训练集分为两部分，一部分用于确定模型参数，一部分用于检验模型效果。或者训练集同时做测试集。 . . .5可能需要进行后处理。包括还原结果的实际意义，结果的可视化，模型的解读等。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-083 / 18本题的特点数据方面：数据是软件模拟得到的，错误较少。一般还应进行简单的检验，确保数据质量。数据采样精度较高，可以适当加工。比如将原始数据按每 10 分钟一组进行加工。一方面可以减少运算量，另一方面也减少每分钟数据振荡引起的随机误差，使流量数据的规律更明显。毛紫阳 (国防科大数学系)“交通流量预

14、测” 讲评2013-07-084 / 18本题的特点数据方面：数据是软件模拟得到的，错误较少。一般还应进行简单的检验，确保数据质量。数据采样精度较高，可以适当加工。比如将原始数据按每 10 分钟一组进行加工。一方面可以减少运算量，另一方面也减少每分钟数据振荡引起的随机误差，使流量数据的规律更明显。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-084 / 18本题的特点数据方面：数据是软件模拟得到的，错误较少。一般还应进行简单的检验，确保数据质量。数据采样精度较高，可以适当加工。比如将原始数据按每 10 分钟一组进行加工。一方面可以

15、减少运算量，另一方面也减少每分钟数据振荡引起的随机误差，使流量数据的规律更明显。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-084 / 18本题的特点模型方面：针对单一序列的预测方法比较多，也比较常见。但是针对高维向量，特别是多输出的预测方法比较少，一般也更复杂。可以认为 10 条道路上的车流量符合相似的规律，可以使用相同的模型、不同的参数进行描述。本题中训练集与测试集的数据不完全一致。道路的其他信息可以不考虑。比如车道数、平均速度、路网的拓扑信息以及各条道路的相对位置关系等。至少，在开始的时候可以先不考虑。毛紫阳 (国防科大数学系

16、)“交通流量预测” 讲评2013-07-085 / 18本题的特点模型方面：针对单一序列的预测方法比较多，也比较常见。但是针对高维向量，特别是多输出的预测方法比较少，一般也更复杂。可以认为 10 条道路上的车流量符合相似的规律，可以使用相同的模型、不同的参数进行描述。本题中训练集与测试集的数据不完全一致。道路的其他信息可以不考虑。比如车道数、平均速度、路网的拓扑信息以及各条道路的相对位置关系等。至少，在开始的时候可以先不考虑。毛紫阳 (国防科大数学系)“交通流量预测” 讲评2013-07-085 / 18本题的特点模型方面：针对单一序列的预测方法比较多，也比较常见。但是针对高维向量，特别是多输出的预测方法比较少，一般也更复杂。可以认为 10 条道路上的车流量符合相似的规律，可以使用相同的模型、不同的参数进行描述。本题中训练集与测试集的数据不完全一致。道路的其他信息可以不考虑。比如车道数、平均速度、路网的拓扑信息以及各条道路的相对位置关系等。至少，在开始的时候可以先不考虑。毛紫阳 (国防科大

展开阅读全文