金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)

上传人:以*** 文档编号:194902375 上传时间:2021-09-01 格式:DOCX 页数:27 大小:33.56KB
返回 下载 相关 举报
金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)_第1页
第1页 / 共27页
金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)_第2页
第2页 / 共27页
金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)_第3页
第3页 / 共27页
金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)_第4页
第4页 / 共27页
金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)》由会员分享,可在线阅读,更多相关《金属复合板公司工程项目数据采集分析与知识管理(工程项目组织与管理)(27页珍藏版)》请在金锄头文库上搜索。

1、泓域咨询/金属复合板公司工程项目数据采集分析与知识管理金属复合板公司工程项目数据采集分析与知识管理xxx(集团)有限公司一、 时间数据分析方法(一)时间数据时间数据也称时间序列(Timeseries)或动态数据,是按时序排列的一组来自同一现象的观察值。时间序列可按日、月、季度、年等收集,有些呈现很强的季节性,建模时应给予反映。气象、水文、生态环境、经济及社会活动都能观察到周期性时间序列。实际观测并记录的时间序列,实际上是随机过程的样本,即,在产生时间序列的实际过程的每一时点上,人们看到的只是该时点随机变量的样本,并不能观察到母体。时间序列可分为平稳和非平稳序列,还可以分成线性和非线性时间序列。

2、(二)时间序列分析1概述时间序列分析是根据随机过程理论,研究时间序列的统计规律。时间序列分析广泛应用于信息压缩、利用卫星照片识别地球资源、石油勘探、经营管理、预测(气象、水文、地震、地下水位、农作物病虫灾害)、控制(环境污染、生态平衡)(天文学和海洋学)等方面。时间序列预测的基本依据是:(1)客观过程是连续的,有惯性,现在是过去的继续,过去的信息会传递到现在与未来,利用过去的数据或信息能推测未来。(2)偶然因素会影响到客观过程,使其行为与模式有随机性。预测要利用时间序列各时点随机量的相关关系。时间序列的趋势与波动称为“模式”,时间序列分析首要要识别其模式,然后用适当的曲线拟合。拟合模式的各种参

3、数根据按“最优预测”原则估算出的时间序列数字特征(期望值、方差、协方差、自相关函数)等确定。2.时间序列成分时间序列常含有4种成分:趋势、季节变动、规则波动和不规则波动。所谓趋势,是长期持续向上或持续向下的倾向。季节变动,是实际过程受气候、市场状况、节假日或风俗习惯等影响而呈现的周期性波动。规则波动,是周期不等的变动,呈涨落交替之状。波动的周期可能很长,但与趋势不同。不规则波动,是时间序列除去趋势、季节变动和周期波动之后的波动。不规则波动总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。时间序列经常是各种周期成分的叠加,例如地震或人工地震波的记录。这样的序列要做频域分析。频域分析

4、确定时间序列各周期成分称为“谱”或“功率谱”的能量分布形态。频域分析又称谱分析。谱分析的重要内容就是通过序列的周期图()的极值点寻找各种分量的周期。3时间序列建模时间序列建模一般有如下几个步骤(1)取得时间序列样本。(2)将样本点画成图,进行相关分析。时间序列图形可显示出变化趋势和周期,并发现离群点和转折点。若离群点确实为观测值,建模时应加以考虑,若非,应加以调整。转折点指时间序列趋势突变的点。如果发现转折拐点,则在建模时须分段用不同的模型拟合时间序列,例如用门限回归模型。(3)模式识别与拟合。时间序列模式众多。小样本可用趋势模型、季节模型加上随机误差拟合。对于样本容量(即观测值个数)大于50

5、的平稳时间序列,可用ARMA(自回归移动平均)模型拟合。非平稳时间序列可经差分化为平稳时间序列,再用ARMA模型拟合。(4)预测未来。利用建成的模型预测时间序列未来值。4时间序列常用模型(1)ARMA模型(2)回归模型二、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、网络日志

6、、病历、事监控、视频和图像档案,及大型电子商务。大数据是数据挖掘产生与生存发展的土壤。如今数据每五年翻一番,面对前所未有的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、文本等。

7、(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议。想要从数据中发现规律(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编排,以便

8、以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业数据往往较多,数据挖掘更耗时间。数据规约就是简化已有可用数据集的表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用的信息。

9、(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否可用。(8)知识表示。将数据挖掘得到的信息以可视方式交给用户,或作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从WWW中发现和分析

10、有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等发现挖掘对象间的内在关系与特性,进而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘沿用了Robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用Robot程序采集静态Web页面,

11、最后获取被访问站点网络数据库中的动态信息,生成WWW资源索引库。(4)信息特征匹配。提取索引库中的源信息特征向量,并与目标样本的特征向量对照,将符合要求的信息交给用户。三、 工程咨询信息类型及来源(一)信息类型工程咨询需要的信息,量大、面广。为了便于识别、分析、存储与保管,可从不同的角度将其分类。例如,从信息属性、来源、形态、用途、载体,是否随时而变或是否经过加工处理等角度划分。1不同属性的信息工程咨询中常用如下几种属性信息:(1)法律。国家、各级政府颁布的有关投资与工程建设的各种法律、法规、规章等。(2)规划与政策。国家和地方的各种规划(战略、行业),以及财政、税收、货币、投资和产业等方面的

12、政策。(3)标准与规范。国家各部门或专业协会发布的技术经济指标、定额、标准与规范等。(4)自然与资源。调查、统计或其他机构保存或取得的河流、湖泊、沼泽、山脉、森林、植被、矿藏、水文等地理资料,气象、气候等天文资料等。(5)行业统计。全国乃至全球各行业规模与产业动向、生产与销售、进出口、技术,以及主要企业、公司等的现状、竞争态势,以及发展趋势等。(6)投资与项目。全国乃至全球各种项目的实施过程与结果,包括投资、规模、技术来源、标准、设备、产品性能和目标市场等。(7)区域社会与经济状况。区域的社会、民族、文化、教育、宗教、习俗等人文状况,区域经济发展、税收、财政、基础设施等。2来源不同的信息(1)

13、内部信息。企业或项目已有或反映企业及项目状况,不希望外人获知的信息。(2)外部信息。诸如宏观政策的变动、市场动态、竞争情况、政策法规、技术发展等方面的信息。3媒介与形式不同的信息信息有多种形式,如数据、文字、图样、影像、录音。信息载体或媒介亦有多种,如书籍、文件、报告、会议、数据库和磁盘等。4原始信息与加工信息信息有原始和加工信息。原始信息,如人口普查记录;加工信息,利用某些方法,根据原始信息取得的判断、评价、预测及建议等,如对人口构成的分析。5用途不同的信息信息的用途五花八门,如标准、规范、手册等,通常用于技术方案设计;如生产资料价格、概算定额等,通常用于投资估算;如税率、产品价格、影子价格

14、等,通常用于项目财务分析或经济分析;行业基准收益率、市场竞争情况等,通常用于投资项目决策。6动态信息与静态信息信息可分为静态和动态两类,前者指不随时间变化或变化较小的信息,如道路、停车场、交通附属设施等;后者为随时变化的信息,如道路状况、交通事故、天气、车辆密度与流量等。7显性信息与隐性信息显性信息指以文字、图形或其他符号明显记载于书籍或其他介质的信息。隐性信息是须经过分析、联系与推断才能获得的信息。(二)工程咨询对信息的基本要求信息是咨询和决策的基础,至少应满足如下要求。1来源须可靠,必须来源于实际,不能含有虚假、伪造的成分。2必须全面或较全面反映客观事物与过程,不得将片面、残缺的信息用于咨

15、询。3必须适合或基本适合选用的咨询方法。不同的咨询方法需要不同范围和时间段的信息。如果不能适合选用的咨询方法,就应选择其他咨询方法。(三)信息来源信息来源很多,例如图书馆、档案馆、调查或咨询机构、学校、出版与研究机构、商场、国家与地方统计局及其他政府或新闻机构、国际组织与外国驻华机构、互联网等。1网络和出版物从互联网上能够快速检索到最新、非常有价值的信息。当然,对这些信息必须特别注意加以鉴别,去伪存真。公开出版物同样发布大量有用的信息,例如行业年鉴、调查与统计报告、专题研究报告等。2借阅与购买从合作单位、专门机构索取或购买资料是一种重要的信息来源。如到各种图书馆借阅文献与资料,购买国家或地方统计局出版的综合与行业统计年鉴,向某些调查机构索取或购买调查报告,向测量部门购买卫星图片、航测或航拍图片,向地震部门购买地震分布资料,向水文、气象部门采购历年水文、气象资料,向城市主管部门采购地理信息资料,向地质勘探部门采购地质勘探资料等。3自有信息从事规划、勘察、设计、科研、监理等咨询活动的咨询企业,积累了大量宝贵信息,例如水文地质与地形勘察报告、图档、投资估算、设计概算、工程决算、可行性研究报告、监理报告、实验报告、总结报告、国内外工程招标信息、最新行业

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 经济/贸易/财会 > 经济学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号