
上传人:aa****6 文档编号:30009594 上传时间:2018-01-26 格式:DOC 页数:77 大小:713KB
返回 下载 相关 举报
第1页 / 共77页
第2页 / 共77页
第3页 / 共77页
第4页 / 共77页
第5页 / 共77页


1、数 据 挖 掘 技 术 在 农 产 品 市 场中 的 应 用 研 究Application Research of Data Mining Technologies in Agricultural Market Information Analysis(申 请 清 华 大 学 工 程 硕 士 专 业 学 位 论 文 )培 养 单 位 : 计 算 机 科 学 与 技 术 系工 程 领 域 : 计 算 机 技 术申 请 人 :指 导 教 师 : 教 授联 合 指 导 教 师 : 教 授 级 高 工 工二 六 年 十 二 月关于学位论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,

2、即:清华大学拥有在著作权法规定范围内学位论文的使用权,其中包括:(1)已获学位的研究生必须按学校规定提交学位论文,学校可以采用影印、缩印或其他复制手段保存研究生上交的学位论文;(2)为教学和科研目的,学校可以将公开的学位论文作为资料在图书馆、资料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内容。本人保证遵守上述规定。(保密的论文在解密后遵守此规定)作者签名: 导师签名: 日 期: 日 期: 摘 要I摘 要我 国 是 一 个 农 业 大 国 , 三 农 问 题 一 直 是 党 中 央 和 国 务 院 各 项 工 作 的 重 中之 重 。 随 着 市 场 经 济 的 不 断 深 化 ,

3、三 农 问 题 与 农 产 品 市 场 关 系 越 来 越 紧 密 。种 什 么 , 卖 哪 里 , 都 必 须 分 析 市 场 。 数 据 挖 掘 可 以 从 大 量 的 数 据 中 抽 取 出 未知 的 、 有 价 值 的 知 识 。 从 大 量 的 农 业 市 场 信 息 数 据 中 , 使 用 数 据 挖 掘 技 术来 找 出 最 有 价 值 的 知 识 和 规 律 , 进 而 为 农 业 市 场 提 供 指 导 分 析 , 为 各 级 领导 决 策 、 广 大 农 民 和 建 设 社 会 主 义 新 农 村 提 供 服 务 , 意 义 重 大 。本 文 从 介 绍 农 产 品 市 场

4、 基 本 知 识 及 我 国 农 业 信 息 化 的 基 本 现 状 出 发 ,介 绍 分 析 了 数 据 挖 掘 的 基 本 理 论 和 应 用 现 状 , 关 联 规 则 及 Apriori 算 法 。利 用 WEKA 数 据 挖 掘 平 台 , 本 文 应 用 关 联 规 则 挖 掘 方 法 分 析 了 农 产 品 期货 市 场 与 现 货 市 场 之 间 的 关 联 关 系 , 分 析 了 现 货 市 场 中 同 类 农 产 品 , 以 及非 同 类 农 产 品 之 间 的 关 联 关 系 。 并 且 在 分 析 过 程 中 发 现 传 统 的 关 联 算 法 在市 场 分 析 方 面

5、 的 许 多 不 足 , 会 产 生 很 多 与 实 际 情 况 不 符 的 规 则 , 并 无 法 在整 体 上 对 数 据 间 的 关 联 作 分 析 。针 对 农 产 品 市 场 数 据 的 特 点 和 传 统 关 联 算 法 的 不 足 , 本 文 提 出 了 关 联关 系 的 数 据 挖 掘 算 法 MPAB 算 法 。 该 算 法 由 数 据 离 散 化 、 正 反 关 联 度计 算 、 关 联 度 阈 值 计 算 和 结 果 输 出 四 个 步 骤 组 成 。 算 法 能 对 数 值 型 数 据 进行 离 散 化 操 作 , 发 现 两 个 数 据 集 之 间 的 正 反 关 联

6、 关 系 及 关 联 的 程 度 。 使 用MPAB 算 法 分 析 各 种 农 产 品 市 场 数 据 , 并 对 挖 掘 的 结 果 进 行 分 析 。 发 现MPAB 算 法 挖 掘 效 果 很 好 , 与 事 实 相 符 , 不 产 生 多 余 规 则 , 可 以 不 需 知 识评 估 。 将 MPAB 算 法 用 于 研 究 外 汇 市 场 数 据 , 分 析 不 同 的 货 币 对 价 格 变 化之 间 的 关 联 关 系 , 效 果 也 十 分 令 人 满 意 。基 于 上 述 工 作 , 本 文 提 出 了 一 个 基 于 MPAB 算 法 的 关 联 挖 掘 软 件 的简 单

7、 设 计 , 该 软 件 可 用 于 各 种 市 场 及 各 种 宏 观 经 济 数 据 关 联 分 析 。关 键 词 : 农 业 市 场 数 据 挖 掘 关 联 分 析 MPAB 算 法AbstractIIAbstractChina is a large agricultural country. Problems related to “San Nong”, i.e., “farmers, rural and agriculture”, have been paid much attention by the working emphasis of Central the Committe

8、e of Chinas Communism Party and National Council. With the rapid development deepening of market economies, the relationship between the problems of “San Nong” and the market of agricultural produces is becoming more and more closer. For example, it is necessary to conduct market analysis before det

9、ermining what crops are to be planted and where to sell the produces. This poses the requirement of large scale existing agricultural data. Data mining can extract unknown and valuable knowledge from large amount of data. It has significant value to discovering valuable knowledge and rules from agri

10、cultural market data using data mining technologies. The discovered knowledge can direct the agricultural market analysis, help to make decisions for leaders at various levels, and provide services for farmers and constructing socialism new rural areas.This paper analyzesed the basic theory and appl

11、ication situation of data mining from introducing the fundamental conceptsbasic knowledge of agricultural product market and the basic current stateituation of agricultural informatization in China, and then studysied the association rules and Apriori algorithm. The associated relationship between t

12、he future market and physical market of agri-produces Assoiarion rules was analyzed is by employed toing find associated rules minings on WEKA data mining platform in this paper. The associated relationships amoung the same kind agro-products and the not same kind of agro-products physical market ar

13、e allalso analyzed. We discovered that many drawbacks of traditional associated algorithms in mining this kind of data, which may result in the AbstractIIIinconsistent rules with the actual situation, and make it impossible to conduct analysis on association among data as a whole.An associated relat

14、ionship data mining algorithm named MPAB was proposed based on the characteristics of agro-products market data in this paper. It is aimed at overcoming the drawbacks discovered in traditional associated algorithms. The algorithm consists of data discretization, computation of positive and negative

15、association degree, computation of threshold association degree, and result outputting. The algorithm can discretize numerical data, discover the positive and negative relationship between two data sets, and degree of association. Agri-products market data was analyzed by using MPAB, and the mining

16、results were also analyzed. We found that the effect of MPAB was pretty good, complying with the fact with redundant rules, without knowledge assessment. The effect was also satisfactory when the MPAB was used to study foreign exchange market data, analyzing associated degree among the changes in the prices of foreign currency. Based on the above effects, a simple design of MPA


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号