应用博弈算法研究成果的智能技术

上传人:jiups****uk12 文档编号:41027835 上传时间:2018-05-28 格式:PDF 页数:2 大小:129.25KB
返回 下载 相关 举报
应用博弈算法研究成果的智能技术_第1页
第1页 / 共2页
应用博弈算法研究成果的智能技术_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《应用博弈算法研究成果的智能技术》由会员分享,可在线阅读,更多相关《应用博弈算法研究成果的智能技术(2页珍藏版)》请在金锄头文库上搜索。

1、应用博弈算法研究成果的智能技术应用博弈算法研究成果的智能技术应用博弈算法研究成果的智能技术应用博弈算法研究成果的智能技术 Intelligent Techniques based on the Result of Game Algorithm Study 小谷小谷小谷小谷善行善行善行善行 Yoshiyuki Kotani 工学研究院 高端信息科学部门 教授 Professor, Division of Advanced Information Technology & Computer Science, Institute of Engineering 研究领域:信息通信 Keywords:

2、game algorithm, learning, search, data mining, question answering URL:http:/www.tuat.ac.jp/kotani/ 1. 研究研究研究研究(技术技术技术技术、开发开发开发开发)简介简介简介简介 背景与目的背景与目的背景与目的背景与目的 象棋等游戏的人工智能研究,就如同生物学中的果蝇一样,通过将其作为明确的研究目标加以解决,最终将为人类服务。通过游戏研究,本研究室在状态搜索及参数学习法方面已经取得成果,并在真实世界的技术创新中加以应用。 内容内容内容内容(研究研究研究研究、技术技术技术技术、开发开发开发开发)说明说

3、明说明说明 博弈游戏中的出棋(象棋中移动棋子、围棋中落子等) ,其实就是从分歧之中选择行动的决策问题。这需要将博弈树搜索、状态评估与范例进行融合而执行。迄今为止,在网上智能系统中得到应用的五种有效方法为: (1)蒙特卡洛搜索; (2)实现概率搜索; (3)证明数搜索; (4)大量参数同时学习; (5)时间差学习。可以认为,用户针对系统动作做出反应后,系统再加以应对的决策交流过程,是一个与游戏对局基本相同的过程。 在智能答疑系统、数据挖掘、建议系统中,我们将制作一种系统,其将对方的反应捕捉为游戏,从而采取迅速恰当的应对。 2. 研究研究研究研究(技术技术技术技术、开开开开发发发发)的独创性的独创

4、性的独创性的独创性 与其他方法与其他方法与其他方法与其他方法(产业方面的竞争技术产业方面的竞争技术产业方面的竞争技术产业方面的竞争技术)之间的区别等之间的区别等之间的区别等之间的区别等 目前还没有其他机构将博弈出棋行动选择的决策应用到当今社会课题中,因此如果能够实现该应用,将产生巨大影响。为此,我们将努力对本研究室已取得成果的五种方法予以应用。在搜索方面是如下所述。 (1)蒙特卡洛搜索:确立了一种可改进以下方法的手法,在选择出现分支的目标时,通过蒙特卡洛法即随机模拟结果的成功机率,对之后结果的预测实施评估。 (2)实现概率搜索:改良了以下方法,针对出现分支的目标,根据专业棋手等人的众多事例事先

5、求得各类型的概率,并通过在末端之前的累积概率来控制搜索深度。 (3)证明数搜索:将为了判断当前状态是否可取胜而必Point 在有关象棋、围棋等对战系统的算法研究中,我们已经取得与搜索法、参数学习等有关的 诸多成果。我们将运用这些成果,制作高性能的网上建议、智能答疑、数据挖掘等系统。 We have achieved many results on searching methods and parameter learning in research of game playing algorithms on Shogi, Go and other games. The goal is to

6、design data mining recommendation, and intellectual interaction systems in Internet space, applying these techniques. 须调查的棋局数量控制在最少,同时进行搜索。在状态评估方面是如下所述。 (4)大量参数同时学习:在出现分支的平行棋局中,将专业棋手实际所下的棋局作为正确答案,将其他棋局作为错误答案,从而同时学习 100 万个以上的参数,获得与问题相符的复杂评估函数。 (5)时间差学习:游戏存在着只有分出胜负之后才知道许多步之前的出棋是好还是坏的困难,这就是解决该时间差的参数学习。

7、 例如,将上述方法应用于答疑系统后,相当于游戏胜利的是正确提供令提问者满意的信息。出棋则是提问者的提问与系统的回答。在建议系统中,出棋是顾客委托(或某些动作)与系统建议信息。相当于游戏胜利的是顾客的满意度或销售人员的销售量。在游戏中,大量采用专业棋手所下的棋谱进行学习。与此相当的是在答疑系统中,例如雅虎知识堂那样的答疑语料库。 3. 今后的展开今后的展开今后的展开今后的展开 关于设想中的市场及对其所做的贡献等关于设想中的市场及对其所做的贡献等关于设想中的市场及对其所做的贡献等关于设想中的市场及对其所做的贡献等 如今,互联网上的各种智能体系正走向实用化。但它们缺少科学检验,仅凭新领域的优越性进行

8、胜负决定。对此,利用已在游戏研究中得到检验的有效且理论严谨的方法,将可以提供优良的智能体系。这点的社会意义非常大。 人与系统之间的交互,全部可与游戏进行比较。从这层意义来看,在人机界面及对人处理技术中应用游戏技术很有意义。 4. 相关资料相关资料相关资料相关资料、文献文献文献文献、参考事项参考事项参考事项参考事项 主要论文主要论文主要论文主要论文 1) 小谷善行编著: “游戏计算机制” ,corona 公司,2010。 2) 小谷善行: “计算机的象棋头脑” ,Science 公司,2007。 3) 但马康宏、北出大藏、中野未知子、中林智、藤本浩司、小谷善行: “基于 HMM 与文本分类器的对

9、话段落分割” , 信息处理学会论文杂志, 数理模型化与应用, vol. 2, no. 2, pp.70-79, Mar. 2009。 4) 古宫嘉那子、但马康宏、小谷善行: “应用决策树获得敬语的选择规则” ,信息处理学会论文杂志,vol.49,no.7,pp.2679-2691,Jul. 2008。 5) Haruhiko AKIYAMA, Kanako KOMIYA, Yoshiyuki KOTANI, Nested Monte-Carlo Search with AMAF Heuristic, 2010 International Conference on Technologies a

10、nd Applications of Artificial Intelligence (TAAI 2010), pp. 172-176, Nov. (2010).(*Best Paper Award 获奖) 6) Takuma TOYODA, Yoshiyuki KOTANI, Monte Carlo Go using Previous Simulation Results, 2010 International Conference on Technologies and Applications of Artificial Intelligence (TAAI 2010), pp. 182-186, Nov. (2010). 过去的实用化成果过去的实用化成果过去的实用化成果过去的实用化成果 我们在呼叫中心的自然语言对话类型分析、计算机象棋在游戏机上的并列计算等方面一直进行共同研究。并在共生信息项目中,将研究结果应用到了感性信息系统之中。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号