首页 | 本学科首页   官方微博 | 高级检索  
     

MAXQ方法在出租车问题中的应用
引用本文:安岭丽,彭志平,李铁鹰. MAXQ方法在出租车问题中的应用[J]. 茂名学院学报, 2007, 17(1): 56-59
作者姓名:安岭丽  彭志平  李铁鹰
作者单位:1. 茂名学院,计算机与电子信息学院,广东,茂名,525000;太原理工大学信息工程学院,山西,太原,030024
2. 茂名学院,计算机与电子信息学院,广东,茂名,525000
3. 太原理工大学信息工程学院,山西,太原,030024
摘    要:分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中解决问题。针对MAXQ方法。首先介绍其基本原理,然后介绍MAXQ方法在出租车问题中的应用,包括任务分解以及类的设计,最后用实验验证了MAXQ方法比Q-学习算法收敛快。

关 键 词:分层强化学习  MAXQ  任务分解
文章编号:1671-6590(2007)01-0056-04
收稿时间:2006-10-09
修稿时间:2006-11-02

Application of MAXQ Method in Taxi Problem
AN Ling-li,PENG Zhi-ping,LI Tie-ying. Application of MAXQ Method in Taxi Problem[J]. Journal of Maoming College, 2007, 17(1): 56-59
Authors:AN Ling-li  PENG Zhi-ping  LI Tie-ying
Abstract:Hierarchical reinforcement learning can be used to solve curse of dimensionality problem. MAXQ method decomposes the task into gubtasks in different levels through decomposing value function hierarchically, so it can be realized in low dimension space. Aiming at the method MAXQ, we firstly introduce the basal principle. Then we introduce the application of the MAXQ method in the taxi problem, including the task decomposition and the class design. Finally,as is testified in practice,MAXQ method converges more faster than Q - learning algorithm.
Keywords:hierarchical reinforcement learning  MAXQ  task decomposition
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号