马尔可夫决策过程引论

出版时间:2000-7  出版社:西安电子科技大学出版社  作者:胡奇英  页数:273  
Tag标签:无  

内容概要

  马尔可夫决策过程是研究随机环境下多阶段决策过程优化问题的理论工具,在过去的几十年中,随着生态科学、经济理论、通讯工程以及众多学科中需要考虑不确定因素和序列决策问题的大量新模型的涌现,进一步刺激了马尔可夫决策过程在理论上和应用领域中长足发展。本书从简单的例子开始,介绍了马尔可夫决策过程的基本概念、决策过程以及一些常用的基本理论。还介绍了多种最优准则,包括有限阶段准则、折扣准则、平均准则、权重报酬准则、概率准则等。从模型角度考虑了有限状态空间、可数状态空间和一般Borel状态空间;从决策时间上来说,考虑了离散时间、连续时间和半马氏决策时刻问题。本文还介绍了大量的应用实例以及建模方法。本书可作为高年级大学和研究生教材,也可作为运筹学、管理科学、信息科学、系统科学以及计算机科学和工程领域的学者和技术人员的参考书。

书籍目录

序言一些常用的符号和缩第1章 引论1.1 序列决策模型1.2 马氏决策过程的例子1.3 马氏决策过程的定义与记号1.4 马氏决策过程的起源和发展第2章 有限阶段模型2.1 最优准则2.2 有限阶段的策略迭代和最优方程2.3 最优策略的存在性和算法2.4 两个例子2.5 单调策略的最优性第3章 无限阶段折扣模型3.1 最优准则3.2 最优方程3.3 最优策略的存在性3.4 策略迭代算法3.5 值迭代算法3.6 改进的策略迭代算法3.7 线性规划算法3.8 可数状态与行动的模型3.9 最优单调策略3.10 最优策略的结构第4章 无限阶段平均模型4.1 最优准则4.2 最优平稳策略的存在性4.3 平稳策略的一些特征4.4 最优方程与策略迭代算法4.5 单链时的情形4.6 多链时的情形第5章 权重准则模型与概率准则模型5.1 折扣权重模型5.2 折扣与平均权重模型5.3 MDP的百分比与目标水平5.4 风险概率准则模型第6章 连续时间与半马氏模型6.1 连续时间折扣MDP6.2 连续时间平均MDP6.3 折扣半马氏模型6.4 平均半马氏模型6.5 服务率受控的一个排队模型第7章 空集装箱调配问题7.1 单港口的问题与建模7.2 无限阶段折扣准则7.3 无限阶段平均准则7.4 数值例子7.5 多港口空集装箱的调配问题第8章 人力资源模型8.1 问题8.2 数学模型8.3 相关参数分析8.4 数例参考文献索引

图书封面

图书标签Tags

评论、评分、阅读与下载


    马尔可夫决策过程引论 PDF格式下载


用户评论 (总计0条)

 
 

 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7