首页 > 《应用数学学报：英文版》 > 2011年4期 > Average Sample-path Optimality for Continuous-time Markov Decision Processes in Polish Spaces

Average Sample-path Optimality for Continuous-time Markov Decision Processes in Polish Spaces

在线阅读下载PDF 导出详情

摘要在这份报纸，我们在波兰的空格为连续时间的Markov决定过程学习平均样品路径费用(ASPC)问题。就我们的知识而言，这份报纸是第一次尝试与波兰的状态和行动空格在连续时间的MDP上学习ASPC标准。相应转变率被允许无界，并且费用率可以有既不上面也不更低的界限。在一些温和假设下面，我们证明存在(0)-ASPC最佳的静止政策基于二不同approaches:one是optimality方程途径，其它是不平等接近的二optimality。

DOI rdxxe1r5dl/1000949

作者 Quan-xin ZHU

机构地区不详

出处《应用数学学报：英文版》 2011年4期

关键词马氏决策过程连续时间样本路径空间波兰平均

分类 [理学][基础数学]

出版日期 2011年04月14日（中国期刊网平台首次上网日期，不代表论文的发表时间）

相关文献

1刘克. WEIGHTED DISCOUNTED MARKOV DECISION PROCESSES WITH PERTURBATION.基础数学,1999-02.
2LIU Bingbing;KANG Yu;JIANG Xiaofeng;QIN Jiahu. A Fast Approximation Method for Partially Observable Markov Decision Processes.系统科学,2018-06.
3. SINGULARLY PERTURBED MARKOV DECISION PROCESSES WITH INCLUSION OF TRANSIENT STATES.系统科学,2001-02.
4Wei WANG;Huanshui ZHANG. H∞ FILTERING FOR CONTINUOUS-TIME SYSTEMS WITH POINTWISE TIME-VARYING DELAY.系统科学,2012-01.
5Qi-Ming HE. CONSTRUCTION OF CONTINUOUS TIME MARKOVIAN ARRIVAL PROCESSES.系统科学,2010-03.
6Cuiqin MA;Jifeng ZHANG. ON FORMABILITY OF LINEAR CONTINUOUS-TIME MULTI-AGENT SYSTEMS.系统科学,2012-01.
7Aiguo WU Guangren DUAN. Robust H-infmity estimation for continuous-time polytopic uncertain systems.控制理论与控制工程,2005-04.
8Zijun Guo Lixin Zhao. Mean-variance Portfolio Selections in Continuous-time Model with Stochastic Interest Rate Process.系统科学,2007-01.
9Yan-ping Chen;Yun-qing Huang. IMPROVED ERROR ESTIMATES FOR MIXED FINITE ELEMENT FOR NONLINEAR HYPERBOLIC EQUATIONS: THE CONTINUOUS-TIME CASE.计算数学,2001-04.
10罗振东 ;朱江 ;曾庆存 ;谢正辉. MIXED FINITE ELEMENT METHODS FOR THE SHALLOW WATER EQUATIONS INCLUDING CURRENT AND SILT SEDIMENTATION （Ⅰ）——THE CONTINUOUS-TIME CASE.力学,2004-01.

来源期刊

应用数学学报：英文版

相关推荐

同分类资源更多

相关关键词

马氏决策过程连续时间样本路径空间波兰平均

返回顶部