Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo

Lorenzo Magán, José María

Publicación:
Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo

Archivos

LORENZO_MAGAN_Jose_Tesis.pdf (798.04 KB)

Fecha

2016-01-19

Autores

Lorenzo Magán, José María

Director/a

Prieto Rumeau, Tomás

Derechos de acceso

Atribución-NoComercial-SinDerivadas 4.0 Internacional
info:eu-repo/semantics/openAccess

Licencia Creative Commons

http://creativecommons.org/licenses/by-nc-nd/4.0

Editor

Universidad Nacional de Educación a Distancia (España). Facultad de Ciencias. Departamento de Estadística, Investigación Operativa y Cálculo Numérico

Resumen

Esta tesis estudia métodos de aproximación para cadenas de Markov controladas en tiempo continuo y para juegos markovianos bipersonales de suma cero en tiempo continuo. Estos modelos dinámicos ya han sido estudiados desde el punto de vista teórico pero, en general, no es posible obtener explícitamente los valores óptimos de los problemas ni las estrategias óptimas, debido a la complejidad de las correspondientes ecuaciones de optimalidad. Es por ello que se introducen aquí métodos de aproximación que permitan aproximar numéricamente dichos valores óptimos y las correspondientes estrategias óptimas. En un contexto más general, la idea es proponer una definición de convergencia de una sucesión {Mn}n?1 de modelos de cadenas de Markov controladas a un modelo M, cuya solución óptima se quiere aproximar. Se darán entonces condiciones bajo las cuales la convergencia Mn ? M implique la convergencia de los valores óptimos y de las políticas óptimas de Mn a los de M. Esta misma problemática se abordara para la convergencia Gn ? G para juegos de Markov de suma nula. Los modelos de control y juegos considerados tienen espacio de estados numerable, espacios de acciones de Borel, y sus tasas de transición y pago pueden ser no acotadas. Se estudiarán los criterios de optimalidad del pago descontado y del pago promedio. Las hipótesis principales que se harán sobre estos modelos incluyen desigualdades de tipo Lyapunov sobre las tasas de transición, continuidad del pago y de las tasas de transición, y compacidad de los conjuntos de acciones. Además de los resultados de convergencia de los valores óptimos de los modelos de control M y juegos G, se estudiaran las tasas de convergencia de los valores óptimos de Mn y Gn, cuando estos se definen mediante una truncación finita de los espacios de estados y acciones de los modelos originales. Se probara que estas tasas están estrechamente relacionadas con el máximo exponente para el que se obtiene una desigualdad de Lyapunov. Los resultados teóricos obtenidos se ilustran con varias aplicaciones a modelos de poblaciones y procesos de nacimiento y muerte. De esta manera, se prueba también que los métodos de aproximación estudiados son una herramienta potente que permite estimar con precisión la solución óptima de modelos estocásticos de decisión complejos.

Centro

Facultades y escuelas::Facultad de Ciencias

Handle

https://hdl.handle.net/20.500.14468/19127

Colecciones

Tesis doctorales

Página completa del ítem

Publicación:
Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo

Archivos

Fecha

Autores

Editor/a

Director/a

Tutor/a

Coordinador/a

Prologuista

Revisor/a

Ilustrador/a

Derechos de acceso

Licencia Creative Commons

Título de la revista

ISSN de la revista

Título del volumen

Editor

Proyectos de investigación

Unidades organizativas

Número de la revista

Resumen

Descripción

Categorías UNESCO

Palabras clave

Citación

Centro

Departamento

Grupo de investigación

Grupo de innovación

Programa de doctorado

Cátedra

Handle

DOI

Colecciones

Publicación: Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo

Archivos

Fecha

Autores

Editor/a

Director/a

Tutor/a

Coordinador/a

Prologuista

Revisor/a

Ilustrador/a

Derechos de acceso

Licencia Creative Commons

Título de la revista

ISSN de la revista

Título del volumen

Editor

Proyectos de investigación

Unidades organizativas

Número de la revista

Resumen

Descripción

Categorías UNESCO

Palabras clave

Citación

Centro

Departamento

Grupo de investigación

Grupo de innovación

Programa de doctorado

Cátedra

Handle

DOI

Colecciones

Publicación:
Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo