Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo

Lorenzo Magán, José María

Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo

Lorenzo Magán, José María. Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo . 2016. Universidad Nacional de Educación a Distancia (España). Facultad de Ciencias. Departamento de Estadística, Investigación Operativa y Cálculo Numérico

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre			Descripción	Tipo MIME		Size
LORENZO_MAGAN_Jose_Tesis.pdf			Full text (open access)		application/pdf	798.04KB

Título	Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo
Autor(es)	Lorenzo Magán, José María
Resumen	Esta tesis estudia métodos de aproximación para cadenas de Markov controladas en tiempo continuo y para juegos markovianos bipersonales de suma cero en tiempo continuo. Estos modelos dinámicos ya han sido estudiados desde el punto de vista teórico pero, en general, no es posible obtener explícitamente los valores óptimos de los problemas ni las estrategias óptimas, debido a la complejidad de las correspondientes ecuaciones de optimalidad. Es por ello que se introducen aquí métodos de aproximación que permitan aproximar numéricamente dichos valores óptimos y las correspondientes estrategias óptimas. En un contexto más general, la idea es proponer una definición de convergencia de una sucesión {Mn}n?1 de modelos de cadenas de Markov controladas a un modelo M, cuya solución óptima se quiere aproximar. Se darán entonces condiciones bajo las cuales la convergencia Mn ? M implique la convergencia de los valores óptimos y de las políticas óptimas de Mn a los de M. Esta misma problemática se abordara para la convergencia Gn ? G para juegos de Markov de suma nula. Los modelos de control y juegos considerados tienen espacio de estados numerable, espacios de acciones de Borel, y sus tasas de transición y pago pueden ser no acotadas. Se estudiarán los criterios de optimalidad del pago descontado y del pago promedio. Las hipótesis principales que se harán sobre estos modelos incluyen desigualdades de tipo Lyapunov sobre las tasas de transición, continuidad del pago y de las tasas de transición, y compacidad de los conjuntos de acciones. Además de los resultados de convergencia de los valores óptimos de los modelos de control M y juegos G, se estudiaran las tasas de convergencia de los valores óptimos de Mn y Gn, cuando estos se definen mediante una truncación finita de los espacios de estados y acciones de los modelos originales. Se probara que estas tasas están estrechamente relacionadas con el máximo exponente para el que se obtiene una desigualdad de Lyapunov. Los resultados teóricos obtenidos se ilustran con varias aplicaciones a modelos de poblaciones y procesos de nacimiento y muerte. De esta manera, se prueba también que los métodos de aproximación estudiados son una herramienta potente que permite estimar con precisión la solución óptima de modelos estocásticos de decisión complejos.
Materia(s)	Matemáticas
Editor(es)	Universidad Nacional de Educación a Distancia (España). Facultad de Ciencias. Departamento de Estadística, Investigación Operativa y Cálculo Numérico
Director de tesis	Prieto Rumeau, Tomás
Fecha	2016-01-19
Formato	application/pdf
Identificador	tesisuned:Ciencias-Jmlorenzo http://e-spacio.uned.es/fez/view/tesisuned:Ciencias-Jmlorenzo
Idioma	eng
Versión de la publicación	acceptedVersion
Nivel de acceso y licencia	http://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess
Tipo de recurso	Thesis
Tipo de acceso	Acceso abierto

Tipo de documento:	Doctoral Thesis
Collections:	Set de openaire Set de Tesis Doctorales de la UNED Tesis Facultad de Ciencias (UNED)

Contador de citas:	Search Google Scholar
Estadísticas de acceso:	729 Visitas, 662 Descargas - Estadísticas en detalle
Creado:	Tue, 18 Oct 2016, 18:00:49 CET

e-spacio

Aproximaciones de modelos de cadenas de Markov controladas y juegos markovianos en tiempo continuo