Saltar al contenido

¿La cadena de Markov ergódica es tanto irreducible como aperiódica o simplemente irreducible?

Esta sección fue analizado por especialistas para garantizar la exactitud de este escrito.

Solución:

Prefiero la primera definición con diferencia. Relaciono la pregunta con la teoría ergódica, como parece apropiado, y asumo que la cadena tiene un número finito de valores posibles, para no molestarme con la recurrencia positiva.

Consideremos un espacio de estados finito $A$y denota todas las secuencias posibles de elementos en $A$ por $X:=A^mathbbN$. Definamos una transformación $sigma$ en $X$ por $(sigma x)_n = x_n+1$ en $X$. Para $x en X$tenemos $x_n = (sigma^nx)_0$. En otras palabras, aplicando la transformación $sigma$puedo leer los valores sucesivos de una secuencia dada.

Ahora, tomemos alguna medida de probabilidad $mu$ en $A$ con soporte completo (para ver todo), y una matriz estocástica $P$ (el núcleo de transición). Usando $mu$ como la distribución de $X_0$ y la matriz $P$ para definir transiciones, obtenemos una cadena de Markov $(X_n)_n geq 0 = x = ((sigma^nx)_0)_n geq 0$que es un proceso estocástico con valores en $A$. La distribución de $(X_n)_ngeq 0$ es una medida $overlinemu$ en $A^mathbbN$ que satisface las condiciones usuales en cilindros, y cuyo primer marginal es $mu$.

La construcción puede parecer un poco confusa. Sin embargo, si te olvidas de $sigma$es lo que se hace de manera más o menos informal cuando se definen las cadenas de Markov (es decir, la construcción puede estar oculta, pero está ahí).

Por lo tanto, podemos considerar una cadena de Markov como un sistema dinámico $(X, sigma)$ junto con una medida de probabilidad $overlinemu$. Podemos usar las definiciones de la teoría ergódica, y lo que obtenemos al final es que:

  • el sistema $(X, sigma, overlinemu)$ conserva la medida si y sólo si $mu$ es estacionario para $P$;
  • el sistema $(X, sigma, overlinemu)$ es ergódica (en el sentido de teoría ergódica) si y sólo si la cadena de Markov es irreducible;
  • el sistema $(X, sigma, overlinemu)$ es una mezcla si y solo si la cadena de Markov es irreducible y aperiódica.

Entonces estas son dos condiciones muy diferentes, y la aperiodicidad no corresponde a la ergodicidad. Como corolario, se pueden aplicar teoremas ergódicos a las cadenas de Markov sin necesidad de aperiodicidad.

También considero cadenas de Markov con espacio de estado finito, ya que no sé mucho sobre teoría ergódica con medidas infinitas.

La irreductibilidad del gráfico de transición del espacio de estado significa que una ruta de muestra no puede quedar atrapada en subconjuntos más pequeños del espacio de estado, ya que uno puede ir de cualquier lugar a cualquier lugar.

Esto implica, pero hay que resolverlo, que toda la cadena es ergódica: (casi) todos los caminos de la cadena muestran un comportamiento estadísticamente estable, lo que significa que las frecuencias que visitan cualquier estado del espacio convergen. Hablando dinámicamente, existe una medida de probabilidad invariante en el espacio de todos los caminos.

Evidentemente lo contrario true: si hay una medida invariante (que es compatible con todo el espacio de estados), entonces se puede ir de todos los estados a todos los estados.

Los gráficos de transición aperiódicos implican, en términos generales, que no hay fenómenos periódicos ocultos en la dinámica: los tiempos de recurrencia de cualquier punto tienen el máximo común divisor 1; más generalmente, la matriz de transición de n pasos tiene entradas positivas para tiempos grandes adecuados n.

Esta propiedad de la matriz generalmente se usa para probar la convergencia de las probabilidades en el momento n en una sola distribución llamada equilibrio cuando n tiende a infinito (lea el teorema de Perron Frobenius). La cadena se llama entonces mezcla. La mezcla es más fuerte que la ergódica: implica que los estados futuros se vuelven incluso asintóticamente independientes del estado inicial.

Personalmente, nunca escuché sobre gráficos de transición regulares, pero la propiedad de la matriz a la que se hace referencia en su enlace es nuevamente la misma propiedad que se usa para mostrar la convergencia al equilibrio. Supongo, pero no sé, que es solo una definición formal bastante inútil, ya que las únicas cadenas regulares pero que no se mezclan que se me ocurren pueden descomponerse en un sentido adecuado en cadenas de mezcla.

Espero que esto ayude.

Tienes la opción de añadir valor a nuestro contenido informacional aportando tu veteranía en las referencias.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *