Saltar al contenido

¿Cómo interpretar los resultados de scipy.stats.probplot?

Nuestros desarrolladores estrellas agotaron sus provisiones de café, en su búsqueda a tiempo completo por la respuesta, hasta que Carmen encontró la contestación en GitHub por lo tanto hoy la comparte con nosotros.

Solución:

Busqué desde hace horas una respuesta a esta pregunta, y esto se puede encontrar en los comentarios del código de Scipy / Statsmodel.

En Scipy, comenta en https://github.com/scipy/scipy/blob/abdab61d65dda1591f9d742230f0d1459fd7c0fa/scipy/stats/morestats.py#L523 dice:

probplot genera una gráfica de probabilidad, que no debe confundirse con una gráfica QQ o PP. Statsmodels tiene una funcionalidad más extensa de este tipo, consulte statsmodels.api.ProbPlot.

Entonces, ahora, veamos Statsmodels, donde comenta en https://github.com/statsmodels/statsmodels/blob/66fc298c51dc323ce8ab8564b07b1b3797108dad/statsmodels/graphics/gofplots.py#L58 dice:

ppplot: Gráfica de probabilidad-probabilidad Compara la muestra y las probabilidades teóricas (percentiles).

qqplot: gráfico de cuantiles-cuantiles Compara la muestra y los cuantiles teóricos

probplot: Gráfica de probabilidad Igual que una gráfica QQ, sin embargo, las probabilidades se muestran en la escala de la distribución teórica (eje x) y el eje y contiene cuantiles sin escala de los datos de la muestra.

Entonces, la diferencia entre la gráfica QQ y la gráfica de probabilidad, en estos módulos, está relacionada con las escalas.

La probabilidad teórica de que ocurra un evento es una probabilidad “esperada” basada en el conocimiento de la situación. Es el número de resultados favorables al número de posibles resultados.

Cuando recopile datos de observaciones durante un experimento, estará calculando una probabilidad empírica (o experimental).

Ejemplo: lanzaste una moneda y obtuviste cara.

Probabilidad experimental (cabeza) = 1

Probabilidad teórica (cabeza) = 0.5

Para simplificar, vea el diagrama a continuación que muestra la probabilidad de obtener un monto de factura particular. Se muestran las gráficas pyq.
ingrese la descripción de la imagen aquí

ppplot: Gráfica de probabilidad-probabilidad Compara la muestra y las probabilidades teóricas (percentiles).

qqplot: gráfico de cuantiles-cuantiles Compara la muestra y los cuantiles teóricos

probplot: Gráfica de probabilidad Igual que una gráfica QQ, sin embargo, las probabilidades se muestran en la escala de la distribución teórica (eje x) y el eje y contiene cuantiles sin escala de los datos de la muestra.

Las diferencias entre ppplot, qqplot y probplot están relacionadas con las escalas. Ambos muestran valores teóricos y de muestra en los ejes xey.

ingrese la descripción de la imagen aquí

Gráficos de percentiles Los gráficos de percentiles son los gráficos más simples. Simplemente grafica los datos contra sus posiciones de trazado. Las posiciones de trazado se muestran en una escala lineal, pero los datos se pueden escalar según corresponda.

Gráficas de cuantiles Las gráficas de cuantiles son similares a las gráficas de probabilidad. Las principales diferencias es que las posiciones de trazado se convierten en cuantiles o puntuaciones ZZ basadas en una distribución de probabilidad.

La distribución predeterminada es la distribución estándar-normal. Observará que la forma de los datos es más recta en la gráfica QQ que en la gráfica PP. Esto se debe a la transformación que tiene lugar al convertir las posiciones de trazado en los cuantiles de una distribución.

Líneas de mejor ajuste

Agregar una línea de mejor ajuste a una gráfica de probabilidad puede proporcionar información sobre si un conjunto de datos se puede caracterizar o no por una distribución.

ingrese la descripción de la imagen aquí

En estadística y los cuantiles de probabilidad son puntos de corte que dividen el rango de una distribución de probabilidad en intervalos continuos con probabilidades iguales, o que dividen las observaciones en una muestra de la misma forma. Densidad de probabilidad de una distribución normal, con los cuartiles mostrados. El área debajo de la curva roja es la misma en los intervalos (−∞, Q1), (Q1, Q2), (Q2, Q3) y (Q3, + ∞).

En estadística, una gráfica Q – Q (cuantiles-cuantiles) es una gráfica de probabilidad, que es un método gráfico para comparar dos distribuciones de probabilidad trazando sus cuantiles entre sí.

Si las dos distribuciones que se comparan son similares, los puntos en la gráfica Q – Q estarán aproximadamente en la línea y = x. Si las distribuciones están relacionadas linealmente, los puntos en la gráfica Q – Q estarán aproximadamente en una línea, pero no necesariamente en la línea y = x.

La gráfica AQ-Q se utiliza para comparar las formas de las distribuciones, proporcionando una vista gráfica de cómo las propiedades como la ubicación, la escala y la asimetría son similares o diferentes en las dos distribuciones.

La gráfica AP – P grafica dos funciones de distribución acumulativa (CDF) entre sí: es una gráfica de probabilidad para evaluar qué tan cerca están de acuerdo dos conjuntos de datos, que grafica las dos funciones de distribución acumulativa entre sí. Los gráficos de PP se utilizan ampliamente para evaluar la asimetría de una distribución.

Si estás de acuerdo, eres capaz de dejar una noticia acerca de qué te ha gustado de este escrito.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *