Saltar al contenido

Calcular la incertidumbre en desviación estándar

Nuestros mejores programadores agotaron sus reservas de café, investigando noche y día por la respuesta, hasta que César encontró la solución en GitHub y hoy la comparte aquí.

Solución:

Si desea averiguar la incertidumbre o el error estándar (SE) en la desviación estándar de una muestra elegida, simplemente puede usar $ SE ( sigma) = frac sigma sqrt 2N – 2 $, donde $ N $ es el número de puntos de datos en su muestra.

¡Espero que ayude!

Si se le permite tomar esa muestra repetidamente, básicamente se trata de bootstrapping.

Procedimiento:

  1. Dibuja 100 puntos

  2. Calcular la desviación estándar

  3. Repita los pasos 1 y 2 muchas veces (empíricamente, he encontrado que 5-10,000 son suficientes), realizando un seguimiento de los resultados del paso 2.

  4. Examine la distribución de estimaciones del Paso 2 con las herramientas que desee: histogramas, momentos de muestra, etc.

la respuesta a la pregunta de OP depende de si se conoce o no la media de la distribución. si se conoce la media (por ejemplo, si sabe que la media de la población de la muestra debería llegar a ser cero), entonces el problema es un poco diferente, no por mucho, pero no investigué para averiguar hasta qué punto , [4] podría ayudar. Supongo que no se conoce la media.

por lo que tiene una muestra de 100 valores, para los que no conoce la media o la varianza. puede calcular el estimador de varianza insesgado:[1]
$$ S ^ 2 = varianza estimador = frac 1 n-1 sum_i left (x_i- frac sum x n right) ^ 2 = frac 1 n (n-1) sum_ i, j frac (x_i-x_j) ^ 2 2 $$

pero también desea saber qué tan precisa es esta estimación de la varianza de la muestra. en otras palabras, desea la varianza del estimador de varianza. $ Var left (S ^ 2 right) $
esto se muestra en [2] ser – estar:
$$ Var left (S ^ 2 right) = frac 1 n left ( mu_4- frac n-3 n-1 mu_2 ^ 2 right) $$

$$ donde mu_k: = E[(X-E[X]) ^ k]$$
($ mu_k $ son los momentos centrados) y así obtienes:
$$ sigma ^ 2: = mu_2 = S ^ 2 pm sqrt frac 1 n left ( mu_4- frac n-3 n-1 mu_2 ^ 2 derecha) $$
pero lamentablemente esto no se da en función de sus puntos de datos (es una función de $ mu_4, mu_2 $ ambos son desconocidos), lo que realmente desea es un estimador insesgado para $ Var left (S ^ 2 right) $. No pude encontrar completamente la manera correcta de lograr esto. Los estimadores insesgados de funciones no lineales no son, en general, fáciles de encontrar (en este caso, creo que probablemente sea imposible), por lo que hasta donde yo sé, tendrá que lidiar con algunos sesgos. en un intento de minimizar este sesgo, podría encontrar buenos estimadores para $ mu_4, mu_2 $y conéctelos a
$ sqrt frac 1 n left ( mu_4- frac n-3 n-1 mu_2 ^ 2 right) $
e ignorar el sesgo que surge de la no linealidad. los estimadores insesgados para momentos centrados ($ mu_4, mu_2 $) se denominan estadísticas H, son bastante fáciles de encontrar en línea o en libros y no son demasiado complejas de calcular. para mi utiliza la estadística H para $ mu_4 $ es una expresión bastante terrible [3], y como ya dije, usarlo no está exento de sesgo, así que lo que decidí hacer fue asumir que Xi está lo suficientemente cerca de gaussiano para que $ mu_4 = 3 mu_2 ^ 2 $ y así obtuve:
$$ Var left (S ^ 2 right) = frac 1 n left ( mu_4- frac n-3 n-1 mu_2 ^ 2 right) = frac 1 n left (3 mu_2 ^ 2- frac n-3 n-1 mu_2 ^ 2 right) = frac 1 n left (3- frac n-3 n-1 right) mu_2 ^ 2 = frac 1 n left ( frac 2n n-1 right) mu_2 ^ 2 = frac 2 mu_2 ^ 2 n-1 $$

y así ahora (asumiendo $ mu_4 = 3 mu_2 ^ 2 $):
$$ sigma ^ 2: = mu_2 = S ^ 2 pm sqrt frac 2 n-1 sigma ^ 2 approx S ^ 2 pm sqrt frac 2 n-1 S ^ 2 $$

para terminar, OP pidió la incertidumbre en S y no en $ S ^ 2 $. así que si usas la propagación de la incertidumbre [5] para evaluar cómo se ve afectada la incertidumbre al sacar la raíz cuadrada:

($ SE $ significa error estándar)
$$ SE[sqrtY] approx frac 1 2 sqrt E[Y] SE[Y]$$$$ sigma = S pm frac 1 2 sqrt S ^ 2 sqrt frac 2 n-1 S ^ 2 = S pm frac S sqrt 2n-2 $$

que coincide con las otras respuestas.

referencias:

[1] – Algunas propiedades de la varianza muestral por Eric Benhamou

https://arxiv.org/pdf/1809.03774.pdf

[2] – Varianza de varianza simple por Eungchun Cho y Moon Jung Cho

http://www.asasrms.org/Proceedings/y2008/Files/300992.pdf

[3] – WolframMathWorld h-Staatistic

https://mathworld.wolfram.com/h-Statistic.html

[4] – Estimación StatLect Point de la varianza

https://www.statlect.com/fundamentals-of-statistics/variance-estimation

[5] – Wikipedia Propagación de la incertidumbre 26/09/2020

https://en.wikipedia.org/wiki/Propagation_of_uncertainty

Ten en cuenta difundir este ensayo si lograste el éxito.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *