Saltar al contenido

¿Cómo determino el tamaño de la muestra para una prueba?

Si te encuentras con algo que no comprendes puedes comentarlo y te responderemos lo más rápido posible.

Solución:

Dejalo ser $N$ rollos independientes. Dejar $N_i$ sea ​​el numero de veces el resultado $i$ ha ocurrido, y por lo tanto $N_1+cdots+N_n=N.$

La distribución empírica después $N$ rollos es $hatp_i=N_i/N,$ por $1leq ileq n,$ y denotemos la distribución real $p_i$ ($p_i=1/n$ en tu caso). Dejar
$$ mathbbp=(p_1,ldots,p_n),quad hatmathbbp=(hatp_1,ldots,hatp_n) $$
y definir la variación total ($ell_1$) distancia entre las dos distribuciones como
$$ Vert mathbbp-hatmathbbpVert_1=sum_i=1^n mid p_i-hatp_imid $$
Uno de los resultados en este dominio que es fácil de aplicar fue probado por Devroye [1]:

Dejar $varepsilongeqsqrt20N/n$ luego
$$ matemáticasP[Vert mathbbp-hatmathbbpVert_1>varepsilon]leq 3exp(-Nvarepsilon^2/25) $$
Si desea acotar directamente la máxima diferencia de probabilidades, es decir,
$$ Vert mathbbp-hatmathbbpVert_infty=sup_1leq ileq n mid p_i-hatp_imid $$
puedes obtener
$$ matemáticasP[Vert mathbbp-hatmathbbpVert_infty>varepsilon]leq 4 exp(-Nvarepsilon^2/2),quad forall varepsilon>0. $$
Finalmente, observe que si la segunda desigualdad se usa con $varepsilon_0$el correspondiente $varepsilon$ en la primera desigualdad puede ser tan grande como $varepsilonleq nvarepsilon_0$.

  1. Luc Devroye. La equivalencia de convergencia débil, fuerte y completa en L1 para estimaciones de densidad kernel. Ana. Statist., 11(3):896–904, 1983.

Necesita darle la vuelta a esta pregunta para obtener una respuesta útil. Nunca podrá tirar el dado suficientes veces para asegurarse de que es perfectamente justo.

Lo que puedes hacer es decir que quieres tirar el dado tantas veces como para detectar si no es justo. Hay una manera de responder eso matemáticamente. Necesitas una manera de decir qué tan lejos de las probabilidades $(1/6, 1/6, 1/6, 1/6, 1/6, 1/6)$
desea poder detectar. por ejemplo, es
$(5/36, 7/36, 6/36, 6/36, 6/36, 6/36)$ ¿Tan deshonesto que querrías atrapar eso? Eso es tamaño del efecto
quieres detectar.

A continuación, debe decir qué tan probable desea detectar un efecto de ese tamaño. Los objetivos razonables pueden ser 80%, 90% y 95%. (100% no es razonable, en las pruebas casi nada es absolutamente seguro.) Ese es el deseado potencia de la prueba.

Finalmente, debe indicar qué prueba utilizará. Para detectar la falta de equidad en un dado, tal vez una prueba de bondad de ajuste de chi-cuadrado al nivel del 5%. Por lo general, una prueba puede acusar falsamente a un dado de injusticia. muchos investigadores quieren cometer ese error rara vez y eligen el Nivel significativo ser pequeño–5% o 1%. Por lo tanto, debe especificar el tipo de prueba y su nivel de significación.

Eso es un montón de cosas diferentes a considerar. En muchos casos, para planificar el tamaño de la muestra necesario para un estudio exitoso, un investigador decidirá (al menos tentativamente) sobre el tamaño del efecto, el tipo de prueba y el nivel de significación, y luego hará un cálculo para equilibrar el poder contra el tamaño de la muestra.

Muchos programas de software estadístico tienen procedimientos de “Potencia y tamaño de muestra” para realizar estos cálculos. Mostrar los detalles matemáticos de la potencia frente al tamaño de la muestra para tirar los dados puede requerir demasiados detalles matemáticos para obtener una respuesta útil aquí.

En cambio, supongamos que desea responder una pregunta similar para lanzar una moneda al aire para ver si es justo. Le gustaría saber si la moneda tiene una probabilidad de cara mayor que $Delta = 0.02$ de la feria $(1/2).$ Quiere que el nivel de significación sea $alfa = 0.05$ y el poder de ser $.95 = 1-beta = 1-.05$ en una prueba de $H_0: p = 0,5$ en contra $H_a: pne 0.5.$ ¿Qué tamaño de muestra se requiere?

la fórmula es
$$n = frac.25(z_beta+z_alpha/2)Delta^2 = 2253,$$
donde $z_beta = 1.645, z_alpha/2 = 1.96.$ [The significance level gets split in half for a two-sided test.]

n = .25*(1.645+1.96)/.02^2;  n
[1] 2253.125

Eso es un lote de lanzamientos de monedas. Tal vez te pongas a pensar si se necesitan tantos lanzamientos para detectar $Delta$ tan pequeño como $0.02,$
entonces tal vez podría estar satisfecho con el tamaño del efecto $Delta = 0.05.$
Entonces solo necesitarías $n = 361$ lanzamientos de la moneda.

Hay muchas páginas de Internet gratuitas con “calculadoras” potentes y de tamaño de muestra con diversos grados de transparencia sobre cómo usarlas (y una cantidad variable de anuncios emergentes para mirar). Tal vez quieras explorar. En cualquier caso, espero que sepa cuáles son los principales problemas que debe decidir para realizar dichos cálculos de manera útil.

Nos encantaría que puedieras dar visibilidad a esta sección si si solucionó tu problema.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *