Prueba T de Student inicio
Prueba T de Student.
Esta prueba estadística es una de las más empleadas para determinar si dos poblaciones o grupos muestrales son significativamente diferentes o no.
Esta prueba compara muestras pequeñas (menores de 30 idealmente), e involucra las medias y las desviaciones estándar de dos grupos de datos. El resultado que de obtiene de la aplicación de la formula se compara con los de una tabla de valores críticos, y dependiendo de si el valor calculado es menor o mayor al de la tabla, se puede concluir si las diferencias observadas en las medias de las poblaciones que se comparan son o no significativamente diferentes.
La formula es:
La formula es:
Donde X y Y (con la línea arriba), son las medias de los dos grupos de muestras;
S1 y S2 son sus desviaciones estándar y
n y m el numero de datos correspondiente a cada uno de los grupos muestrales (tamaño de la muestra)
Como primer paso se establecen la hipótesis nula (H0 ) y la alternativa (Ha). La primera (Ho) establece que No hay diferencias significativas entre las muestras, lo cual estaría indicando que las diferencias observadas de deberían al azar y la hipótesis alternativa (Ha) establece que Si hay diferencias significativas, esto es, que las diferencias se deben al tratamiento aplicado o en el caso de poblaciones, que estas son diferentes entre si.
Ejemplo:
En un experimento se midieron las hojas de brotes de trigo de tres días de germinados. El grupo A eran de semillas normales, en tanto que el B era de semillas que habían sido radiadas.
La siguiente tabla muestra las medias, Desviaciones estándar y tamaño de la muestra de los dos grupos.
Semillas normales (grupo A)
|
Semillas radiadas (grupo B)
| |
Media del largo de las hojas mm±1mm
|
10.91
|
2.30
|
Desviación estándar mm
|
3.97
|
1.52
|
Tamaño de la muestra
|
15
|
15
|
Después de aplicar la formula el resultado dio 7.89.
Ahora hay que calcular los grados de libertad que son (15-1) + (15-1) = 28
Buscando en la tabla de valores críticos (enlace Tabla valores T Student ) los grados de libertad se ven en la columna de la izquierda y arriba la probabilidad de que la diferencia se deba solo al azar o a la variabilidad propia del organismo. Por convención, para Biología siempre se trabaja con una probabilidad de 0.05 o bien 5%.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.
Lo que hace esta prueba es calcular la probabilidad muestras procedan de dos poblaciones subyacentes y el grado en que estas se sobreponen.
PARA CALCULARLA EN EXCEL
En Excel la prueba no da como resultado el resultado de la formula, sino que arroja directamente la probabilidad, por lo que si este resultado es mayor de 0.05 se acepta la hipótesis nula, y si es menor se rechaza la nula y se acepta la alternativa.
La función que se usa es:
TTEST (Prueba T de Student)
Problema ejemplo:
La empresa X, a mandado a algunos de sus empleados nuevos a un seminario de entrenamiento en Boston durante los pasados seis meses, en tanto que otros lo tomaron en New York. Al final del seminario, todos los empleados tomaron un examen para obtener el certificado. El seminario en Boston es más caro, pero en se piensa que el entrenamiento que se ofrece en Boston es mejor que el que se ofrece en New York. Los resultados de las calificaciones de 15 empleados que estudiaron en Boston y de 15 empleados que estudiaron en New York son los que se presentan en la siguiente tabla. Basadas en es estas calificaciones, ¿Se puede comprobar que el programa de Boston es mejor que el programa de New York?
Persona
|
Boston
|
New York
|
1
|
99
|
98
|
2
|
99
|
96
|
3
|
98
|
96
|
4
|
97
|
95
|
5
|
90
|
85
|
6
|
85
|
80
|
7
|
84
|
79
|
8
|
82
|
78
|
9
|
81
|
75
|
10
|
79
|
73
|
11
|
79
|
72
|
12
|
68
|
69
|
13
|
61
|
67
|
14
|
60
|
62
|
15
|
56
|
60
|
Promedio
|
81.2
|
79
|
Desv. Est.
|
14.4973
|
12.6152
|
Observaciones:
La función de TTEST calcula la probabilidad asociada con la prueba t de Student para determinar la probabilidad de que dos muestras procedan de dos poblaciones subyacentes. La función pide lo siguiente: TTEST(Array1, Array 2, tails, type) [PRUEBA.T(matriz1, matriz2, colas, tipo)]:
Array 1 es el primer conjunto de datos, el cual en este ejemplo son las calificaciones de Boston.
Array 2 es el segundo conjunto de datos, el cual en este ejemplo son las calificaciones de New York.
Tails especifica el número de colas de distribución. Si el argumento colas = 1, TTEST utiliza la distribución de una cola. Si colas = 2, TTEST utiliza la distribución de dos colas. En este ejemplo se supone 2 colas (por la distribución normal hacia ambos lados de la media).
Type es el tipo de prueba t que se realiza: 1 = Observaciones por pares; 2 = Observaciones de dos muestras con varianzas iguales; y 3 = Observaciones de dos muestras con varianzas diferentes. En este ejemplo se supone dos muestras con varianzas iguales.
Como resultado, la función de este ejemplo es la siguiente: TTEST(B2:B16, C2:C16, 2, 2). La probabilidad asociada con el valor t es de 0.6609. Ya que el valor no es menor de.05, no podemos decir que el entrenamiento en Boston es significativamente mejor que el entrenamiento de New York. Además, basada en esta información sería difícil justificar el entrenamiento más caro de Boston.”
Ustedes una vez que tienen sus datos en Excel calculan media y desviación estándar. Luego abren el cuadro de funciones, seleccionan las estadísticas y buscan la de PRUEBA.T o TTEST y les aparece el cuadro del ejemplo de arriba, seleccionan los datos de la primera columna en matriz 1, los de la 2ª en matriz 2, en colas ponen 2 y en el tipo generalmente es el 3 y cuando la varianza es igual ponen 2..
BIBLIOGRAFIA;
APUNTES DE TALLERES BI
Comentarios
Publicar un comentario