Diseño de experimentos.
1.
Análisis de varianza.
Suponga que un experimento industrial un ingeniero
está interesado en cómo la absorción media de humedad en concreto varía entre
cinco mezclas diferentes de concreto. Las muestras se exponen a la humedad por
48 horas y se decide que se prueben seis muestras para cada mezcla, por lo que
se requiere probar un total de 30 muestras. Los datos de este experimento se
muestran en la siguiente tabla.
Tabla 1
Absorción de humedad en mezclas de concreto. |
||||||
Mezcla |
1 |
2 |
3 |
4 |
5 |
|
|
551.00 |
595.00 |
639.00 |
417.00 |
563.00 |
|
|
457.00 |
580.00 |
615.00 |
449.00 |
631.00 |
|
|
450.00 |
508.00 |
511.00 |
517.00 |
522.00 |
|
|
731.00 |
583.00 |
573.00 |
438.00 |
613.00 |
|
|
499.00 |
633.00 |
648.00 |
415.00 |
656.00 |
|
|
632.00 |
517.00 |
677.00 |
555.00 |
679.00 |
|
Total |
3320.00 |
3416.00 |
3663.00 |
2791.00 |
3664.00 |
16854.00 |
Media |
553.33 |
569.33 |
610.50 |
465.17 |
610.67 |
561.80 |
H1 : al menos dos de las medias no son
iguales.
Además, nos podemos interesar en realizar
comparaciones individuales entres estas cinco medias poblacionales.
En el procedimiento de
análisis de varianza, se supone que cualquier variación que exista entre los
promedios de las mezclas se atribuye a
1)
La variación en la absorción entre las observaciones
dentro de los tipos de mezclas
2)
la variación que se debe a los tipos de mezclas; las
que se deben a diferencias en la composición química de las mezclas.
Las variaciones dentro de la
muestra, por supuesto, son ocasionadas por diversas causas. Quizá las
condiciones de humedad y temperatura no se conservaron completamente constantes
a lo largo del experimento. Es posible que haya cierta cantidad de heterogeneidad
en los lotes de materia prima que se utilizan. De todos modos, consideraremos
que la variación dentro de la muestra es una variación aleatoria o al azar, y
parte del objetivo del análisis de varianza es determinar si las diferencias
entre las cinco medias muéstrales son las que se esperarían debido sólo a la
variación aleatoria o si en realidad también hay una contribución de la
variación sistemática que se atribuye al tipo de mezcla.
2.
Estrategia del diseño experimental.
Definimos a una unidad
experimental como una unidad motivo del análisis, por ejemplo, una unidad
experimental podría ser el peso, la talla, el nivel de colesterol, etc. Es
necesario que estas se tomen de forma aleatoria para eliminar el sesgo, nunca
se debe realizar el experimento para un conjunto de variables dadas y tomar de
forma secuencial un conjunto de datos.
Cuando se tiene un conjunto de
datos grande el sesgo se reduce, pero hay que recordar, que este se incrementa
a medida que reducimos el tamaño del conjunto.
Definimos un bloque al
conjunto de unidades experimentales que se agrupan de acuerdo a una propiedad o
característica en particular. Los niveles del factor o tratamiento se asignan
entonces de forma aleatoria dentro de los bloques. El propósito de formar
bloques es reducir el error experimental efectivo.
El término tratamiento se usa
por lo general para referirnos a las diversas clasificaciones, ya sea de las
mezclas diferentes, análisis diferentes, fertilizantes diferentes o regiones
diferentes del país.
3. Diseño completamente aleatorizado.
H1 : al
menos dos de las medias no son iguales.
Denotemos a yij
como la j-ésima observación del i-ésimo tratamiento y acomodemos
los datos de acuerdo con la siguiente tabla.
Aquí Ti es el total de todas las observaciones del i-ésimo
tratamiento, es la media de todas
las observaciones del i-ésimo tratamiento, T.
es el total de las nk observaciones y
es la media de todas
las observaciones. Cada observación se puede escribir en la forma
donde eij mide la desviación de la j-ésima observación de la
i-ésima muestra de la correspondiente media del tratamiento. El término eij representa el error
aleatorio y juega el mismo papel que los términos de error en los modelos de
regresión. Una forma alternativa de esta misma ecuación y que se prefiere se
obtiene al sustituir
sujeta a la restricción , de aquí podemos escribir
donde m es la media
general de todas las observaciones es decir:
y ai se denomina el efecto de i-ésimo tratamiento.
La hipótesis nula de que las k
medias poblacionales son iguales contra la alternativa de que al menos de de
las medias son diferentes se puede reemplazar ahora por la hipótesis
equivalente,
H0:
a1 = a2 =
.. .= ak = 0
H1:
al menos una es diferente de cero.
Nuestra prueba se basará en
una comparación de dos estimaciones independientes de la varianza poblacional
común s2. Estas estimaciones se obtendrán al dividir la
variabilidad total de nuestros datos, que se presentan en la doble sumatoria
en dos componentes.
Esta ecuación es llamada la
Identidad de la suma de cuadrados, ver [Walpole et all] para la prueba.
Será conveniente en lo que
sigue identificar los términos de la identidad de suma de cuadrados mediante la
siguiente notación.
SST = suma total de cuadrados
SSA = suma de cuadrados de
tratamiento
SSE =suma de cuadrados de
error.
La identidad de la suma de
cuadrados se puede presentar de manera simbólica con la ecuación.
SST = SSA + SSE.
Formulas
para el cálculo de sumas de cuadrados.
A continuación presentamos un
conjunto de formulas mas simples para calcular la suma de cuadrados (dejamos al
lector su demostración).
El valor esperado de SSA es:
Si H0 es verdadera,
una estimación de s2, que se basa en k-1 grados de libertad, la
proporciona la expresión
la cual se denomina cuadrado
medio del tratamiento.
Un segundo e independiente
estimados de s2, que se basa en k(n-1) grados de libertad, es la
formula ya familiar
la cual se denomina cuadrado
del error.
Cuando Ho es verdadero, la
razón es un valor de la
variable aleatoria F con k-1 y k(n-1) grados de libertad. Como sobrestima s2
cuando H0 es falsa, tenemos una prueba de una sola cola con la
región crítica completamente en la cola derecha de la distribución.
La hipótesis nula H0
se rechaza en el nivel de significancia a cuando
f
>fa[k-1, k(n-1)]
Análisis de variancia para probar m1
= m2 = m3 = m4
= m5
|
||||
Fuente de variación |
Suma de cuadrados |
Grados de libertad |
Cuadrado medio |
f calculada |
Regresión |
SSA |
k-1 |
s1 =SSA/(k-1) |
s1/s2 |
Error |
SSE |
k(n-1) |
s2=SSE/ (k*(n-1)) |
|
Total |
SST |
nk-1 |
|
|
rechazamos H0, al nivel de significancia
a cuando f > fa(k, n-(k+1)) |
Cálculo utilizando MINITAB
Para
llevar a cabo el procedimiento utilizando MINITAB una vez introducidos los
datos en la hoja de trabajo ir al menú Stat > ANOVA > One-Way… :
Después
aparecerá la caja de diálogo
Ejemplo 10.
Para los datos de la Tabla 1, realizar el análisis de varianza.
y =
551
595 639 417
563
457
580 615 449
631
450
508 511 517
522
731
583 573 438
613
499
633 648 415
656
632
517 677 555
679
---------------------------------------------------------------------
Análisis
de Varianza
---------------------------------------------------------------------
Fuente
de Suma Grados de Cuadrado F calc
Variación cuadrados Libertad medio
---------------------------------------------------------------------
Regresión 85356.47 4 21339.12
4.30
Error 124020.33 25 4960.81
Total 209376.80 29
---------------------------------------------------------------------
Con
(1-alfa) = 0.990 tenemos 4.30
> 4.18
El código en MATLAB para este
ejemplo es:
function z = MiAnova(y)
n =
length(y(:,1));
k =
length(y(1,:));
Suma2
= 0;
Suma
= 0;
for ren = 1:n
for col =
1:k
Suma2
= Suma2 + y(ren, col)^2;
Suma = Suma + y(ren, col);
end;
end;
SST
= Suma2 - Suma^2/n/k;
SSA
= n*sum(mean(y).^2) - Suma^2/n/k;
SSE =
SST - SSA;
v1 =
k-1;
v2 =
k*(n-1);
s1 =
SSA/v1;
s2 =
SSE/v2;
F =
s1/s2;
alfa
= 0.01;
Fc =
Finv(1-alfa, v1, v2);
fprintf('---------------------------------------------------------------------\n');
fprintf('Analisis de Varianza\n');
fprintf('---------------------------------------------------------------------\n');
fprintf('Fuente de
Suma Grados de Cuadrado F calc\n');
fprintf('Variacion
cuadrados Libertad medio \n');
fprintf('---------------------------------------------------------------------\n');
fprintf('Regresion %13.2f
%13.f %13.2f %13.2f\n',
SSA, v1, s1, F);
fprintf('Error
%13.2f %13.f %13.2f \n', SSE, v2, s2);
fprintf('Total
%13.2f %13.f \n', SST, v1+v2);
fprintf('---------------------------------------------------------------------\n');
fprintf('Con (1-alfa)
= %5.3f tenemos %13.2f > %13.2f\n', 1-alfa, F, Fc);
z = F;
Esta implementación se puede
realizar con el comando anova1 de MATLAB y para este ejemplo los resultados
son:
La solución utilizando MINITAB
es
One-way ANOVA: Absorcion versus
Mezcla
Source DF SS
MS F P
Mezcla 4 85356
21339 4.30 0.009
Error 25 124020
4961
Total 29 209377
S = 70.43 R-Sq = 40.77% R-Sq(adj) = 31.29%
Individual
95% CIs For Mean Based on
Pooled StDev
Level N Mean
StDev
--+---------+---------+---------+-------
1 6 553.33
110.15
(-------*--------)
2 6 569.33
47.99
(-------*--------)
3 6 610.50
59.95 (-------*--------)
4 6 465.17
57.61 (-------*--------)
5 6 610.67
58.78
(-------*--------)
--+---------+---------+---------+-------
420 490
560 630
Pooled StDev = 70.43
Para el valor P podemos ver
que es menor que el nivel de significancia por lo tal la hipótesis debe ser
rechazada y tenemos medias diferentes.
Ejemplo 11.
Parte de un estudio que se
llevo a cabo en el Instituto Politécnico y Universidad Estatal de Virginia, se
diseño para medir los niveles de actividad de fosfatasa alcalina en suero de
niños con crisis convulsivas que reciben terapia contra convulsiones bajo el
cuidado de un médico particular. Se encontraron 45 sujetos para estudio y se
clasificaron en cuatro grupos según el medicamento administrado:
G-1: Control (No reciben
anticonvulsivos y no tienen historial de crisis convulsivas)
G-2: Fenobartibal.
G-3: Carbanacepina.
G-4: Otros anticonvulsivos.
Se determinó el nivel de
actividad de la fosfatasa alcalina en suero a partir de muestras sanguíneas
obtenidas de cada sujeto y se registraron en la siguiente tabla. Pruebe la
hipótesis al nivel de significancia de 0.05 de que el nivel promedio de
actividad de fosfatasa alcalina en suero es el mismo para los cuatro grupos.
Nivel de Actividad de fosfatasa alcalina en suero |
||||
G-1 |
G-2 |
G-3 |
G-4 |
|
49.20 |
97.50 |
97.07 |
62.10 |
110.60 |
44.54 |
105.00 |
73.40 |
94.95 |
57.10 |
45.80 |
58.05 |
68.50 |
142.50 |
117.60 |
95.84 |
86.60 |
91.85 |
53.00 |
77.71 |
30.10 |
58.35 |
106.60 |
175.00 |
150.00 |
36.50 |
72.80 |
0.57 |
79.50 |
82.90 |
82.30 |
116.70 |
0.79 |
29.50 |
115.50 |
87.85 |
45.15 |
0.77 |
78.40 |
|
105.00 |
70.35 |
0.81 |
127.50 |
|
95.22 |
77.40 |
|
|
|
La solución con MINITAB es
Results
for: fosfatasa_suero.MTW
One-way
ANOVA: Actividad versus Tratamiento
Source DF SS
MS F P
Tratamiento 3 14136
4712 3.61 0.021
Error 41 53474
1304
Total 44
67609
S = 36.11 R-Sq = 20.91% R-Sq(adj) = 15.12%
Individual 95% CIs For Mean Based on
Pooled
StDev
Level N Mean
StDev
--+---------+---------+---------+-------
1 20 73.01
25.75 (----*-----)
2 9 48.93
47.11 (-------*-------)
3 9 93.61
46.57
(-------*-------)
4 7 101.63
31.02
(--------*--------)
--+---------+---------+---------+-------
30 60 90
120
Pooled StDev = 36.11
En este caso el valor P es
0.021 así que para un grado de significancia del 5% este valor es inferior y la
hipótesis de que las varianzas
4.
Pruebas de igualdad de varianzas.
Aunque
la razón f que se obtiene del procedimiento de análisis de varianza es
insensible a desviaciones de la suposición de varianzas iguales para las k
poblaciones normales cuando las muestras son de tamaño igual, aún podemos
preferir tener precaución y realizar una prueba preliminar para la homogeneidad
de varianzas. Tal prueba en realidad sería aconsejable en el caso de tamaños de
muestras diferentes, donde si hay una duda razonable, con respecto a la
homogeneidad de la varianzas poblacionales. Suponga, por tanto, que deseamos
probar la hipótesis nula
H0 :
H1 : No todas las
varianzas son iguales.
La prueba que utilizaremos,
llamada prueba de Bartlett, se basa en una estadística cuya distribución
muestral proporciona valores críticos exactos cuando los tamaños muéstrales son
iguales. Estos valores críticos para tamaños iguales de muestras también se
pueden utilizar para obtener aproximaciones altamente precisas de los valores
críticos para tamaños diferentes de las muestras.
Los pasos para la prueba de
Bartlett son:
Primero : Calculamos las k
varianzas muestrales s21, s22,
..., s2k a partir de las muestras de tamaño n1,
n2, ... nk, con .
Segundo : Combinamos las
varianzas muestrales para obtener la estimación combinada.
Ahora bien,
es un valor de una variable
aleatoria B que tiene una distribución Bartlett. Para el caso especial donde n1
= n2 = ... = nk = n, rechazamos H0 en el nivel
de significacancia a si
b <bk(a,n)
donde bk(a,n) es el
valor crítico que deja un área de tamaño a en la cola izquierda de una
distribución Bartlett. Cuando los tamaños son diferentes, la hipótesis nula se
rechaza en el nivel de significancia a si
b <bk(a,n1,
n2, ..., nk)
donde
Ejemplo
12.
Utilice la prueba de Bartlett
para probar la hipótesis, en el nivel de significancia 0.01, que las varianzas
poblacionales de los cuatro grupos de medicamentos del ejemplo 11 son iguales.
Nuestra hipótesis a probar es:
H0 :
H1 : No todas las
varianzas son iguales.
Para los datos dados tenemos
que
n1 = 20, n2
= 9, n3 = 9, n4 = 7, N = 45 y k = 4;
Por lo tanto rechazamos cuando
b < b4(0.001, 20, 9, 9, 7)
los valores de bk(a,nj),
son extraídos de una tabla de valores críticos b
|
valor |
b(0.01,20) |
0.8586 |
b(0.01,9) |
0.6892 |
b(0.01,7) |
0.6992 |
destituyendo valores tenemos:
b4(0.01; 20, 9, 9, 7) =
(20*0.8586 + 9*0.6892 + 9*0.6892 + 7*0.6992)/45
= 0.7513
Las varianzas de cada grupo
las calculamos
con lo cual obtenemos s2
= [662.862, 2219.781, 2168.434, 946.032]
sp2 = [(662.862)*(19) +
(2219.781)*(8) + (2168.434)*(8) +
(946.032)*(6)]/41 = 1301.861
b = [(662.862)19
(2219.781)8 (2168.434)8 (946.032)6]1/4
---------------------------------------------------------------------------
1301.861
b = 0.8557
La
decisión es no rechazar la hipótesis y concluir que las varianzas poblacionales
de los cuatro grupos de medicamentos no son significativamente diferentes.
5. Comparación de un solo
grado de libertad.
El análisis de varianza es una
clasificación unilateral, o experimento de un factor, como a menudo se llama,
solamente indica si la hipótesis de media iguales se puede rechazar o no. Por
lo general, un experimentador preferiría que su análisis realizara pruebas más
profundas. Con relación al ejemplo 10 podemos, al rechazar la hipótesis nula,
pero aun no sabemos donde existe diferencia entre las mezclas.
Prueba de Duncan.
Es un procedimiento utilizado
para realizar la comparación de rangos múltiples de medias. Este procedimiento
se basa en la noción general de un rango studentizado (recordar distribución
t-student). El rango de cualquier subconjunto de p medias muestrales debe
exceder cierto valor antes de que se encuentre que cualquiera de la p medias es
diferentes. Este valor se llama rango de menor significancia para las p medias
y se denota con Rp donde
donde:
1.
rp
son los rangos studentizado de menor significancia y depende del nivel
de significancia y den número de grados de libertad.
2.
s2 es el cuadrado medio del error y se toma de la
tabla de análisis de varianza
3.
n es el número de elementos para un tratamiento
especifico.
4.
p representa el tamaño del conjunto de medias.
5.
y Rp puede entenderse como la diferencia
mínima que debe existir entre la media mas grande y la más pequeña de un
conjunto de tamaño p.
Los
pasos que debemos seguir para aplicar la prueba de Duncan son:
1.
Calcular el valor de cada una de las medias
correspondientes a cada tratamiento y ordenarlas de mayor a menor, ya ordenadas
las renumeraremos de 1 a p. Note que inicialmente p es igual al número de
tratamientos k.
2.
Determinar de una tabla los valores rp para
un valor de significancia a.
3.
Calcular los Rp de acuerdo con la expresión anterior y
tomar de la tabla de análisis de varianza el valor s2 = SSE/(k*(n-1))
4.
Probar por rangos que vayan de la media 1 a la p
5.
Si la hipótesis se cumple, es decir si Rp
< mi+p – mi,
terminamos
6.
Hacemos rangos más pequeños p = p-1 y regresamos al
paso 4 mientras p > 1.
Ejemplo 13.
Consideremos un ejemplo
hipotético donde tenemos los siguientes valores para las medias de 6
tratamientos.
Paso 1.
media |
m2 |
m5 |
m1 |
m3 |
m6 |
m4 |
y |
14.5 |
16.75 |
19.84 |
21.12 |
22.90 |
23.20 |
n |
5 |
5 |
5 |
5 |
5 |
5 |
Paso 2.
Los valores de rp
los obtenemos de tablas.
p |
2 |
3 |
4 |
5 |
6 |
rp |
2.919 |
3.066 |
3.160 |
3.226 |
3.276 |
Paso 3.
Calculamos los Rp para nuestro
ejemplo, tomando el valor de s2 = 2.45 del análisis de varianza
R2p = rp*[s2/n]1/2
R22 = r2*[s2/n]1/2 = 2.919*[2.45/5]1/2 = 2.043
R23 = r3*[s2/n]1/2 = 3.066*[2.45/5]1/2 = 2.146
R24 = r4*[s2/n]1/2 = 3.160*[2.45/5]1/2 = 2.212
R25 = r5*[s2/n]1/2 = 3.226*[2.45/5]1/2 = 2.258
R26 = r6*[s2/n]1/2 = 3.276*[2.45/5]1/2 = 2.293
En
resumen
p |
2 |
3 |
4 |
5 |
6 |
rp |
2.919 |
3.066 |
3.160 |
3.226 |
3.276 |
Rp |
2.043 |
2.146 |
2.212 |
2.258 |
2.293 |
Paso
4.
Comenzamos con p=6, por lo
tanto R6 = 2.293 y probamos
m4 – m2
= 23.20 - 14.5 = 8.7
Paso 5.
m4 – m2 es mayor que 2.293, por lo tanto el rango no
es 6.
Paso 6.
p = 5.
m4 – m5
= 23.20 – 16.75 = 6.45
m6 – m2
= 22.90 – 14.50 = 8.4
Paso 5.1
m4 – m5 es mayor que R5 = 2.296, y
m6 – m2 es mayor que R5 = 2.296, por lo
tanto el rango no es 5.
Paso 6.1
p = 4.
Paso 4.2
m4 – m1
= 23.20 – 19.84 = 3.36
m6 – m5
= 22.90 – 16.75 = 6.15
m3 – m2
= 21.12 – 14.50 = 6.62
Paso 5.2
m4 – m1 es mayor que R4 = 2.212,
m6 – m5 es mayor que R4 = 2.212,
m3 – m2 es mayor que R4 = 2.212, y por lo tanto el rango no es 4.
Paso 6.2
p
= 3.
Paso 4.3
m4 – m3
= 23.20 – 21.12 = 2.08
m6 – m1
= 22.90 – 19.84 = 3.50
m3 – m5
= 21.12 – 16.75 = 4.37
m1 – m2
= 19.84 – 14.50 = 5.84
Paso 5.3
m4 – m3 es menor que R3 = 2.146, por tanto
hay un rango 3 dado por [m4, m6, m3].
Para el resto
m6 – m1 es mayor que R3 = 2.146,
m3 – m5 es mayor que R3 = 2.146,
m1 – m2 es mayor que R3 = 2.146 y por lo tanto el rango no es 3.
Paso 6.3
p = 2.
Paso 4.4
Como ya determinamos el
conjunto [m4, m6, m3], trabajamos con el resto
de las medias así
m3 – m1
= 21.12 - 19.84 = 2.08
m1 – m5
= 19.84 - 16.75 = 3.09
m5 – m2
= 16.75 - 14.50 = 2.25
Paso 5.4
m3 – m1 es menor que R2 = 2.043, por tanto
hay un rango 2 dado por [m3 – m1 ].
Para las demás
m1 – m5 es mayor que R2 = 2.043,
m5 – m2 es mayor que R2 = 2.043 por lo tanto el rango no es 2.
Paso 6.3
p = 1. Terminamos.
Finalmente los rangos quedan
m = {[m4, m6, m3,
m1], [m5], [m2]}