Diseño de experimentos

Diseño de bloques completos aleatorizados.

 

El ejemplo clásico, que utiliza un diseño de bloques aleatorizado, es un experimento agrícola en el que se comparan diferentes fertilizantes según su capacidad de aumentar el rendimiento de una cosecha en particular. En lugar de asignar los fertilizantes al azar a muchas parcelas en un área grande de composición de suelos variable, se deben asignar los fertilizantes a bloques más pequeños compuestos de parcelas homogéneas. La  variación entre estos bloques, que es probablemente más significativa comparada con la uniformidad de las parcelas dentro de un bloque, elimina el error experimental en el análisis de varianza.

 

Una disposición típica para el diseño de bloques completos aleatorizados con el uso de tres mediciones en cuatro bloques es el siguiente.

 

bloque 1

bloque 2

bloque 3

bloque 4

t2

t1

t3

t2

t1

t3

t2

t1

t3

t2

t1

t3

 

Las t denotan la asignación a los bloques de cada uno de los tres tratamientos. Por supuesto, la asignación real de los tratamientos a unidades dentro de los bloques se realiza al azar. Una vez que el experimento termina, los datos se pueden registrar como en el siguiente arreglo de 3x4:

 

Tratamiento

Bloques:

1

2

3

4

1

 

y11

y12

y13

y14

2

 

y21

y22

y23

y24

3

 

y31

y32

y33

y34

 

donde yij representa la respuesta que se obtiene al utilizar el i-ésimo tratamiento en el j-ésimo bloque.

 

Generalicemos y consideremos el caso de k tratamientos que se asignan a b bloques. Los datos se pueden resumir como se muestra en el arreglo rectangular de kxb de la siguiente tabla

 

 

Se supondrá que las variables yij i=1,2,...,k y j = 1,2,...,b, son valores de variables independientes que tienen distribuciones normales con media mij y varianza común s2. Definimos

 

Ti. = suma de las observaciones para el i-ésimo tratamiento.

T.j = suma de las observaciones para el j-ésimo bloque.

T.. = suma de todas las bk observaciones.

 = media de las observaciones para el i-ésimo tratamiento

 = suma de las observaciones para el j-ésimo bloque.

*= suma de todas las bk observaciones.

 

Representamos como mi. el promedio de las b medias poblacionales para el i-ésimo tratamiento. Es decir,

 

De manera similar, el promedio de las medias poblacionales para el j-ésimo bloque, se define como

 

 

y el promedio de las bk medias, m se define como

 

 

Para determinar si parte de la variación en nuestras observaciones se debe a diferencias entre los tratamientos, consideremos las pruebas.

 

 

H0 : m1 = m2 = m3 = m4 = m5

H1 : al menos dos de las medias no son iguales.

 

Cada observación se puede escribir de la forma

 

donde eij mide la desviación del valor observado yij de la media poblacional mij. La forma de esta ecuación que se prefiere se obtiene al sustituir

 

 

donde ai es, el efecto del i-ésimo tratamiento y bj es el efecto del j-ésimo bloque. Se supone que los efectos del tratamiento y del bloque se pueden sumar. De aquí, podemos escribir

 

 

Nótese que el modelo parece el de la clasificación unilateral, la diferencia esencial es la introducción del efecto de bloque bj. El concepto básico es muy semejante al de la clasificación unilateral excepto que debemos tomar en cuenta en el análisis el efecto adicional debido a los bloques, pues ahora controlamos de manera sistemática la variación en dos direcciones. Si imponemos ahora las restricciones

      y        

Entonces

y

 

La hipótesis nula de que las k medias de tratamiento mi. son iguales, y por tanto iguales a m, es equivalente ahora a probar la hipótesis

 

H0 : a1 = a2 = .. .= ak = 0

H1 : al menos una es diferente de cero.

 

Cada una de las pruebas de tratamiento se basará en una comparación de estimaciones independientes de la varianza poblacional común s2. Estas estimaciones se obtendrán al dividir la suma total de cuadrados de nuestros datos en tres componentes por medio de la siguiente identidad.

 

Identidad de suma de cuadrados.

 

La identidad de suma de cuadrados se puede representar de manera simbólica con la ecuación

 

SST = SSA + SSB + SSE

 

donde:

 

Podemos mostrar que los valores esperados de las sumas de cuadrados de tratamiento, bloque y error están dados por

 

 

Si los efectos de tratamiento a1 = a2 = ... = ak = 0, s12 es un estimador insesgado de s2 y podemos calcular la varianza como

 

Por bloques tenemos el mismo caso si b1 = b2 = ... = bb = 0 s22 también un estimador insesgado de s2 y podemos calcular la varianza como

 

 

Una tercera estimación de s2, basada en (k-1)(b-1) grados de libertad e independiente de s12 y s22 es

 

 

Para probar la hipótesis nula de que los efectos de tratamiento son todos iguales a cero, calculamos la razón

 

que es un valor de la variable aleatoria F1 que tiene una distribución F con k-1 y (k-1)(b-1) grados de libertad. La hipótesis nula H0 se rechaza en el nivel de significancia a cuando

 

f1 >fa[k-1, (k-1)(b-1)]

 

Análisis de variancia para probar m1 = m2 = m3 = m4 = m5

Fuente de

variación

Suma de

cuadrados

Grados de

libertad

Cuadrado medio

f calculada

Tratamientos

SSA

k-1

s12 =SSA/(k-1)

s1/s

Bloques

SSB

b-1

s22 =SSB/(b-1)

s2/s

Error

SSE

(k-1)(b-1)

s2=SSE/

(k-1)(b-1)

 

Total

SST

bk-1

 

 

rechazamos H0, al nivel de significancia a cuando f1 >fa[k-1, (k-1)(b-1)]

 

Uso de MINITAB

 

Para llevar a cabo estas pruebas de hipótesis en MINITAB, una vez introducidos los datos ir al menú Stat > ANOVA > Two-Way ..

 

 

En la caja de diálogo introducir la respuesta y los factores por renglón y por columna.

 

 
Ejemplo 1

 

Se consideran cuatro diferentes máquinas M1, M2, M3 y M4 para el ensamblaje de un producto particular. Se decide que utilizar seis operadores diferentes en un experimento de bloques aleatorizados para comparar las máquinas. Las máquinas se asignan en orden aletorio a cada operador. La operación de las máquinas requiere destreza física y se anticipa que habrá una diferencia entre los operadores en la rapidez con la que operan las máquinas. Se registra la cantidad de tiempo en segundos para ensamblar el producto

 

Maquina

operador

1

2

3

4

5

6

TOTAL

1

 

42.5

39.3

39.6

39.9

42.9

43.6

247.8

2

 

39.8

40.1

40.5

42.3

42.5

43.1

248.3

3

 

40.2

40.5

41.3

43.4

44.9

45.1

255.4

4

 

41.3

42.2

43.5

44.2

45.9

42.3

259.4

total

 

163.8

162.1

164.9

169.8

176.2

174.1

1010.9

 

 

Pruebe la hipótesis nula.

 

Del análisis de los valores P tenemos que este es igual a 0.048, por lo tanto, para un nivel de significacancia del 0.05 tenemos que el valor P es más pequeño, por lo cual la hipótesis debe ser rechazada y no existe evidencia de que las máquinas trabajen a la misma velocidad.

 

Results for: maquinas.MTW

 

Two-way ANOVA: tiempo versus Operador, maquina

 

Source    DF       SS       MS     F      P

Operador   5  42.0871  8.41742  5.29  0.005

maquina    3  15.9246  5.30819  3.34  0.048

Error     15  23.8479  1.58986

Total     23  81.8596

 

S = 1.261   R-Sq = 70.87%   R-Sq(adj) = 55.33%

 

 

Two-way ANOVA: tiempo versus Operador, maquina

 

Source    DF       SS       MS     F      P

Operador   5  42.0871  8.41742  5.29  0.005

maquina    3  15.9246  5.30819  3.34  0.048

Error     15  23.8479  1.58986

Total     23  81.8596

 

S = 1.261   R-Sq = 70.87%   R-Sq(adj) = 55.33%

 

 

                  Individual 95% CIs For Mean Based on

                  Pooled StDev

Operador    Mean  -----+---------+---------+---------+----

1         40.950     (-------*-------)

2         40.525  (-------*--------)

3         41.225      (--------*-------)

4         42.450              (-------*--------)

5         44.050                        (-------*--------)

6         43.525                     (-------*-------)

                  -----+---------+---------+---------+----

                    40.0      41.6      43.2      44.8

 

 

                  Individual 95% CIs For Mean Based on

                  Pooled StDev

maquina     Mean  -----+---------+---------+---------+----

M1       41.3000  (--------*--------)

M2       41.3833   (--------*--------)

M3       42.5667             (--------*--------)

M4       43.2333                  (--------*--------)

                  -----+---------+---------+---------+----

                    40.8      42.0      43.2      44.4

 

Ejemplo 2

 

Se utilizaron cuatro clases de fertilizantes f1, f2, f3 y f4 para estudiar el rendimiento en el cultivo de fríjol. El suelo de dividió en tres bloques, cada uno de los cuales contiene 4 parcelas homogéneas. A continuación se presentan los rendimientos en kilogramos por parcela, así como los tratamientos correspondientes:

 

Bloque 1             Bloque 2             Bloque 3

f1 = 42.7             f3 = 50.9             f4 = 51.1

f3 = 48.5             f1 = 50.0             f2 = 46.3

f4 = 32.8             f2 = 38.0             f1 = 51.9

f2 = 39.3             f4 = 40.2             f3 = 53.5

 

a) Realice un análisis de varianza con un nivel de significacancia de 0.05, y utilice el modelo de bloques aleatorios por completo

 

Del análisis de varianza podemos ver que con un nivel de significancia de 0.05 que el valor P es 0.030. Esto significa que la hipótesis debe ser rechazada y no hay evidencia de que los rendimientos de fríjol sean iguales.

 

Results for: fertilizante.MTW

 

Two-way ANOVA: Rendimiento versus Fertilizante, Bloque

 

Source        DF       SS       MS     F      P

Fertilizante   3  218.193  72.7311  6.11  0.030

Bloque         2  197.632  98.8158  8.30  0.019

Error          6   71.402  11.9003

Total         11  487.227

 

S = 3.450   R-Sq = 85.35%   R-Sq(adj) = 73.13%

 

 

                       Individual 95% CIs For Mean Based on

                       Pooled StDev

Fertilizante     Mean  -------+---------+---------+---------+--

f1            48.2000                (--------*---------)

f2            41.2000  (--------*---------)

f3            50.9667                     (---------*---------)

f4            41.3667  (---------*--------)

                       -------+---------+---------+---------+--

                           40.0      45.0      50.0      55.0

 

 

                Individual 95% CIs For Mean Based on

                Pooled StDev

Bloque    Mean  -------+---------+---------+---------+--

b1      40.825  (--------*-------)

b2      44.775          (--------*-------)

b3      50.700                      (-------*--------)

                -------+---------+---------+---------+--

                    40.0      45.0      50.0      55.0

 

 

Que es un residuo para un diseño de Bloques completamente aleatorio

 

La formulación de bloques completamente aleatorios es otra situación experimental en la cual la gráfica hace que el analista se sienta cómodo con una “imagen ideal” o con la detección de dificultades. Hay que recordar que el modelo para bloques completamente aleatorios es

 

Con las restricciones impuestas

 

      y        

 

Para determinar qué es lo que en realidad constituye un residuo, considere que

 

 

Como resultado, el valor ajustado o pronóstico esta dado por

 

 

y, entonces, el residuo de observación (i,j) está dado por

 

 

Observe que , el valor ajustad es un estimador de la media mij. Esto es consistente con la partición de la variabilidad en la que la suma de los errores al cuadrado es

 

 

 

Las técnicas visuales en la formación de bloques completamente aleatorios implican graficar los residuos por separado para cada tratamiento y bloque. Si la suposición de varianza homogénea se cumple, el analista debería esperar una variabilidad aproximadamente igual.

 

Ejemplo 3

 

Para los datos del ejemplo 1 tenemos:

 

Maquina

operador

1

2

3

4

5

6

TOTAL

1

 

42.5

39.3

39.6

39.9

42.9

43.6

247.8

2

 

39.8

40.1

40.5

42.3

42.5

43.1

248.3

3

 

40.2

40.5

41.3

43.4

44.9

45.1

255.4

4

 

41.3

42.2

43.5

44.2

45.9

42.3

259.4

total

 

163.8

162.1

164.9

169.8

176.2

174.1

1010.9

 

Para llevar a cabo las gráficas de residuos en MINITAB hacer

 

 

 

Las siguientes figuras muestran las gráficas de residuos para tratamientos separados y bloques separados. La figura de la izquierda revela que la varianza no podría ser la misma para todas las máquinas. Lo mismo sería valido para la varianza del error de cada uno de los seis operadores. Sin embargo son dos residuos inusualmente grandes los que parecen producir la dificultad.

 

 

        

 

 

La siguiente figura, una gráfica de residuos, dan evidencia razonable de un comportamiento aleatorio donde sobresalen dos residuos grandes.

 

 

 

Ejemplo 4

 

Para los datos del ejemplo 2 hacer el análisis de los residuos.

 

Bloque 1             Bloque 2             Bloque 3

f1 = 42.7             f3 = 50.9             f4 = 51.1

f3 = 48.5             f1 = 50.0             f2 = 46.3

f4 = 32.8             f2 = 38.0             f1 = 51.9

f2 = 39.3             f4 = 40.2             f3 = 53.5

 

 

  

 

 

 

Bibliografía.

 

[Walpole et all] Walpole Ronald E., Myers Raymond H.,  Myers Sharon L. y Ye Keying “Probabilidad y estadística para Ingeniería y ciencias”. Octava Edición. Pearson Education. 2007.

 

Regresar.