Experimentos factoriales

 

Considere una situación en la que haya interés por estudiar el efecto de dos factores A y B, sobre alguna respuesta. Por ejemplo, en un experimento químico nos gustaría variar en forma simultánea la presión de reacción y el tiempo de reacción, y estudiar el efecto de cada uno sobre el producto. En un experimento biológico resulta de interés estudiar el efecto que tienen el tiempo de secado sobre la cantidad de sólidos (porcentaje en peso) que queda en las muestras de levadura. El término factor se utiliza en un sentido general para denotar cualquier característica del experimento que pueda variar de un ensayo a otro, como la temperatura, el tiempo de presión. Los niveles de un factor se definen como los valores reales que se utilizan en el experimento.

 

Para cada uno de estos casos, es importante determinar no sólo si cada uno de los factores tiene influencia en la respuesta, sino también si hay interacción significativa entre ellos.

 

Ejemplo 5.1

 

Considere los datos siguientes de temperatura (factor A con niveles t1 t2 y t3 en orden creciente) y tiempo de secado (d1. d2 y d3 también en orden creciente). La respuesta se expresa en porcentaje de sólidos. Estos datos son hipotéticos por completo.

B

A

d1

d2

d3

Total

t1

4.4

8.8

5.2

18.4

t2

7.5

8.5

2.4

18.4

t3

9.7

7.9

0.8

18.4

Total

21.6

25.2

8.4

55.2

 

Interacción en el experimento de dos factores

 

En el modelo de bloques aleatorizados que se estudió en forma previa, se supuso que en cada bloque se tomaba una observación de cada tratamiento. Si la suposición del modelo es correcta, es decir, si los bloques y los tratamientos son los únicos efectos reales y la interacción no existe, el valor esperado del error cuadrático de la media es la varianza, s2, del error experimental. Sin embargo, suponga que existe interacción entre los tratamientos y los bloques, como se indica en el modelo

 

 

 

Representación Gráfica de la Interacción

 

La presencia de interacción, así como su influencia científica, puede interpretarse bien usando gráficas de interacción. Estas dan con claridad una visión panorámica de la tendencia de los datos para mostrar el efecto que tiene cambiar un factor conforme se pasa de un nivel a otro del segundo factor.

 

Para mostrar la gráfica en MINITAB dar

 

Graph > Line Plot

 

Entonces aparecerá el menú

 

 

y al presionar ok aparecerá

 

 

La siguiente figura ilustra la interacción marcada entre la temperatura y el tiempo de secado. La interacción se revela en la falta de paralelismo entre las líneas. Debe ser claro que el paralelismo en las gráficas indica ausencia de interacción.

 

 

 

Análisis de varianza de dos factores

 

Para presentar las formulas generales para el análisis de varianza de un experimento de dos factores que utiliza observaciones repetidas en un diseño por completo aleatorio, debe considerarse el caso de n repeticiones de las combinaciones del tratamiento, determinadas por a niveles de factor A y b niveles del factor B. Las observaciones pueden calificarse usando un arreglo rectangular, donde los renglones representan los niveles del factor A; y las columnas, los del factor B. Cada combinación del tratamiento define una celda del arreglo. Así, se tiene ab celdas, cada una de las cuales contiene n observaciones. Se denota con yijk la k-esima observación tomada en el i-esimo nivel del factor A y j-esimo nivel del factor B;

 

 

 

B

 

 

A

1

2

 

b

Total

Media

1

y111

y121

 

y1b1

Y1..

y1..

 

y112

y122

 

y1b2

 

 

 

 

 

 

 

 

 

 

y11n

y12n

 

y1bn

 

 

2

y211

y221

 

y2b1

Y2..

y2..

 

y212

y222

 

y2b2

 

 

 

 

 

 

 

 

 

 

y21n

y22n

 

y2bn

 

 

 

 

 

 

 

 

 

a

ya11

ya21

 

yab1

Ya..

ya..

 

ya12

ya22

 

yab2

 

 

 

 

 

 

 

 

 

 

ya1n

ya2n

 

yabn

Y…

 

Total

Y.1.

Y.2.

 

Y.b.

 

 

Media

y.1.

y.b.

 

y.b.

 

y…

Las observaciones en la celta ij-esimas constituyen una muestra aleatoria de tamaño n de una población que se supone tiene distribución normal con media mij y varianza s2. Se supone que todas las ab poblaciones tienen la misma varianza s2

 

Se definen los símbolos siguientes, que son de utilidad

 

Yij. = suma de las observaciones en la (ij)-esima celda

Yi.. = suma de las observaciones para el i-esimo nivel del factor A

Y.j. = suma de las observaciones para el j-esimo nivel del factor B

Y… = suma de las abn observaciones,

 = media de las observaciones en la (ij)-ésima celda

 = media de las observaciones para el i-esimo nivel del factor A

 = media de las observaciones para el j-esimo nivel del factor B

= media de todas las abn observaciones

 

A diferencia de la situación para un solo factor, esta vez supondremos que las poblaciones de las que se toman n observaciones independientes con distribución idénticas son combinación de los factores. Así mismo, se supondrá siempre que de cada combinación de factores se toma un número igual n de observaciones. En los casos en que los tamaños de las muestras por combinación son desiguales, los cálculos son más complicados, aunque los conceptos son transferibles.

 

Modelo e hipótesis para el problema con dos factores.

 

Cada observación puede escribirse en la siguiente forma

 

 

donde el termino eijk mide las observaciones, con respecto de la media mij, de los valores yijk observados en la (ij)-ésima celda. Si (ab)ij denota el efecto de la interacción del i-ésimo nivel del factor A con el j-esimo nivel del factor B, ai  el efecto del i-ésimo nivel del factor A, bj del j-ésimo factor B y m la media conjunta, escribimos

 

 

y entonces

 

 

a las que se imponen las restricciones

 

     

 

Las tres hipótesis por probar son las siguientes:

 

1.-     Ho’: a1 = a2 = = aa = 0

         H1’: Al menos una de las ai no es igual a cero

 

2.-     Ho’’: b1 = b2 = = bb = 0

         H1’’: Al menos una de las bj no es igual a cero

 

3.-     Ho’’’: (ab)11 = (ab)12 = = (ab)ab = 0

         H1’’’: Al menos una de las (ab)ij no es igual a cero

 

La tabla para análisis de varianza para el experimento de dos factores con n repeticiones

 

Fuente de Variacion

Suma de Cuadrados

Grados de Libertad

Media Cuadrática

f calculada

Efecto principal

 

 

 

 

A

SSA

a-1

s12=SSA/(a-1)

f1=s12/s2

B

SSB

b-1

s22=SSB/(b-1)

f2 = s22/s2

Interacción

 

 

 

 

AB

SS(AB)

(a-1)(b-1)

S32=SS(AB)/(a-1)(b-1)

f3 = s23/s2

Error

SSE

ab(n-1)

s2=SSE/ab(n-1)

 

Total

SST

abn-1

 

 

 

 

La Hipótesis Ho’ se rechaza cuando f1 > fa[a-1, ab(n-1)]

La Hipótesis Ho’’ se rechaza cuando f2 > fa[b-1, ab(n-1)]

Concluimos Ho’’’ es verdadera o que hay interacción cuando f3 > fa[(a-1), (b-1), ab(n-1)]

 

Desarrollo en MINITAB

 

Ir a la opción Stat > ANOVA > Balanced ANOVA

 

 

Donde aparecerá el cuadro de dialogo

 

 

 

 

Ejemplo 5.2

 

En un experimento que se realizo para determinar cuál de los tres sistemas de misiles distintos es preferible, se midió la taza de combustión del propulsor para 24 arranques estáticos. Se emplearon 4 tipos de combustible diferentes. El experimento generó observaciones duplicadas de las tasas de combustión con cada combinación de los tratamientos.

 

Los datos ya codificados, se dan en la siguiente tabla. Pruebe las siguientes hipótesis: a) Ho’: no hay diferencia en las tasas medias de combustión cuando el propulsor se emplean diferentes sistemas de misiles, b) Ho’’: no existe diferencia en las tasas medias de combustión cuando de los cuatro tipos de propulsor, c) Ho’’’: no hay interacción entre los distintos sistemas de misiles y los tipos diferentes de propulsor.

 

 

Sistema de

Tipo de propulsor

misiles

b1

B2

b3

b4

a1

34.0

30.1

29.8

29.0

 

32.7

32.8

26.7

28.9

a2

32.0

30.2

28.7

27.6

 

33.2

29.8

28.1

27.8

a3

28.4

27.3

29.7

28.8

 

29.3

28.9

27.3

29.1

 

Respuestas

 

 

ANOVA: taza versus tipo, sistema

 

Factor   Type   Levels  Values

tipo     fixed       4  1, 2, 3, 4

sistema  fixed       3  1, 2, 3

 

 

Analysis of Variance for taza

 

Source        DF      SS      MS      F      P

tipo           3  40.082  13.361  10.75  0.001

sistema        2  14.523   7.262   5.84  0.017

tipo*sistema   6  22.163   3.694   2.97  0.051

Error         12  14.910   1.242

Total         23  91.678

 

 

S = 1.11467   R-Sq = 83.74%   R-Sq(adj) = 68.83%

 

 

ANOVA: taza versus tipo, sistema

 

Factor   Type   Levels  Values

tipo     fixed       4  1, 2, 3, 4

sistema  fixed       3  1, 2, 3

 

 

Analysis of Variance for taza

 

Source        DF      SS      MS      F      P

tipo           3  40.082  13.361  10.75  0.001

sistema        2  14.523   7.262   5.84  0.017

tipo*sistema   6  22.163   3.694   2.97  0.051

Error         12  14.910   1.242

Total         23  91.678

 

 

S = 1.11467   R-Sq = 83.74%   R-Sq(adj) = 68.83%

 

 

 

a)        Rechace Ho’ y concluya que los distintos sistemas de misiles generan tasas medias diferentes de combustión de propulsor. El valor P es aproximadamente 0.017.

b)        Rechace Ho’’ y concluya que las tasas medias de combustión del propulsor no son las mismas para los cuatro tipos de propulsor. El valor P es mas pequeño que 0.0010

c)        La interacción es casi insignificante al nivel 0.05, pero el valor P de aproximadamente 0.0512 indicaría que la interacción debe tomarse en cuenta.

 

Dada la conclusión dada en el inciso (c) verifiquemos gráficamente esta condición de dependencia.

 

 

En la gráfica podemos ver claramente una falta total de paralelismo lo cual corrobora el resultado. Hay dependencia entre los dos factores de nuestro experimento que son el tipo de propulsor y el sistema de combustible

 

Ejemplo 5.3

 

Se realizo un experimento para estudiar el efecto de la temperatura y el tipo de horno sobre la vida de un componente en particular que está a prueba. En el experimento se utilizaron 4 tipos de horno y tres niveles de temperatura. Se asignaron cuatro piezas al azar, 2 para cada combinación de tratamientos, y se registraron los resultados siguientes

 

horno

temperatura

vida

1

500

227

1

500

221

1

550

187

1

550

208

1

600

174

1

600

202

2

500

214

2

500

259

2

550

181

2

550

179

2

600

198

2

600

194

3

500

225

3

500

236

3

550

232

3

550

198

3

600

178

3

600

213

4

500

260

4

500

229

4

550

246

4

550

273

4

600

206

4

600

219

 

Con un nivel de significancia de 0.05, pruebe las hipótesis de que:

 

a)    las temperaturas diferentes no tienen efecto sobre la vida del componente;

b)    los hornos distintos no tienen efecto en la vida del componente;

c)    el tipo de horno y la temperatura no interactúan.

 

Results for: Hornos.MTW

 

ANOVA: vida versus horno, temperatura

 

Factor       Type   Levels  Values

horno        fixed       4  1, 2, 3, 4

temperatura  fixed       3  500, 550, 600

 

 

Analysis of Variance for vida

 

Source             DF       SS      MS     F      P

horno               3   4963.1  1654.4  5.18  0.016

temperatura         2   5194.1  2597.0  8.13  0.006

horno*temperatura   6   3126.2   521.0  1.63  0.222

Error              12   3833.5   319.5

Total              23  17117.0

 

 

S = 17.8734   R-Sq = 77.60%   R-Sq(adj) = 57.07%

 

 

 

Conclusiones

 

a)    Rechazamos la hipótesis dado que P=0.06  y concluimos que la temperatura influye en la vida del componente

b)    Rechazamos la hipótesis dado que P=0.016 y concluimos que los diferentes tipos de horno influyen en la vida del componente

c)    Aceptamos la hipótesis y por lo tanto existe interacción entre el tipo de horno y la temperatura. Gráficamente podemos ver

 

 

Ejemplo 5.4

 

Para determinar cuáles músculos necesitan sujetarse a un programa de acondicionamiento para mejorar el rendimiento individual en el servicio tendido que se usa en el tenis, el Departamento de salud, Educación Física y Recreación del Instituto Politécnico y Universidad Estatal de Virginia realizó un estudio de cinco músculos diferentes:

 

1 deltoides anterior

2 pectoral mayor

3 deltoides posterior

4 deltoides medio

5 tríceps

 

los cuales se probaron en 3 sujetos, y el experimento se efectuó 3 veces para cada combinación de tratamiento. Los datos electromiográficos se registraron durante el servicio y se presentan a continuación. Use un nivel de 0.01 de significancia para probar la hipótesis de que

 

a)    diferentes sujetos tienen mediciones iguales del electromiograma

b)    músculos diferentes no tienen efecto en las mediciones del electromiograma

c)    los sujetos y los tipos de músculo no interactúan

 

ANOVA: entrenamiento versus musculo, sujeto

 

Factor   Type   Levels  Values

musculo  fixed       5  1, 2, 3, 4, 5

sujeto   fixed       3  1, 2, 3

 

 

Analysis of Variance for entrenamiento

 

Source          DF       SS      MS      F      P

musculo          4   7543.9  1886.0  26.95  0.000

sujeto           2   4814.7  2407.4  34.40  0.000

musculo*sujeto   8  11362.2  1420.3  20.30  0.000

Error           30   2099.2    70.0

Total           44  25820.0

 

 

S = 8.36494   R-Sq = 91.87%   R-Sq(adj) = 88.08%

 

a)    Rechazamos la hipótesis dado que P = 0 y concluimos que tenemos que diferentes sujetos tienen mediciones diferentes del electromiograma

b)    Rechazamos la hipótesis dado que P = 0 y decimos que  tienen efecto en las mediciones del electromiograma

c)    Rechazamos la hipótesis dado que P = 0 y concluimos que los sujetos y los tipos de músculo no interactúan. En la siguiente gráfica se ve un poco débil esta consideración aunque entre los sujetos 1 y 2 si hay mucho paralelismo.

 

 

 

 

Experimentos con tres factores

 

Ahora consideraremos experimentos en los cuales se tienen tres factores A, B y C. La formulación en muy similar, salvo que el número de combinaciones en el modelo crece. La siguiente es una tabla de ANOVA para el caso de experimentos con tres factores.

 

Fuente de Variacion

Suma de Cuadrados

Grados de Libertad

Media Cuadrática

f calculada

Efecto principal

 

 

 

 

A

SSA

a-1

s12=SSA/(a-1)

f1=s12/s2

B

SSB

b-1

s22=SSB/(b-1)

f2 = s22/s2

C

SSC

c-1

s32=SSB/(b-1)

f3 = s32/s2

Interacción dos factores

 

 

 

 

AB

SS(AB)

(a-1)(b-1)

s42=SS(AB)/(a-1)(b-1)

f4 = s43/s2

AC

SS(AC)

(a-1)(c-1)

s52=SS(AC)/(a-1)(c-1)

f5 = s53/s2

BC

SS(BC)

(b-1)(c-1)

s62=SS(BC)/(b-1)(c-1)

f6 = s63/s2

Interaccion tres factores

 

 

 

 

AB

SS(ABC)

(a-1)(b-1)(c-1)

s42=SS(AB)/(a-1)(b-1)(c-1)

f7 = s73/s2

 

 

 

 

 

Error

SSE

abc(n-1)

s2=SSE/abc(n-1)

 

Total

SST

abn-1

 

 

 

Ejemplo 5.5

 

En la producción de un material en particular hay tres variables de interés A, el efecto del operador (tres operadores): B el catalizador utilizando en el experimento (tres catalizadores); y C, el tiempo de lavado del producto después del proceso de enfriamiento (15 y 20 minutos). Con cada combinación de factores se hicieron tres corridas. Se pensaba que deberían estudiarse todas las interacciones entre los factores. Realice un análisis de varianza para probar los efectos que son significativos.

 

 

 

Tiempo de lavado C

 

15 Minutos

20 minutos

 

B (Catalizador)

B (Catalizador)

A (Operador)

1

2

3

1

2

3

1

10.70

10.30

11.20

10.90

10.50

12.20

 

10.80

10.20

11.60

12.10

11.10

11.70

 

11.30

10.50

12.00

11.50

10.30

11.00

2

11.40

10.20

10.70

9.80

12.60

10.80

 

11.80

10.90

10.50

11.30

7.50

10.20

 

11.50

10.50

10.20

10.90

9.90

11.50

3

13.60

12.00

11.10

10.70

10.20

11.90

 

14.10

11.60

11.00

11.70

11.50

11.60

 

14.50

11.50

11.50

12.70

10.90

12.20

 

 

Los resultados del análisis de varianza utilizando MINITAB son

 

Results for: Material3F.MTW

 

ANOVA: Material versus Operador, Catalizador, Tiempo

 

Factor       Type   Levels  Values

Operador     fixed       3  1, 2, 3

Catalizador  fixed       3  1, 2, 3

Tiempo       fixed       2  15, 30

 

 

Analysis of Variance for Material

 

Source                       DF       SS      MS      F      P

Operador                      2  13.9826  6.9913  11.64  0.000

Catalizador                   2  10.1826  5.0913   8.48  0.001

Tiempo                        1   1.1852  1.1852   1.97  0.169

Operador*Catalizador          4   4.7741  1.1935   1.99  0.117

Operador*Tiempo               2   2.9137  1.4569   2.43  0.103

Catalizador*Tiempo            2   3.6337  1.8169   3.03  0.061

Operador*Catalizador*Tiempo   4   4.9074  1.2269   2.04  0.109

Error                        36  21.6133  0.6004

Total                        53  63.1926

 

 

S = 0.774836   R-Sq = 65.80%   R-Sq(adj) = 49.65%

 

De estos datos podemos ver que ninguna de las interacciones muestra un efecto significativo para un nivel de significancia de 0.05. Sin embargo, el valor P para BC es 0.0610; por ello, debe de ignorarse (catalizador, tiempo de lavado).

 

 

Regresar