Ejercicios Propuestos

Ejercicio Propuesto 1

La convección es una forma de transferencia de calor por los fluidos debido a sus variaciones de densidad por la temperatura; las partes calientes ascienden y las frías descienden formando las corrientes de convección que hacen uniforme la temperatura del fluido. Se ha realizado un experimento para determinar las modificaciones de la densidad de fluido al elevar la temperatura en una determinada zona. Los resultados obtenidos han sido los siguientes:

Temperatura

Densidad

100

21.8

21.9

21.7

21.6

21.7

125

21.7

21.4

21.5

21.4

 

150

21.9

21.8

21.8

21.6

21.5

175

21.9

22.1

21.85

21.9

 

Responder a las siguientes cuestiones:

  1. ¿Afecta la temperatura a la densidad del fluído?
  2. Determinar qué temperaturas producen modificaciones significativas en la densidad media del fluido.
  3. Estudiar las hipótesis del modelo: Homocedasticidad, independencia y normalidad.
  4. ¿Se puede afirmar que las temperaturas de 100 y 125 producen menos densidades de fluido en promedio que las temperaturas de 150 y 175?

Ejercicio Propuesto 2

Un laboratorio de reciclaje controla la calidad de los plásticos utilizados en bolsas. Se desea contrastar si existe variabilidad en la calidad de los plásticos que hay en el mercado. Para ello, se eligen al azar cuatro plásticos y se les somete a una prueba para medir el grado de resistencia a la degradación ambiental. De cada plástico elegido se han seleccionado ocho muestras y los resultados de la variable que mide la resistencia son los de la tabla adjunta.

Calidad Plásticos

Resistencia

Plástico A

135
175
97
169
213
171
115
143

Plástico B

275
170
154
133
219
187
220
185

Plástico C

169
239
184
222
253
179
280
193

Plástico D

115
105
93
85
120
74
87
63

¿Qué conclusiones se deducen de este experimento?


Ejercicio Propuesto 3

Debido a la proliferación de los campos de golf y a la gran cantidad de agua que necesitan, un grupo de científicos estudia la calidad de varios tipos de césped para implantarlo en invierno en los campos de golf. Para ello, miden la distancia recorrida por una pelota de golf, en el campo, después de bajar por una rampa (para proporcionar a la pelota una velocidad inicial constante). El terreno del que disponen tiene mayor pendiente en la dirección norte-sur, por lo que se aconseja dividir el terreno en cinco bloques de manera que las pendientes de las parcelas individuales dentro de cada bloque sean las mismas. Se utilizó el mismo método para la siembra y las mismas cantidades de semilla. Las mediciones son las distancias desde la base de la rampa al punto donde se pararon las pelotas. En el estudio se incluyeron las variedades: Agrostis Tenuis (Césped muy fino y denso, de hojas cortas y larga duración), Agrostis Canina (Hoja muy fina, estolonífera. Forma una cubierta muy tupida), Paspalum Notatum (Hojas gruesas, bastas y con rizomas. Forma una cubierta poco densa), Paspalum Vaginatum (Césped fino, perenne, con rizomas y estolones).

 

Bloques

Variedad de césped

Bloque 1
Bloque 2
Bloque 3
Bloque 4
Bloque 5

Agrostis Tenuis

1.30
1.60
0.50
1.20
1.10

Agrostis Canina

2.20
2.40
0.40
2.00
1.80

Paspalum Notatum

1.80
1.70
0.60
1.50
1.30
Paspalum Vaginatum
3.90
4.40
2.00
4.10
3.40

Se pide:

  1. Identificar los elementos del estudio (factores, unidades experimentales, variable respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.
  2. ¿Son los bloques fuente de variación?
  3. Existen diferencias reales entre las distancias medias recorridas por una pelota de golf en los distintos tipos de césped?
  4. Estudiar las interacciones de los factores.
  5. Comprobar que se cumplen las hipótesis del modelo.
  6. Utilizando el método de Newman-Keuls, ¿qué tipo de cesped ofrece menor resistencia al recorrido de las pelotas?

Ejercicio Propuesto 4

Consideremos de nuevo el ejercicio propuesto 3 sobre un grupo de científicos que estudia la calidad de varios tipos de césped para implantarlo en invierno en los campos de golf. Para ello, miden la distancia recorrida por una pelota de golf, en el campo, después de bajar por una rampa (para proporcionar a la pelota una velocidad inicial constante). El terreno del que disponen tiene mayor pendiente en la dirección norte-sur, por lo que se aconseja dividir el terreno en cinco bloques de manera que las pendientes de las parcelas individuales dentro de cada bloque sean las mismas. Se utilizó el mismo método para la siembra y las mismas cantidades de semilla. Las mediciones son las distancias desde la base de la rampa al punto donde se pararon las pelotas, y al realizar dichas mediciones no se han podido obtener una para cada combinación de tipo de césped y tipo de terreno, sino que sólo se han podido realizar con tres de las variedades del césped en cada uno de los bloques de terreno. Para controlar el efecto del tipo de terreno deciden utilizar un diseño en bloques incompletos. En el estudio se incluyeron las variedades: Agrostis Tenuis (Césped muy fino y denso, de hojas cortas y larga duración), Agrostis Canina (Hoja muy fina, estolonífera. Forma una cubierta muy tupida), Paspalum Notatum (Hojas gruesas, bastas y con rizomas. Forma una cubierta poco densa), Paspalum Vaginatum (Césped fino, perenne, con rizomas y estolones).

 

Bloques

Variedad de césped

Bloque 1
Bloque 2
Bloque 3
Bloque 4
Bloque 5

Agrostis Tenuis

1.30
1.60
0.50
1.20

Agrostis Canina

2.20
2.40
0.40
1.80

Paspalum Notatum

1.80
1.50
1.30
Paspalum Vaginatum
4.40
2.00
4.10
3.40

Se pide:

  1. Identificar los elementos del estudio (factores, unidades experimentales, variable respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.
  2. ¿Son los bloques fuente de variación?
  3. Existen diferencias reales entre las distancias medias recorridas por una pelota de golf en los distintos tipos de césped?
  4. Comprobar que se cumplen las hipótesis del modelo.
  5. Utilizando el método de Newman-Keuls, ¿qué tipo de cesped ofrece menor resistencia al recorrido de las pelotas?

Ejercicio Propuesto 5

Un investigador quiere evaluar la productividad de cuatro variedades de aguacates, A, B, C y D. Para ello decide realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y además, diferencias en la disponibilidad de Nitrógeno de norte a sur, para controlar los efectos de la pendiente y la disponibilidad de Nitrógeno, utilizó un diseño de cuadrado latino, los datos corresponden a la producción en kg/parcela.

 

Pendiente

Nitrógeno

1
2
3
4

1

D
785
A
730
C
700
B
595

2

A
855
B
775
D
760
C
710

3

C
950
D
885
B
795
A
780

4

B
945
C
950
A
880
D
835

Responder a las siguientes cuestiones:

  1. ¿Se puede afirmar que la productividad media de las cuatro variedades de aguacate es la misma?
  2. ¿Qué supuestos han de verificarse?
  3. ¿Se obtiene la misma producción con las cuatro variedades de aguacate? En caso negativo, analizar mediante el procedimiento de Tukey, con qué variedad de aguacate hay mayor producción.

Ejercicio Propuesto 6

Consideremos de nuevo el ejercicio propuesto 5 del investigador que quiere evaluar la productividad de cuatro variedades de aguacate, A, B, C y D. Para ello, decide realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y además, diferencias en la disponibilidad de Nitrógeno de norte a sur. Se seleccionan cuatro disponibilidades de nitrógeno, pero sólo dispone de tres gradientes de pendiente. Para controlar estas posibles fuentes de variabilidad, el investigador decide utilizar un diseño en cuadrado de Youden con cuatro filas, las cuatro disponibilidades de Nitrógeno (NI, N2, N3, N4), tres columnas, los tres gradientes de pendientes (P1, P2, P3) y cuatro letras latinas, las variedades de aguacates (A, B, C, D). Los datos corresponden a la producción en kg/parcela.

 

Pendiente

Nitrógeno

P1
P2
P3

N1

D
956
A
820
C
689

N2

A
867
B
975
D
680

N3

C
850
D
775
B
699

N4

B
950
C
870
A
980

Responder a las siguientes cuestiones:

  1. Estudiar cuál es el tipo de diseño adecuado a este experimento y escribir el modelo matemático asociado.
  2. ¿Se puede afirmar qué la productividad media de las cuatro variedades de aguacate es la misma?
  3. ¿Qué supuestos han de verificarse?
  4. ¿Se obtiene la misma producción con las cuatro variedades de aguacate? En caso negativo, analizar mediante el procedimiento de Duncan, con qué variedad de aguacate hay mayor producción.

Ejercicio Propuesto 7

En un invernadero se está estudiando el crecimiento de determinadas plantas, para ello se quiere controlar los efectos del terreno, abono, insecticida y semilla. El estudio se realiza con cuatro tipos de semillas diferentes que se plantan en cuatro tipos de terreno, se les aplican cuatro tipos de abonos y cuatro tipos de insecticidas. La asignación de los tratamientos a las plantas se realiza de forma aleatoria. Para controlar estas posibles fuentes de variabilidad se decide plantear un diseño por cuadrados greco-latinos como el que se muestra en la siguiente tabla, donde las letras griegas corresponden a los cuatro tipos de semilla y las latinas a los abonos.

Crecimiento

 

Tipo de insecticidad

Tipo de terreno

Insecticidad 1

Insecticidad 2

Insecticidad 3

Insecticidad 4

Terreno 1

6
C β

12
B α

13
A δ

13
D γ

Terreno 2

6
B γ

10
C δ

16
D α

11
A β

Terreno 3

7
D δ

5
A γ

5
B β

7
C α

Terreno 4

11
A α

11
D β

8
C γ

9
B δ

 

Responder a las siguientes cuestiones:

  1. Estudiar cuál es el tipo de diseño adecuado a este experimento y escribir el modelo matemático asociado.
  2. ¿Qué supuestos han de verificarse?
  3. ¿Se puede afirmar que el crecimiento de las plantas es el mismo para los cuatro tipos de abonos?¿Y con los distintos insecticidas?
  4. ¿Existen diferencias significativas en el crecimiento de las plantas con las distintas semillas? ¿Y el tipo de tierra influye en dicho crecimiento?
  5. ¿Con qué tipo de semilla se produce el mayor crecimiento de las plantas?
  6. ¿El crecimiento de las plantas es el mismo utilizando al mismo tiempo los abonos A y B que utilizando los abonos C y D?

Ejercicio Propuesto 8

Se realiza un estudio sobre el efecto que produce la descarga de aguas residuales de un planta sobre la ecología del agua natural de un río. En el estudio se utilizaron dos lugares de muestreo. Un lugar está aguas arriba del punto en el que la planta introduce aguas residuales en la corriente; el otro está aguas abajo. Se tomaron muestras durante un periodo de cuatro semanas y se obtuvieron los datos sobre el número de diatomeas halladas. Los datos se muestran en la tabla adjunta:

 

Semana

Lugar

Semana 1

Semana 2

Semana 3

Semana 4

Aguas arriba

78       94
43       58

620       760
420       913

204       333
98       89

890       655
763       562

Aguas abajo

79        87
145       522

546       652
76        94

45       69
59       62

254       86
789      267

Responder a las siguientes cuestiones:

  1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático y explicar los distintos elementos que intervienen.
  2. Estudiar si la semana y el lugar son factores determinantes en el número de diatomeas halladas en el agua del río. ¿Hay posibilidad que una semana sea más recomendable en un lugar del río en concreto y no lo sea en el otro lugar?
  3. Estudiar en qué semana se producen menos contaminación en el río, utilizando el método de Duncan.
  4. Estudiar en qué lugar del río se producen menos diatomeas.

Ejercicio Propuesto 9

La cotinina es uno de los principales metabolitos de la nicotina. Actualmente se le considera el mejor indicador de la exposición al humo de tabaco. Se ha realizado un estudio con distintas marcas de tabaco distinguiendo principalmente entre negro y rubio para detectar las posibles diferencias en el nivel de nicotina de personas expuestas al humo de tabaco. Para ello, se han analizado personas de distintas edades (niños, jóvenes y adultos) y se ha distinguido entre mujeres y hombres. Se han obtenido los datos de la siguiente tabla sobre el nivel de nicotina en miligramos por mililitro.

 
Sexo
Hombres
Mujeres
Tabaco
Tabaco
Edades
Rubio
Negro
Rubio
Negro
Niños
110
240
360
125
230
219
141
123
Jóvenes
112
239
252
455
655
432
873
256
Adultos
652
451
354
701
653
259
198
343

Responder a las siguientes cuestiones:

  1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático y explicar los distintos elementos que intervienen.
  2. Contrastar la hipótesis nula de no interacción entre los factores. Adecuar el modelo al resultado de las interacciones y contrastar los efectos principales.
  3. ¿Hay diferencias significativas en el nivel de nicotina en las distintas edades?¿En qué edad el nivel de nicotina es mayor?
  4. ¿El tipo de tabaco es un factor determinante en el nivel de nicotina?
  5. Comparar el nivel medio de nicotina entre las mujeres y los hombres. ¿Se detectan diferencias significativas?

Ejercicio Propuesto 1

La convección es una forma de transferencia de calor por los fluidos debido a sus variaciones de densidad por la temperatura; las partes calientes ascienden y las frías descienden formando las corrientes de convección que hacen uniforme la temperatura del fluido. Se ha realizado un experimento para determinar las modificaciones de la densidad de fluido al elevar la temperatura en una determinada zona. Los resultados obtenidos han sido los siguientes:

Temperatura

Densidad

100

21.8

21.9

21.7

21.6

21.7

125

21.7

21.4

21.5

21.4

 

150

21.9

21.8

21.8

21.6

21.5

175

21.9

22.1

21.85

21.9

 

Responder a las siguientes cuestiones:

  1. ¿Afecta la temperatura a la densidad del fluído?
  2. Determinar qué temperaturas producen modificaciones significativas en la densidad media del fluido.
  3. Estudiar las hipótesis del modelo: Homocedasticidad, independencia y normalidad.
  4. Se puede afirmar que las temperaturas de 100 y 125 producen menos densidades de fluido en promedio que las temperaturas de 150 y 175.

Solución:

El problema planteado se modeliza a través de un diseño unifactorial totalmente aleatorizado de efectos fijos no-equilibrado.

Variable respuesta: Densidad del fluido.

Factor: Temperatura. Es un factor de Efectos fijos.

Modelo no-equilibrado: Los niveles de los factores tienen distinto número de elementos.

  1. ¿Afecta la temperatura a la densidad del fluído?

Para responder a este apartado, se plantea el siguiente contraste de igualdad de medias:

Se selecciona Analizar/Modelo lineal general/Univariante. En la salida correspondiente, se introduce en el campo Variable dependiente: La variable respuesta Densidad del fluido y en el campo Factores fijos: el factor Temperatura. Pulsando Aceptar se obtiene la Tabla ANOVA

En la tabla ANOVA el valor del estadístico de contrates de igualdad de medias F = 6.983, deja a su derecha un p-valor = 0.004 inferior a 0.05, por lo que se rechaza la hipótesis nula de igualdad de medias. Concluyendo que existen diferencias significativas en la densidad del fluido en función de la modificación de la temperatura.

  1. Determinar qué temperaturas producen modificaciones significativas en la densidad media del fluido.

Se plantea la pregunta de si la densidad media del fluido es significativamente diferente para las 4 temperaturas analizadas o sólo para alguna de ellas. Esta cuestión se resuelve mediante los contrastes de comparaciones múltiples. Utilizando la prueba de Tukey,se obtienen los siguientes resultados:

La tabla de comparaciones múltiples muestra los intervalos simultáneos construidos por el método de Tukey para cada posible combinación de temperaturas. Como se puede observar todos los intervalos de confianza construidos para las diferencias entre las densidades medias contienen al 0, excepto el correspondiente a la pareja de temperatura125 y 175. Lo que significa que todas las densidades medias no pueden considerarse distintas estadísticamente excepto las densidades medias correspondientes a las temperaturas de 125 y 175. Así mismo se observa que la significación asociada al contraste de las densidades medias correspondientes a estas temperaturas es inferior a 0.05, lo que se traduce en que existe evidencia empírica de que ambas densidades medias son diferentes significativamente.

Para poder analizar esta tabla más fácilmente la ponemos de la siguiente forma

En esta tabla es más cómodo comparar cualquier pareja de temperaturas para saber si hay diferencias significativas. Se deduce que sólo se observan diferencias significativas entre las densidades de los fluidos cuando se ha modificado la temperatura a 125 y 175 grados (significación inferior a 0.05).

En la tabla Subconjuntos homogéneos asociada al contraste de Tukey se muestra por columnas los subgrupos de medias iguales. En nuestro estudio sobre las densidades de los fluidos se observan que las densidades medias del fluido analizado pueden considerarse similares cuando las temperaturas son 100, 125 y 150 y cuando son 100, 150 y 175 grados.

Tal y como se observa en la tabla, el p-valor asociado al primer grupo de temperaturas (100, 125 y 150) es 0.081, mayor que 0.05 lo que significa que no se puede rechazar la hipótesis de igualdad en las densidades medias para este subgrupo. Análogamente ocurre con el otro subgrupo formado, con un p-valor igual a 0.124. También se deduce qué subconjuntos difieren entre si, las densidades medias del primer grupo difieren de las del segundo. Y se observa que la densidad media mayor (21.9375) se obtiene para la temperatura de 175 y la menor (21.5) para la tremperatura de 125.

  1. Estudiar las hipótesis del modelo: Homocedasticidad, independencia y normalidad.

Validar el modelo propuesto consiste en estudiar si las hipótesis básicas del modelo están o no en contradicción con los datos observados. Es decir, si se satisfacen los supuestos del modelo: Normalidad, Independencia y Homocedasticidad.

Hipótesis de Homocedasticidad

El primer aspecto que vamos a considerar es el de la homocedasticidad, la igualdad de varianzas. Para ello, a través del botón Opciones del menú Analizar/Modelo lineal general/Univariante, pulsando en Pruebas de homogeneidad se obtiene:

De donde se deduce a partir del valor de la significación, 0.585, que se puede asumir la igualdad de varianzas entre las densidades registradas para las diferentes temperaturas.

Gráficamente, representamos las barras de error para la desviación típica seleccionando en el menú principal Gráficos/Cuadros de diálogo antiguos/Barras de error

Se obtiene para cada grupo de temperaturas una representación gráfica de la densidad media (círculo de cada una de las barras) y dos desviaciones típicas a izquierda y derecha del promedio. Se observa una mayor dispersión en la densidad para las temperaturas 125 y 150. Este gráfico no aporta evidencias sobre la homogeneidad de las varianzas, por lo que siempre habrá que recurrir al contraste de Levene para dicha comparación.

Hipótesis de Independencia

Para comprobar que se satisface el supuesto de independencia entre los residuos, representamos gráficamente los residuos frente a los valores pronosticados. La presencia de alguna tendencia en el gráfico puede indicar la alteración de dicha hipótesis. Seleccionando Opciones en el cuadro de diálogo de Análisis Univariante, se selecciona la casilla Gráfico de los residuos y se obtienen los gráficos de residuos asociados al análisis

En el gráfico de la tercera fila y la segunda columna (residuos frente a valores pronosticados) no se observa ninguna tendencia concreta lo que muestra la no existencia de relación de dependencia.

Hipótesis de Normalidad

En primer lugar analizamos la normalidad de las densidades y continuaremos con el análisis de la normalidad de los residuos. Se selecciona en SPSS Analizar/Estadísticos descriptivos/Explorar y se obtienen los ajustes de normalidad

El contraste de Shapiro-Wilk (apropiado dado que el número total de datos es inferior a 50), muestra p-valores siempre superiores a 0.05, por lo que podemos concluir que las densidades se distribuyen según una normal para cada temperatura considerada en el estudio.

Para contrastar la hipótesis de Normalidad de los residuos recurriremos a procedimientos gráficos y analíticos. Para ello, en primer lugar se calculan los residuos tipificados asociados al ajuste univariante.

Para obtener el histograma de los residuos se selecciona en el menú principal de SPSS, Gráficos/Cuadros de diálogo antiguos/Histograma. Aunque podemos observar algunas desviaciones de la normalidad en el histograma, estas no implican la ausencia de normalidad de los residuos como se comprueba con el gráfico probabilístico normal (Analizar/Estadísticos Descriptivos/Gráficos QQ ).

            

El análisis numérico se llevará a cabo a través del contraste de Kolmogorov-Smirnov, Analizar/Pruebas no paramétricas/Cuadros de diálogo antiguos/K-S de 1 muestra

El valor del p- valor (significación = 0.637) es mayor que el nivel de significación, 0.05, por lo que se puede confirmar la normalidad de los residuos.

  1. ¿Se puede afirmar que las temperaturas de 100 y 125 producen menos densidades de fluido en promedio que las temperaturas de 150 y 175?

El contraste de hipótesis que se debe resolver para contestar este apartado es:

Para realizarlo con SPSS, en Analizar/Comparar medias/Anova de un factor... pulsamos Contrastes. Introduciendo los correspondientes coeficientes se obtiene la siguiente salida

  

Para interpretar la tabla, asumimos en todos los contrastes la homocedasticidad, observamos que el p-valor vale 0.006 menor que el nivel de significación 0.05. Por lo tanto, se rechaza la hipótesis nula y se deduce que las temperaturas de 100 y 125 conjuntamente producen menos densidades de fluido en promedio que las temperaturas de 150 y 175 conjuntamente.


Ejercicio Propuesto 2

Un laboratorio de reciclaje controla la calidad de los plásticos utilizados en bolsas. Se desea contrastar si existe variabilidad en la calidad de los plásticos que hay en el mercado. Para ello, se eligen al azar cuatro plásticos y se les somete a una prueba para medir el grado de resistencia a la degradación ambiental. De cada plástico elegido se han seleccionado ocho muestras y los resultados de la variable que mide la resistencia son los de la tabla adjunta.

 

Calidad Plásticos

Resistencia

Plástico A

135
175
97
169
213
171
115
143

Plástico B

275
170
154
133
219
187
220
185

Plástico C

169
239
184
222
253
179
280
193

Plástico D

115
105
93
85
120
74
87
63

¿Qué conclusiones se deducen de este experimento?


Solución:

Los cuatro tipos de plásticos analizados corresponden a una selección aleatoria de 4 conjuntos de observaciones extraídos aleatoriamente del total de diferentes tipos de plásticos que hay en el mercado, entre los cuales debemos observar si existen o no diferencias significativas. Nos encontramos por tanto ante un diseño unifactorial completamente aleatorio con efectos aleatorios .

En este modelo, se supone que las variables τi son variables aleatorias normales independientes con media 0 y varianza común .

Dado que trabajamos con el modelo de efectos aleatorios, analizar si las medias poblacionales son iguales será equivalente a contrastar:

No rechazar H0 será equivalente a afirmar que no hay variedad en los efectos de los tratamientos, es decir, que la resistencia que ofrecen los plásticos empleados en la fabricación de bolsas de cara a la degradación ambiental es la misma.

Plantearemos el contraste a partir de la información de que disponemos:

Variable respuesta: Resistencia a la degradación ambiental.

Factor: Tipo de plástico.

Modelo equilibrado: Cada uno de los niveles del factor tienen el mismo número de observaciones.

Tamaño del experimento: Número total de observaciones (40 unidades experimentales).

Comenzaremos definiendo las variables e introduciendo los datos:

Para formular el contraste, en el menú principal se selecciona Analizar/Modelo lineal general/Univariante … En la ventana resultante introducimos Resitencia en la Variable dependiente: y Tipo de plástico como Factor aleatorio. Pulsando Aceptar, obtenemos la tabla ANOVA:

El valor del estadístico de contraste 17.232 deja a su derecha un p-valor menor que 0.001, rechazando la Hipótesis nula tanto a un nivel de significación del 5% como del 1%. Podemos concluir que los datos muestran evidencias de variabilidad en la resistencia para la degradación ambiental según el tipo de plástico empleado en la fabricación de la bolsa.

Dado que estamos ante un modelo de efectos aleatorios, no tenemos que realizar contrastes adicionales para comprobar qué medias son diferentes, ya que la respuesta es generalizada a todos los tipos de plásticos.

La media cuadrática esperada, así como los cálculos necesarios para la obtención de las esperanzas de los cuadrados medios del factor y del error vienen dados en la tabla:

       

 

A partir de estas expresiones se pueden estimar las componentes de la varianza y σ2

Para determinar el valor concreto de estas estimaciones se selecciona, Analizar/Modelo lineal general/Componentes de la varianza. En la ventana Opciones se selecciona ANOVA en Método y Tipo III en Sumas de Cuadrados. Pulsando en Continuar y Aceptar, se obtienen las estimaciones de las componentes de la varianza:

       

La varianza total, 4047.091, se descompone en una parte atribuible a la diferencia entre los plásticos, 2710.993, y otra debida a la variabilidad existente dentro de ellos, 1336.098.

En la varianza total, tiene mayor peso la variación debida al tipo de plástico empleado en la fabricación de la bolsa (66.98%) que la originada dentro de los plásticos (33.013%).


Ejercicio Propuesto 3

Debido a la proliferación de los campos de golf y a la gran cantidad de agua que necesitan, un grupo de científicos estudia la calidad de varios tipos de césped para implantarlo en invierno en los campos de golf. Para ello, miden la distancia recorrida por una pelota de golf, en el campo, después de bajar por una rampa (para proporcionar a la pelota una velocidad inicial constante). El terreno del que dispone tiene mayor pendiente en la dirección norte-sur, por lo que se aconseja dividir el terreno en cinco bloques de manera que las pendientes de las parcelas individuales dentro de cada bloque sean las mismas. Se utilizó el mismo método para la siembra y las mismas cantidades de semilla. Las mediciones son las distancias desde la base de la rampa al punto donde se pararon las pelotas. En el estudio se incluyeron las variedades: Agrostis Tenuis (Césped muy fino y denso, de hojas cortas y larga duración), Agrostis Canina (Hoja muy fina, estolonífera. Forma una cubierta muy tupida), Paspalum Notatum (Hojas gruesas, bastas y con rizomas. Forma una cubierta poco densa), Paspalum Vaginatum (Césped fino, perenne, con rizomas y estolones).

 

 

Bloques

Variedad de césped

Bloque 1
Bloque 2
Bloque 3
Bloque 4
Bloque 5

Agrostis Tenuis

1.30
1.60
0.50
1.20
1.10

Agrostis Canina

2.20
2.40
0.40
2.00
1.80

Paspalum Notatum

1.80
1.70
0.60
1.50
1.30

Paspalum Vaginatum

3.90
4.40
2.00
4.10
3.40

Se pide:

  1. Identificar los elementos del estudio (factores, unidades experimentales, variable respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.
  2. ¿Son los bloques fuente de variación?
  3. ¿Existen diferencias reales entre las distancias medias recorridas por una pelota de golf en los distintos tipos de cesped?
  4. Estudiar las interacciones de los factores.
  5. Comprobar que se cumplen las hipótesis del modelo.
  6. Utilizando el método de Newman-Keuls, ¿qué tipo de cesped ofrece menor resistencia al recorrido de las pelotas?


Solución:

  1. Identificar los elementos del estudio (factores, unidades experimentales, variable respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.

Variable respuesta: Distancia.

Factor: Tipo_Cesped que tiene cuatro niveles. Es un factor de efectos fijos ya que viene decidido qué niveles concretos se van a utilizar.

Bloque: Bloques que tiene cinco niveles. Es un factor de efectos fijos ya que viene decidido qué niveles concretos se van a utilizar.

Modelo completo: Los cuatro tratamientos se prueban en cada bloque exactamente una vez.

Tamaño del experimento: Número total de observaciones (20).

Este experimento se modeliza mediante un diseño en Bloques completos al azar. El modelo matemático es:

  1. ¿Son los bloques fuente de variación?

Para resolver la cuestión planteada. Se selecciona, en el menú principal, Analizar/Modelo lineal general/ Univariante… En la salida correspondiente, se introduce en el campo Variable dependiente: La variable respuesta Distancia y en el campo Factores fijos: el factor Tipo_Cesped y el bloque Bloques. Para indicar que se trata de un modelo sin interacción entre los tratamientos y los bloques, se debe pinchar en Modelo e indicar en la salida correspondiente que es un modelo aditivo.

Por defecto, SPSS tiene marcado un modelo Factorial completo, por lo que hay que señalar Personalizado. En el modelo que estamos estudiando sólo aparecen los efectos principales de los dos factores, por lo tanto se selecciona en Tipo: Efectos principales y se pasan los dos factores, Tipo_Cesped y Bloque, al campo Modelo: Se pulsa Continuar y Aceptar.

Puesto que la construcción de bloques se ha diseñado para comprobar el efecto de una variable, nos preguntamos si ha sido eficaz su construcción. En caso afirmativo, la suma de cuadrados de bloques explicaría una parte sustancial de la suma total de cuadrados. También se reduce la suma de cuadrados del error dando lugar a un aumento del valor del estadístico de contraste experimental utilizado para contrastar la igualdad de medias de los tratamientos y posibilitando que se rechace la Hipótesis nula, mejorándose la potencia del contraste.

La construcción de bloques puede ayudar cuando se comprueba su eficacia pero debe evitarse su construcción indiscriminada. Ya que, la inclusión de bloques en un diseño da lugar a una disminución del número de grados de libertad para el error, aumenta el punto crítico para contrastar la Hipótesis nula y es más difícil rechazarla. La potencia del contraste es menor.

La Tabla ANOVA, muestra que:

La salida de SPSS también nos muestra que R cuadrado vale 0.963, indicándonos que el modelo explica el 96.30% de la variabilidad de los datos.

  1. ¿Existen diferencias reales entre las distancias medias recorridas por una pelota de golf en los distintos tipos de cesped?

Esta cuestión está contestada afirmativamente en el apartado anterior, en el que la tabla ANOVA nos muestra un valor de F = 75.895 y un Sig. menor que 0.001.

  1. Estudiar las interacciones de los factores.

La interacción entre el factor bloque y los tratamientos se puede estudiar gráficamente de diversas formas:

Gráfico de residuos frente a los valores predichos por el modelo. Si este gráfico no presenta ningún aspecto curvilíneo se admite que el modelo es aditivo. Seleccionamos Opciones en el cuadro de diálogo de Univariante y marcamos la casilla Gráfico de los residuos. Se pulsa, Continuar y Aceptar

Interpretamos el gráfico que aparece en la fila 3 columna 2, es decir aquel gráfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho gráfico, ninguna tendencia curvilínea, es decir no muestra evidencia de interacción entre el factor bloque y los tratamientos.

Gráfico de perfil. Es un gráfico de las medias de los tratamientos, para realizarlo se selecciona, en el menú principal, Analizar/Modelo lineal general/ Univariante/Gráficos… se introduce en el Eje horizontal: Tipo_Cesped y en Líneas separadas: Bloques. Se pulsa Añadir, Continuar y Aceptar.

La figura representa el gráfico de las medias de los tratamientos. Cuando no existe interacción, los segmentos lineales que unen dos medias cualesquiera serán paralelos a través de los bloques. Es decir, es posible hacer consideraciones generales relativas a los tratamientos sin tener que especificar el bloque implicado. Podemos deducir, por ejemplo, que el césped Agrostis Tenuis presenta más resistencia al recorrido de las pelotas que los otros tipos de céspedes. Cuando estos segmentos no son paralelos se deduce que hay interacción entre los bloques y tratamientos. Esto significa que debemos tener cuidado cuando hagamos declaraciones relativas a los tratamientos, porque el bloque implicado es también importante.

  1. Comprobar que se cumplen las hipótesis del modelo

Hipótesis de normalidad

En primer lugar se deben salvar los residuos y a continuación realizamos el estudio de la normalidad mediante el Gráfico probabilístico Normal y el Contraste de Kolmogorov-Smirnov.

Gráfico probabilístico Normal: Se selecciona en el menú principal, Analizar/Estadísticos descriptivos/Gráficos Q-Q. Se introduce en el campo Variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar

Podemos apreciar en este gráfico que los puntos aparecen próximos a la línea diagonal. Esta gráfica no muestra una desviación marcada de la normalidad.

Contraste de Kolmogorov-Smirnov: Se selecciona en el menú principal, Analizar/Pruebas no paramétricas/ Cuadros de diálogos antiguos/K-S de 1 muestra. Se introduce en el campo Lista Contrastar variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar

El valor del p-valor, 0.901, es mayor que el nivel de significación 0.05, aceptándose la hipótesis de normalidad.

Independencia de los residuos

En el gráfico de los residuos realizado anteriormente, interpretamos el gráfico que aparece en la fila 3 columna 2, es decir aquel gráfico que se representan los residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas. No observamos, en dicho gráfico, ninguna tendencia sistemática que haga sospechar del incumplimiento de la suposición de independencia. Este gráfico también lo podemos realizar mediante un diagrama de dispersión de los residuos y las predicciones.

Homogeneidad de varianzas

En primer lugar comprobamos la homocedasticidad gráficamente, para ello se selecciona en el menú principal, Gráficos/Cuadros de diálogos antiguos/Barras de error… Y en la salida correspondiente seleccionar Simple y pulsar Definir. Se introduce en el campo Variable: La variable respuesta Distancia y en el campo Eje de categorías: el factor Tipo_Cesped. En Las barras representan se selecciona Desviación típica, en Multiplicador: 2 (nos interesa que la desviación típica esté multiplicada por dos). Se pulsa Aceptar

                 

Cada grupo tiene su promedio (el círculo en cada una de las barras), dos desviaciones típicas a la izquierda y dos desviaciones típicas a la derecha del promedio. Observamos que en los tipos de césped Agrostis Canina y Paspalum Vaginatum hay mucha más dispersión que en los otros dos. Del gráfico no se deduce directamente si hay homogeneidad en las varianzas, por lo que recurrimos a analizarlo numéricamente mediante una prueba, el test de Levene.

Realizamos el mismo gráfico para el factor bloque, para ello introducimos en el campo Eje de categorías: el factor Bloques.

Observamos que en el Bloque 2 parece que hay mayor dispersión pero seguido a muy poca distancia del los Bloques 4, 1 y 5 y donde hay menos dispersión es en el Bloque 3. Como en el gráfico anterior, no se deduce directamente si hay homogeneidad en estas varianzas, por lo que recurrimos a analizarlo numéricamente mediante el test de Levene.

Para realizar el test de Levene mediante SPSS, se selecciona, en el menú principal, Analizar/Comparar medias/ANOVA de un factor. En la salida correspondiente, se introduce en el campo Lista de dependientes: La variable respuesta Distancia y en el campo Factor: el factor Tipo_Cesped. Se pulsa Opciones. Se selecciona Pruebas de homogeneidad de las varianzas y Gráfico de medias. Se pulsa Continuar y Aceptar

              

El p-valor es 0.412 por lo tanto no se puede rechazar la hipótesis de homogeneidad de las varianzas y se concluye que los tres grupos tienen varianzas homogéneas.

 En el gráfico de medias, donde en el eje de ordenadas figuran las medias de las distancias recorridas por las pelotas y en el eje de abscisas los tipos de césped. En esta gráfica observamos que la mayor distancia recorrida se produce en el tratamiento 4 (Paspalum Vaginatum) y el número más bajo se produce con el tratamiento1 (Agrostis Tenuis). Para saber entre que parejas de tratamientos estas diferencias son significativas se realiza una prueba Post-hoc.

Realizamos el mismo contraste para los bloques, ya que hay que comprobar la homocedasticidad tanto en los tratamientos como en los bloques. En este caso se introduce en el campo Factor: Bloques.

          

 

El p-valor es 0.899 por lo tanto no se puede rechazar la hipótesis de homogeneidad de las varianzas entre los bloques y se concluye que los diez grupos tienen varianzas homogéneas.

En esta gráfica observamos que la mayor distancia recorrida se produce en el Bloque 2 y el número más bajo se produce en el Bloque 3. Para saber entre que parejas de Bloques estas diferencias son significativas, aplicamos una prueba Post-hoc.

  1. Utilizando el métdodo de Newman-Keuls, ¿qué tipo de cesped ofrece menor resistencia al recorrido de las pelotas?

A partir de los resultados obtenidos, se deduce que las distancias medias recorridas por las pelotas es similar para los céspedes Agrostis Tenuis y Paspalum Notatum por una parte, también son similares en el Paspalum Notatum y Agrostis Canina, y en ambos grupos dichas distancias medias difieren significativamente de las recorridas en el césped Paspalum Vaginatum. Por lo tanto, se pueden establecer tres agrupaciones con características similares para las distancias medias recorridas. El tipo de césped que ofrece menor resistencia al recorrido de las pelotas es el Paspalum Vaginatum, donde las pelotas tienen un recorrido medio de 3.56 u.d.


Ejercicio Propuesto 4

Consideremos de nuevo el ejercicio propuesto 3 sobre un grupo de científicos que estudia la calidad de varios tipos de césped para implantarlo en invierno en los campos de golf. Para ello, miden la distancia recorrida por una pelota de golf, en el campo, después de bajar por una rampa (para proporcionar a la pelota una velocidad inicial constante). El terreno del que disponen tiene mayor pendiente en la dirección norte-sur, por lo que se aconseja dividir el terreno en cinco bloques de manera que las pendientes de las parcelas individuales dentro de cada bloque sean las mismas. Se utilizó el mismo método para la siembra y las mismas cantidades de semilla. Las mediciones son las distancias desde la base de la rampa al punto donde se pararon las pelotas, y al realizar dichas mediciones no se han podido obtener una para cada combinación de tipo de césped y tipo de terreno, sino que sólo se han podido realizar con tres de las variedades de césped en cada uno de los bloques de terreno. Para controlar el efecto del tipo de terreno deciden utilizar un diseño en bloques incompletos. En el estudio se incluyeron las variedades: Agrostis Tenuis (Césped muy fino y denso, de hojas cortas y larga duración), Agrostis Canina (Hoja muy fina, estolonífera. Forma una cubierta muy tupida), Paspalum Notatum (Hojas gruesas, bastas y con rizomas. Forma una cubierta poco densa), Paspalum Vaginatum (Césped fino, perenne, con rizomas y estolones).

 

Bloques

Variedad de césped

Bloque 1
Bloque 2
Bloque 3
Bloque 4
Bloque 5

Agrostis Tenuis

1.30
1.60
0.50
1.20

Agrostis Canina

2.20
2.40
0.40
1.80

Paspalum Notatum

1.80
1.50
1.30
Paspalum Vaginatum
4.40
2.00
4.10
3.40

Se pide:

  1. Identificar los elementos del estudio (factores, unidades experimentales, variable respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.
  2. ¿Son los bloques fuente de variación?
  3. ¿Existen diferencias reales entre las distancias medias recorridas por una pelota de golf en los distintos tipos de césped?
  4. Comprobar que se cumplen las hipótesis del modelo.
  5. Utilizando el método de Newman-Keuls, ¿qué tipo de cesped ofrece menor resistencia al recorrido de las pelotas?

Solución:

Para resolver las cuestiones planteadas sobre los tratamientos y los bloques, en el menú principal se selecciona: Analizar\Modelo lineal general\Univariante… Introduciendo la información relativa al diseño en la ventana de análisis: La variable dependiente es la Distancia y el resto de variables, Tipo_Cesped y Bloques corresponden a los factores fijos del modelo. En la opción Modelo, hay que indicar al programa que se trata de un modelo sin interacción entre los tratamientos y los bloques. Además hay que tener en cuenta que se trata de un diseño en bloques incompletos. En este tipo de diseño los tratamientos no están en todos los bloques, entonces los bloques y tratamientos no son ortogonales (como lo son en el diseño de bloques completos al azar), por lo tanto no es posible realizar una descomposición de la variabilidad del experimento como en el diseño en bloques completos. Para resolver está cuestión, SPSS utiliza las Sumas de cuadrados de tipo I.

          

De la tabla ANOVA se deduce que los bloques son una fuente de variación.

          

Se observa en la tabla ANOVA que hay diferencias reales entre las distancias medias recorridas por una pelota de golf en los distintos tipos de césped ya que el p-valor es menor que 0.001.


Ejercicio Propuesto 5

Un investigador quiere evaluar la productividad de cuatro variedades de aguacate, A, B, C y D. Para ello decide realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y además, diferencias en la disponibilidad de Nitrógeno de norte a sur, para controlar los efectos de la pendiente y la disponibilidad de Nitrógeno, utilizó un diseño de cuadrado latino, los datos corresponden a la producción en kg/parcela.

 

Pendiente

Nitrógeno

1
2
3
4

1

D
785
A
730
C
700
B
595

2

A
855
B
775
D
760
C
710

3

C
950
D
885
B
795
A
780

4

B
945
C
950
A
880
D
835

Responder a las siguientes cuestiones:

  1. ¿Se puede afirmar que la productividad media de las cuatro variedades de aguacate es la misma?
  2. ¿Qué supuestos han de verificarse?
  3. ¿Se obtiene la misma producción con las cuatro variedades de aguacate? En caso negativo, analizar mediante el procedimiento de Tukey, con qué variedad de aguacate hay mayor producción.

Solución:

  1. ¿Se puede afirmar que la productividad media de las cuatro variedades de aguacate es la misma?

El análisis de la productividad de las variedades de aguacate corresponde al análisis de un factor con 4 niveles. Dado que en el estudio intervienen dos fuentes de variación: la Disponibilidad de Nitrógeno y la Pendiente, se consideran dos factores de bloque, cada uno de ellos con 4 niveles.

Se pretende, entonces dar respuesta al contraste:

Variable respuesta: Productividad

Factor: Variedad de aguacate. Es un factor de efectos fijos ya que desde el principio se establecen los niveles concretos que se van a analizar.

Bloques: Disponibilidad de Nitrógeno y Pendiente, ambos con 4 niveles y ambos de efectos fijos.

Tamaño del experimento: Número total de observaciones (42) .

Para resolver el contraste planteado, en el menú principal se selecciona: Analizar\Modelo lineal general\Univariante… Introduciendo la información relativa al diseño en la ventana de análisis: La variable dependiente es la Productividad y el resto de variables, Nitrógeno, Pendiente y Variedad corresponden a los factores fijos del modelo. En la opción Modelo, hay que indicar al programa que se trata de un modelo sin interacción entre los tratamientos y los bloques

          

A la vista de los p-valores, todos ellos inferiores a 0.05, podemos afirmar que todos los efectos son significativos. Tanto las variedades de aguacates utilizadas, como la pendiente del terreno y la disponibilidad de nitrógeno influyen en la productividad de los aguacates.

  1. ¿Qué supuestos han de verificarse?

Los supuestos que han de verificarse en un diseño de cuadrados latinos son Normalidad, Homocedasticidad e Independiencia además del supuesto de aditividad entre filas, columnas y tratamientos (es decir, que no haya interacciones entre los mismos).

Hipótesis de normalidad

Gráfico probabilístico Normal: Se selecciona en el menú principal, Analizar/Estadísticos descriptivos/Gráficos Q-Q. Se introduce en el campo Variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar

Contraste de Kolmogorov-Smirnov: Se selecciona en el menú principal, Analizar/Pruebas no paramétricas/ Cuadros de diálogos antiguos/K-S de 1 muestra. Se introduce en el campo Lista Contrastar variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar

El valor del p-valor, 0.323, es mayor que el nivel de significación 0.05, aceptándose la hipótesis de normalidad.

Independencia entre los residuos

En el gráfico de los residuos

interpretamos el gráfico que aparece en la fila 3 columna 2. No observamos, en dicho gráfico, ninguna tendencia sistemática que haga sospechar del incumplimiento de la suposición de independencia.

Homogeneidad de varianzas

En primer lugar comprobamos la homocedasticidad gráficamente, para ello se selecciona en el menú principal, Gráficos/Cuadros de diálogos antiguos/Barras de error… Y en la salida correspondiente seleccionar Simple y pulsar Definir. Se introduce en el campo Variable: La variable respuesta Productividad y en el campo Eje de categorías: el factor Variedad. En Las barras representan se selecciona Desviación típica, en Multiplicador: 2 (nos interesa que la desviación típica esté multiplicada por dos). Se pulsa Aceptar

Observamos que en las variedades de aguacates B y C hay mucha más dispersión que en las otras dos. Del gráfico no se deduce directamente si hay homogeneidad en estas varianzas, por lo que recurrimos analizarlo numéricamente mediante una prueba, el test de Levene.

Se debe realizar el mismo gráfico para cada uno de los factores de bloque.

Contraste de Levene: Se selecciona, en el menú principal, Analizar/Comparar medias/ANOVA de un factor. En la salida correspondiente, se introduce en el campo Lista de dependientes: La variable respuesta Productividad y en el campo Factor: el factor Variedad. Se pulsa Opciones. Se selecciona Pruebas de homogeneidad de las varianzas y Gráfico de medias. Se pulsa Continuar y Aceptar

                           

El p-valor es 0.167 por lo tanto no se puede rechazar la hipótesis de homogeneidad de las varianzas y se concluye que la cuatro variedades tienen varianzas homogéneas.

 En el gráfico de medias, donde en el eje de ordenadas figuran las producciones medias de aguacates y en el eje de abscisas las cuatro variedades de aguacate. En esta gráfica observamos que la producción mayor se obtiene con la Variedad C y la producción más baja es la de la Variedad de aguacate B . Para saber entre qué parejas de tratamientos estas diferencias son significativas, se debe realizar una prueba Post-hoc.

Realizamos el mismo contraste para los bloques, ya que hay que comprobar la homocedasticidad tanto en los tratamientos como en los bloques.

                                              

Los p-valores son mayores que 0.05, por lo tanto no se puede rechazar la hipótesis de homogeneidad de las varianzas.

Aditividad de los factores

Gráfico de residuos frente a los valores predichos por el modelo. Si el gráfico que aparece en la fila 3 columna 2 no presenta ningún aspecto curvilíneo se admite que el modelo es aditivo.

Gráfico de perfil. Es un gráfico de las medias de los tratamientos, realizamos los siguientes gráficos para comprobar la no interacción entre los factores

               

Cuando no existe interacción, los segmentos lineales que unen dos medias cualesquiera serán paralelos a través de los bloques. Es decir, es posible hacer consideraciones generales relativas a los tratamientos sin tener que especificar el bloque implicado. Cuando estos segmentos no son paralelos se deduce que hay interacción entre los bloques y tratamientos. Esto significa que debemos tener cuidado cuando hagamos declaraciones relativas a los tratamientos, porque el bloque implicado es también importante.

  1. ¿Se obtiene la misma producción con las cuatro variedades de aguacate? En caso negativo, analizar mediante el procedimiento de Tukey, con qué variedad de aguacate hay mayor producción.

                

La tabla de comparaciones múltiples muestra los intervalos simultáneos construidos por el método de Tukey para cada posible combinación de variedades de aguacates. Como se puede observar, todos los intervalos de confianza construidos para las diferencias entre las producciones medias de las variedades no contienen al 0, excepto el correspondiente a la pareja de variedades de aguacates A y D. Lo que significa que todas las producciones medias pueden considerarse distintas estadísticamente excepto las producciones medias correspondientes a las variedades A y D. En la tabla de la derecha es más cómodo comparar cualquier pareja de variedades de aguacates para saber si hay diferencias significativas. Se deduce que únicamente no se observan diferencias significativas entre las producciones de las variedades de aguacates A y D (P-valor = 0.429).

En la tabla Subconjuntos homogéneos asociada al contraste de Tukey se muestra por columnas los subgrupos de medias iguales. En nuestro estudio sobre las producciones de aguacates se observan que hay tres subgrupos homogéneos, al primer subgrupo pertenece la Variedad B, al segundo las variedades A y D y al tercero la Variedad C. Y se observa que la producción media mayor se obtiene con la Variedad C (827.5 Kg/ parcela) y la menor con la Variedad B (777.50 Kg/parcela).


Ejercicio Propuesto 6

Consideremos de nuevo el ejercicio propuesto 5 del investigador que quiere evaluar la productividad de cuatro variedades de aguacate, A, B, C y D. Para ello, decide realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y además, diferencias en la disponibilidad de Nitrógeno de norte a sur. Se seleccionan cuatro disponibilidades de nitrógeno, pero sólo dispone de tres gradientes de pendiente. Para controlar estas posibles fuentes de variabilidad, el investigador decide utilizar un diseño en cuadrado de Youden con cuatro filas, las cuatros disponibilidades de Nitrógeno (NI, N2, N3, N4), tres columnas, los tres gradientes de pendientes (P1, P2, P3) y cuatro letras latinas, las variedades de aguacates (A, B, C, D). Los datos corresponden a la producción en kg/parcela.

 

Pendiente

Nitrógeno

P1
P2
P3

N1

D
756
A
720
C
689

N2

A
596
B
855
D
780

N3

C
750
D
975
B
899

N4

B
950
C
870
A
880

Responder a las siguientes cuestiones:

  1. Estudiar cuál es el tipo de diseño adecuado a este experimento y escribir el modelo matemático asociado.
  2. ¿Qué supuestos han de verificarse?
  3. ¿Se puede afirmar que la productividad media de las cuatro variedades de aguacate es la misma? En caso negativo, analizar mediante el procedimiento de Duncan, con qué variedad de aguacate hay mayor producción.

Solución:

El análisis de la productividad de las variedades de aguacate corresponde al análisis de un factor con 4 niveles. Dado que en el estudio intervienen dos fuentes de variación: la Disponibilidad de Nitrógeno y la Pendiente, se consideran dos factores de bloque, el primero con 4 niveles y el segundo con tres niveles.

Se pretende, entonces dar respuesta al contraste:

Variable respuesta: Productividad.

Factor: Variedad de aguacate. Es un factor de efectos fijos ya que desde el principio se establecen los niveles concretos que se van a analizar.

Bloques: Disponibilidad de Nitrógeno y Pendiente, con 4 y 3 niveles, respectivamente y ambos de efectos fijos.

Tamaño del experimento: Número total de observaciones: 12 .

Para resolver el contraste planteado, en el menú principal se selecciona: Analizar\Modelo lineal general\Univariante… Introduciendo la información relativa al diseño en la ventana de análisis: La variable dependiente es la Productividad y el resto de variables, Nitrógeno, Pendiente y Variedad corresponden a los factores fijos del modelo. En la opción Modelo, hay que indicar al programa que se trata de un modelo sin interacción entre los tratamientos y los bloques. Además hay que tener en cuenta que el diseño en cuadrados de Youden es un diseño en bloques incompletos por lo que hay que utilizar, para realizarlo mediante SPSS, las Sumas de cuadrados de Tipo I y tener en cuenta que para analizar un determinado factor hay que introducirlo en último lugar. Los resultados del ANOVA dependerán del orden en que se introduzcan los factores.

          

A la vista del valor de Sig. (0.024), podemos afirmar que en la productividad del aguacate influyen las distintas variedades utilizadas.

La mayor productividad de aguacates se obtiene con la Variedad B, con un productividad media de 901.33 Kg/parcela.


Ejercicio Propuesto 7

En un invernadero se está estudiando el crecimiento de determinadas plantas, para ello se quiere controlar los efectos del terreno, abono, insecticida y semilla. El estudio se realiza con cuatro tipos de semillas diferentes que se plantan en cuatro tipos de terreno, se les aplican cuatro tipos de abonos y cuatro tipos de insecticidas. La asignación de los tratamientos a las plantas se realiza de forma aleatoria. Para controlar estas posibles fuentes de variabilidad se decide plantear un diseño por cuadrados greco-latinos como el que se muestra en la siguiente tabla, donde las letras griegas corresponden a los cuatro tipos de semilla y las latinas a los abonos.

Crecimiento

 

Tipo de insecticidad

Tipo de terreno

Insecticidad 1

Insecticidad 2

Insecticidad 3

Insecticidad 4

Terreno 1

6
C β

12
B α

13
A δ

13
D γ

Terreno 2

6
B γ

10
C δ

16
D α

11
A β

Terreno 3

7
D δ

5
A γ

5
B β

7
C α

Terreno 4

11
A α

11
D β

8
C γ

9
B δ

Responder a las siguientes cuestiones:

  1. Estudiar cuál es el tipo de diseño adecuado a este experimento y escribir el modelo matemático asociado.
  2. ¿Qué supuestos han de verificarse?
  3. ¿Se puede afirmar que el crecimiento de las plantas es el mismo para los cuatro tipos de abonos?¿Y con los distintos insecticidas?
  4. ¿Existen diferencias significativas en el crecimiento de las plantas con las distintas semillas? ¿Y el tipo de tierra influye en dicho crecimiento?
  5. ¿Con qué tipo de semilla se produce el mayor crecimiento de las plantas?
  6. ¿El crecimiento de la planta es el mismo utilizando al mismo tiempo los abonos A y B que utilizando los abonos C y D?

Solución:

         

Son significativos todos los efectos de los factores y el mayor crecimiento de las plantas se produce con el Abono A siendo la altura que alcanza de 11.65 y la altura menor de 7.65 la alcanza cuando se le suministra el Abono C.

Para comprobar si el crecimiento de la planta es el mismo utilizando al mismo tiempo los abonos A y B que utilizando los abonos C y D, se debe realizar el siguiente contraste de hipótesis:

Suponiendo que se cumple la hipótesis de homocedasticidad, observamos un p-valor de 0.715 que indica que el contraste realizado no es significativo, por lo tanto se rechaza la hipótesis nula en el contraste planteado.


Ejercicio Propuesto 8

Se realiza un estudio sobre el efecto que produce la descarga de aguas residuales de un planta sobre la ecología del agua natural de un río. En el estudio se utilizaron dos lugares de muestreo. Un lugar está aguas arriba del punto en el que la planta introduce aguas residuales en la corriente; el otro está aguas abajo. Se tomaron muestras durante un periodo de cuatro semanas y se obtuvieron los datos sobre el número de diatomeas halladas. Los datos se muestran en la tabla adjunta:

 

Semana

Lugar

Semana 1

Semana 2

Semana 3

Semana 4

Aguas arriba

78       94
43       58

620       760
420       913

204       333
98       89

890       655
763       562

Aguas abajo

79        87
145       522

546       652
76        94

45       69
59       62

254       86
789      267

 

Responder a las siguientes cuestiones:

  1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático y explicar los distintos elementos que intervienen.
  2. Estudiar si la semana y el lugar son factores determinantes en el número de diatomeas halladas en el agua del río. ¿Hay posibilidad que una semana sea más recomendable en un lugar del río en concreto y no lo sea en el otro lugar?
  3. Estudiar en qué semana se producen menos contaminación en el río, utilizando el método de Duncan.
  4. Estudiar en qué lugar del río se producen menos diatomeas.

Solución:

  1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático y explicar los distintos elementos que intervienen.

En este experimento los factores de interés que intervienen son la Semana en la que se realiza el recuento de diatomeas y el Lugar del río donde se realiza dicho recuento, Son factores de efectos fijos, el primero tiene cuatro niveles y el segundo tiene dos niveles y se realizan cuatro réplicas con cada tratamiento. El número de tratamientos es de ocho, formados a partir de las combinaciones de los niveles de los dos factores. Es un modelo bifactorial de efectos fijos con interacción, el modelo matemático adecuado para este experimento es:

  1. Estudiar si la semana y el lugar son factores determinantes en el número de diatomeas halladas en el agua del río. ¿Hay posibilidad que una semana sea más recomendable en un lugar del río en concreto y no lo sea en el otro lugar?

El único efecto que no es significativo es la interacción de los dos factores, por lo que se debe modificar el modelo suprimiendo la interacción entre ambos factores y realizar un estudio del modelo modificado.

  1. Estudiar en qué semana se producen menos contaminación en el río, utilizando el método de Duncan.

  1. Estudiar en qué lugar del río se producen menos diatomeas..


Ejercicio Propuesto 9

La cotinina es uno de los principales metabolitos de la nicotina. Actualmente se le considera el mejor indicador de la exposición al humo de tabaco. Se ha realizado un estudio con distintas marcas de tabaco distinguiendo principalmente entre negro y rubio para detectar las posibles diferencias en el nivel de nicotina de personas expuestas al humo de tabaco. Para ello, se han analizado personas de distintas edades (niños, jóvenes y adultos) y se ha distinguido entre mujeres y hombres. Se han obtenido los datos de la siguiente tabla sobre el nivel de nicotina en miligramos por mililitro.

 

 
Sexo
Hombres
Mujeres
Tabaco
Tabaco
Edades
Rubio
Negro
Rubio
Negro
Niños
110
240
360
125
230
219
141
123
Jóvenes
112
239
252
455
655
432
873
256
Adultos
652
451
354
701
653
259
198
343

 

Responder a las siguientes cuestiones:

  1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático y explicar los distintos elementos que intervienen.
  2. Contrastar la hipótesis nula de no interacción entre los factores. Adecuar el modelo al resultado de las interacciones y contrastar los efectos principales.
  3. ¿Hay diferencias significativas en el nivel de nicotina en las distintas edades?¿En qué edad el nivel de nicotina es mayor?
  4. ¿El tipo de tabaco es un factor determinante en el nivel de nicotina?
  5. Comparar el nivel medio de nicotina entre las mujeres y los hombres. ¿Se detectan diferencias significativas?

Solución:

El único efecto significativo son las distintas edades. Hay que seguir analizando el diseño suprimiendo una a una las interacciones, empezando por las de mayor orden.