Vista previa:
l\!IÉTODOS ESTADÍSTICOS U .A.M. Cuarto curso de Biología
Examen Final, septiembre 2010
Ejercicio 1(5 puntos) El incipiente bio climático está produciendo un aumento de la temperatura media, que puede afectar a 1 producción e uva destinada a la elaboración de vino. Las afamadas bodegas Castillo de Crelos decl evar a cabo un pequeño estudio, para lo cual eligen ~Q§J)arcelas de 100 metros cuadrados cada una n, 800 metros de altitud, otras dos a 1000 metros y dos más a 120 ..0 metros. Utilizan dos fertilizantes diferentes para las parcelas (guano y compost). Los kg recogidos en cada parcela se indican en la siguiente tabla: 800 m 70 kg 72 kg 71 kg 1000 m 90 kg 88 kg 89 kg 1200 m Media con cada fertilizante 68 kg 76 kg 74 kg 78 kg 71 kg Media global= 77 kg
~\}. "\~ C uano ~ Compost xledia en cada altitud
Dato adicional: la suma total de cuadrados es 454. (a) Plantear todos los elementos de un modelo de diseño de experimentos con dos factores para analizar la producción por parcela, indicando el motivo por el que se utilizará un modelo con o sin interacción. (b) Construir la tabla ANOVA para el modelo anterior. Con un nivel de significación del 5 %, ¿influye la altitud sobre la producción? ¿Infiuye el fertilizante? (c) Hallar uno a uno los residuos de estos datos para el modelo utilizado.
(d) Hallar los intervalos de confianza para estimar la diferencia de producciones medias entre cada par de altitudes,'"Con un nivel de confianza conjunto de 0,85. ¿Conclusiones? (e) A partir de la tabla ANOVA anteriormente obtenida, hallar la tabla ANOVA correspondiente al modelo de diseño de experimentos con un único factor (altitud). ¿Conclusiones al 5 % de significación? ¿Se observa alguna contradicción?
Ejercicio 2 (5 puntos) En un estudio sobre la calidad de la investigación en las universidades iberoamericanas (Ranking Iberoamericano SIR 2010) se seleccionaron las 119 universidades en las que el número de publicaciones incluidas en el índice de citas Scopus producido por Elsevier era superior a 1.000. En cada universidad se consideran las siguientes variables: País (nombre del país). Publicaciones (PC: número de publicaciones incluidas en el índice de citas Scopus).
Índice de colaboración internacional (CI: Ratio de publicaciones científicas de una institución que han sido elaboradas junto con instituciones de otro país). Calidad científica promedio (CCP: Impacto científico de una institución después de eliminar la influencia del tamaño y el perfil temático de la institución. 1= media mundial). Publicaciones en revistas del primer cuartil JCR (PQ: tanto por ciento de publicaciones que la universidad publica dentro del conjunto compuesto por el 25 % de las revistas más influyentes del mundo). .
(a) ¿Qué tipo de variables son «País», «Cl», «PC», «CCP». «PQ»? La FIGURA 1 adjunta muestra el diagrama de dispersión de las variables PQ y CCP. Comenta su forma y que métodos estadísticos sugiere aplicar.
o
',5<>"
o
',25-
o
',00'
Q,
o o
.,'5'
.,50'
o o
.,25'
o
10,00
20,00
30,00
40,00
50,00
60,00
70,00
PQ
FIGURA
1
(b) A continuación (CUADRO 1) se dan los resultados obtenidos al aplicar un modelo de ~egresión lineal simple entre estas dos variables, ¿Qué variable se utiliza como predictora? Escribe la ecuación de la recta de regresión estimada, Evalúa la calidad del ajuste, Enuncia el contraste de hipótesis de la regresión y decide (al nivel de significación 0,05) cuál es el resultado del contraste a la vista de los valores obtenidos,
Estadistica. N PO CCP N válido 119 119 119 Mínimo 11,31 ,35 MáXImo 62,16 1,57 descriptivos Media 42,2396 9044 Desv tío, 10,31520 ,24550
Vananza
106,403 060
, de la esnrnación
14557
a Vana DIe, predlCloras ¡Constante), PO
E
il
ql
Sl
o Vanable
dependlflnle
CCP
Coeflclentes Modelo Coeficientes no Coeficientes tipificados Beta t 1,647 ,807 14,786 sto. ,102 000
estandanzados B (Constante) ,093 ,019 dependiente: CCP Error tic, ,056 ,001
p,
PI Ín
qn
PO a, Vanable
ANOVA Modelo
ea
inf
.
Suma de cuadrados 4633 2.479 7,112 predictoras: dependiente: (Constante), CCP
gl
Media
cuadrcitica
F
Slg,
Raqresrón ReSidual
1 117 118 PO
4633 0,02119
218,628
000
Pu la l
mUJ
Total a, Vanables b Vanable
CUADRO
1
(a)
el di sugír
(c) Halla el intervalo de . onfianza del 95 % para la predicción de l· de PQ es de 35. ~
Q de CCP
clla~do el valor
Describe el modelo de regresión lineal simple con todos sus requisitos. Los dos diagramas de la 2 corresponden a los residuos tipificados de la regresión lineal anterior. ¿Qué puedes decir sobre los requisitos previos?
FIGURA
(el)
3
o o o o o o o o o o ~o o o o o o
·
---
__ v-.,.
lJcPo
o 00 o o 000 r;1:J%0 % o o o o § 0°0 o o "b o ~ o ~o o o ¿> o 00 o o o o o o o o ~o . o 00 o o
o o o % 00 '80 oo <11I o
00
o o
BO
o
o o
-1.-
·. _
''-
10,00
20,00
30,00
40,00
so,oo
60,00
70,00
PQ
FIGURA
2
(e) A continuación (CUADRO 2) se dan los resultados obtenidos en una regresion lineal múltiple utilizando como predictoras (de la variable CCP) las variables PO, CI, PQ. Escribe cuál es el contraste de hipótesis global de la regresión cuáles son los contrastes particulares . ara cada uno de los coeficientes a os los valores obtenidos, ¿Cuál es el resultado de estos contrastes, al nivel de significación O,05? Compara estos resultados con los obtenidos en el apartado (b).
Resumen
del modelob
Error Modelo
tipo
de la
R
,811"
R cuadrado
R cuadrado
corregida
estimación ,14536
1
a. Vanables
658
PC,
649
predictoras:
dependiente:
(Constante),
el. PO
b. Variable
CCP
ANOVA'
Modelo Suma de cuadrados
gl 3 115 118
Media
cuadratica
F 73.867
Sigo ,000'
1
Regresion
4.682 2.430 7,112
(Constante), PC.
_ 1,561 .021
Residual
Tolal
a. Vanabtes
predictoras:
el.
PO
b. Variable
dependiente:
CCP
Coeficientes"
Coeficientes
Coeficientes no estandanzados
Modelo
fiprñcados t 1,917 -,079 .836 ,037 -1,261 13,103 ,659 Sigo .058
B
(Constante)
Errortip.
Bela
1
.112 -,002 ,020 1,994E-6
CCP
,059 001 ,002 ,000
CI PO PC
a. Variable dependiente:
G;
,000 ,511
CUADRO
2