Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Análisis apuntes temas 1-5, Ejercicios de Psicología

Asignatura: Análisis de Datos I, Profesor: carmen ximenez, Carrera: Psicología, Universidad: UAM

Tipo: Ejercicios

2017/2018

Subido el 10/06/2018

black_neko
black_neko 🇪🇸

3.8

(4)

18 documentos

Vista previa parcial del texto

¡Descarga Análisis apuntes temas 1-5 y más Ejercicios en PDF de Psicología solo en Docsity! Descargado en: patatabrava.com ANÁLISIS DE DATOS II (UAM) ANALISIS DE DATOS TEMAS 1-5 OLMOS, RICARDO 16-17 CAPITULO 1 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Se corresponde con las siguientes lecturas: capítulos 7 y 8 del volumen 1. Capítulo 1 del volumen 2. Puntos del capítulo o Tipos de variables (categóricas y cuantitativas) o Repaso de conceptos: población, muestra, parámetro y estadístico o Distribuciones muestrales o Estimación de parámetros o Contraste de hipótesis o Error tipo I, error tipo II, potencia y tamaño del efecto Tipos de variables - Variables categóricas (nominales y ordinales) Aquellas variables cuyos valores solo establecen una relación de igualdad o desigualdad (nominales), o de menor a mayor (ordinales). - Variables cuantitativas (intervalos y de razón) Aquellas variables cuyos valores permiten ‘hablar’ de diferencias entre ellos (de intervalo) o de ratios entre ellos (de razón). ¿Por qué hablamos del tipo de medida de las variables? El tipo de medida determina la técnica estadística con la que se estudian. Ejemplos de variables categóricas (nominales y ordinales) Tabaco (fumadores, no fumadores, exfumadores); Sexo (hombre, mujer); carrera escogida (humanidades, ciencias, técnicas)… Ejemplos de variables cuantitativas (intervalos y de razón) Los rasgos de personalidad (extroversión, neuroticismo, psicoticismo…) medida por una escala psicométrica Nivel de colesterol Nota numérica en un examen (0 – 10 puntos) La estatura de las personas … Ejercicio Clasificar las variables como cuantitativas o categóricas: Percepción subjetiva del dolor (de 0 a 100 puntos) Grupo de tratamiento (experimental – control) Peso de los recién nacidos Tiempo de reacción Calidad percibida del estado de salud general (mala, regular, buena) Rendimiento en el test de inteligencia Raven Actitud hacia el aborto (en contra, indiferente, a favor) Nivel socioeconómico (bajo, medio, alto) Estadística inferencial ¿Qué es la estadística inferencial? Lo que llamamos inferencia estadística es el salto de lo concreto (muestra, estadístico) a lo general (población, parámetro). Población y muestra Población: Su desviación típica es y se conoce como error típico. Luego tenemos que . Distribución de la población Distribución muestral de la media La distribución muestral de la media de la prueba de aptitud espacial en muestras de 36 personas es: ¿Cuál es la probabilidad de que en una muestra al azar de 36 personas la media sea de 23 o mayor? Para eso conviene tipificar: P(Z 3) = 1 – P(Z 3) = 1 – 0,9987 = 0,001 ¿Y si la muestra fuera de 64 personas, cuál sería la probabilidad de encontrarnos una media de 23 o mayor? ¿Sería igual de probable que con la muestra de 36 personas, más probable o menos probable encontrarnos esa media de 23 puntos o mayor? La distribución muestral de la media de la prueba de aptitud espacial en muestras de 64 personas es: Calculamos la Z que se corresponde con una media de 23: Conclusiones: Las distribuciones muestrales nos permiten ver la probabilidad de obtener un estadístico. Las distribuciones muestrales se ‘estrechan’ cuanto mayor es el tamaño de la muestra. O lo que es lo mismo, el error típico disminuye a medida que aumenta n. Ejercicio 1. En la población general se sabe que la media en una escala de autoestima es 18 y la desviación típica 6. Si extraemos una muestra de 9 personas, ¿cuál es la probabilidad de obtener una media muestral de 21 o mayor? SOLUCIÓN Ejercicio 1. Paso 1. Tenemos que llevar a escala Z para hacernos una idea de la probabilidad. Paso 1. Se nos pregunta cuál es la probabilidad de obtener una media de 21 o más en una muestra de 9 personas. Ya sabemos que esa media de 21 se corresponde con una Z = 1,5. Luego… Ejercicio 2. Sabemos que en la población de estudiantes de primaria se distribuye N(8,3) en una prueba de comprensión lectora (Y). Al seleccionar de esa población una muestra aleatoria de 16 estudiantes y aplicar la prueba de comprensión lectora, ¿cuál es la probabilidad de obtener una media comprendida entre 6,25 y 10? SOLUCIÓN Ejercicio 2. Paso 1. Tenemos que llevar e a escala Z para hacernos una idea de la probabilidad. Ejercicio 3. La variable Y se distribuye N(10,2) en una determinada población. Al extraer dos muestras aleatorias de tamaños n = 9 y n = 16, la probabilidad de obtener en esas muestras una media de 12 o mayor es: a) Mayor en la muestra de tamaño 9 b) Mayor en la muestra de tamaño 15 c) Exactamente igual en las dos SOLUCIÓN Ejercicio 3. Para responder se puede calcular la Z que se corresponde con en la muestra n = 9 y n = 16 y ver en cuál de ellas tenemos una Z más extrema. Luego es más probable encontrar una media de 12 o mayor en la muestra n = 9, dado que su Z es más pequeña. Ejercicio 4. En los años 50 del siglo pasado se realizaron pruebas masivas para medir el CI. La distribución del CI poblacional era N (100,15). Hoy, un grupo de psicólogos sospecha que la media puede haber cambiado. Para ello selecciona una muestra aleatoria de la población de tamaño 25 y obtiene una media de 109. Según los datos que has obtenido, ¿crees que los psicólogos están en lo cierto?, ¿por qué? Como en el resto de ejercicios, tenemos que calcular cuál es la Z que se corresponde con . Haber encontrado una media de 109 se corresponde con una Z = 3. Una Z 3 es muy improbable. Luego parece que los psicólogos tienen razón: no se puede sostener que la media de CI sea 100 actualmente. Distribución muestral de la proporción Otro estadístico interesante del que conocemos su distribución muestral es la proporción (P). La proporción, recordemos, es un estadístico que oscila entre 0 y 1, y nos informa del número de éxitos del total de extracciones. A diferencia de la media, la proporción se aplica a variables dicotómicas: acierto-error en un ítem de un test, recuperado-no recuperado de una depresión, cara-cruz al tirar A un buen estimador se le exigen dos propiedades: (1) que carezca de sesgo, esto es, que sea insesgado Insesgado se refiere a que en promedio el estimador coincida con el parámetro que deseamos estimar. (2) que sea eficiente Eficiente se refiere a que la variabilidad del estimador debe ser pequeña cuando lo comparamos con otro estimador. Si queremos estimar y contamos con dos estimadores: y . Decimos que es más eficiente que si, . ¿Qué diana refleja un estimador insesgado y eficiente, cuál insesgado ineficiente, cuál sesgado eficiente y cuál sesgado e ineficiente? pág. 200, vol I Estimación por intervalos La estimación puntual es arriesgada. Otra estrategia mejor es hacer una estimación por intervalos, es decir, asignar un rango de valores entre los que se espera que pueda encontrarse el verdadero valor del parámetro con una probabilidad conocida. Esto supone sumarle y restarle al estimador una cantidad que llamaremos error máximo: Lo primero que hacemos es establecer con qué nivel de confianza queremos estimar el parámetro. El nivel de confianza es la probabilidad con la que cabe esperar que el parámetro poblacional se encuentre en el intervalo de valores que hay entre L y L. El nivel de confianza se representa como 1 – . Consecuentemente el error típico se representa como y se conoce como nivel de significación o nivel de riesgo. Estimación por intervalos de la media Estimación por intervalos de la media Toma esta forma: Tenemos una confianza de 1 – de que el verdadero parámetro se encuentre entre esos límites. Ejemplo: una muestra de 100 aleatoria de pacientes con depresión obtienen una media en una prueba de autoestima de 15. Sabiendo que = 4, ¿entre qué límites cabe esperar la media de autoestima entre la población de pacientes depresivos? Queremos una confianza del 95%. (1) La confianza (1 – ) = 0,95. El nivel de significación = 0,05 (2) Obtener los valores Z y Z que encierran un área de 1 – . Son -1,96 y +1,96 en el ejemplo. 3) Obtenemos el error típico: (4) Obtenemos el error máximo: (5) Calculamos los límites del intervalo: Concluimos que tenemos una confianza del 95% de que la media poblacional de autoestima se encuentre entre esos valores. Pregunta: ¿Qué ocurre si queremos estimar con una confianza del 99% el intervalo de confianza para la media? ¿El intervalo será mayor o menor que al 95% de confianza? Los límites del intervalo son: Ejercicio 1. Imagina que estás interesado en saber el CI medio en la población universitaria. Para ello seleccionas una muestra aleatoria en el campus de 36 personas y obtienes . ¿Entre qué límites cabe esperar que esté la media poblacional universitaria de CI? (tomemos un riesgo = 0,05 y supongamos que = 18). Con los datos del problema anterior, imagina ahora que tu muestra aleatoria de universitarios era de 100 personas. Sin hacer los cálculos, el intervalo de confianza, ¿será más amplio o más estrecho que con 36 personas? ¿Por qué? Ejercicio 2. Supongamos que un profesor de la facultad os dice que estiméis cómo se valora al profesorado en una escala de 0 – 10 puntos en la facultad. Naturalmente, no preguntáis a todos los estudiantes de la facultad, sino que buscáis una muestra aleatoria de 25 estudiantes que proporciona una . Suponiendo una , entre qué limites cabe esperar que se encuentre la valoración del profesorado entre los estudiantes de psicología ( = 0,05). ¿Qué ocurre si tenemos una muestra pequeña y no disponemos, como es habitual, del parámetro ? En ese caso debemos estimar , es decir, debemos estimar el error típico de la media. Lo haremos con S de la siguiente forma: El problema es que al hacer esto ya no podemos calcular el intervalo de confianza con |Z|, sino con el estadístico T de Student con n – 1 grados de libertad. ¿Qué ocurre si tenemos una muestra pequeña y no disponemos, como es habitual, del parámetro ? Los límites del intervalo de confianza serán: Estimación por intervalos de la media Ejercicio. Un grupo de estudiantes de psicología intenta averiguar entre la población de estudiantes de la UAM qué porcentaje piensa votar al PP en las próximas elecciones. Selecciona aleatoriamente en el campus a una muestra de 80 estudiantes y obtiene que 20 de ellos votarán al PP. ¿Entre qué valores puede estimarse que se encuentra la verdadera proporción de votantes del PP entre los estudiantes de la UAM (1 – = 0,95)? Ejercicio. Suponiendo que queremos una amplitud máxima de 0,10 para nuestro IC (es decir, un EMAX = 0,05). ¿Qué número de estudiantes de la UAM necesitaríamos encuestar? Vamos a suponer que la proporción de votantes es de 0,25 (P = 0,25). Contraste de hipótesis El contraste de hipótesis es la otra estrategia por la que llegamos a conocimiento general (la otra es la estimación de parámetros) a partir de hechos o datos concretos. ¿Es más eficaz el tratamiento A que el B para tratar la depresión? ¿Es el porcentaje de votos en hombres y mujeres diferente? ¿La nueva terapia consigue más de un 40% de curaciones de gente con el trastorno de ludopatía? ¿La tasa de recuerdo de dígitos es mayor, igual o menor que la tasa de recuerdo de letras? La lógica del contraste de hipótesis. Primero formulamos la hipótesis estadística. Buscamos evidencia empírica, es decir, muestras. Tomamos una decisión sobre la hipótesis en términos probabilísticos. Hipótesis estadísticas. Primero hay que definir la hipótesis estadística que queremos contrastar. Dos ejemplos: (1) Psicología clínica: ludopatía. Tasa de curación de ludópatas. (2) Psicología básica: memoria dígitos y memoria letras. Los contrastes de hipótesis se hacen proponiendo dos hipótesis, H y H . A H se conoce como hipótesis nula y a H como hipótesis alternativa. H La hipótesis nula es una afirmación sobre uno o varios parámetros poblacionales y es la que guía todo el proceso del contraste. H La hipótesis alternativa es la negación de la hipótesis nula. Mientras que H es una hipótesis exacta (lleva siempre el signo igual), H es inexacta (no lleva asociado el signo igual). Se dicen que ambas hipótesis, H y H, son rivales porque son exhaustivas (agotan todas las posibilidades) y exclusivas (no se solapan; si una es cierta, la otra, necesariamente, es falsa). Ludopatía: contraste unilateral Memoria: contraste bilateral Los supuestos del contraste Nos referimos al conjunto de condiciones que deben darse para que la distribución de probabilidad en la que se basará la decisión sobre H quede completamente especificada. Básicamente se establecen supuestos que tienen que ver con el estadístico del contraste y con el procedimiento de muestreo. El estadístico del contraste y su distribución muestral Para poder efectuar el contraste de hipótesis necesitamos tener un estadístico con distribución muestral conocida y que dé cuenta de la hipótesis que queremos contrastar. Por ejemplo, si queremos contrastar la H: µ 100 y H: µ > 100, sabemos que el estadístico se distribuye N (0,1). Con lo cual, podemos ver cuál es la probabilidad de obtener un estadístico Z como el que hemos obtenido o más extremo. Por ejemplo, si buscamos una muestra aleatoria n = 25, sabiendo que = 15, y obtenemos una media , podemos utilizar el estadístico Z para ver qué probabilidad tenemos de obtener una media de 109 o mayor. Consultando la tabla de la N(0,1) vemos que Lo cual nos ayudará a decidir sobre H. La regla de decisión La regla de decisión es sencilla. En función de la probabilidad asociada al estadístico del contraste, debemos decidir si mantener o rechazar H. Para ello dividimos la distribución muestral del estadístico en dos zonas exclusivas y exhaustivas: la zona de rechazo y la zona de aceptación. La zona de rechazo es la zona de la distribución que se muestra improbable si H fuese verdadera. Es decir, contiene los valores poco compatibles con H. La zona de aceptación es la zona de la distribución que contiene los valores del estadístico cercanos a la predicción hecha en H. Es decir, es esa zona cuyos valores se muestran compatibles con H. La regla de decisión ¿Qué hacemos? Tenemos que cuantificar la probabilidad de obtener un estadístico del contraste como el que hemos obtenido o aún más extremo. En el ejemplo de H: µ 100 y H: µ > 100, habíamos encontrado una Z = 3. A esta probabilidad (0,0013) se la conoce como nivel crítico o p Ya tenemos una regla de decisión. Si p rechazaremos H ; en cambio, si p > mantendremos H O más sencillo, cuando el estadístico del contraste caiga en una zona perteneciente a la zona de rechazo, rechazaremos H ; mantendremos en caso contrario. ¿Qué nivel de significación, , establecer? Debemos establecer un nivel de significación que sea suficientemente pequeño como para pensar que siempre que sea verdadera H nuestro estadístico no caiga en la zona de rechazo (o lo hagan con probabilidad baja). Habitualmente el nivel de significación, , es de 0,05 (también suele utilizarse 0,01). ¿Cómo dividimos la distribución muestral en una zona de rechazo (zona crítica) y otra de aceptación? En determinados contrastes de hipótesis la zona de rechazo ocupa dos pequeñas zonas. La regla de decisión Esto es así en contrastes de hipótesis que llamamos bilaterales. Cuando no tenemos idea de en qué dirección vendrán valores incompatibles con H dividimos la distribución muestral en dos zonas de rechazo (zona crítica). El nivel crítico p en un contraste unilateral derecho es la probabilidad de obtener un estadístico como el que hemos obtenido o mayor. Ejemplo. En un contraste unilateral derecho obtengo un estadístico Z = 2,3. ¿Cuál será el nivel crítico (p)? ¿Y si el contraste hubiese sido bilateral? El nivel crítico p en un contraste unilateral izquierdo es la probabilidad de obtener un estadístico como el que hemos obtenido o menor. Ejemplo: en un contraste unilateral izquierdo, obtengo un estadístico Z = -1,33. ¿Cuál será el nivel crítico (p)? El nivel crítico p y el nivel de significación El nivel de significación es el riesgo que asumimos de rechazar una hipótesis nula que es verdadera. Ese riesgo lo asumimos a priori (antes de realizar el contraste). Esta forma de proceder ha recibido críticas entre las que destacan: - La decisión tiene una dependencia excesiva de - ¿Qué ocurre con Z = 1,89 en un contraste unilateral derecho (donde p = 0,029)?, ¿Rechazamos con = 0,05, pero mantenemos con = 0,01? El mínimo necesario para empezar a rechazar H tendría que ser 0,029 - se impone según sean las consecuencias de rechazar una H - Otro problema de es que no informa sobre el grado en el que los datos se muestran incompatibles con H - p o nivel crítico, es la probabilidad asociada al estadístico del contraste cuando Hes verdadera, o más coloquialmente, es el grado de compatibilidad entre los datos y la H - p entonces, se obtiene después del contraste, es decir, a posteriori - Hay investigadores que toman una decisión en función de p : rechazar Hsi p es claramente menor de 0,05, mantener Hsi p es claramente mayor de 0,05 y repetir el contraste cuando p está en una frontera poco nítida (valores próximos a 0,05 Ejercicio 5. Supongamos que hacemos tres contrastes de hipótesis unilateral derechos con = 0,05. En el primero de ellos obtenemos un nivel crítico p = 0,98, en el segundo p = 0,07 y en el tercero p = 0,01. ¿Con qué distribuciones muestrales se corresponde el primer contraste, el segundo y el tercero? Ejercicio 6. Un estadístico V tiene la función de probabilidad acumulada que muestra la tabla. Llevado a cabo un contraste unilateral izquierdo con una determinada muestra obtenemos para el estadístico V un valor de –1. V -1 -0,5 0 0,5 1 1,5 2 F(V|H) 0,03 0,05 0,37 0,65 0,90 0,97 1 a) La regla de decisión podría ser rechazar H cuando V es ? b) ¿Qué decisión debe tomarse sobre H? ¿Por qué? c) ¿Cuánto vale el nivel crítico p? Ejercicio 7. Un investigador afirma que, entre los estudiantes universitarios, ellas fuman más que ellos. Tras efectuar una encuesta, ha comparado la proporción de fumadoras con la proporción de fumadores (H: ; H: > ) y ha obtenido para el estadístico del contraste, un valor T= 2,681. La siguiente tabla ofrece la función de distribución (probabilidades acumuladas) de algunos de los valores del estadístico T: T - 0,53 9 0,000 0,539 1,356 1,782 2,179 2,681 3,055 F(T|H) 0,30 0 0,500 0,700 0,900 0,950 0,975 0,990 0,995 Con = 0,05 a) ¿Puede afirmarse que los datos confirman la hipótesis del investigador? ¿Por qué? b) ¿Cuánto vale el nivel crítico p? c) ¿A partir de qué nivel de significación () podría rechazarse H? Ejercicio 8. Un terapeuta afirma que una determinada terapia consigue recuperaciones aceptables en más del 80% de los pacientes tratados. Un colega suyo piensa que la proporción de recuperaciones aceptables es menor que el 80%. Ambos realizan un estudio para contrastar sus respectivas hipótesis con = 0,05. a) ¿Qué hipótesis estadísticas debe plantear cada terapeuta? b) Al contrastar su H el primer terapeuta obtiene un nivel crítico p = 0,818. ¿Qué decisión debe tomar? ¿Por qué? c) Al contrastar su H el segundo terapeuta obtiene un nivel crítico p = 0,002. ¿Qué decisión debe tomar? ¿Por qué? d) ¿Cuál de los dos terapeutas tiene razón?, ¿tienen razón los dos?, ¿no tiene razón ninguno de los dos? Ejercicio 9. En 1990 fumaba el 30% de los universitarios madrileños. Un investigador cree que en los últimos años ese porcentaje ha aumentado. Para comprobarlo, selecciona una muestra aleatoria de universitarios madrileños y obtiene un estadístico del contraste que se corresponde con el centil 93 de su distribución. a) Plantea las hipótesis estadísticas del contraste. b) ¿Qué decisión debe tomarse sobre Hcon = 0,05? ¿Por qué? c) ¿A partir de qué nivel de significación () podríamos haber rechazado H? Importante Cuando rechazamos una H decimos que ésta es falsa y que, por tanto, H se considera verdadera. Ahora bien, cuando mantenemos H decimos que los datos son compatibles con la hipótesis nula, NO decimos nunca que la hipótesis nula sea cierta. Errores tipo I y II, y potencia de un contraste Ahora bien, supongamos que es verdadera H para algún valor (recuérdese que H es inespecífica). Si rechazamos H habremos acertado, pero si mantenemos H nos habremos equivocado. Así que si H es verdadera: • Si mantenemos H habremos cometido un error. Lo llamaremos o error tipo II y es la probabilidad de mantener una H que es falsa P (mantener H| H falsa). • Si rechazamos H habremos acertado. Lo llamaremos 1 – o potencia del contraste y es la probabilidad de rechazar una H que es falsa P(rechazar H| H falsa). Decisión sobre H Naturaleza de H Mantener Rechazar Z -1,96 - 1,64 5 -1 0 1 1,64 5 1,96 2,5 3 F(Z|H) 0,02 5 0,05 0 0,15 9 0,50 0,84 1 0,95 0 0,97 5 0,99 4 0,99 9 F(Z|H) 0 0 0 0,00 1 0,00 2 0,15 0 0,35 0 0,61 0 0,85 0 Si establecemos como regla de decisión “Rechazar H si Z toma un valor de 1,645 o mayor”; mantenerla en caso contrario”, a. ¿Cuál es la probabilidad de rechazar H siendo verdadera ()? b. ¿Cuál es la probabilidad de mantener H siendo falsa ()?, ¿cuánto vale la potencia del contraste (1 – )? HH Ejercicio 11. La siguiente tabla ofrece los valores y las distribuciones del estadístico W. W -2 -1 0 1 2 3 4 f(W|H) 0,0 0 0,0 3 0,1 0 0,2 0 0,5 0 0,1 0 0,0 7 f(W|H) 0,0 5 0,2 5 0,3 0 0,2 0 0,1 0 0,1 0 0 Si establecemos como regla de decisión “Rechazar H si W toma un valor menor que 0”; mantenerla en caso contrario”, a. ¿Cuál es la probabilidad de mantener H siendo falsa ()?, ¿cuánto vale la potencia del contraste (1 – )? b. ¿Cuál es la probabilidad de rechazar H siendo verdadera ()? Ejercicio 12. Sea un contraste unilateral derecho con = 0,05. Se muestran las probabilidades de un estadístico, n, bajo H y H. n 0 1 2 3 4 f(n|H) 0,13 0 0,34 5 0,34 5 0,15 4 0,02 6 f(n|H) 0,02 6 0,15 4 0,34 5 0,34 5 0,13 0 a. ¿Cuál será la decisión sobre H si n = 3? b. ¿Qué tipo de error se podría estar cometiendo con esta decisión? c. ¿Cuánto vale la probabilidad de cometer ese error? d. ¿Cuánto vale la potencia del contraste? Capítulo 2 Inferencia con una variable • Resumen del tema – Contraste sobre una proporción (prueba binomial) – Contraste sobre bondad de ajuste (Xde Pearson sobre bondad de ajuste) – Contraste sobre una media (prueba T para una muestra) – Contraste sobre la forma de una distribución (ver con SPSS) Capítulo 9 del vol. I de Pardo (colgado en moodle). En los contrastes que se ven en este tema participan tres tipos de variables: Categórica con dos niveles (dicotómicas): Ejemplos Sexo (mujer-varón), Tratamiento (control-experimental), Resultado (aprobado-suspenso). Categórica con más de dos niveles: Ejemplos Estado civil (soltero, casado, divorciado, separado y viudo), País (España, Francia o Portugal), Carrera escogida (humanidades, ciencias y técnicas/ingenierías). Cuantitativas: Ejemplos Peso, Estatura, Nivel de colesterol, nivel de ansiedad, extroversión, neuroticismo… Contraste sobre una proporción Comenzamos con el contraste sobre una proporción (prueba binomial). Tenemos variables categóricas dicotómicas (curados-no curados) o dicotomizadas (aprobado-suspenso). Normalmente codificamos con un 1 la presencia de la característica, los aciertos, los recuperados, etc., y con 0 la ausencia de la característica, los errores, los no recuperados, etc. ¿Qué tipo de preguntas (hipótesis) podemos contrastar con estas variables dicotómicas? - ¿Es el porcentaje de depresivos en la población igual a un 15%? H: = 0,15; H: 0,15. - Sospechamos que la proporción de psicópatas ha aumentado y ya es más de 2% de la población: H: 0,02; H: > 0,02. - Creemos que la intención de voto es menor en estas elecciones generales que en las pasadas, donde fue de un 55%: H: 0,55; H: < 0,55. 1. Hipótesis a. Contraste bilateral: ; b. Contraste unilateral derecho: ; c. Constaste unilateral izquierdo: ; 2. Supuestos: De la población se extrae una muestra aleatoria de n observaciones con probabilidad de éxito constante en cada extracción. 3. Estadísticos del contraste 3.1. n = “número de éxitos en los n ensayos” P = “proporción de éxitos en los n ensayos” 3.2. 4. Distribuciones muestrales n y P se distribuyen según el modelo binomial con parámetros n y . Z se distribuyen según el modelo N(0,1) a medida que n aumenta Con n 20 la aproximación a la normal es ya muy buena. 5. Reglas de decisión a. Contraste bilateral a.1. Se rechaza H si n o P o toman un valor tan alejado de su valor esperado bajo H que la probabilidad de obtener un valor tan alejado como ese o más es menor que /2. a.2. Se rechaza H si Z Zo si Z Z b. Contraste unilateral derecho b.1. Se rechaza H si n o P o toman un valor tan grande que la probabilidad de obtener un valor igual o mayor es menor que . b.2. Se rechaza H si Z Z c. Contraste unilateral izquierdo c.1. Se rechaza H si n o P o toman un valor tan pequeño que la probabilidad de obtener un valor igual o más pequeño es menor que . c.2. Se rechaza H si Z Z 6. Nivel crítico (valor p) a. Contraste bilateral a.1. Con los estadísticos n y P, el nivel crítico es el doble de la probabilidad de obtener un valor n y P, tan alejado de su valor esperado bajo Hcomo el obtenido a.2. Con el estadístico Z, p = 2[P(Z |Z|)] siendo Zel valor concreto que toma el estadístico Z. b. Contraste unilateral derecho b.1. Con los estadísticos n y P, el nivel crítico es la probabilidad de obtener un proporciones poblacionales no son las afirmadas en H. La opinión sobre la eutanasia en los jóvenes de hoy ha cambiado en relación a hace 20 años. 7. Nivel crítico (valor p). p = P(X 12,05) < 0,005 Ejercicio. Plantea un contraste de hipótesis con la prueba de Pearson sobre bondad de ajuste - Piensa en una variable categórica con más de dos niveles - Plantea un valor poblacional para cada una de las categorías - Plantea la hipótesis nula y la alternativa Ejercicio 9.2. Se cree que, en la población de estudiantes universitarios, 1/4 tienen ideología de derechas, 1/4 de centro y 2/4 de izquierdas. Al clasificar una muestra aleatoria de 24 estudiantes se ha obtenido el siguiente resultado: 5 de derecha (D), 8 de centro (C) y 11 de izquierdas (I). ¿Son compatibles estos datos con la hipótesis de partida? ( = 0,05). El contraste sobre una media (prueba T para una muestra) El contraste de hipótesis sobre una media nos permite poner a prueba hipótesis del tipo, ¿es la media poblacional de CI igual a 100?, ¿se parece la media de una prueba de aptitud verbal a la que se viene utilizando habitualmente?, ¿es el peso medio de los bebés recién nacidos superior a 3 kilos hoy en día? Todos estos interrogantes tienen en común que detrás hay una variable cuantitativa. Sabemos del tema 1 que la distribución muestral del estadístico media, es: Y que si utilizamos tenemos el estadístico Z con distribución muestral conocida N(0,1), por lo que podemos contrastar H sobre el parámetro µ. Pero el estadístico Z en estudios reales se utiliza raramente porque al igual que desconocemos µ, también se suele desconocer . Si una variable Y se distribuye normalmente y seleccionamos una muestra aleatoriamente de tamaño n y calculamos el estadístico se verifica que: se distribuye según t Es decir, al sustituir por Sla transformación resultante no se distribuye ya N(0,1) como ocurría con la Z, sino según el modelo de probabilidad t de Student con n – 1 grados de libertad (ver tabla E). Para estudiar el contraste sobre una media vamos a poner un ejemplo de un contraste bilateral y otros unilaterales izquierdo y derecho. Supongamos que queremos averiguar si la media poblacional µ es 30 (trabajaremos con = 0,05). Extraemos una muestra aleatoria de n = 25 sujetos que arroja una y S= 10. 1. Hipótesis a. Si el contraste es bilateral: ; b. Si el contraste es unilateral derecho: ; c. Si el contraste es unilateral izquierdo: ; 2. Supuestos: La muestra de 25 sujetos se extrae aleatoriamente. Además, la distribución de Y es normal (si la distribución de Y no es normal, necesitamos un tamaño de muestra por encima de unos 30 - 40 sujetos) ver pág. 262 del capítulo 9. 3. Estadístico del contraste: 4. Distribución muestral: T se distribuye según t con n – 1 grados de libertad. 5. Zona crítica: a. En el contraste bilateral rechazaremos H cuando T sea igual o menor que el centil /2 de su distribución o cuando T sea igual o mayor que el centil 1 – /2 de dicha distribución. En la distribución t con 24 grados de libertad el centil 2,5 es –2,064 y el centil 97,5 es 2,064. b. En el contraste unilateral derecho rechazaremos H cuando T sea mayor o igual que el centil 1 – de su distribución. En la distribución t con 24 grados de libertad el centil 95 es 1,711. c. En el contraste unilateral izquierdo rechazaremos H cuando T sea igual o menor que el centil de su distribución. En la distribución t con 24 grados de libertad el centil 5 es –1,711. 6. Regla de decisión: a. En el caso de un contraste bilateral rechazaríamos H puesto que T = 3,5 cae en la zona crítica (zona de rechazo) al superar el centil 97,5 de su distribución (3,5 > 2,064). b. En el caso de un contraste unilateral derecho rechazaríamos H puesto que T = 3,5 cae en la zona crítica (zona de rechazo) al superar el centil 95 de su distribución (3,5 > 1,711). c. En el caso de un contraste unilateral izquierdo hubiésemos mantenido H puesto que T = 3,5 cae en la zona de aceptación al superar el centil 5 de su distribución (3,5 > –1,711). 7. Nivel crítico (valor p): a. En el contraste bilateral p = 2[P(T |3,5|)] = 2(0,00092) = 0,00184. b. En el contraste unilateral derecho p = P(T 3,5) = 0,00092. c. En el contraste unilateral izquierdo p = P(T 3,5) = 0,99908. Ejercicio. Plantea un contraste de hipótesis sobre una media - Piensa en una variable cuantitativa que te permita poner a prueba la H y la H - Plantea un valor µ poblacional - Plantea la hipótesis nula y la alternativa Ejercicio 9.4. Las puntuaciones del WAIS (Escala de Inteligencia para Adultos de Wechsler) se distribuyen normalmente con media 100. Un psicólogo ha construido una nueva prueba de inteligencia (Y) y desea saber si la media que se obtiene con ella se parece o no a la del WAIS. Para ello selecciona una muestra de 100 sujetos y, tras pasarles la prueba, obtiene una media de 105 y una desviación típica de 16. ¿Qué concluirá el psicólogo con un nivel de confianza de 0,95? Ejercicio 9.6. Algunos datos recogidos durante los últimos años señalan que los trastornos de tipo depresivo (D) afectan al 32% de las personas en paro. Un investigador social sospecha que esta cifra es demasiado alta y decide obtener alguna evidencia sobre ello. Selecciona una muestra aleatoria de 300 sujetos en paro y encuentra que 63 de ellos muestran trastornos de tipo depresivo. Utilizando = 0,01, ¿qué puede concluirse sobre la sospecha del investigador? Ejercicio 9.11. Con un método tradicional de enseñanza de las matemáticas, la población de estudiantes de primaria vienen promediando una media de 6,4. Un educador sospecha que su método es mejor y lo aplica a dos aulas de 25 estudiantes cada uno. Al final del curso los 50 estudiantes obtienen una calificación media de 6,8 y una varianza de 2. ¿Se puede concluir, con un nivel de confianza de 0,95, que el nuevo método de enseñanza ha mejorado la calificación media que se venía obteniendo? Ejercicio. Queremos averiguar si todas las caras de un dado tienen la misma probabilidad de salir. Para ello lanzamos el dado 120 veces obteniendo los siguientes resultados: Car a 1 2 3 4 5 6 n 28 16 20 21 24 11 ¿Permiten estos datos afirmar que la proporción de caras del dado no se distribuye uniformemente? ( = 0,05) Ejercicio 9.18. Se ha utilizado el estadístico X de Pearson para contrastar la H: f(n) =[= 0,50; = 0,25; = 0,25]. En una muestra aleatoria se ha obtenido X = 4,61. Sabiendo que P(X > 4,61) = 0,10: a. ¿Qué decisión debe tomarse sobre H con = 0,05? b. ¿Por qué? c. ¿Qué puede concluirse? Ejercicio 9.20. Consideremos la hipótesis H: f(X) =Multinomial [n = 200; = 0,50; = 0,25; = 0,25] y la siguiente tabla. X X X n ( ) ( ) ( ) m ( ) ( ) ( ) Sabiendo que, tras recoger los datos y analizarlos, se ha obtenido para el estadístico X de Pearson un valor de cero: a. Completar la tabla b. ¿Qué decisión debe tomarse sobre H? c. ¿Cuánto vale el nivel crítico (valor p) del contraste? Ejercicio. Se sospecha que la media de errores ortográficos en una prueba ha aumentado en la población durante los últimos años. Se plantea la H: 5 frente a H: > 5. Se extrae una muestra aleatoria de 40 niños de 4º de primaria que arrojan un estadístico T = 2,71. A continuación se muestran determinados valores t y sus probabilidades acumuladas. T - 0,68 0 0,68 1,30 1,68 2,02 2,43 2,71 3,31 F(t|H) 0,25 0 0,50 0 0,75 0 0,90 0 0,95 0 0,97 5 0,99 0 0,99 5 0,99 9 ¿A partir de qué valor rechazaremos H ( = 0,05)? Tabaquismo Sexo Fumador es Exfumador es No fumador es Tot al Hombr es 18 7 69 94 Mujere s 42 6 58 106 Total 60 13 127 200 Inferencia con dos variables categóricas Tabaquismo Sexo Fumadores Exfumadore s No fumadores Total Hombre s 9% 3,5% 34,5% 47% Mujeres 21% 3% 29% 53% Total 30% 6,5% 63,5% 100 % Tabaquismo Sexo Fumadores Exfumadores No fumadores Total Hombre s 19,1% 7,4% 73,4% 100 % Mujeres 39,6% 5,7% 54,7% 100 % Total 30% 6,5% 63,5% 100 % Tabaquismo Sexo Fumad ores Exfumad ores No fumad ores Tot al Homb res 30% 53,8% 54,3% 47 % Mujer es 70% 46,2% 45,7% 53 % Total 100% 100% 100% 10 0% Asociación entre dos variables categóricas. Concepto de independencia. Decimos que dos variables categóricas son independientes cuando las distribuciones condicionales de cualquiera de ellas son iguales en todas las categorías de la otra. Tabaquismo Sexo Fumad ores Exfumad ores No fumad ores To tal Homb res 10 0 Mujer es 10 0 Total 60 50 90 20 0 Tabaquismo Sexo Fumador es Exfumador es No fumador es Tot al Hombr es 35 35 30 100 Mujere s 25 15 60 100 Total 60 50 90 200 La prueba X de Pearson sobre independencia La hipótesis nula que ponemos a prueba es precisamente la de independencia en la población entre las dos variables categóricas. Antes hemos visto que los datos muestrales de Sexo x Tabaquismo nos hacen dudar de que ambas variables sean independientes. Como siempre, tenemos que buscar una estrategia para poder decidir si esos datos muestrales se muestran compatibles o incompatibles con la hipótesis nula de independencia. Supongamos que queremos averiguar si hay relación entre las variables Sexo y Tabaquismo entre los mayores de 50 años. Para ello muestreamos a 200 personas y les clasificamos en una de las seis casillas de la tabla. Los resultados del muestreo se presentan en una tabla de contingencias 2 x 3: Tabaquismo Sexo Fumador es Exfumador es No fumadore s Total Hombre s 35 35 30 100 Mujeres 25 15 60 100 Total 60 50 90 200 1. Hipótesis H: Las variables Sexo y Tabaquismo son independientes H: Las variables Sexo y Tabaquismo NO son independientes Genéricamente en la prueba X de independencia las hipótesis nula y alternativa se formulan como: H: Las variables X e Y son independientes H: Las variables X e Y NO son independientes 2. Supuestos: Una muestra aleatoria de 200 personas son clasificadas en 3 x 2 categorías resultado de combinar 2 variables categóricas. No más de un 20% de las casillas tiene una frecuencia esperada inferior a 5. 3. Estadístico del contraste Frecuencias observadas n Tabaquismo Sexo Fumador es Exfumador es No fumadores Total Hombres 35 35 30 100 Mujeres 25 15 60 100 Total 60 50 90 200 Frecuencias esperadas m Tabaquismo Sexo Fumadore s Exfumadores No fumadores Total Hombres 1,5 3,3 -4,3 100 Mujeres -1,5 -3,3 4,3 100 Total casos 60 50 90 200 Los residuos tipificados corregidos nos permiten hacer un diagnóstico fino de cómo es el tipo de relación encontrado en la tabla de contingencias. Residuos tipificados corregidos por encima de 1,96 delatan casillas con más casos de los que cabría esperar por azar si las variables fuesen independientes. Casillas con residuos tipificados corregidos menores de -1,96 delatan menos casos de los que cabría esperar encontrar. Interpreta estos residuos tipificados corregidos: Hábitat Trastorno depresivo Rur al Semiurbano Urban o Total casos Sí -2,4 -1,2 3,7 60 No 2,4 1,2 -3,7 240 Total casos 100 100 100 300 Esquema para analizar tablas de contingencias con la prueba de Pearson sobre independencia H: independencia X e Y (dos variables categóricas) H: No independencia X e Y (dos variables categóricas) Ejercicio. Queremos averiguar ahora si hay relación entre el tipo de dieta (baja, media y alta en grasas) y el estado civil (soltero, casado, separado, divorciado y viudo). Tras seleccionar una muestra aleatoria de 400 personas se obtiene un estadístico X = 3,49. ¿Cuánto vale el punto crítico a partir del cual rechazaríamos H ( = 0,05)? ¿Qué decisión debemos tomar en relación a H? ¿Cuánto vale el nivel crítico (p)? ¿Qué afirmación sirve como conclusión del contraste? - Tipo de dieta y estado civil están relacionados en la población - Tipo de dieta y estado civil son independientes en la población - No hay evidencias de que tipo de dieta y estado civil estén relacionados. Ejercicio. En un contraste de hipótesis sobre independencia de dos variables categóricas X e Y, se ha obtenido un estadístico X = k tal que P(X k) = 0,98. ¿Qué decisión debemos tomar en relación a H ( = 0,05)? ¿Cuánto vale el nivel crítico (p)? Ejercicio. Estudiamos a una muestra aleatoria de estudiantes de primero, de segundo y de tercero de psicología. Se les pregunta si prefieren examen tipo test, abierto (respuesta construida) o ambos. A continuación, se muestran los residuos tipificados corregidos. Interpreta los resultados obtenidos. Tipo de examen Curso Test Abierto (respuesta construida) Ambo s Primero -5,0 7,5 -2,8 Segundo -0,9 -4,0 4,8 Tercero 5,9 -3,5 -2,0 Ejercicio. Plantea un escenario con dos variables categóricas donde quieres averiguar si hay relación entre ambas. H: __________________________________________ H: __________________________________________ ¿Cuántas filas y columnas tienen la tabla de contingencias donde representarías los datos en los que has pensado? Inferencia con dos variables categóricas La prueba Xde independencia no es la única que se puede realizar con tablas de contingencias. Si las categorías de las 2 variables son distintas Sexo (H y M); Tabaco (Fumador, Exfumador y No fumador) nos centramos en la hipótesis de independencia. Si las tablas son distintas a 2x2 nos centramos en la hipótesis de independencia. Si las categorías de las 2 variables son iguales Aborto (A favor y En contra); Eutanasia (A favor y En contra) entonces además de la hipótesis de independencia podemos centrarnos en la hipótesis de homogeneidad marginal o prueba de McNemar. La hipótesis de independencia consiste en comparar a dos grupos: ¿los que están a favor y en contra del aborto difieren en su opinión de la eutanasia? Opinión eutanasia Opinion aborto A favor En cotra Total A favor 60 20 80 En contra 30 90 120 Total 90 110 200 La hipótesis de homogeneidad marginal o McNemar nos permite averiguar si la proporción de gente a favor del aborto difiere de la proporción de gente a favor de la eutanasia. La diferencia es que aquí comparamos una muestra medida en dos variables. ¿Por qué la llamamos prueba de homogeneidad marginal? Porque nos fijamos en las proporciones de los márgenes, es decir, de los totales. Opinión eutanasia Opinión aborto A favor En contra Total A favor 0,30 0,10 0,40 En contra 0,15 0,45 0,60 Total 0,45 0,55 1 Así que la prueba de homogeneidad marginal surge cuando a una sola muestra la medimos en dos variables (ej. Aborto y Eutanasia), cuando ambas variables comparten las mismas categorías de respuesta (a favor y en contra) y cuando la tabla es 2x2. ¿Hay algún otro estudio donde se utilice la prueba de homogeneidad marginal? Sí, en estudios donde medimos una misma variable dos veces en el tiempo. Es decir, en estudios longitudinales. Aquí comparar si dos proporciones marginales difieren es lo mismo que averiguar si hay un cambio significativo entre la opinión antes y después. En los estudios longitudinales a la hipótesis de homogeneidad marginal también se la conoce como hipótesis de simetría. Opinión aborto después Opinión aborto antes A favor En contra Total A favor 60 20 80 En contra 30 90 120 Total 90 110 200 Sea como sea, ¡el contraste es el mismo! Utilizaremos la prueba de McNemar para poner a prueba estas hipótesis. Y (después) X (antes) A favor En contra Total A favor n n n En contra n n n Total n n n Ejercicio. Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate ( = 0,05). Tabaquismo Sí No Total Fumadores 51 374 425 No fumadores 29 696 725 Total 80 1070 1150 Significa esto que en la muestra estudiada, la proporción de infarto es tres veces mayor entre los fumadores que entre los no fumadores. En contextos clínicos es habitual cambiar el término proporción por el de riesgo, de modo que en la muestra estudiada se podría decir que el riesgo de tener un infarto es 3 veces mayor entre los fumadores que entre los no fumadores. ¿Es significativo el riesgo relativo? ¿Cómo saber si el riesgo es mayor significativamente en un grupo que en otro? Es decir, ¿cómo averiguar si el riesgo de un grupo es mayor que en el otro en la población? Aquí no tenemos un estadístico del contraste como en otras pruebas. Sin embargo, podemos calcular el intervalo de confianza para el riesgo relativo. Si incluye el valor 1 dicho intervalo (es decir, si está incluido entre el LI y el LS), concluimos que no hay evidencias de que haya más riesgo en un grupo que en otro. Si no incluye el valor 1 el IC, entonces concluimos que el riesgo es mayor en un grupo que en otro en la población (el equivalente a encontrar p < ). ¿Es significativo el riesgo? El IC para el riesgo relativo se calcula: Siendo En el ejemplo donde R = 3, calculamos el IC: Puesto que el valor 1 no se encuentra entre el LI y LS, se puede concluir, con una confianza del 95%, que el riesgo de tener un infarto es significativamente mayor entre los fumadores que entre los no fumadores. Índices de riesgo: Odds ratio. En los diseños hacia atrás o de casos controles estudiamos la odds ratio (OR). La diferencia es que ahora se fijan los totales de columna. Es decir, se cogen sujetos con infarto (casos) y sujetos sanos (controles). Infarto Tabaquismo Sí No Tot al Fumadores 51 374 425 No fumadores 29 696 725 Total 80 1070 115 0 La OR es una estimación de Ren diseños hacia atrás. ¿Es significativa la Odds ratio? Igual que antes, se tiene que calcular el IC de forma que si incluye el valor 1 concluimos que no hay significativamente más OR en un grupo que en otro. Al contrario, si encontramos que el IC no incluye el valor 1 podemos determinar con una confianza dada que un grupo tiene más OR que el otro. Podemos interpretarlo igual que el riesgo relativo pues la OR es una estimación de aquel. Cálculos de la OR El IC para la OR se calcula: Siendo En el ejemplo donde OR = 3,27, calculamos el IC: Puesto que el valor 1 no se encuentra entre el LI y LS, se puede concluir, con una confianza del 95%, que el riesgo de tener un infarto es significativamente mayor entre los fumadores que entre los no fumadores. Causalidad Los índices de riesgo (y en general los datos estadísticos) tienden a interpretarse en términos causales. Eso está mal. La causalidad solo puede venir determinada por el diseño de investigación (diseños experimentales o teorías muy bien fundadas), pero no por resultados estadísticos. ¿Podemos inferir que como entre los fumadores la proporción de tener un infarto es mayor que entre los no fumadores, entonces fumar provoca más infartos? No se puede inferir causalidad a no ser que estemos en el marco de los diseños experimentales con asignación aleatoria de los sujetos a las condiciones del estudio (fumadores y no fumadores). Los estudios de riesgo son observacionales, no experimentales. En estos estudios no hay control sobre variables extrañas (factores de confusión) que pueden estar detrás de los datos, pero que nos pasan desapercibidas. La falacia ecológica Tendemos a interpretar los índices de riesgo para las personas, pero en realidad es un estadístico aplicado a grupos. Ejercicio. Un equipo de epidemiólogos estudia en un grupo de 90 hipertensos si lleva o no habitualmente una vida sedentaria. Selecciona también a 360 sujetos sanos de forma que se parezcan en edad y otras características censales a los hipertensos y los clasifica también como sedentarios y no sedentarios. Hipertensión Vida sedentaria Sí No Total Sí (sedentario) 52 154 206 No (físicamente activo) 38 206 244 Total 90 360 450 ¿Es un estudio longitudinal de cohortes (prospectivo) o de casos controles (retrospectivo)? El índice de riesgo toma un valor de 1,83; IC(1,15; 2,92). Interpreta este valor (1,83) y concluye si hay más riesgo en un grupo que en otro. Ejercicio. Plantea un estudio con dos variables categóricas donde interese estudiar si existe relación entre ambas. ¿Cuáles son las dos variables categóricas? ¿Cuáles son las dimensiones de la tabla? ¿Qué hipótesis nula y alternativa propones? Ejercicio. Plantea un estudio con dos variables categóricas (2x2) donde interese estudiar la hipótesis de homogeneidad marginal. ¿Cuáles son las dos variables categóricas? ¿Cuáles son las dimensiones de la tabla? ¿Qué hipótesis nula y alternativa propones? Ejercicio. Plantea un estudio con dos variables categóricas (2x2) donde el interés ahora resida en estudiar el riesgo de un grupo frente a otro. ¿Cuáles son las dos variables categóricas? Ejercicio. La siguiente tabla recoge algunos datos extraídos de una encuesta realizada a 240 jóvenes madrileños de edades comprendidas entre 15 y 25 años. Beben Fuma n Sí No Tota l Sí 64 16 80 No 32 128 160 Total 96 144 240 Si queremos averiguar si la proporción de bebedores difiere entre los que fuman y no fuman (dos grupos). ¿Qué hipótesis nula debemos proponer? Si queremos averiguar si la proporción de fumadores difiere de la proporción de bebedores. ¿Qué hipótesis nula debemos proponer? Esquema genérico de la prueba de homogeneidad marginal En cualquiera de los casos lo que interesa es si difiere de , por lo que las hipótesis siempre van a ser: 1. Hipótesis H: = ; H: = H: ; H: 2. Supuestos: muestra aleatoria de n sujetos en la que se ha medido una variable dicotómica en dos momentos distintos o dos variables dicotómicas con las mismas categorías. 3. Estadístico del contraste Opinión aborto después Opinión aborto antes A favor En contra Total A favor 60 20 80 Como tenemos = 0,05, busco el percentil 95 de la distribución con 1 grado de libertad. Ese valor es 3,84. Por lo tanto, rechazaré Hsi el estadístico X 3,84. Mantengo Hen caso contrario. 6) Decisión y conclusión Como X= 25,56 3,84, rechazo Hy concluyo que ambas variables están relacionadas. Por lo tanto, hay relación entre tener o no empatía y cometer o no actos delictivos. Es decir, hay diferencias en la proporción de cometer actos delictivos entre los que tienen y no tienen empatía (con un índice de riesgo se puede cuantificar esa relación). Capítulo 4. Inferencia con dos variables cuantitativas • Resumen del tema • Relacionar dos variables cuantitativas • Para compararlas: Prueba T para muestras relacionadas • Para relacionarlas: coeficiente de correlación de Pearson Capítulo 11 del vol. I de Pardo (colgado en moodle). Ejercicios propuestos: 11.1, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8, 11.9, 11.10 Inferencia con dos variables cuantitativas Tres tipos de datos habituales con dos variables cuantitativas. - Cuando hablamos de dos variables cuantitativas estamos estudiando a una muestra medida dos veces en dos variables distintas: por ejemplo, una muestra de 50 bebés donde tenemos recogido el peso y la estatura. - Es habitual medir en una muestra una misma variable dos veces en el tiempo: la depresión antes del tratamiento y la depresión después del tratamiento. - También podemos referirnos a pares de sujetos (sujetos emparejados) medidos en una misma variable: gemelos donde les medimos su capacidad espacial, marido-mujer donde medimos satisfacción en el matrimonio, etc. A estos estudios los llamamos de muestras relacionadas o medidas repetidas. Ejemplos de datos: Estudios longitudinales: Estudios transversales: Depresión antes Depresión después 25 14 32 22 35 28 27 19 29 24 Peso bebé Estatura bebé 3,1 49 2,6 44 3,4 52 3,0 48 2,9 48 Muestras emparejadas: CI gemelo 1 CI gemelo 2 105 108 97 99 108 113 94 100 114 108 ¿Comparar o relacionar? Con dos variables cuantitativas el interés se puede centrar en dos cosas distintas: comparar o relacionar. Con dos variables cuantitativas comparar y relacionar son cosas diferentes. Cuando comparamos estamos estudiando si difieren las medidas de tendencia central (nos fijamos en un único punto de la distribución: media, mediana, etc.). Cuando relacionamos dos variables cuantitativas nos interesa saber si las puntuaciones de una variable covarían de forma parecida con las de otra variable (nos fijamos en todas las puntuaciones). Comparamos variables siempre y cuando estén en la misma métrica. Por ejemplo, no tiene sentido comparar los promedios poblacionales del peso de los bebés y la altura de los bebés. Sí tiene sentido comparar la depresión antes con la depresión después de un tratamiento. En cambio, siempre podemos estudiar la relación entre dos variables cuantitativas, independientemente de la métrica de las variables. Comparar medias relacionadas: prueba T de Student para muestras relacionadas Puesto que vamos a comparar tenemos dos variables cuantitativas Ye Ymedidas en la misma métrica. Si restamos ambas puntuaciones tenemos una variable D que es la diferencia entre cada par de puntuaciones del sujeto. Depresión antes (Y) Depresión después (Y) Diferencia D = Y – Y 25 14 8 32 22 10 35 28 7 27 19 8 29 24 5 La prueba T para dos muestras relacionadas Para estudiar el contraste sobre dos medias relacionadas vamos a poner un ejemplo de un contraste unilateral derecho (el ejemplo de la depresión antes y después), bilateral (CI para gemelo primogénito y el segundo) y unilateral izquierdo (intervención de la capacidad espacial antes y después de un tratamiento). 1. Hipótesis a. Contraste bilateral: ; b. Contraste unilateral derecho: ; c. Contraste unilateral izquierdo: ; 2. Supuestos Muestra aleatoria de n sujetos medida dos veces (o muestra aleatoria de sujetos emparejados) donde Y e Y se distribuyen normalmente (conforme aumenta n el supuesto de normalidad pierde importancia). 3. Estadístico del contraste donde S es la desviación típica de la variable diferencias. 4. Distribución muestral ¿Cuál es la función de probabilidad que sigue el estadístico del contraste? La distribución t de Student con n – 1 grados de libertad. 5. Zona crítica / Regla de decisión Teniendo un especificado, si el contraste es bilateral, la zona crítica queda determinada por T t y por T t 5. Zona crítica / Regla de decisión Si el contraste es unilateral derecho, la zona crítica queda determinada T t Otras relaciones entre variables cuantitativas: Ausencia relación Relacion cuadrática Relación cúbica Cuantificación de la relación. Los diagramas de dispersión son útiles como una primera aproximación del tipo de relación que hay entre dos variables. ¿Cómo cuantificamos la relación entre dos variables? Con el coeficiente de correlación de Pearson. - Mide el grado de relación lineal - Toma un valor positivo cuando existe relación lineal positiva y negativo cuando existe relación lineal negativa. - Su valor oscila entre -1 y 1. Un valor de -1 informa de una relación lineal inversa perfecta y un valor de 1 relación directa perfecta. Un valor de 0 informa de ausencia de relación lineal. - Su valor no se altera ante transformaciones lineales (sumando o multiplicando las variables X e Y) Coeficiente de correlación de Pearson: a) Coeficiente R= –0,801 b) Coeficiente R= 0,967 c) Coeficiente R= 0,635 d) Coeficiente R= 0,002 1 2 3 4 Contraste de hipótesis sobre el parámetro : 1. Hipótesis: a. Contraste bilateral: ; b. Contraste unilateral derecho; c. Contraste unilateral izquierdo: ; 2. Supuestos: muestra aleatoria de n pares XY independientes que tienen distribución normal tanto en X como en Y (conforme aumenta n pierde importancia la distribución normal). 3. Estadístico del contraste: 4. Distribución muestral: T se distribuye según el modelo t de Student con n – 2 grados de libertad. 5. Zona crítica Teniendo un especificado, si el contraste es bilateral, la zona crítica queda determinada por T t y por T t Si el contraste es unilateral derecho, la zona crítica queda determinada T t Si el contraste es unilateral izquierdo, la zona crítica queda determinada T t 6. Decisión: Si T cae en la zona crítica rechazamos H; en caso contrario mantenemos. Cuando rechazamos H podemos afirmar que X e Y están linealmente relacionadas en la población (se suele decir que hay una relación lineal estadísticamente significativa). Cuando mantenemos H solo podemos decir que no hay evidencia de que X e Y estén relacionadas linealmente. 7. Nivel crítico En un contraste unilateral derecho p es la probabilidad que queda a la derecha de nuestro estadístico T. Si por ejemplo T = 2,32, p será, P(T 2,32). En un contraste unilateral izquierdo p es la probabilidad que queda a la izquierda de nuestro estadístico T. Si por ejemplo T = –1,26, p será, P(T –1,26). En un contraste bilateral p es 2 veces la probabilidad de obtener un estadístico como el que hemos obtenido en valor absoluto o mayor. Si por ejemplo, T = –1,26, p = 2[P(T |–1,26|] Ejercicio correlación. Un equipo de investigación sobre personalidad quiere averiguar si hay relación negativa entre el rasgo de neuroticismo y las horas medias que se duermen semanalmente. Para ello consigue una muestra aleatoria de 14 personas a las que aplica un cuestionario de personalidad y les pide que registren durante una semana las horas que duermen. ¿Qué podemos decir sobre la sospecha de este equipo de investigación? ( = 0,01). Nota: S= -2,31; S= 6,55; S= 0,50; Sujetos 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 X= Neuroticism o 2 2 2 6 1 0 8 1 5 4 1 6 1 8 1 4 2 0 2 8 1 7 1 6 1 3 Y = Horas de sueño/día 7, 4 7, 2 8, 1 8, 2 8, 6 8, 1 7, 9 8, 2 7, 8 7, 3 6, 9 8, 4 8, 2 8, 0 1. Hipótesis: se trata de un contraste unilateral izquierdo puesto que se sospecha de antemano una relación negativa entre las horas de sueño y el rasgo de personalidad neuroticismo. 2. Supuestos: La muestra de 14 pares de puntuaciones es aleatoria y tanto X como Y ajustan a la normal. 3. Estadístico del contraste: 4. Distribución muestral T se distribuye según la t de Student con 12 grados de libertad (n – 2) 5. Zona crítica Como es un contraste unilateral izquierdo con = 0,01 buscamos el percentil 1 de la distribución t de Student con 12 gl. t= -2,681 Por lo tanto, la zona crítica serán los valores T iguales o menores a -2,681. 6. Decisión: puesto que T = -3,49 < -2,681 rechazamos H y concluimos que neuroticismo y horas de sueño están relacionados linealmente y de forma negativa en la población. 7. Nivel crítico (p): p = 0,002 (en las tablas solo podemos saber que es menor de 0,005 y mayor de 0,001). Algunos comentarios sobre la correlación 1- Primero conviene ver si dos variables cuantitativas correlacionan significativamente o no. 2- Segundo, la magnitud de la correlación depende del contexto (no hay recetas para decidir cuándo es alto un coeficiente de correlación y cuándo es bajo, dependerá de la situación concreta). 3- La correlación debe acompañarse de su respectivo diagrama de dispersión. Un coeficiente de correlación de 0,80 puede tener pautas muy distintas y eso lo desvela el gráfico de dispersión. 4- Es sensible a casos extremos. 5- También es sensible a la variabilidad de los datos. 6- Una correlación no implica que haya causalidad. Por ejemplo, existe una alta correlación lineal entre el número de televisores per cápita y la esperanza de vida media en cada país. ¿Significa eso que aumentando el número de televisores en los hogares se conseguirá aumentar la esperanza de vida? Hay muchas relaciones espurias. Ejercicio En un centro escolar 7 estudiantes disléxicos se examinan con un dictado y se contabiliza el número de errores que tienen. Reciben un programa de entrenamiento para reducir la dislexia y tras 20 sesiones se les examina con el dictado. ¿Queremos averiguar si el número de errores disminuye significativamente? 1. ¿Qué tipo de prueba estadística nos permite poner a prueba esta hipótesis? 2. ¿Se trata de un contraste bilateral, unilateral derecho o unilateral izquierdo? 3. Si obtenemos un estadístico T = 3,707, ¿Qué decisión tomamos sobre H( = 0,05) y qué podemos concluir? 4. ¿Cuánto vale el nivel crítico (p)? Ejercicio 11.8. En un estudio sobre la relación entre rigidez y creatividad, un investigador plantea las siguientes hipótesis: H: 0; H: < 0. En una muestra aleatoria se obtiene un estadístico T = – 2. Sabiendo que P(T –2) = 0,98 y utilizando = 0,05: a. ¿Es razonable rechazar H? ¿Por qué? b. ¿Se puede afirmar que las variables están linealmente relacionadas? Ejercicio 11.9. ¿Cuáles de las siguientes afirmaciones podrían servir como conclusión de los resultados obtenidos? a. La creatividad no tiene nada que ver con la rigidez b. La creatividad depende de la rigidez c. La rigidez depende de la creatividad d. Las puntuaciones altas en rigidez tienden a ir acompañadas de puntuaciones altas en creatividad e. Las puntuaciones altas en rigidez tienden a ir acompañadas de puntuaciones bajas en creatividad Ejercicio 11.10. Al contrastar la hipótesis nula H: = 0 frente a la alternativa H: > 0 se ha obtenido un estadístico T= 2,12. Sabiendo que P(T > 2,12) = 0,02, señalar la(s) alternativa(s) correcta(s): a. Con = 0,05, se mantiene H b. Con = 0,01, puede concluirse que X está relacionada con Y. Y 6 4 6 3 7 4 9 5 7 4 8 5 7 8 7 6 6 9 7 0 1 0 71, 8 6,9 6 Y 6 0 6 2 7 0 6 1 6 7 7 0 6 4 7 1 6 0 6 3 1 0 64, 8 4,3 4 1. Hipótesis: (se trata de un contraste unilateral derecho) 2. Supuestos: Las dos muestras son aleatorias. Asumimos que las puntuaciones en el test visoespacial son normales en ambas poblaciones y también asumimos que las varianzas poblacionales son iguales. 3. Estadístico del contraste: 4. Distribución muestral: el estadístico T se distribuye según el modelo de probabilidad t de Student con n+ n– 2 = 18 gl. 5. Zona crítica: Al ser un contraste unilateral derecho tenemos que encontrar en la distribución t de Student con n+ n– 2 = 18 gl., el percentil 95 (ya que = 0,05) de la distribución. Dicho valor es 1,734. Por lo tanto, la zona crítica queda determinada por T 1,734. 6. Decisión: Puesto que T = 2,70 > 1,734 rechazamos H, lo cual nos permite afirmar que el grupo experimental obtiene una media significativamente más alta que el grupo control en capacidad visoespacial (dicho de otra forma, la media poblacional del grupo experimental es más alta que la del grupo control). 7. Nivel crítico (p): p = P(T 2,70) < 0,01 Inferencia con una variable categórica y una cuantitativa Medidas del tamaño del efecto Cuando examinábamos la relación entre dos variables categóricas, estudiamos un par de medidas que cuantifican el grado o fuerza de la relación entre las dos variables (repasar en las diapositivas el coeficiente de contingencia y la V de Cramér). En el caso de relación entre dos variables cuantitativas el mismo coeficiente de correlación de Pearson es una medida del tamaño del efecto en tanto que nos dice cuál es la intensidad de la relación lineal que hay entre dos variables cuantitativas. En realidad hay que elevar este estadístico al cuadrado como se verá más adelante. Cuando comparamos medias también querremos disponer de una medida que mida la intensidad de la diferencia encontrada. Medidas del tamaño del efecto Las medidas del tamaño del efecto tratan de medir ya no la significación estadística, sino la relevancia de un resultado. Cuando comparamos dos grupos tenemos la de Cohen: Donde La de Cohen no es más que una puntuación típica que expresa cuántas desviaciones típicas se aleja una media de otra. Así, una = 1 significa que la media de un grupo está una desviación típica por encima de la media del otro grupo. Como es una puntuación típica, sabemos que una Z = 1 deja (ver tabla N(0,1)) al 84% de las puntuaciones por debajo, luego una = 1 nos informa de que el 84% de las puntuaciones del grupo con menos media está por debajo de la media del grupo con más media. Supongamos una = 2. Significa ello que las medias están separadas por dos desviaciones típicas. Como Z = 2 deja por debajo (ver tabla N(0,1)) al 97,7% de las puntuaciones, una = 2 nos informa de que el 97,7% de las puntuaciones del grupo con menos media están por debajo de la media del grupo con más media. Si desconocemos las varianzas muestrales S y S podemos estimar la de Cohen si tenemos los tamaños muestrales n y n y si conocemos el estadístico T de Student: Igual que sucede con el coeficiente de correlación de Pearson, o con el coeficiente de contingencia o V de Cramér, la relevancia de un resultado depende del contexto en el que se enmarque la investigación. No obstante, el propio Cohen ha puesto unos valores para decir cuándo el tamaño del efecto es pequeño, mediano o grande. Valores en torno a 0,20 indican un efecto pequeño. Valores en torno a 0,50 indican un efecto medio. Valores en torno a 0,80 o mayores indican un efecto grande. Otra medida muy extendida de tamaño del efecto es el coeficiente de correlación de Pearson R. Para el caso de una variable categórica y una cuantitativa el cálculo de R = donde N es n + n . Elevando al cuadrado el coeficiente de correlación vemos la proporción de varianza que comparten ambas variables. Cohen ha sugerido para R que valores de 0,10 muestran un tamaño del efecto pequeño, de 0,30 medio y de 0,50 grande. Ejercicio Estimaremos el tamaño del efecto para el ejemplo de los 20 niños con problemas perceptivos. Habíamos obtenido un estadístico T = 2,70. Aplicando la fórmula donde aparece la T: El valor es 1,21. Si vamos a la tabla de la N(0,1) y buscamos Z = 1,21 veremos que el 88,7% de las puntuaciones cae por debajo de esta puntuación. Así, podemos interpretar el valor como un valor grande ( > 0,80) y que aproximadamente el 89% de las puntuaciones del grupo control caen por debajo de la media del grupo de niños expuestos a entrenamiento (el grupo experimental). En definitiva, lo que podemos decir no es solamente que las medias difieren en la población (contraste sobre dos medias independientes), sino que el resultado encontrado es relevante. Estimaremos el tamaño del efecto para el ejemplo de los 20 niños con problemas perceptivos. Calcularemos ahora la medida de tamaño del efecto R Si elevamos al cuadrado 0,54= 0,29, que indica que las puntuaciones en el test de capacidad visoespacial y la variable grupo (control y experimental) comparten un 29% de la varianza. Esto se puede entender mejor de la siguiente manera: sabiendo el grupo de pertenencia de un niño (control o experimental) el conocimiento sobre su puntuación en el test de capacidad visoespacial mejora un 29%. Se corresponde con un tamaño del efecto grande (0,54 > 0,50). Plantea un ejemplo de diseño dentro de un contexto de psicología clínica en el que se tendría que analizar los datos con la prueba T para muestras independientes. Plantea la hipótesis nula y la hipótesis alternativa. Ejercicio. Un psicólogo clínico desea ver si un nuevo fármaco sacado al mercado es capaz de aliviar los problemas de sueño en pacientes aquejados de insomnio. Para ello selecciona aleatoriamente a 20 pacientes con insomnio y a 10 de ellos asignados también al azar les administra el fármaco (grupo experimental). A los otros 10 les administra un placebo. Se recogen las horas dormidas en promedio durante una semana tras el tratamiento (ver Tabla). ¿Permiten estos datos afirmar que los sujetos que reciben el medicamente duermen más que los que reciben el placebo ( = 0,05)? Grupos 1 2 3 4 5 6 7 8 9 1 0 Y 7, 2 7, 0 7, 9 6, 9 7, 2 6, 1 7, 7 7, 8 7, 2 6, 4 1 0 7,1 4 0,5 8 Y 4, 8 4, 2 6, 6 6, 2 5, 4 4, 8 4, 8 4, 1 3, 9 4, 0 1 0 4,8 8 0,9 3 ¿Cuál es el tamaño del efecto según la de Cohen y según la R? Interprétalos y comenta si es grande el efecto encontrado. Ejercicio Un psicólogo educativo piensa que para el aprendizaje de matemáticas conviene implantar un nuevo método de enseñanza mucho más participativo que el método convencional. Para ello, durante un trimestre asigna aleatoriamente a un aula con 12 niños al método nuevo participativo y a otra aula con 10 niños al método convencional. Tras finalizar el trimestre mide el rendimiento en matemáticas a ambos grupos. Las hipótesis planteadas son: H: µ µ;H: µ> µ. ¿Cuál es el punto crítico que delimita la zona de rechazo frente a la zona de aceptación? ( = 0,05) Si el estadístico del contraste T = -2,086, ¿qué decisión debe tomar el psicólogo educativo? ¿Cuál es el nivel crítico del contraste? Ejercicio En un contraste unilateral izquierdo sobre dos medias independientes se obtiene un estadístico T = -2,32, tal que P(T -2,32) = 0,98. Con = 0,05: ¿Qué decisión debe tomar el investigador sobre H? ¿A qué conclusión llega el investigador? ¿Cuánto vale el nivel crítico del contraste ALGUNAS COSAS PRÁCTICAS: RESUMEN CURSO HASTA AQUÍ Una variable (TEMA 2): Contraste sobre una proporción: H: 0,30; H: > 0,30 Variable categórica dicotómica Estadístico Z ~ N(0,1) o la prueba binomial Contraste Xsobre bondad de ajuste: H: f(n) = [ = 0,30; = 0,20; = 0,50] H: f(n) [ = 0,30; = 0,20; = 0,50] Variable categórica con más de dos categorías Estadístico X~ con I – 1 grados de libertad (I = nº de categorías) Contraste sobre una media: H: 105 H: > 105 Variable cuantitativa Estadístico T para una muestra ~ t con n – 1 grados de libertad
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved