Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Contrastes de Hipótesis No Paramétricos: Ajuste y Independencia - Prof. Núñez, Apuntes de Economía

El tema 8 de estadística, donde se estudian los contrastes no paramétricos de hipótesis, específicamente el contraste de bondad de ajuste y el contraste de independencia. Se explica cómo verificar si una muestra procede de una determinada distribución de probabilidad y cómo contrastar la independencia entre dos variables poblacionales.

Tipo: Apuntes

2016/2017

Subido el 20/05/2017

diego_uam
diego_uam 🇪🇸

4

(5)

11 documentos

1 / 7

Documentos relacionados


Vista previa parcial del texto

¡Descarga Contrastes de Hipótesis No Paramétricos: Ajuste y Independencia - Prof. Núñez y más Apuntes en PDF de Economía solo en Docsity! 20/03/2012 1 Tema 8: Contrastes de Hipótesis NO Paramétricas Introducción Contrastes de Bondad de Ajuste - Prueba cuando no se estiman parámetros - Prueba cuando se estiman parámetros Contrastes de Independencia. Contrastes de Homogeneidad. (NO) T8 1 T1 Hasta ahora hemos estudiado contrastes de hipótesis paramétricos, en los que obteníamos una MAS de tamaño n procedente de una población en la que una determinada VA se distribuye según una función de densidad o probabilidad f(x;θ) cuya forma es conocida, pero de la que no conocíamos el valor de uno o más parámetros θ ∈ Ω. En este tema (CONTRASTES NO PARÁMETRICOS) asumimos un supuesto más realista en muchos casos: suponemos que no conocemos la distribución de probabilidad de la que proceden los datos, construyéndose las hipótesis acerca de la forma que puede tener esa distribución. Dentro del amplio campo de construcción no paramétrica, veremos los contrastes más usuales: • CONTRASTE DE BONDAD DE AJUSTE • CONTRASTE DE INDEPENDENCIA • CONTRASTE DE HOMOGENEIDAD (NO) Introducción 2 20/03/2012 2 T1 El objetivo de este tipo de contraste es verificar si la muestra procede de una determinada distribución de probabilidad (ej. Poisson, Binomial, Normal, etc). Partimos de una MAS (x1, ………xn) con función de distribución F(x) desconocida. A la vista de los datos, se quiere contrastar si proceden de una distribución F0(x): H0: F(x) = F0(x) H1: F(x) ≠ F0(x) De entre toda la amplia variedad de contrastes para resolver esta cuestión (χ2 de Pearson, Kolmogorov-Smirnov, Shapiro-Wilks, etc.) veremos sólo el primero, el de χ2 de Pearson, que es válido para distribuciones continuas y discretas. Distinguiremos dos supuestos: - Cuando no se estiman parámetros - Cuando sí se estima parámetros Contraste de Bondad de Ajuste 3 T1 4 Prueba cuando no se estiman parámetros En este caso la función de densidad o probabilidad está completamente especificada (es decir, se conoce el valor de todos sus parámetros). Seguiremos los siguientes pasos: Paso 1. Se dispone de una MAS (x1, ………xn) cuyas observaciones pueden dividirse en “r” clases exhaustivas y mutuamente excluyentes. Si representamos las categorías por Ak y por nk el nº de observaciones en cada categoría k, tendremos: nk es una VA cuyo valor variará de unas muestras a otras. Contraste de Bondad de Ajuste Categorías (Ak) Nº de valores observados (nk) A1 n1 A2 n2 : : Ak nk : : Ar nr  = = r k k nn 1 20/03/2012 5 T1 9 Prueba cuando SÍ se estiman parámetros Con respecto al caso anterior, se reducen los grados de libertad en una cantidad igual al número de parámetros estimados. Los grados de libertad indican los elementos de información disponibles para realizar el contraste. En el primer caso (cuando no se estiman parámetros) hay “r” elementos de información muestral, de los que son estrictamente útiles “r-1”, pues teniendo la restricción de que ∑ nk = n esto implica que conociendo r-1, tenemos determinados los nr. En el segundo caso (cuando se estiman los parámetros desconocidos) hay que restar el número de parámetros a estimar, ya que implican restricciones sobre nk. La consecuencia práctica es que, para un mismo α, el valor crítico . Es decir, se agranda el tamaño de la región crítica: se puede rechazar la Ho para discrepancias más pequeñas que en el caso anterior. Esto es lógico: se está exigiendo que el ajuste sea mejor, debido a que los parámetros desconocidos se estiman en base a los observados de la muestra. Contraste de Bondad de Ajuste T1 10 En el CONTRASTE DE INDEPENDENCIA se desea contrastar, con una MAS de tamaño n, procedente de una población bivariante, si las variables poblacionales son independientes. Es decir, queremos saber si existe dependencia entre dos características diferentes de individuos de una misma población. Por ejemplo, ¿existe relación entre fumar y desarrollar un cáncer de pulmón?¿o entre el nivel de estudios y los ingresos de los individuos? En este caso, la hipótesis nula es que ambas características son independientes. Ho: X e Y independientes H1: X e Y están relacionadas Para ello se toma una MAS de tamaño n y de cada individuo se observan dos características, A y B. La característica A (variable X) presenta r formas o categorías: A1, A2, ..Ai, …Ar. La característica B (variable Y) presenta s formas o categorías: B1, B2, ..Bi, …Bs. Contraste de Independencia 20/03/2012 6 T1 11 Contraste de Independencia A\ B B1 B2 … Bj … Bs Total mg A1 n11 n12 … n1j … n1s n1. A2 n21 n22 … n2j … n2s n2. : : : : : : Ai ni1 ni2 … nij … njs ni. : : : : : : Ar nr1 nr2 … nrj … nrs nr. Total mg n.1 n.2 … n.j … n.s n El resultado de la clasificación de una muestra bivariante recibe el nombre de TABLA DE CONTINGENCIA DE DOBLE ENTRADA, y contiene las frecuencias observadas: nij = nº individuos muestra / frecuencia que pertenecen a la categoría i de diferentes de individuos de una misma población. ni. = nº individuos pertenecientes a la categoría Ai (independientemente de a cual pertenezcan de B) = frecuencia marginal de Ai n.j = nº individuos pertenecientes a la categoría Bj (independientemente de a cual pertenezcan de A) = frecuencia marginal de Bj nnnn s j j r i i s j ij r i ===  ==== 1 . 1 . 11 T1 12 Contraste de Independencia Por tanto: pij = probabilidad de que un individuo seleccionado al azar se sitúe en la casilla i,j. pi. = probabilidad marginal de que un individuo pertenezca a Ai p.j = probabilidad marginal de que un individuo pertenezca a Bj pij = P(Ai ∩ Bj); pi.=P(Ai); p.j=P(Bj) La hipótesis nula es que las características A y B son independientes. Si efectivamente lo son, la condición necesaria y suficiente de independencia es que el producto de las probabilidades marginales debe ser igual a la probabilidad conjunta. Ho: Independencia → [pij = pi. p.j] ∀i,j → H1: Dependencia → [pij ≠ pi. p.j] Por tanto, tenemos que bajo la hipótesis nula cierta las frecuencias teóricas o esperadas serían: Y el estadístico de contraste: n nn n n n n n n n ji ij jiij .... =→= jiij ji ij pnpnpn nn E .. .. === ( ) ( )  = − == = ⎯→⎯ − = − = r i sr a s j ji jiij r i s j ij ijij pnp pnpn E En 1 2 1· 1 .. 2 .. 1 1 2 2 χχ 20/03/2012 7 T1 13 Contraste de Independencia Sin embargo, en la mayoría de casos las probabilidades marginales poblacionales no son conocidas, y habrá que estimarlas en base a la muestra. El estadístico anterior es válido, ya que los estimadores son máximo verosímiles. Ya sabemos que ni. = nº individuos pertenecientes a Ai antes de tomar una muestra es una B(n; pi.), y que el estimador máximo verosímil de p es: Análogamente: Por tanto hay que estimar las probabilidades marginales: Valor crítico: *(r·s-1) –(r-1)-(s-1)=rs-1-r-1-s+1=rs-r-s+1=(r-1)·(s-1) MV i ii MV pn n n Aindn posiblescasos favorablescasos n x p .. ˆ º ˆ ==→==  n n p jMVj . .ˆ = ( )   = −− = ⎯→⎯       − = − = r i sr a i j ji ji ijs j ji jiij n nn n nn n ppn ppnn 1 2 *)1)(1( .. 2 .. 1 .. 2 ..2 ˆˆ ˆˆ χχ [ ] %/ 02 )1)(1( αχ =≥−− HkP sr
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved