UNIVERSIDAD CATOLICA DE COLOMBIA. Ingeniería de Sistemas.

Estadística II

ESTIMACIÓN Y CONTRASTE DE HIPOTESIS.

CHI CUADRADO Y REGRESIÓN. ESTADÍSTICOS DE DISTRIBUCIÓN LIBRE

Complementos y Ejercicios. 

 

1. Los procesos de Estimación estadística y los propios de las Pruebas o contrastación de hipótesis han sido durante mucho tiempo los procedimientos mediante los cuales se han resuelto la mayor parte de las situaciones en las que la inferencia estadística muestra su utilidad. Un tercer grupo de situaciones en las cuales está presente la inferencia es el que se relaciona con los pronósticos y, allí, es de gran importancia el conocimiento de las técnicas asociadas con el estudio de la Regresión cuya vinculación con el Análisis de Varianza tanto como el conocimiento de las técnicas estadísticas denominadas de Distribución libre ó no paramétricas, constituyen el objeto de estudio de un amplio campo temático entre los saberes propios de la Estadística contemporánea. Algunas situaciones típicas en las cuales se aplican los procesos y técnicas ya mencionados se hallan cuando se piensa en la solución de cuestiones como las planteadas en los ejercicios que aquí se incluyen:

 

1.1.            Se desea estimar el número medio de horas de uso continuo hasta que cierta clase de computadora necesite reparación por primera vez. Si se puede suponer que D.S. = 48 horas , ¿ de que tamaño debe ser la muestra para que se puede afirmar con una probabilidad de 0.99 que el error de la estimación no será superior a 10 horas?.

1.2.            En un estudio de contaminación del aire, una muestra aleatoria de 8 especímenes tomados con el viento a favor a una milla de cierta fábrica contuvieron, en promedio, 2.26 microgramos de sustancias orgánicas solubles en benceno por metro cúbico con D.S = 0.56. Si se usa 2.26 como una estimación puntual de la media de la población de la que se efectúa el muestreo, ¿ cuál es el error máximo de esta estimación si la misma se lleva a cabo con una confianza del 95%?.¿Del 0.99?.

1.3.            En la producción de cierto tipo de chips para circuitos electrónicos se toman muestras con intervalos regulares de tiempo para verificar con el 5% de significancia si  el proceso se halla controlado, esto es, si en muestras de 40 de los chips se cubren las especificaciones. ¿ Hay motivo para preocuparse si se debiera rechazar la hipótesis nula en seis ocasiones?.

1.4.            Una muestra aleatoria de 12 graduadas de una escuela de comercio promedió 73.2 palabras por minuto con una D.S. = 7.9, en una prueba de mecanografía. Pruebe con un nivel de significancia de 0.05 la hipótesis nula de que las graduadas de ésta escuela promedian 75.0 palabras por minuto en la prueba de referencia contra la hipótesis alternativa de que promedian menos.

1.5.            En una investigación acerca de los tiempos de reparación de dos clases de equipos de computación se obtuvieron estos valores de los datos: 

Tipo de equipo

Reparaciones. (#)

Tiempo promedio. (Min.)

D.S.

(Min.)

AXELITAX

60

84.2

19.4

EXONITAN

60

91.6

18.8

a)        Pruebe con 0.01 de significancia si la diferencia entre estas dos medias muestrales es significativa.

b)       Encuentre el valor de probabilidad correspondiente al valor calculado de z en la parte a).

c)        Use el valor calculado en b) para decidir si se podría haber rechazado la hipótesis nula  con 0.02 como nivel de significancia.

d)       Use el valor calculado en b) para decidir si se podría haber rechazado la hipótesis nula  con 0.03 como nivel de significancia.

e)        Use el valor calculado en b) para decidir si se podría haber rechazado la hipótesis nula  con 0.04 como nivel de significancia.

 

2. LA DENSIDAD DE PROBABILIDAD O  DISTRIBUCIÓN CHI CUADRADA (c2 , ó Ji cuadrado): es un caso especial de la densidad GAMMA de probabilidades; a cuya formulación se llega cuando a= n/2, y b = 2. La expresión funcional mediante la cual se le identifica define a una distribución teórica ó modelo  de probabilidades para variable continua, una de cuyas presentaciones es::

f(c2)  =  K (c2)n/2 –1[e] ½c2 ; para c2³ 0, donde :

 

K= [ (½ n – 1)!] –1 (2) –n/2    ; n = Grados de libertad ;  e = 2.71828....

 

Para c2 se cumple  E(c2) = n ; Var (c2) = 2n.

 

(Ver CANAVOS – Probabilidad y Estadística – numeral 5.5, páginas 152 a 159).

La distribución c2, cambia la forma de su curva descriptiva cuando varía el número de grados de libertad. De otra parte , el estudio de una tabla de áreas – la función de distribución - para c2  permite establecer que a medida que aumenta el número de grados de libertad se incrementa también el valor crítico para el rechazo de la hipótesis nula. A pesar de que  c2 es un modelo probabilístico definido para variables continuas, su utilización mas amplia tiene lugar al contrastar o docimar hipótesis para variables discretas cualitativas. Para efectos operativos: 

c2 = å [(fo – fe)2/ fe] ; donde fo = Frecuencias observadas,

                                                fe = Frecuencias esperadas.

å fo =å fe = Total de observaciones.

Grados de libertad = ( Número de filas -1) x (Número de columnas –1)

(Ver CANAVOS – Probabilidad y Estadística – numeral 10.4, páginas 370 a 374)

Las principales situaciones en las que la distribución c2  muestra su utilidad son aquellas relacionadas con:

·        Establecer la independencia de variables(estudio de tablas de contingencia).

·        Establecer la concordancia entre unos hechos observados – en una muestra – y la distribución teórica a la que los  fenómenos observados deberían ajustarse ( pruebas de bondad de ajuste).

 

2.1. Se realizó una encuesta entre congresistas colombianos con el objeto de establecer la opinión que ellos tenían acerca de un cierto proyecto de ley. La siguiente tabla de contingencia resume los resultados de la indagación adelantada.

 

          Opinión

Posición

A  favor

En contra

Indecisos

Totales

Gobiernista

50

46

10

 

Oposición

48

34

12

 

Totales

 

 

 

 

¿ La información elaborada a partir de los datos recogidos permite señalar que hay independencia entre la opinión expresada y la posición política de los congresistas ?. Utilice 0.05 como nivel de significación.

 

2.2.Al lanzar 5 monedas 320 veces, la distribución del número de caras obtenidas se ilustra con el siguiente cuadro:

# de caras

0

1

2

3

4

5

Frecuencia

 

 

 

 

 

 

NOTA : Para este ejercicio cada estudiante deberá llenar la fila de frecuencias y resolver lo planteado para la situación por él diseñada.

¿ Podrá asegurarse que las 5 monedas son legales?. Utilice un nivel de significación del 0.01. ¿Variaría la respuesta si el nivel de Significación fuera 0.05?. Explique su respuesta.

 

2.3.Una investigación se basó en los resultados de un sondeo de opinión realizado en tres ciudades. El objetivo del sondeo era establecer el potencial de compradores para un producto próximo a ser lanzado al mercado; por ello a cada persona que probó el producto se le solicitó calificarlo con una de tres apreciaciones. Los resultados observados fueron:

Ciudad A :  Excelente: 51 ; Bueno: 45 ; No satisfactorio:19

Ciudad B :  Excelente : 30 ;  Bueno: 35; No satisfactorio:20 

Ciudad C : Excelente :62 ;  Bueno: 28; No satisfactorio:10

¿ Puede señalarse, si el riesgo de equivocarse fuera del 1% , que la apreciación acerca del producto es independiente de la ciudad en donde se realizó el sondeo ?.

 

2.4. Resolver de: CANAVOS – Probabilidad y Estadística – los ejercicios:

-          Página 375: 10.4 y 10.6.  -  Página 377: 10.16 a 10.18.

 

3.      REGRESIÓN LINEAL y ANALISIS DE VARIANZA.

(Ver CANAVOS – Probabilidad y Estadística – numerales 13.1 a 13.3 ; 13.7 y 13.8

       SPIEGEL – Probabilidad y Estadística – capítulos 8).

3.1. Resolver de: CANAVOS – Probabilidad y Estadística – los ejercicios:

-          Página 493: 13.12 y 13.13. -  Página 563: 14.2.

3.2. Resolver de: SPIEGEL – Probabilidad y Estadística – los ejercicios:

-          Página 300: 8.74. - Página 301: 8.82, 8.84.y 8.86. - Página 302: 8.100.

 

4.      ESTADÍSTICOS  DE DISTRIBUCIÓN LIBRE – ESTADÍSTICA NO PARAMÉTRICA.

 

4.1. La estadística NO PARAMÉTRICA  se ocupa de estudiar los métodos de inferencia que para su utilización no requieren de suposiciones acerca de la forma o medidas de la distribución de la variable investigada en la población de donde proviene la muestra seleccionada. De allí la denominación alternativa de ESTADÍSTICOS DE DISTRIBUCIÓN LIBRE con la que, con frecuencia, se les identifica. A  la prueba CHI CUADRADA, empleada para inferir acerca de independencia estadística entre variables o para examinar la bondad de ajuste de unos datos empíricos a un modelo teórico, se le suele considerar una prueba no paramétrica. Los  procedimientos estadísticos que caen bajo esta denominación incluyen numerosas técnicas, entre las cuales se cuenta el COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPEARMAN al que se refiere el numeral 15.6 de CANAVOS –Probabilidad y Estadística - páginas 586 a 588. Se trata de una técnica no paramétrica empleada para calcular la correlación existente entre variables ordinales ó entre las que sin serlo puedan ser ordinalizadas. De allí que a esta medida estadística se le conozca con frecuencia como el coeficiente de correlación de datos jerarquizados. La expresión matemática empleada para el cálculo de este coeficiente – r  -- es:

 

      r = 1 – [ 6 åDi2/ (n3 – n)] ; donde,

 
n =Número de parejas de observaciones
D =Diferencia entre las jerarquías de las observaciones      
      aparejadas.

 

4.2. Resolver de: CANAVOS – Probabilidad y Estadística – los ejercicios:

-          Página 592: 15.15 a 15.18..

P. Trouchón M.

 Bogotá, Noviembre 8 de 2000.