Estadística II
ESTIMACIÓN Y
CONTRASTE DE HIPOTESIS.
CHI CUADRADO Y
REGRESIÓN. ESTADÍSTICOS DE DISTRIBUCIÓN LIBRE
Complementos y Ejercicios.
1. Los
procesos de Estimación estadística y los propios de las Pruebas o contrastación de hipótesis han sido durante mucho
tiempo los procedimientos mediante los cuales se han resuelto la mayor parte de
las situaciones en las que la inferencia estadística muestra su utilidad. Un
tercer grupo de situaciones en las cuales está presente la inferencia es el que
se relaciona con los pronósticos y, allí, es de gran importancia el
conocimiento de las técnicas asociadas con el estudio de la Regresión
cuya vinculación con el Análisis de Varianza tanto como el conocimiento
de las técnicas estadísticas denominadas de Distribución libre ó no paramétricas, constituyen el objeto de estudio de un
amplio campo temático entre los saberes propios de la
Estadística contemporánea. Algunas situaciones típicas en las cuales se aplican
los procesos y técnicas ya mencionados se hallan cuando se piensa en la
solución de cuestiones como las planteadas en los ejercicios que aquí se
incluyen:
1.1.
Se desea
estimar el número medio de horas de uso continuo hasta que cierta clase de
computadora necesite reparación por primera vez. Si se puede suponer que D.S. = 48 horas , ¿ de que tamaño debe ser la muestra para
que se puede afirmar con una probabilidad de 0.99 que el error de la estimación
no será superior a 10 horas?.
1.2.
En un estudio
de contaminación del aire, una muestra aleatoria de 8 especímenes
tomados con el viento a favor a una milla de cierta fábrica contuvieron, en
promedio, 2.26 microgramos de sustancias orgánicas solubles en benceno por
metro cúbico con D.S = 0.56. Si se usa 2.26 como una
estimación puntual de la media de la población de la que se efectúa el
muestreo, ¿ cuál es el error máximo de esta estimación si la misma se lleva a
cabo con una confianza del 95%?.¿Del 0.99?.
1.3.
En la
producción de cierto tipo de chips para circuitos electrónicos se toman
muestras con intervalos regulares de tiempo para verificar con el 5% de significancia si el
proceso se halla controlado, esto es, si en muestras de 40 de los chips se
cubren las especificaciones. ¿ Hay motivo para preocuparse si se debiera
rechazar la hipótesis nula en seis ocasiones?.
1.4.
Una muestra
aleatoria de 12 graduadas de una escuela de comercio promedió 73.2 palabras por
minuto con una D.S. = 7.9, en una prueba de
mecanografía. Pruebe con un nivel de significancia de
0.05 la hipótesis nula de que las graduadas de ésta escuela promedian 75.0
palabras por minuto en la prueba de referencia contra la hipótesis alternativa
de que promedian menos.
1.5.
En una
investigación acerca de los tiempos de reparación de dos clases de equipos de
computación se obtuvieron estos valores de los datos:
Tipo
de equipo
|
Reparaciones. (#) |
Tiempo promedio. (Min.) |
D.S. (Min.) |
|
AXELITAX |
60 |
84.2 |
19.4 |
|
EXONITAN |
60 |
91.6 |
18.8 |
a)
Pruebe con 0.01
de significancia si la diferencia entre estas dos
medias muestrales es significativa.
b) Encuentre el valor de probabilidad correspondiente al
valor calculado de z en la parte a).
c)
Use el valor
calculado en b) para decidir si se podría haber rechazado la hipótesis
nula con 0.02 como nivel de significancia.
d) Use el valor calculado en b) para decidir si se podría
haber rechazado la hipótesis nula con
0.03 como nivel de significancia.
e)
Use el valor
calculado en b) para decidir si se podría haber rechazado la hipótesis
nula con 0.04 como nivel de significancia.
2. LA DENSIDAD DE PROBABILIDAD O DISTRIBUCIÓN CHI CUADRADA (c2 , ó Ji cuadrado): es un caso especial de
la densidad GAMMA de probabilidades; a cuya formulación se llega cuando a= n/2, y b = 2. La expresión funcional mediante la cual se le identifica define a
una distribución teórica ó modelo de
probabilidades para variable continua, una de cuyas presentaciones es::
f(c2) = K (c2)n/2 –1[e] ½c2 ; para c2³ 0, donde :
(Ver CANAVOS – Probabilidad y Estadística – numeral 5.5, páginas 152 a 159).
La
distribución c2, cambia
la forma de su curva descriptiva cuando varía el número de grados de libertad.
De otra parte , el estudio de una tabla de áreas – la
función de distribución - para c2 permite establecer que a medida que aumenta el número
de grados de libertad se incrementa también el valor crítico para el rechazo de
la hipótesis nula. A pesar de que c2 es un
modelo probabilístico definido para
variables continuas, su utilización mas amplia tiene lugar al contrastar o docimar hipótesis para variables discretas cualitativas.
Para efectos operativos:
c2 = å [(fo – fe)2/ fe] ; donde fo = Frecuencias
observadas,
fe = Frecuencias esperadas.
å fo
=å fe = Total de
observaciones.
Grados
de libertad = ( Número de filas -1) x (Número
de columnas –1)
(Ver CANAVOS – Probabilidad y Estadística – numeral
10.4, páginas 370 a 374)
Las
principales situaciones en las que la distribución c2 muestra su utilidad son aquellas relacionadas
con:
·
Establecer la
independencia de variables(estudio de tablas de
contingencia).
·
Establecer la
concordancia entre unos hechos observados – en una muestra – y la distribución
teórica a la que los fenómenos
observados deberían ajustarse ( pruebas de bondad de
ajuste).
|
A favor
|
En contra
|
Indecisos
|
Totales
|
Gobiernista
|
50
|
46
|
10
|
|
Oposición
|
48
|
34
|
12
|
|
Totales
|
|
|
|
|
¿ La
información elaborada a partir de los datos recogidos permite señalar que hay
independencia entre la opinión expresada y la posición política de los
congresistas ?. Utilice 0.05 como nivel de
significación.
2.2.Al lanzar 5 monedas 320 veces, la distribución del
número de caras obtenidas se ilustra con el siguiente cuadro:
|
# de caras |
0 |
1 |
2 |
3 |
4 |
5 |
|
Frecuencia |
|
|
|
|
|
|
NOTA : Para este ejercicio cada estudiante deberá llenar la fila de frecuencias y resolver lo planteado para la situación por él diseñada.
¿
Podrá asegurarse que las 5 monedas son legales?.
Utilice un nivel de significación del 0.01. ¿Variaría la respuesta si el nivel
de Significación fuera 0.05?. Explique su respuesta.
¿ Puede
señalarse, si el riesgo de equivocarse fuera del 1% , que la apreciación acerca
del producto es independiente de la ciudad en donde se realizó el sondeo ?.
2.4. Resolver de: CANAVOS – Probabilidad y Estadística –
los ejercicios:
-
Página
375: 10.4 y 10.6. - Página 377: 10.16 a 10.18.
3. REGRESIÓN LINEAL y ANALISIS DE VARIANZA.
(Ver CANAVOS – Probabilidad y Estadística
– numerales 13.1 a 13.3 ; 13.7 y 13.8
SPIEGEL – Probabilidad y Estadística –
capítulos 8).
3.1. Resolver de: CANAVOS – Probabilidad y Estadística –
los ejercicios:
-
Página
493: 13.12 y 13.13. - Página 563: 14.2.
3.2. Resolver de: SPIEGEL – Probabilidad y Estadística –
los ejercicios:
-
Página
300: 8.74. - Página 301: 8.82, 8.84.y 8.86. - Página 302: 8.100.
4. ESTADÍSTICOS DE
DISTRIBUCIÓN LIBRE – ESTADÍSTICA NO PARAMÉTRICA.
4.1. La estadística NO PARAMÉTRICA se ocupa de estudiar los métodos de
inferencia que para su utilización no requieren de suposiciones acerca de la
forma o medidas de la distribución de la variable investigada en la población
de donde proviene la muestra seleccionada. De allí la denominación alternativa
de ESTADÍSTICOS DE DISTRIBUCIÓN LIBRE con la que, con frecuencia, se les
identifica. A la prueba CHI CUADRADA,
empleada para inferir acerca de independencia estadística entre variables o
para examinar la bondad de ajuste de unos datos empíricos a un modelo teórico,
se le suele considerar una prueba no paramétrica.
Los procedimientos estadísticos que caen
bajo esta denominación incluyen numerosas técnicas, entre las cuales se cuenta
el COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPEARMAN al que se refiere el numeral
15.6 de CANAVOS –Probabilidad y Estadística - páginas 586 a 588. Se
trata de una técnica no paramétrica empleada para
calcular la correlación existente entre variables ordinales ó entre las que sin
serlo puedan ser ordinalizadas. De allí que a esta
medida estadística se le conozca con frecuencia como el coeficiente de
correlación de datos jerarquizados. La expresión matemática empleada para el
cálculo de este coeficiente – r -- es:
4.2. Resolver
de: CANAVOS –
Probabilidad y Estadística – los ejercicios:
-
Página
592: 15.15 a 15.18..
P. Trouchón M.
Bogotá,
Noviembre 8 de 2000.