Problemas de Estadística

Variables aleatorias Binomial y Normal
 
Inferencia
Distribuciones discretas de probabilidad
Distribución Binomial
Distribuciones continuas de probabilidad
Distribución Normal
Aproximación de la Binomial por la Normal

 

Muestreo
Estimación a partir de una muestra
Test de hipótesis

VARIABLES ALEATORIAS BINOMIAL Y NORMAL


DISTRIBUCIONES DISCRETAS DE PROBABILIDAD:

1) Sea X una variable aleatoria discreta cuya función de probabilidad es:

x

0

1

2

3

4

5

p

0’1

0’2

0’1

0’4

0’1

0’1

a)      Representar gráficamente la función de probabilidad. b) Calcular las siguientes probabilidades: P(X<4’5); P(X³3); P(3£X<4’5).

P(X<4’5)=0'1+0'2+0'1+0'4+0'1=0'9

P(X³3)=0'4+0'1+0'1=0'6

P(3£X<4’5)=0'4+0'1=0'5

 

2) Sea X una variable aleatoria cuya función de probabilidad viene dada por P(X=r)=1/8; (r=2,3,..,9). Se pide hallar: a) La función de probabilidad. b) La media y la desviación típica. c) Las probabilidades: P(X<-3); P(X³6); P(4<X<7).

 
xi pi xipi xi2pi

 μ = 44/8=11/2=5'5

 σ2 = 284/8-(11/2)2=21/4
 =5'25

 σ = √(21/4)=2'29

 P(X<-3)=0
 P(X≥6)=4(1/8)=1/2=0'5
 P(4<X<7)=2(1/8)=1/4=0'25

2 1/8 2/8 4/8
3 1/8 3/8 9/8
4 1/8 4/8 16/8
5 1/8 5/8 25/8
6 1/8 6/8 36/8
7 1/8 7/8 49/8
8 1/8 8/8 64/8
9 1/8 9/8 81/8
  1 44/8 284/8

 

SUBIR


DISTRIBUCIÓN BINOMIAL:

1) Una urna contiene 60 bolas blancas y 40 bolas negras. Sacamos 8 veces una bola devolviéndola, cada vez, a la urna. ¿Cuál es la probabilidad de que salgan 5 blancas?. ¿Y más de 4 blancas?.¿Cuántas blancas saldrán por término medio?.

Es un experimento Binomial consistente en sacar 8 veces una bola, anotar el color y devolverla:

a) Son 8 pruebas independientes; b) En cada prueba pueden ocurrir dos sucesos: A=sale blanca y A'=no sale blanca; c) P(A)=0'6=p y P(A')=0'4=q son constantes.

X="nº de veces que sale bola blanca"; XєB(8,0'6).

Usando las tablas (invertidas) para n=8 q=0'4 YP(X=5)=0'2787; P(X>4)=0'2787+0'2090+0'0896+0'0168=0'5941; F=np=4'8  

2) Se lanza un dado 6 veces. ¿Cuál es la probabilidad de obtener 3 cincos?. ¿Cuál es el promedio de cincos que pueden salir y la desviación típica?.

Sol: X є B(6;1/6); P(X=3)=0'0536; 1; 0'9129

3) Si el 20% de los cerrojos producidos por una máquina son defectuosos, determinar la probabilidad de que en una muestra de 4 cerrojos:
    a. a lo sumo, 2 sean defectuosos.
    b. al menos, 1 sea correcto.
    c. el promedio de defectuosos de cada muestra de 4 cerrojos.

Sol: X є B(4,0'2); P(X≤2)=0'9728; P(X≤3)=0'9984; 0'8

4) La probabilidad de que salga cara con una moneda trucada es 0'45. Se lanza la moneda 7 veces. Calcular la probabilidad de que:
    a) Salgan exactamente tres caras.
    b) Al menos tres caras.
    c) A lo sumo tres caras.

Sol: X є B(7,0'45); P(X=3)=0'2918; P(X≥3)=0'6836; P(X≤3)=0'6082 

5) Se hace un control de calidad a 1000 coches en cuatro puntos de soldadura. Los resultados de los fallos en las soldaduras son:

nº de fallos

0

1

2

3

4

nº de coches

530

357

98

14

1

Con ayuda de las tablas ajustar los datos empíricos a una distribución binomial: Calcula las frecuencias relativas, busca la función de probabilidad binomial más parecida y calcula las frecuencias absolutas esperadas. Calcula las diferencias entre las frecuencias absolutas empíricas y las teóricas y obtener la diferencia media.

Sol: [0'5030; 0'3570; 0'0980; 0'0140; 0'0010]; [0'5220; 0'3685; 0'0975; 0'0115; 0'0005]; B(4,0'15)

6) Quinientos opositores han participado en una prueba escrita que consta de tres ejercicios. Los resultados son los que figuran el la siguiente tabla:

nº ejercicios aprobados

0

1

2

3

nº opositores

136

223

120

21

Ajustar la distribución empírica a una distribución teórica binomial y halla las frecuencias teóricas esperadas.

Sol: [0'2720; 0'4460; 0'2400; 0'0420];  [0'2963; 0'4436; 0'2389; 0'0429]; B(3,0'35)

SUBIR


DISTRIBUCIONES CONTINUAS DE PROBABILIDAD:

1) Una variable aleatoria continua X tiene como función de densidad f(x). Su  gráfica se muestra a continuación:

a.- Comprobar que f(x) es una función de densidad.
b.- Calcular la probabilidad de los siguientes sucesos:

        I.      P(X<3)

     II.      P(3<X£4)

   III.      P(X³3)

  IV.      P(X>6)

 

 

 

 

 

 

 

Sol: 0'6; 0'3; 0'4; 0

2) Una variable aleatoria continua X tiene como función de densidad f(x). Su  gráfica se muestra a continuación:

a.- Comprobar que f(x) es una función de densidad.
b.- Calcular la probabilidad de los siguientes sucesos:

        I.      P(X<0’3)

     II.      P(0’2<X£0’4)

   III.      P(X³0’3)

  IV.      P(X>2)

 

 

 

 

 

 

Sol: 0'45; 0'5; 0'55; 0

SUBIR


DISTRIBUCIÓN NORMAL:

1) Al elegir 1000 personas de una población, resultó que su talla media era 170 cm y sus deviación típica de 15 cm. Si dichos datos se distribuyen normalmente, ¿cuántas personas miden entre 191 y 214 cm?.¿Y, a lo sumo, 158 cm?.

Sol: 79; 212

2) El nivel medio de colesterol en sangre de la población adulta entre 50 y 60 años de edad es de 185 mg por cada 100 ml de sangre. La desviación típica es de 25 mg por cada 100 ml. Si las medidas se distribuyen según una normal, calcula:
a) ¿Qué porcentaje de la población tiene niveles superiores a 200 mg?
b) ¿Qué porcentaje de la población tiene niveles inferiores a 130 mg?
c) ¿Qué porcentaje de la población está comprendido entre 130 y 200 mg?

Sol: 27'43%; 1'39%; 71'18%

3) Se supone que el coeficiente intelectual de los alumnos de una Universidad se distribuye normalmente con una media de 100 y desviación típica de 20. Se pide: a) Porcentaje de alumnos que tienen coeficiente intelectual superior a 130. b) Si se toma una muestra al azar de 500 estudiantes, ¿cuántos tendrán coeficiente intelectual entre 90 y 105?.

Sol: 6'68%; 145

4) El tiempo de recuperación de los enfermos de un hospital sigue una distribución N(7,3). Se pide:
a) Probabilidad de que un enfermo esté menos de 5 días en el hospital.
b) Probabilidad de que necesite para recuperarse entre 9 y 15 días de estancia.
c) Si en el hospital hay 1000 enfermos, ¿cuántos necesitan estar más de 8 días en el hospital?.

Sol: 0'2514; 0'2476; 371

5) La duración media en funcionamiento de un televisor es de 8 años, con varianza de 1/4. Si la vida util del televisor se distribuye normalmente, se pide hallar el porcentaje de televisores que duran:
a) Más de 9 años. b) Como máximo 6 años. c) Entre 7 y 9 años.

Sol: 2'28%; 0%; 95'44%

6) El número de visitantes que diariamente acuden a una atracción se distribuyen según una N(2000,250).
a) Hallar la probabilidad de que un día determinado, el número de visitantes no supere los 2100.
b) Calcular la probabilidad de que un día cualquiera, los visitantes sean más de 1500.
c) En un día de treinta días, ¿en cuántos días cabe esperar que el número de visitantes supere los 2210?.

 

7) Los ingresos diarios en una empresa tienen una distribución normal, con media 35560 ptas y desviación típica 2530 ptas. Justificar si es razonable o no el esperar obtener un día ventas superiores a 55000 ptas. Calcula cuántos días en un año se espera obtener unas ventas superiores a 40620 ptas.

 

8) La altura de los jovenes de una determinada edad, en cm, se distribuye según N(168,8) y su peso, en Kg, según N(67,5).
a) ¿Qué porcentaje de ellos pesan entre 60 y 80 kg?
b) ¿Qué porcentaje mide entre 160 y 180 cm?.
c) ¿Se puede saber el porcentaje de de los que están a la vez en los intervalos de altura y peso anteriores?.

 

9) Las estaturas de 1400 mujeres se distribuyen según la N(168.8, 6.4). Calcular los valores µ-3σ, µ-2 σ, µ- σ, µ+ σ, µ+2 σ, µ+3 σ, y reparte a las 1400 mujeres, en los intervalos determinados por estos valores.

 

10) Aplicando un test a un grupo de 300 personas se ha obtenido una distribución normal de media 50 y desviación típica 5.
Se pide:
    a) Calcular el percentil 33.
    b) Calcular las puntuaciones que delimitan el 30% central de la distribución.
    c) Calcular el nº de personas que obtiene en el test más de 56 puntos o menos de 47.

Sol: 47'8; (48'05,51'95); 117

11) Tras un test de cultura general se observa que las puntuaciones obtenidas siguen una distribución N(65,18). Se desea clasificar a los examinados en tres grupos (de baja cultura general, de cultura general aceptable, de excelente cultura general) de modo que haya en el primero un 20% de la población, un 65% en el segundo y un 15% en el tercero. ¿Cuáles deben de ser las puntuaciones que marcan el paso de un grupo a otro?.

Sol: 49,88; 83'72

12) Un test de sensibilidad musical da resultados que se distribuyen N(65,18). Se quiere hacer un baremo por el cual, a cada persona, junto con la puntuación obtenida se le asigna uno de los siguientes comentarios:

Sol: 94'61; 77'15; 62'66; 41'96

de modo que haya, respectivamente, en cada uno de los grupos un 10%, un 35%, un 30%, un 20% y un 5% del total de individuos observados. ¿En qué puntuaciones pondrías los límites entre los distintos grupos?.

 

13) Supongamos una distribución normal de media m=50 y que el 7% de los casos tiene una puntuación por encima de 70. ¿Cuál es la desviación típica?. ¿Cuál será la probabilidad de los puntos por debajo de 45?.

Sol: 13'51; 0'3557

14) Un test de inteligencia da una puntuación que sigue una ley normal con media 100 y desviación típica 15. Encontrar un intervalo centrado en 100 que contenga el 50% de las puntuaciones. En una prueba hecha a 2500 individuos, ¿cuántos se espera que tengan una puntuación superior a 125?.

 

SUBIR


APROXIMACIÓN DE LA BINOMIAL POR LA NORMAL:

1) En una cierta población, la probabilidad de que una persona pertenezca al grupo sanguíneo A es igual a 0'38. Se toma, aleatoriamente, una muestra de 25 personas de dicha población. Halla la probabilidad de que en dicha muestra haya exactamente 5 del grupo sanguíneo A. ¿Cuántas personas del grupo A cabe esperar que haya en la referida muestra?.

  

 X es B(25,0'38); P(X=5)=25C5·(0'38)5(0'62)20=0'0298; μ=25·0'38=9'5

Se puede aproximar por una normal porque se cumplen las condiciones de Moivre:
np=9'5≥5 y nq=15'5≥5.

 X'єN(9'5, √(25·0'38·0'62))=N(9'5,2'43)

 P(X=5)=P(4'5<X'<5'5)=P((4'5-9'5)/2'43<Z>(5'5-9'5)/2'43)=
 =P(-2'06<Z<-1'65)=0'0495-0'0197=0'0298

2) En un test hay 100 preguntas con cuatro opciones de respuesta, de las que hay que seleccionar una. Si se responde totalmente al azar, ¿cuál es el número medio esperado de respuestas correctas?. ¿Cuál es la desviación típica?. ¿Cuál es la probabilidad de acertar más de 25?.

Sol: X es B(100,0'25); 25; 4'33; 0'4522

3) La probabilidad de que un golfista haga hoyo en un cierto lanzamiento es 0'2. Si lo intenta 5 veces, calcular la probabilidad de que:
    a) no acierte ninguna vez;
    b) acierte por lo menos dos veces;
    c) Supongamos que lanzara 10000 veces y su capacidad de acierto se mantuviera, ¿qué probabilidad hay de que acierte más de 2080 veces?.

Sol: 0'3277; 0'2627; 0'0222

4) El porcentaje de españoles con estudios medios es del 35%. Elegidos 8 al azar, calcular la probabilidad de que entre 3 y 5 (ambos inclusive) tengan estudios medios, aplicando:
    a) la distribución binomial;
    b) la aproximación de la binomial por la normal.

 

5) En una asociación juvenil, el 40% de los socios juegan al voleibol. En un momento dado, se trata de reunir gente para formar un equipo, por lo que se pregunta a un grupo de 15 socios si practican dicho deporte.
    a) Describir la variable aleatoria que representa el número de individuos del grupo que lo practican.
    b) ¿Cuál es la probabilidad de que en el grupo haya al menos 5 personas que jueguen a voleibol?.
    c) ¿Cuántos socios cabe esperar, por término medio, que práctiquen voleibol en un grupo de 15?.

Sol: 6; 0'7852

6) En un proceso de control de calidad se sabe que el 3% de los artículos son defectuosos. Si estos se colocan en cajas de 300, se pide:
    a) Probabilidad de que una caja contenga 10 o más artículos defectuosos.
    b) Probabilidad de que el número de defectuosos esté comprendido entre 15 y 20, ambos inclusive.
    c) Si se rechazan todas las cajas con más de 10 defectuosos y se examinan 125 cajas, ¿cuántas de ellas se rechazarán?.

Sol: 0'4325; 0'0313

7) La probabilidad de que un alumno matriculado en 2º de Bachillerato abandone los estudios es de 0'2. Si en un centro hay 100 alumnos de ese nivel, se pide:
    a) ¿De qué distribución se trata?. ¿Qué condiciones debe de cumplir para que se pueda aproximar por una normal?.
    b) Halla la probabilidad de que abandonen menos de 30 alumnos.
    c) Halla la probabilidad de que abandonen entre 10 y 20 alumnos.

Sol: 0'9913; 0'4396

8) En un centro comercial se sabe que el 35% de los clientes pagan con tarjeta
    a) Si en una caja han pagado 120 clientes, ¿cuál es el número esperado de clientes que no han pagado con tarjeta?
    b) Si en una caja han pagado 200 clientes, ¿cuál es la probabilidad de que hayan pagado con tarjeta entre 60 y 85 clientes?
    c) Si en una caja han pagado 400 clientes, ¿cuál es la probabilidad de que al menos 260 no lo hayan hecho con tarjeta?
(PAU-JUNIO 2003/2004)

Sol: 78; 0'9049; 0'5199

9) Se sabe que el 40% de las mujeres embarazadas dan a luz antes de la fecha prevista. En un hospital, han dado a luz 125 mujeres en una semana.
    a) ¿Cuál es el número esperado de mujeres a las que se les retrasó el parto?
    b) ¿Cuál es la probabilidad de que entre 45 y 60 mujeres se les haya adelantado el parto?
(PAU-SEPTIEMBRE 2003/2004)

Sol: 0'7521

10) El 70% de los alumnos de instituto tiene teléfono móvil.
    a) Si un instituto tiene 1400 alumnos ¿cuántos se espera que tengan móvil?
    b) ¿Cuál es la probabilidad de que, en una muestra de 150 alumnos, haya más de 100 con teléfono móvil?
    c) ¿Cuál es la probabilidad de que, en una muestra de 200 alumnos, haya como máximo 140 con teléfono movil?
(PAU-JUNIO 2004/2005)

Podemos considerar que estamos ante experimentos binomiales en los tres casos: 1) Se revisa a n alumnos independientemente unos de otros; 2) En cada prueba vemos si tiene teléfono móvil (A) o no (A); 3) p(A)=0'7=p y p(A)=0'3=q. La variable a considerar es X=nº de alumnos con móvil. XєB(n,0'7)

a) n=1400; μ=np=1400·0'7=980

b) n=150; ¿P(X>100)?. Se cumplen las condiciones de Moivre ya que: np=150·0'7=105≥5 y nq=150·0'3=45≥5, luego podemos aproximar la binomial por una normal X'єN(150·0'7, √(150·0'7·0'3))=N(105,5'61); teniendo en cuenta el ajuste de continuidad:

P(X>100)=P(X'>100'5)=P(Z>(100'5-105)/5'61)=P(Z>-0'80)=1-P(Z≤-0'80)=1-0'2119=0'7881

c) n=200; ¿P(X≤140)?. Se cumplen las condiciones de Moivre: np=200·0'7=140≥5 y nq=200·0'3=60≥5, luego podemos aproximar la binomial por una normal X'єN(200·0'7, √(200·0'7·0'3))=N(140,6'48); teniendo en cuenta el ajuste de continuidad:

P(X≤140)=P(X'≤140'5)=P(Z≤(140'5-140)/6'48)=P(Z≤0'08)=0'4681

Nota: Este problema se puede resolver como un problema de distribuciones de muestreo.

SUBIR


INFERENCIA


MUESTREO:

1) Una población está formada por seis elementos con valores: 2,4,6,8,10 y 12. Considerando todas las muestras posibles de tamaño 2 con reemplazamiento, se pide:
    a) La media y desviación típica de la población.
    b) La media y desviación típica de la distribución muestral de medias.

La población finita es P={2,4,6,8,10,12}

La variable X="número" sigue una distribución discreta cuya media y desviación típica se obtiene con la siguiente tabla:

 

xi pi xipi xi2pi  μx =7

 σ2x = (364/6)-72=35/3

 σ x = 3'4157

 

2 1/6 2/6 4/6
4 1/6 4/6 16/6
6 1/6 6/6 36/6
8 1/6 8/6 64/6
10 1/6 10/6 100/6
12 1/6 12/6 144/6
totales 1 7 364/6

 

Todas las muestras de tamaño 2 obtenidas con reemplazamiento junto con sus medias muestrales se recogen en la tabla siguiente:

 

{2,2}2 {2,4}3 {2,6}4 {2,8}5 {2,10}6 {2,12}7
{4,2}3 {4,4}4 {4,6}5 {4,8}6 {4,10}7 {4,12}8
{6,2}4 {6,4}5 {6,6}6 {6,8}7 {6,10}8 {6,12}9
{8,2}5 {8,4}6 {8,6}7 {8,8}8 {8,10}9 {8,12}10
{10,2}6 {10,4}7 {10,6}8 {10,8}9 {10,10}10 {10,12}11
{12,2}7 {12,4}8 {12,6}9 {12,8}10 {12,10}11 {12,12}12

La variable X="media de la muestra" sigue una distribución discreta cuya media y desviación típica se obtiene con la siguiente tabla:

xi pi xipi xi2pi  μx = 252/36=7

 σ2x = (1974/36)-72=35/6

 σ x = 2'4152

 se cumple que μx =μx
 y que  σ x = σ x:√n

 

2 1/36 2/36 4/36
3 2/36 6/36 18/36
4 3/36 12/36 48/36
5 4/36 20/36 100/36
6 5/36 30/36 180/36
7 6/36 42/36 294/36
8 5/36 40/36 320/36
9 4/36 36/36 324/36
10 3/36 30/36 300/36
11 2/36 22/36 242/36
12 1/36 12/36 144/36
totales 1 252/36 1974/36

 

2) Una población está formada por los elementos 1,2,4 y 6. a) Calcular la proporción de cifras impares; b) Para cada una de las muestras con reemplazamiento de tamaño 2, calcular la proporción de cifras impares; c) Calcular la media y la desviación típica de las distribuciones muestrales de proporciones.

La población es finita P={1,2,4,6} y las muestras de tamaño n=2 son con reemplazamiento

a) En la población la proporción de cifras impares es: p=1/4=0'25=25%

b) Todas las muestras de tamaño 2 junto con la proporción de cifras impares se muestra en la siguiente tabla:

 

{1,1}1 {1,2}0'5 {1,4}0'5 {1,6}0'5
{2,1}0'5 {2,2}0 {2,4}0 {2,6}0
{4,1}0'5 {4,2}0 {4,4}0 {4,6}0
{6,1}0'5 {6,2}0 {6,4}0 {6,6}0

 

c) La proporción de cifras impares define una variable aleatoria, p, a la que podemos tabular su distribución (en este caso la trataremos como discreta) y calcular su media y desviación típica:

 

pi pi pipi pi2pi  μ = 4/16 = 1/4 = 0'25

 σ2 = 2'5/16-(1/4)2=
  =1'5/16 = 3/32 = 0'09375
 σ
= 0'30619

 se cumple que σ = √(pq/n)

 

0 9/16 0 0
0'5 6/16 3/16 1'5/16
1 1/16 1/16 1/16
totales 1 4/16 2'5/16

 

3) Los tornillos fabricados por cierta máquina de precisión, que se distribuyen según una normal, tienen pesos medios de 142'32 g y una desviación típica de 8'5 g.
    a) Halla la probabilidad de que una muestra elegida al azar de 25 tornillos, tomada entre ellos, tenga un peso medio superior a 144'6 g
    b) Realiza el mismo cálculo si la muestra que se toma es de 100 tornillos.

X= "longitud de un tornillo"

XєN(142'32,8'5)

Como X es normal → X es también normal;  X25єN(142'32, 8'5/√25)=N(142'32,1'7); X100єN(142'32, 8'5/√100)=N(142'32,0'85)

a) P(X25>144'6)=P(Z>(144'6-142'32)/1'7))=P(Z>1'34)=1-P(Z≤1'34)=1-0'9099=0'0901

b)P(X100>144'6)=P(Z>(144'6-142'32)/0'85))=P(Z>2'68)=1-P(Z≤2'68)=1-0'9963=0'0037

4) Suponiendo que las puntuaciones de un test se distribuyen según una normal N(100,15), encontrar un intervalo de probabilidad, con un nivel de confianza del 95%, dónde se encontrará la media de las puntuaciones de una muestra de 81 personas a las que se les pasará el test. Resolver el problema, también, para un nivel de confianza del 99% y un tamaño de la muestra de 120 personas.

X="puntuación obtenida en el test"

XєN(100,15)

Tamaño de la muestra: n=81; Nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96

El intervalo de probabilidad para este tamaño de muestra y este nivel de confianza es: (100-1'96·15/√81,100+1'96·15/√81)=(96'73,103'27)

y esto significa que P(96'73<X<103'27)=0'95

Para n=120 y 1-α=0'99 → α=0'01 → α/2=0'005 → zα/2=2'575, con lo que le intervalo de probabilidad es:

(100-2'575·15/√120,100+2'575·15/√100)=(96'47, 103'53) y esto significa que P(96'47<X<103'53)=0'99

Nótese que, según la fórmula del intervalo de probabilidad, el incremento del tamaño muestral implica una disminución de la longitud del intervalo y un aumento del nivel de confianza, su alargamiento. En este caso el resultado final fue un intervalo de más longitud en el segundo caso que en el primero.

5) Se sabe que el 60% de los adultos de una determinada ciudad asisten regularmente a programas culturales. Se obtiene una muestra aleatoria de 150 adultos. Se desea conocer cuál es la probabilidad de que la proporción de los que asisten regularmente a esos programas, en dicha muestra, este comprendida entre el 50% y el 70%. También cuál es la probabilidad de que esa proporción muestral sea superior al 50%.

La población adulta está dividida en dos partes: los que asisten regularmente a programas culturales (p=0'6) y los que no asisten regularmente (q=0'4).

El tamaño de la muestra es: n=150

Como n≥30, la distribución en las muestras de la proporción de los que asisten regularmente es normal: pєN(0'6,√(0'6·0'4/150))=N(0'6,0'04)

Se pide: P(0'5<p<0'7)=P((0'5-0'6)/0'04<Z<(0'7-0'6)/0'04)=P(-2'5<Z<2'5)=0'9938-0'0062=0'9876.

Se pide a continuación: P(p>0'5)=P(Z>(0'5-0'6)/0'04)=P(Z>-2'5)=1-P(Z≤-2'5)=1-0'0062=0'9938.

6) Supongamos que el 25% de los jóvenes fuma. Calcula la probabilidad de que en una muestra de tamaño 140 encontremos que más de 70 jóvenes son fumadores. Calcula el intervalo de probabilidad al 99%, para la proporción de fumadores en muestras de tamaño 100. Interpreta este último resultado.

La población esta dividida en dos grupos: los fumadores (p=0'25) y los no fumadores (q=0'75).

El tamaño de la muestra inicialmente es: n=140. Después es: n=100

Como n≥30, la distribución en las muestras de la proporción de los fumadores es normal: p140єN(0'25,√(0'25·0'75/140))=N(0'25,0'037); p100єN(0'25,√(0'25·0'75/100))=N(0'25,0'043)

Se pide en primer lugar: P(p140>70/140)=P(p140>0'5)=P(Z>(0'5-0'25)/0'037)=P(Z>6'76)~0

Para la segunda parte considerando que el  nivel de confianza es: 1-α=0'99 → α=0'01 → α/2=0'005 → zα/2=2'575

El intervalo de probabilidad queda: (0'25-2'575√(0'25·0'75/100),0'25+2'575√(0'25*0'75/100))=(0'14, 0'36). Esto significa que para muestras de tamaño 100 la probabilidad de que en una de esas muestras salga una proporción de fumadores entre el 14% y el 36% es del 99%.


7) Una fábrica de coches lanza al mercado el modelo "Mathe" del que se sabe que sus pesos siguen una distribución normal de media 3100 Kilos y una desviación típica de 130 Kilos.
    a) ¿Cuál es la probabilidad de que, al comprar un coche Mathe, pese más de 3130 Kilos?
    b) ¿Qué distribución seguirán las muestras de tamaño 100 de coches Mathe?
    c) ¿Cuál será la probabilidad de que al comprar un coche pese más de 2900 Kilos y menos de 3500 Kilos?
(PAU-SEPTIEMBRE 2001/2002)
 

 

 

8) Un estudio indica que la proporción de individuos que enfermarán después de suministrarle una determinada vacuna es del 5%. Se toma una muestra de 400 individuo vacunados. Determinar:
    a) El número esperado de individuos que no enfermará.
    b) La probabilidad de que el número de individuos que enferman sea, como mínimo, igual a 24.
    c) Determinar la probabilidad de que el número de individuos que no enferman sea, como mínimo 372.
(PAU-SEPTIEMBRE 2000/2001)
 

 

 

SUBIR


ESTIMACIÓN A PARTIR DE UNA MUESTRA:

1) En una oposición en la que participaron miles de candidatos se hizo un examen tipo test. La desviación típica de las calificaciones fue σ =10.

  1. Si se elige una muestra de tamaño 100, con una media muestral de 71 puntos, ¿Cuál será el intervalo de confianza para la media poblacional con una probabilidad del 90%?
  2. Idem, si n=40, la media muestral es 74 y el nivel de significación 0,05.
     

X="puntuación obtenida en el test". X="puntuación media de la muestra"

Como las muestras de los dos apartados cumplen que n≥30, la distribución de las medias muestrales son normales:

X100єN(μx, 10/√100)=N(μx, 1); X40єN(μx, 10/√40)=N(μx, 1'58)

a) Tamaño de la muestra: n=100; media obtenida en la muestra: X100=71; nivel de confianza: 1-α=0'90 → α=0'10 → α/2=0'05 → zα/2=1'645;

intervalo de confianza: (71-1'645·10/√100, 71+1'645·10/√100)=(69'36,72'65). Esto significa que la media de la población se encuentra en el intervalo (69'36,72'65) con una probabilidad del 90%, o igualmente, P(69'36<μx<72'65)=0'9

b) Tamaño de la muestra: n=40; media obtenida en la muestra: X40=74; nivel de significación:  α=0'05 → α/2=0'025 → zα/2=1'96;

intervalo de confianza: (74-1'96·10/√40, 74+1'96·10/√40)=(70'90,77'10). Esto significa que la media de la población se encuentra en el intervalo (70'90,77'10) con una probabilidad del 95%, o igualmente, P(70'90<μx<77'10)=0'95

2) Una encuesta realizada a 1100 personas da los siguientes porcentajes de voto para dos partidos de ámbito nacional: partido A, 37%; partido B, 39%. Si el mismo día que se hizo la encuesta , que se supone realizada correctamente, se hubiesen realizado las elecciones, ¿resultaría estadísticamente extraño que las hubiese ganado el partido A?. Pongamos una confianza del 95%.

La población la podemos considerar formada de dos maneras: 1) los que votan al partido A y los que no lo votan; 2) los que votan al partido B y los que no lo votan.

Tamaño de la muestra: n=1100. Nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96. Tomaremos pq≤0'25.

Vamos a encontrar un intervalo de confianza para la proporción de los que votan a A, pA, y otro para la proporción de los que votan a B, pB.

Estimación de pA en la población: (0'37-1'96·√(0'25/1100), 0'37+1'96·√(0'25/1100))=(0'3405, 0'3995).

Estimación de pB en la población: (0'39-1'96·√(0'25/1100), 0'39+1'96·√(0'25/1100))=(0'3605, 0'4195).

Es decir, se estimaría a partir de la muestra (con probabilidad del 95%) que A sacaría entre el 34'05% y el 39'95% de los votos, y B entre el 36'05% y el 41'95% de los votos, por lo tanto podría haber ganado cualquiera de los dos aunque B tendría más opciones de ganar.

3) En una encuesta se pregunta a 10000 estudiantes de bachillerato sobre su consumo de refrescos semanal, encontrándose una media de 5 botes, con una desviación típica de 2.

  1. Halla los intervalos de confianza para la media al 80% y al 95% de probabilidad.
  2. Si aceptamos un error de 0,25 botes para la media poblacional con una fiabilidad de 0,2, ¿a cuántas personas es necesario entrevistar?.¿Y si queremos un nivel de confianza del 95%?.
     

X="número de refrescos consumidos a la semana"

Tamaño de la muestra: n=10000 (las distribuciones de las medias muestrales se pueden considerar normales); media de la muestra: X = 5; desviación típica de la muestra: s=2 (se tomará σ = s)

a) 1er nivel de confianza: 1-α=0'80 → α=0'20 → α/2=0'10 → zα/2=1'28; 2º nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96

I80%=(5-1'28·2/√10000, 5+1'28·2/√10000)=(4'9744, 5'0256); I95%=(5-1'96·2/√10000, 5+1'96·2/√10000)=(4'9608, 5'0392). Al aumentar la confianza aumenta la longitud del intervalo.

b) Error máximo admitido E=0'25

En el primer caso: n=(1'28·2/0'25)2 ~105 personas. En el segundo: n=(1'96·2/0'25)2 ~246 personas. Si queremos estimar la media de la población con un margen de error de ±0'2 botes para obtener más confianza en la estimación (del 80% al 95%) debemos de aumentar  el número de encuestados.

4) El nivel de colesterol (en mg/dl) para una muestra de 144 personas mayores de 60 años sigue una media de 235, con desviación típica 45. ¿Se puede admitir que la media de colesterol de la población de mayores de 60 años es de 225, con un nivel de confianza del 95%?

X="nivel de colesterol para personas mayores de 60 años"

Tamaño de la muestra: n=144 (las distribuciones se pueden considerar normales); media de la muestra: X = 235; desviación típica de la muestra: s=45 (se tomará σ = s); nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96

Calculamos el intervalo de confianza para la media de la población: (235-1'96·45/√144, 235+1'96·45/√144)=(227'65,242'35). Según este resultado la media de la población está entre 227'65 y 242'35 con una probabilidad de que así sea del 95%, luego no podemos admitir que la media de la población sea 225 con ese nivel de confianza.

5) En 1995, un informe de uno de los grandes bancos españoles afirmaba, a partir de una muestra de tamaño n=1200, que el 65% de las familias españolas tenían dificultades económicas para llegar a fin de mes. Construye el intervalo de confianza al 95% para la totalidad de las familias españolas.

La población de todas las familias españolas de ese año está dividida en dos bloques: Las que tienen dificultad económica para llegar a fin de mes (porcentaje=p) y las que no.

En la muestra de tamaño n=1200 salía como porcentaje de las que tenían dificultades p=0'65. Para un nivel de confianza del 95% se tiene: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96. Tomaremos pq≤0'25.

El intervalo de confianza para estimar p será: (0'65-1'96·√(0'25/1200),0'65+1'96·√(0'25/1200))=(0'6217, 0'6783). Es decir el porcentaje de familias españolas del año 1995 que tenían dificultades económicas para llegar a fin de mes estaba entre un 62'17% y un 68'83%, con una probabilidad de que así ocurriera del 95%

6) Un granjero quiere conocer el peso ganado por sus pollos tras un período de 15 días con una nueva alimentación. Estima el número de pollos que habrá que pesar para conocer el peso medio ganado por cada pollo, con un error máximo de 50g y una confianza del 90%, si por estudios de nutrición se sabe que la desviación típica del aumento de peso es de 150 gramos.

X="peso de los pollos después de 15 días de engorde"

Nivel de confianza: 1-α=0'90 → α=0'10 → α/2=0'05 → zα/2=1'645; desviación típica de la población: σ = 150

Error máximo admitido: E=50

Tamaño de la muestra estimado: n=(1'645·150/50)2~25

7) En una muestra aleatoria de 1000 personas, están a favor de que el ministerio de Economía mantenga la presión fiscal el 65%. Halla el intervalo de confianza del 99%. En una encuesta realizada un año antes había resultado un 68% favorable al mantenimiento de la presión. ¿Cae este valor dentro del margen de confianza de la nueva encuesta?.

En la población hay un porcentaje, p, que está a favor y otro, q, en contra.

Tamaño de la muestra: n=1000 (las distribuciones se pueden considerar normales); porcentaje a favor en la muestra:  p=0'65; nivel de confianza: 1-α=0'99 → α=0'01 → α/2=0'005 → zα/2=2'575; tomaremos pq≤0'25.

Intervalo de confianza: I=(0'65-2'575·√(0'25/1000),0'65-2'575·√(0'25/1000))=(0'6093,0'6907). El resultado de la encuesta anterior cae dentro del margen de confianza de la nueva encuesta.

8) La duración de bombillas sigue una distribución normal de media desconocida y desviación típica de 50 horas. Para estimar la duración media, se experimenta con una muestra de tamaño n. Calcula el valor de n para que, con un nivel de confianza del 95%, se haya conseguido un error en la estimación inferior a 5 horas.

 

9) El diámetro medio interior de una muestra de 200 tubos producidos por una máquina es de 0,502 cm y la desviación típica es de 0,05 cm. El uso de los tubos permite una tolerancia en el diámetro de 0,496 a 0,508 cm; de otro modo se considerarán defectuosos. Determina el porcentaje de tubos defectuosos, supuesto que los tubos producidos por esa máquina están normalmente distribuidos.

 

10) Se hizo una encuesta aleatoria entre 130 estudiantes universitarios, de los cuales 85 eran mujeres, sobre el número de horas que estudian diariamente fuera del aula, obteniéndose una media de 3'4 horas.
    a) Si la desviación típica es de 1'1 horas, obtener un intervalo de confianza, al 98%, para la media del número de horas que estudian diariamente fuera del aula los estudiantes universitarios.
    b) Obtener un intervalo de confianza, al 90%, para la proporción de mujeres entre los estudiantes universitarios.
(PAU-JUNIO 2003/2004)

X="número de horas de estudio"

En la población hay dos grupos: mujeres (cuyo porcentaje es p) y hombres (q)

Tamaño de la muestra: n=130 (las distribuciones se pueden considerar normales); media de la muestra: X = 3'4

a) Desviación típica de la población: σ lo tomamos como s =1'1; nivel de confianza: 1-α=0'98 → α=0'02 → α/2=0'01 → zα/2=2'325

I98%=(3'4-2'325·1'1/√130, 3'4+2'325·1'1/√130)=(3'18,3'62). Los estudiantes universitarios estudian entre 3'18 horas y 3'62 horas de media con una probabilidad de que así sea del 98%.

b) La proporción de mujeres en la muestra es: p=85/130=0'6538. El nivel de confianza del 90% da: 1-α=0'90 → α=0'10 → α/2=0'05 → zα/2=1'645. Tomaremos pq≤0'25.

I90%=(0'6538-1'645·√(0'25/130), 0'6538+1'645·√(0'25/130))=(0'5817,0'7259). El porcentaje de mujeres universitarias estimado está entre el 58'17% y el 72'59% con una probabilidad de que así sea del 90%.

11) En un país se sabe que la altura de la población se distribuye según una normal cuya desviación típica es igual a 10 centímetros.
    a) Si dicha media fuera de 170 centímetros, calcular la probabilidad de que la media muestral, de una muestra de 64 personas, difiera menos de un centímetro de la media de la población.
    b) ¿Cuál es el tamaño muestral que se debe tomar para estimar la media de la altura de la población con un error menor de 2 centímetros y con un nivel de confianza del 95%?
    c) Y si, en el apartado anterior, aumentamos el nivel de confianza al 99%, ¿qué tamaño muestral se necesitará?
(PAU-JUNIO 2003/2004)

X="altura de una persona en centímetros"

XєN(μ,10)→X64єN(μ, 10/√64)=N(μ, 1'25)

a) Si μ=170, P(169<X64<171)=P((169-170)/1'25<Z<(171-170)/1'25)=P(-0'8<Z<0'8)=0'7881-0'2119=0'5762

b) E=2; nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96; n=(1'96·10/2)2~97

c) E=2; nivel de confianza: 1-α=0'99 → α=0'01 → α/2=0'005 → zα/2=2'575; n=(2'575·10/2)2~166

12)  Se supone que el tiempo de reacción de un conductor, ante un obstáculo imprevisto, sigue una distribución normal con desviación típica 0'05 segundos.
    a) Si se quiere conseguir que el error de estimación de la media no supere los 0'01 segundos, con un nivel de confianza del 99%, ¿qué tamaño mínimo ha de tener la muestra de tiempos de reacción?
    b) Se toma una muestra de 100 tiempos de reacción y se obtiene una media muestral igual a 0'03 segundos. Determinar el correspondiente intervalo de confianza cuyo nivel de confianza es igual a 0'96.
(PAU-SEPTIEMBRE 2003/2004)

 

SUBIR


TEST DE HIPÓTESIS:

1) Hace algunos años la media de estatura de los españoles adultos (varones) era de 170 cm, con F =9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una media de 172 cm.

a)¿Podemos afirmar, con una confianza del 90%, que esa diferencia de 2 cm es debida al azar?.
b)¿No es posible que la estatura media haya aumentado?.
c)¿Cambiarían las conclusiones si esa media de 172 cm se hubiese obtenido tras un muestreo de tamaño n=900?.

X="estatura de los de los varones españoles adultos"

Hace algunos años μ0=170 y σ0=9, hoy en día la media es  μ1 y vamos a suponer que la desviación típica no ha cambiado σ10.

La muestra tiene tamaño: n=36 (distribuciones se consideran normales); media de la muestra: X=172

a) H0: Las medias de la población no han cambiado, μ10=170; H1: Las medias son diferentes μ1≠μ0;

Es un contraste de hipótesis de dos colas: 1-α=0'90 → α=0'10 → α/2=0'05 → zα/2=1'645;

De ser cierta la H0, entonces encontraríamos que la media de la muestra estaría en el intervalo (170-1'645·9/√36, 170-1'645·9/√36) = (167'53,172,47) con una probabilidad de sea así del 90%. Como la media de la muestra cae en ese intervalo, es decir, ha ocurrido un suceso que tiene el 90% de probabilidad de ocurrir, entonces aceptamos H0 y rechazamos H1. Podemos cometer un error β con esta decisión.

b) H0: Las medias de la población no han cambiado, μ10=170; H1: Las media actual ha aumentado μ10;

Es un contraste de hipótesis de una cola: 1-α=0'90 → α=0'10 → zα=1'28;

De ser cierta la H0, entonces encontraríamos que la media de la muestra estaría en el intervalo (-∞, 170+1'28·9/√36)=(-∞,171'92). Como la media de la muestra no cae entre estos límites, no ha ocurrido este suceso que tenía un 90% de probabilidades de ocurrir si la hipótesis nula fuese verdadera. En conclusión rechazamos H0 y aceptamos la alternativa  H1 admitiendo que podemos cometer un error α en esta decisión.

c) En el primer caso la región de aceptación sería: (170-1'645·9/√900, 170-1'645·9/√900) = (169'51,170'49), como 172 no pertenece al intervalo el resultado sería diferente, rechazaríamos H0 y aceptaríamos H1.

En el segundo caso la región de aceptación sería: (-∞, 170+1'28·9/√900)=(-∞,170'38) y como 172 sigue estando fuera de este intervalo se mantendrían las conclusiones anteriores.

2) Supongamos que, respecto a una determinada ley, el 52% de los ciudadanos está en contra. Pasado un tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han descendido hasta el 49%. Para una significación de 0.05, nos planteamos:

¿Se admite que ha cambiado, realmente la opinión pública, o tal resultado es debido al azar?.
¿Se admite que ha disminuido el porcentaje de ciudadanos en contra de esa ley?.

 

3) La Concejalía de salud de una ciudad tiene serias dudas sobre el nivel de proteínas de los ciudadanos: se sospecha que ha descendido. Tal nivel es considerado normal si vale 7.25 gramos por decilítro, con desviación típica F =0.71. Para contratar las dudas se realiza un muestreo con 35 personas, del que se obtiene una media de 6.85. Si se desea una confianza en los resultados del 97.5%, ¿puede asegurarse que el nivel de proteínas ha descendido?.

 

4) Una encuesta a 64 profesionales de una institución reveló que el tiempo medio de empleo en dicha profesión era de 5 años con desviación típica de 4. Considerando un nivel de significación del 0.05, ¿sirven estos datos para afirmar que el tiempo medio de empleo de los profesionales de esta institución está por debajo de los 6 años?. Suponemos normales las distribuciones.

 

5) Un experto en temas electorales, basado en los resultados de anteriores comicios, sostiene que, si se celebran elecciones generales en la actualidad, tan sólo acudiría a votar el 48% del electorado. Sin embargo, en un sondeo electoral realizado recientemente con una muestra de 1500 personas, 800 manifiestan su intención de votar. Plantea la prueba de hipótesis más adecuada, para un nivel de significación de 0.05 y comenta el resultado.

 

6) Existe la hipótesis de que en una determinada región realizan estudios de nivel medio el mismo número de varones que de mujeres. Mediante un sistema aleatorio tomamos una muestra de 1000 expedientes escolares, de los cuales 532 son varones y 468 son mujeres. ¿Es este un resultado poco probable o, por el contrario, se ajusta a la gran mayoría del 99% de los resultados?.

 

7) Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías, se eligieron 300 nueces al azar y se detectaron 21 vacías.
    a) Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la marca?.
    b) Si se mantiene el porcentaje muestral de nueces que están vacías y 1-α=0'95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces vacías con un error menor del 1%?
(PAU-JUNIO 2004/2005)

La proporción de nueces vacías vamos a llamarle p.

El tamaño de la muestra es: n=300 (distribuciones se pueden considerar normales). La proporción de nueces vacías encontradas en la muestra fue p=21/300=0'07.

a) H0: La marca dice que p≤0'06 ; H1: La alternativa es que p>0'06.

Es un contraste de una cola: α=0'01 →  zα=2'325.

De ser cierta la hipótesis nula entonces la región de aceptación sería:  (-∞, 0'06+2'325·√(0'06·0'94/300))=(-∞,0'09). Como la proporción muestral cae dentro de este intervalo se verifica un intervalo con una probabilidad de ocurrir del 99%, por lo tanto aceptamos la hipótesis nula H0 y rechazamos la alternativa  H1. Podemos cometer un error β.

b) Para un nivel de confianza:1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96. Estimamos el porcentaje de nueces vacías de la población con un intervalo de confianza. Si el error máximo admitido es: E=0'01, entonces el tamaño de la muestra debe de ser: n=1'962·0'07·0'97/0'012~2609.

8) En una muestra de 900 páginas escritas por alumnos de bachillerato, 351 tenían algún tipo de falta de ortografía.
    a) Determinar un intervalo de confianza, de nivel igual a 0'95, para la proporción de páginas con faltas de ortografía.
    b) Si α=0'1, ¿se podría rechazar la hipótesis de que, como máximo, el 38% de las páginas escritas por los alumnos de bachillerato tienen algún tipo de faltas de ortografía?
(PAU-Septiembre 2004/2005)

La proporción de páginas con faltas de ortografía le llamaremos p.

La muestra tiene de tamaño n=900, y la proporción muestral p=351/900=0'39

a) Para nivel de confianza 0'95 se tiene: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96

El intervalo de confianza para p será: (0'39-1'96·√(0'25/900),0'39+1'96·√(0'25/900))=(0'36,0'42). Es decir, P(0'36<p<0'42)=0'95

b) H0: La proporción de páginas con faltas p≤0'38 ; H1: La alternativa es que p>0'38.

 Para α=0'1 se tiene:1-α=0'90 → α=0'10 → zα=1'28; La región o suceso de aceptación es: (-∞,0'38+1'28·√(0'38·0'62/900))=(-∞, 0'40), y, como 0'39 pertenece a este intervalo, aceptamos la hipótesis nula H0 con un error de equivocarnos β.

9) Un vendedor de paquetes de carbón para barbacoa afirma que el peso medio de cada paquete es, como mínimo, de 20 kgr. Para contrastar esto se toma una muestra de 9 paquetes, obteniéndose una media de 19'3 kgr. Si se supone que el peso de los paquetes sigue una distribución normal con desviación típica de 1 kgr:
    a) Determinar si se puede aceptar la afirmación con α=0'05.
    b) Con un nivel de confianza del 90%, ¿qué tamaño muestral es necesario para estimar el peso medio de un paquete de carbón con un error menor de 0'2 kgr.?
(PAU-Septiembre 2004/2005)

 

 

SUBIR