PROBLEMAS RESUELTOS 7ª QUINCENA.

Puedes encontrar los enunciados en el libro de Matemáticas 1. 1º Bachillerato . Ciencias de la Naturaleza y la Salud. Grupo Eureka: Luis Botella, Bernardina Cascón, Carmen Martín, Luis M. Millán,  Carmen Pérez y Enrique Salinas. Editorial Marfil.

1. ¿Qué marca interesa más?

2. Tanto duermes

3. Producción industrial

4. La Bolsa

 

horizontal rule

séptima quincena    página principal      octava quincena

horizontal rule

1.   ¿Qué marca interesa más?

Una asociación de consumidores está realizando un estudio sobre la calidad de las pilas alcalinas fabricadas por las marcas "Duramucho" y "Vidalarga" que tienen un precio de venta al público similar. Para ello realiza una prueba con 100 recambios da cada una, obteniendo los siguientes resultados:

Duración (en horas)

6

7

8

9

10

11

Pilas "Duramucho"

4

10

31

35

15

6

Pilas "Vidalarga"

0

6

39

42

13

1

a)        Dibuja el histograma correspondiente a cada marca.

b)        Calcula la moda, media y mediana de cada marca.

c)        ¿Qué marca crees que resulta más interesante para el consumidor?

Respuesta

a)    Aunque la tabla aparentemente presenta una variable discreta, la variable duración de la pila es claramente continua. Los valores que aparecen en la tabla deben interpretarse como marcas de clase para determinar los intervalos correspondientes ([5.5, 6.5], [6.5, 7.5] ...) y poder así dibujar correctamente el histograma.

nº de pilas

Duración (h)

Duramucho

nº de pilas

Duración (h)

Vidalarga

En el caso de variables continuas, en el eje de ordenadas se representa la densidad de frecuencia, que es la frecuencia absoluta dividida entre la amplitud del intervalo, que es la base del rectángulo, de forma que la frecuencia absoluta coincida con el área del rectángulo correspondiente..

Como en nuestro caso, todos los rectángulos tienen de base 1, la densidad de frecuencia, el área del rectángulo y la frecuencia absoluta de cada intervalo coinciden.

b)   La moda es el valor que más se repite (en el caso general, el intervalo de mayor densidad de frecuencia sería el intervalo modal).

En el caso de las pilas "Duramucho", la moda sería 9 h, si consideramos la variable discreta, o podríamos decir que el intervalo modal es [8'5,9'5], ya que la variable es continua.

En el caso de las pilas "Vidalarga", la moda sería también 9 h, o el mismo intervalo modal.

La mediana es el valor de la variable que divide al histograma en dos regiones de igual área.

En nuestro caso, la suma de todas las áreas de los rectángulos es 100, por lo que tendríamos que buscar el valor de la variable que hace que el área sea 50.

Comprueba que en ambos casos, el valor de la mediana es  8'65 h.

Para calcular la media hemos de sumar todos los valores y dividir entre el total. La fórmula recuerda que es

Actualmente las calculadoras científicas nos permiten calcularla evitándonos todo el proceso de calculo que suele ser muy laborioso. Indicamos a continuación una posible forma de hacerlo sin utilizar la calculadora, pero en adelante, dejaremos que los cálculos los haga... la calculadora.

Lo que vamos a hacer es confeccionar una tabla, en la que las columnas están formadas por los términos que aparecen en la fórmula:

Pilas "Duramucho"

 

Pilas "Vidalarga"

Intervalo

xi

ni

xi·ni

 

xi

ni

xi·ni

[5'5,6'5)

6

4

24

 

6

0

0

[6'5,7'5)

7

10

70

 

7

6

42

[7'5,8'5)

8

31

248

 

8

39

312

[8'5,9'5)

9

34

306

 

9

41

369

[9'5,10'5)

10

15

150

 

10

13

130

[10'5,11'5]

11

6

66

 

11

1

11

 

 

 

 

 

 

 

 

Total

 

100

864

 

 

100

864

Para calcular la media aritmética, vemos que es la misma en ambos casos:

c)    Ya que todas las medidas de centralización (moda, media y mediana), coinciden, para decidir la marca más interesante, deberíamos calcular la desviación típica. Recuerda que se trata de la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones, y su fórmula es:

Nos mide lo que se dispersan los valores de una distribución de su media aritmética.

Para calcularla es conveniente utilizar la calculadora. El proceso "a mano" sería:

Pilas "Duramucho"

 

Pilas "Vidalarga"

Intervalo

xi

ni

xi2

xi2·ni

 

xi

ni

xi2

xi2·ni

[5'5,6'5)

6

4

36

144

 

6

0

36

0

[6'5,7'5)

7

10

49

490

 

7

6

49

294

[7'5,8'5)

8

31

64

1984

 

8

39

64

2496

[8'5,9'5)

9

34

81

2754

 

9

41

81

3321

[9'5,10'5)

10

15

100

1500

 

10

13

100

1300

[10'5,11'5]

11

6

121

726

 

11

1

121

121

 

 

 

 

 

 

 

 

 

 

Total

 

100

 

7598

 

 

100

 

7532

 

Para las pilas "Duramucho", tenemos

 

Y para las pilas "Vidalarga":

Al haber menos dispersión en estas últimas, serían más interesantes para el consumidor.

En el caso de que las medias no fuesen las mismas, para comparar ambas distribuciones debes estudiar el coeficiente de variación

2. Tanto duermes.

Se realizó un estudio para determinar los efectos de no dormir en la capacidad de las personas para resolver problemas sencillos. Diez personas, de un nivel cultural similar, participaron en el estudio. Cada persona, después de un periodo específico sin dormir, resolvió un conjunto de problemas sencillos de cálculo y se registró el número de errores cometidos. Se obtuvieron los siguientes resultados:

Nº de horas sin dormir (X)

8

8

12

12

16

16

20

20

24

24

Nº de errores (Y)

8

6

6

10

8

14

14

12

16

12

a) Dibuja la nube de puntos y la recta de regresión.

b) Obtén el coeficiente de correlación.

c) Una persona que lleva 18 horas sin dormir realiza la prueba ¿Cuántos errores se pueden esperar?

d) Otra persona comete 15 errores ¿Cuánto tiempo lleva sin dormir?

e) ¿Son fiables las conjeturas de c) y d) ?

Respuesta

a)    Para dibujar la nube de puntos, simplemente elegimos un sistema de coordenadas. En el eje de ordenadas representamos el número de errores y en el eje de abscisas el número de horas sin dormir.

Para obtener la recta de regresión de Y sobre X,  su ecuación es

Con la calculadora se obtienen los siguientes resultados:

  sx@5'66        sy@3'35   

De acuerdo con esto, la recta de regresión sería

que tras hacer operaciones y despejar y queda:

y=0'475x+3

Ya podemos dibujar la nube de puntos y la recta de regresión:

Nube de puntos

Recta de regresión

Los datos numéricos son:

Centro de gravedad: G(16,10'6)

Recta de regresión de Y sobre X: y=0'475x+3

Coeficiente de correlación; r@0'80

b)   El coeficiente de correlación es r=0'80, como ya hemos calculado anteriormente, lo que significa que la correlación es positiva, y que los resultados que se obtengan con la recta de regresión son bastante fiables.

c)    Para calcular los errores que cabe esperar, sustituimos x=18 en la recta de regresión antes obtenida, resultando

Nº de errores=y(18)=0'475·18+3=11'55@12

d)   Para calcular el número de horas que cabe esperar que esté sin dormir, utilizando la recta de regresión de X sobre Y, que es

(ver página 236 del libro de texto)

Es decir

 Û x=1'35y+1'67

Si sustituimos y=15, obtenemos x=1'35·15+1'67=21'92@ 22 horas

Podríamos utilizar la recta Y sobre X, calculando x para y=15, y obtendríamos:

15=0'475x+3 Û x=25'26@25 horas sin dormir.

Cometemos un error bastante apreciable al hacerlo de una forma u otra, por lo que en este caso se hace necesario obtenerlo sobre la recta de regresión de X sobre Y.

Resulta interesante comparar las dos rectas de regresión Si queremos representar gráficamente la recta X sobre Y de forma que podamos compararla con la recta de regresión de Y sobre X, hemos de despejar la y de dicha ecuación, que nos quedaría

y=0'74x–1'23

La gráfica sería

Y las dos gráficas, de forma conjunta serían:

Cuanto mayor es la amplitud entre las rectas, peor es la correlación entre las variables. Este es otro procedimiento para valorar la calidad del ajuste lineal.

Hay que tener en cuenta que la escala utilizada puede influir bastante en el aspecto de las gráficas.

El valor del coeficiente de correlación también nos puede indicar si es necesario obtener ambas rectas, ya que cuanto más próximo a 1 esté (ó –1 si la correlación es negativa), más se parecerán ambas rectas.

e)    Según acabamos de decir, son bastante fiables. No obstante, algunos libros indican que la correlación es significativa si .

3. Producción industrial.

Durante 6 años consecutivos la producción industrial x de una empresa, medida en toneladas métricas, fue: 110, 125, 130, 140, 150 y 155, mientras que las compras efectuadas, expresadas en millones de euros fueron: 30, 41, 43, 47, 50 y 55. Se pide:

a) Representar los 6 puntos (x,y) (es decir (110,30), (125,41), (130,43), (140,47), (150,50) y (155,55) en unos ejes OXY y dibujar aproximadamente la recta de regresión de y sobre x. Sobre esta recta, obtener ahora gráficamente la predicción de compras a efectuar para una producción industrial de 160 millones de euros.

b) Explicar cómo se ha hecho el dibujo de la recta y la predicción.

c)  Razonar si se puede predecir o no las compras para una producción de 400 millones de euros.

Respuesta

a)      La ecuación de la recta de regresión de y sobre x es: .

En nuestro caso         

                              

y además            r@0’97         

Por lo tanto, la recta de regresión es   

que una vez efectuadas las operaciones nos queda:

y=0’51x–24’13

Ya podemos representar gráficamente la recta de regresión y la nube de puntos correspondiente:

b)      Dado que el coeficiente de correlación tiene un valor muy próximo a 1, las predicciones que se hagan con la recta de regresión serán muy fiables. Así, para x=160, obtendríamos y(160)@57.

Respuesta: Cabe esperar unas compras de unos 57 millones de euros, con bastante fiabilidad.

c)      Puesto que 400 es un número bastante alejado de los valores de la tabla, no sería muy fiable la predicción de la recta de regresión.

4. La Bolsa.

En cierto país el tipo de interés y el índice de la Bolsa en los últimos seis meses vienen dados por la tabla:

Tipo de interés

8%

7,5%

7,2%

6%

5,5%

5%

Índice de la Bolsa

120

130

135

142

150

165

Hallar el índice previsto de la Bolsa en el mes séptimo, suponiendo que el tipo de interés en ese mes fuese el 4,1%,y analiza la fiabilidad de la predicción, según el valor del coeficiente de correlación.

Respuesta

 

1º Elección de variables

Puesto que lo que nos piden es el índice de la bolsa para un cierto tipo de interés (el 4'1%), elegimos como variable X el tipo de interés, y como variable Y el índice de la bolsa.

2º. Cálculo del coeficiente de correlación.

Como sabemos el coeficiente de correlación entre ambas variables viene dado por

siendo sxy la covarianza, sx la desviación típica de la variable x y sy la desviación típica de la variable y.

Dicho coeficiente puede tomar valores comprendidos en [–1,1]. Los valores –1 y 1 se obtienen si la relación entre ambas variables es funcional y además dicha función es una función lineal, de manera que cuanto más próximo a 1 (si la correlación es positiva) o a –1 (si la correlación es negativa), esté el valor de r, mayor será la fiabilidad de los valores que podamos predecir utilizando la recta de regresión.

Teniendo en cuenta que

y puesto que si calculamos la media aritmética de cada una de las variables nos da:

          

obtenemos:

sxy@ –15'34

sx@1'1

sy@14'45

con lo cual el valor del coeficiente de correlación es    

3º Comentarios respecto al coeficiente de correlación.

El coeficiente de correlación es negativo, como era de esperar, ya que a medida que aumenta el tipo de interés, disminuye el índice de la bolsa.

Su valor nos indica que la correlación estadística que existe entre ambas variables es muy alta, y que podemos predecir resultados del índice de la bolsa, utilizando la recta de regresión de Y sobre X,  con una fiabilidad muy elevada.

Es por ello, que paso a calcular la ecuación de la recta de regresión.

4. Obtención de la recta de regresión.

La expresión que nos da la ecuación de la recta de regresión es

En este caso, tendríamos:

que una vez simplificada resulta

y= –12'73x+223'49.

5. Obtención del índice de la bolsa pedido.

Se trata de calcular el valor de y para x=4'1. Para ello sustituimos en la ecuación de la recta de regresión y obtenemos:

y= –12'73·4'1+223'49@171'31@171.

Y como ya hemos dicho antes, la fiabilidad es muy alta, dado que el valor del coeficiente de correlación es muy próximo a –1.

6º Respuesta

El valor del coeficiente de correlación es

r@ –0'97,

lo que nos permite asegurar que las predicciones que podemos hacer mediante la recta de regresión son bastante fiables.

El índice de la Bolsa que cabría esperar para un interés del 4'1% es de 171.

 

Nota: Los cálculos se han realizado con la calculadora gráfica, de forma que aunque los valores de los parámetros obtenidos se han escrito redondeando a dos decimales, se han utilizado todos los decimales para hacer las operaciones, y se han redondeado los resultados finales.

 

horizontal rule

principio    séptima quincena    página principal      octava quincena