Activa JavaScript para disfrutar de los vídeos de la Mediateca.
4-3BSO1 - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
En principio de la clase os voy a preguntar que si alguien tiene algún inconveniente en que la grabemos, pues dejamos de grabar y nos olvidamos del tema.
00:00:00
Y si no, pues supongo que estáis de acuerdo, que nos favorece el que tengáis la grabación de la clase.
00:00:11
¿De acuerdo? Bueno, pues dicho eso, vamos a verlo. Vamos a compartir la pantalla y vamos a la clase de hoy.
00:00:20
La clase del viernes no la subí porque era idéntica a la del lunes pasado. La del lunes creo que me quedó bastante mejor y en la del viernes hubo un par de interrupciones y no sé, pensé que era mejor.
00:00:32
Mejor dejarla que está porque es que para el caso todo era...
00:00:48
Bueno, en esta evaluación os recuerdo que tenemos el bloque que es de probabilidad estadística.
00:00:55
De estadística hay un tema que es de variables unidimensionales que es el que ocupa la novena quincena y la décima quincena está con distribuciones estadísticas bidimensionales.
00:01:04
Os dije que esto en realidad es un ejercicio, es un ejercicio tipo, yo creo que es un ejercicio bastante asequible, que merece la pena que lo hagáis.
00:01:16
y bueno, además que de vez en cuando tenéis una pista para saber si el ejercicio os ha salido bien o no.
00:01:35
Me refiero sobre todo cuando calculáis el coeficiente de correlación.
00:01:45
Bueno, entonces, el otro día vimos la gran distribución bidimensional,
00:01:50
vimos que no íbamos a ver tablas de doble entrada, o sea, que esto sin frecuencias
00:01:55
y vimos lo que era la nube de puntos
00:02:01
para hacernos una idea de que va la correlación lineal
00:02:05
insisto, lineal
00:02:08
que todo lo que sea lineal es relativo a rectas
00:02:10
a nubes de puntos que se pueden aproximar por rectas
00:02:15
y bueno, las fórmulas que tenéis que saber
00:02:18
son la de la recta de regresión
00:02:22
bueno, para la recta de regresión necesitáis conocer
00:02:25
Lo primero, lo que es la covarianza. La covarianza, si os acordáis, se calcula añadiendo una columna o una fila en la serie de datos, dividiendo entre el número de datos y restando el producto de las medias. De tal forma que conviene que calculeis la media de cada una de las variables con la calculadora.
00:02:28
Bueno, insisto, el que no sepa hacerlo con la calculadora lo tendría que hacer a mano. Yo hice un ejemplo el primer día. Creo que no merece la pena. Os he dejado los dos tutoriales, según la calculadora que utilicéis, los dos más típicos.
00:02:52
O si alguien tiene una calculadora un poco más extraña, pues que me lo diga y ya le busque un tutorial al uso.
00:03:10
La covariación de una distribución bidimensional puede ser positiva o negativa.
00:03:19
Es muy raro que se haga cero.
00:03:25
Y, bueno, si la correlación es positiva, se supone que la correlación entre las dos variables implica que a mayor valor de la X le va a salir mayor valor de la Y.
00:03:26
Esto puede ser con más o menos seguridad dependiendo luego del coeficiente de correlación.
00:03:46
Entonces, esta era en principio la interpretación de la covarianza, si la correlación es positiva o negativa, luego tenéis que saber la fórmula de la recta de regresión, yo me la aprendo muy fácil cogiendo a la x le resto su media, a la y le resto su media y luego esto sí que es un poco más extraño.
00:03:52
La covarianza, que es lo que habéis calculado antes, y abajo se pone el cuadrado de la desviación típica, que esa se ha hecho con un calzado.
00:04:18
Por otra parte, fijaos entre esto y esto, es muy parecido.
00:04:28
La covarianza, para hacer el coeficiente de correlación, la covarianza siempre está en el numerador.
00:04:33
Y aquí en vez de ser el cuadrado de la desviación típica de la X, se multiplican las dos desviaciones típicas que nos han sido.
00:04:39
Es importante, el valor del coeficiente de correlación no puede ser ni más pequeño que menos uno, ni mayor que uno.
00:04:45
Si pasa eso es que el ejercicio no está bien.
00:04:55
Salvo, a veces puede quedar un 1,01 porque ha habido un redondeo y entonces los datos no son exactamente precisos, pero bueno, esto es lo más raro.
00:05:00
Entonces, el coeficiente de correlación es un número que está comprendido entre menos 1 y 1.
00:05:10
Cuanto más se acerca a 1 o a menos 1, la correlación es más fuerte.
00:05:18
Y cuanto más próximo es a 0, la correlación es débil.
00:05:24
Insisto, la correlación es lineal.
00:05:33
Eso quiere decir que no van a estar muy aproximadas las nubes de puntos a una recta, aunque sí pueden adoptar alguna figura, alguna forma que sea parecida.
00:05:36
Bueno, este ejercicio, yo no sé si lo hicimos el otro día, creo que lo hicimos en la clase, pero bueno. Vamos a hacerlo para recordar un poco lo que era el coeficiente de correlación y cómo se puede aplicar a un D.
00:05:50
Esto es la idea intuitiva. Luego, al final, lo que vale en realidad son las cuentas. Las cuentas es el ejercicio que os digo que es en lo que se basa todo el tema. Todo el tema es un ejercicio que suele caer, por supuesto.
00:06:23
Bueno, a ver, aquí nos dice, los coeficientes de correlación de estas distribuciones bidimensionales son en valor absoluto 0,55, 0,75, 0,87 y 0,96.
00:06:42
Entonces, dice, asigna cada ruido cambiando el signo cuando proceda, porque aquí dice en valor absoluto.
00:06:55
A ver, yo diría que los términos que se aproximan más a una recta son la nube de puntos que se parecen más a una recta, yo diría que es esto.
00:07:01
Entonces, aquí el valor absoluto se tiene que acercar lo más posible a 1.
00:07:17
El valor más cerca a 1 a 1 es 0,96.
00:07:23
¿Pero qué es lo que ocurre?
00:07:27
Que aquí esta recta tiene pendiente negativa.
00:07:29
La correlación es negativa, por lo cual yo diría que este es el coeficiente de correlación que está asociado a esta nube de puntos.
00:07:33
Después de este, pues yo diría que lo que más se parece a una recta, a la nube de puntos que se aproxima más a una recta, yo diría que es este.
00:07:44
Esto hay gente que lo hace muy bien a ojo, a mí no me sale muy bien, pero vamos, yo diría que si tomo esta recta que es más dispersa.
00:07:55
Aquí los puntos están más separados y aquí los puntos están muy separados.
00:08:08
Yo diría que aquí esta recta debería ser positiva, pero alguno podría decir que se acerca más una de aquí.
00:08:14
Entonces, ya os digo, esto es un poco subjetivo.
00:08:21
bueno, la segunda
00:08:25
correlación más fuerte es esta
00:08:28
y vuelve a ser negativa
00:08:30
pues menos 0,87
00:08:32
yo aquí sí que diría
00:08:34
que la correlación es positiva
00:08:38
es 0,75
00:08:40
no es tan fuerte
00:08:41
como la anterior
00:08:44
más o menos
00:08:45
sigue la trayectoria más recta
00:08:46
pero para nada
00:08:50
se parece eso más recta
00:08:51
Y aquí está muchísimo, esto ya diríamos, de 0.5 para abajo la correlación es débil.
00:08:53
Entonces esta es media tirando a débil.
00:09:01
Entonces con este color, pues estaría que es menos 0.5.
00:09:07
Esto es la idea. ¿Por qué os doy esta idea?
00:09:11
Pues porque yo creo que si os doy una recta de regresión con esta nube de puntos o con esta nube de puntos
00:09:15
Y dais un valor intermedio, que es lo que vamos a hacer al final, pues aquí veis que la estimación es bastante fiable. En cambio aquí es menos fiable. No creo que sea demasiado mala, pero no es fiable. Pero aquí se ve que los datos están mucho más dispersos.
00:09:22
Bueno, pues vamos al caso que es, vamos ya al ejercicio. Voy a hacer uno porque este es exactamente, a mí esto es lo que me gusta preguntar en un examen, exactamente esto.
00:09:42
No están dos series de datos, en este caso de edades y pesos, y se obtienen determinados resultados. Y lo que queremos hacer es la estimación, una estimación y ver si es fiable esa estimación.
00:10:06
A mí eso es lo que me doy mucha importancia, porque le veis la utilidad. Cuando hacéis una estimación, ¿va a ser buena o tenéis que decir, bueno, espero que sea esto, pero tampoco os esperéis gran precisión, ¿no?
00:10:24
vamos a ver
00:10:39
se observan las edades de 5 niñas
00:10:42
y sus pesos respectivos y se obtienen
00:10:45
los siguientes
00:10:47
entonces, yo tengo una serie
00:10:47
de datos
00:10:52
que es X, de la cual
00:10:53
puedo calcular una media y una desmedida
00:10:56
y eso como lo hago
00:10:58
con el cauto
00:11:00
si la tenéis a mano
00:11:01
y podéis hacerla conmigo
00:11:04
estupendo, si tenéis el otro
00:11:06
modelo, pues
00:11:08
También podréis hacerlo si ya habéis visto el tutorial.
00:11:10
Tengo cinco niños.
00:11:17
Primero tengo que poner la calculadora en modo estadístico.
00:11:21
Yo ahora mismo la tengo.
00:11:24
Tengo que borrar los datos anteriores, que serían SID, LIAB o NO.
00:11:26
Pero igual, se supone que no tengo datos.
00:11:32
y entonces pongo 2m más, 4,5m más, 6m más, 7,2m más, 8m más.
00:11:34
Me pone la calculadora n igual a 5, le doy a SIF 2, 1 y la media me sale 5,54.
00:11:48
Aquí siempre os diré, coged siempre dos decimales. Esto como sale 5,54 exacto, pongo igual.
00:11:58
Pero a la hora de hacer la desviación típica, la desviación típica generalmente no sale exacta, sale aproximadamente 2,13.
00:12:08
Si sale 2,13, pongo el signo de aproximado. 2,13.
00:12:16
Esto serían años. Esos niños tienen una media de 5,54 años y una desviación típica de 2 puntos.
00:12:21
Lo que estoy viendo es si el peso va aumentando con la edad según una recta o la cosa se dispara o se queda una cosa más parecida a una parábola o una cosa un poco más parecida a una función logarítmica.
00:12:35
Bueno, entonces yo tengo una serie de datos que es X y ahora tengo una serie de datos Y. Borro los datos. Os voy diciendo las cosas en las que soléis olvidar. La primera, que no se os olvide, borrar los datos.
00:12:54
SIF, CLIA, 1, les sale igual, ya tengo 0 datos y ahora 15, N más, 19, N más, 25, N más, 33, N más y 34.
00:13:11
a muchos se os olvida
00:13:29
dar el último M más
00:13:31
en la calculadora
00:13:33
en la pantalla pone N igual a 5
00:13:35
y ahora la media sería
00:13:37
6, 2, 1
00:13:39
aquí hay veces que se os olvida darle al igual
00:13:41
25,2
00:13:46
y la desviación típica
00:13:47
de la I pues hago
00:13:53
6, 2, 2
00:13:55
y me sale 7,40
00:13:56
esto sería
00:14:00
kilogramos
00:14:02
Entonces, para hacer la covarianza, tengo aquí que hacer la columna, bueno, en este caso la fila, xy por yy.
00:14:02
Tengo que ir multiplicando. 2 por 15, 30.
00:14:14
4,5 por 19, 85,5.
00:14:18
6 por 25, 150.
00:14:27
7,2 por 33, 236.
00:14:34
237,6 y 8 por 34 que sería 250. Sumo todos estos datos. Esto se llama la suma de x y por y sub i.
00:14:41
A mi me sale 272 más 237,6 más 150 más 85,5 más 30.
00:15:01
Y me sale 775,1.
00:15:17
Estos son todos los cálculos previos a todo lo que me va a meter.
00:15:23
Ahora, ¿cómo hago la covarianza?
00:15:28
Pues la covarianza consiste en tomar esa suma que nos ha salido, 775,1, dividir entre el número de datos, que son 5, y restarle el producto de las medias, que son 5,54 por 25,2.
00:15:29
Hago esto. La covarianza no tiene unidades porque mezcla años con kilos. 775,1 dividido entre 5, menos 5,54 por 5,2.
00:15:55
Me sale 15, aproximadamente, 15,41. ¿Sí? Entonces, ya puedo hacer todas las pruebas.
00:16:12
En el apartado A, estos son los cálculos previos, apartado A, coeficiente de correlación. El coeficiente de correlación es la covarianza partido por el producto de las desviaciones típicas.
00:16:28
Pues ya está, 15,41 dividido entre 2,13 por 7,49. Acordaos que aquí con la calculadora que tenéis vosotros hay que hacerlo con pánico.
00:16:44
Voy a hacer con la calculadora que tengo aquí, para que no tengáis ningún fallo, porque esto tiene que salir un número que está entre menos uno y uno.
00:17:05
A ver, sería 15,41 dividido entre, abrís paréntesis, 2,13 por 7,41.
00:17:16
Y esto sale 0,97 aproximadamente, aproximadamente 0,97. Como veis es menor que 1, con lo cual yo supongo que está bien.
00:17:30
Bueno, esto me dice que la correlación es muy fuerte, porque se acerca muy fuerte y positiva.
00:17:48
O sea, que entre los 2 y los 8 años parece que los pesos van subiendo como en línea recta y parece que se va a poder hacer una bonanza.
00:17:57
Bueno, el apartado D dice ¿qué peso correspondería a un niño de 5 años?
00:18:12
Para un niño de 5 años lo que tengo que hacer es, acordaos, como un acuerdo de la fórmula de la recta de progresión.
00:18:16
A y le resto su media, a x le resto su media y aquí la pendiente de la recta hemos dicho que era la covarianza partido por la desviación típica de x al cuadrado, que es lo mismo que la varianza.
00:18:26
Bueno, pues aquí sustituís y cogéis y igual a sigma xy es 15,41 partido por la desviación típica que es 2,13 al cuadrado por x.
00:18:41
X es igual a 5
00:19:02
¿Qué peso le corresponde
00:19:07
al número de 5X?
00:19:13
Pues hago 5 menos
00:19:15
la media de la X que es
00:19:17
5,50 y que no se os olvide
00:19:19
que tenéis aquí una cosa razonable
00:19:23
que esto que está restando
00:19:24
va a pasar
00:19:26
subido, o sea que aquí sería
00:19:29
la media de la X
00:19:32
que es 25,2
00:19:36
Esto lo hacemos con la calculadora.
00:19:38
11,91 dividido entre 2,13 al cuadrado por 5 menos 5,54 más 25,2 y me sale 23,37.
00:19:40
3,37
00:20:14
por coherencia redondea los dos decimales
00:20:17
hace buenos redondeos
00:20:20
tenéis que saber si se redondea a 36
00:20:22
por último
00:20:25
¿es fiable la estimación?
00:20:28
pues vamos a ver
00:20:33
primera cosa
00:20:35
el valor de x
00:20:37
x es igual a 5
00:20:39
es un valor
00:20:43
entre
00:20:45
2 y 8.
00:20:47
Si yo pusiera, por ejemplo,
00:20:50
x igual a 95,
00:20:51
pues una persona de 95
00:20:54
años que debe saber yo lo que va a saber
00:20:55
el otro.
00:20:58
Eso se llama extrapolar.
00:20:59
Esto es solamente
00:21:02
un poder. Esto, en principio,
00:21:03
parece que
00:21:05
los valores de las edades
00:21:06
están entre 2 y 8.
00:21:09
Y, por otra parte,
00:21:11
El coeficiente de correlación es 0,97. Por lo cual, la correlación es muy fuerte. Esto se acerca muchísimo a 1. Muy fuerte. Entonces, yo sabiendo estas dos cosas, yo diría que es fiable.
00:21:13
Es fiable. ¿Puede haber fallos? Sí, pero yo diría que es bastante probable que nos acerquemos bastante al peso de este niño.
00:21:33
bueno, pues esto es
00:21:45
este es el ejercicio
00:21:50
típico
00:21:52
si alguno lo tiene hecho
00:21:53
ya de la semana pasada, que es posible
00:22:00
es repetirlo
00:22:02
porque es que es lo mismo
00:22:04
y ya a partir de ahí que hagáis uno o dos
00:22:05
y que, vamos
00:22:08
los que necesitéis hasta que os salga
00:22:10
porque este ejercicio
00:22:12
es muy asequible y os tiene que salir.
00:22:13
¿Vale?
00:22:16
Bueno, dicho eso,
00:22:18
la próxima quincena
00:22:19
vamos a
00:22:22
empezar el tema de probabilidad.
00:22:23
En esos temas de probabilidad
00:22:29
ya estamos cambiando bastante
00:22:31
de tercio.
00:22:32
Con lo cual,
00:22:37
hoy quería aprovechar
00:22:38
para hacer algunos ejercicios de repaso
00:22:39
para que recordéis lo fundamental de las unidades de ejercicio.
00:22:42
¿De acuerdo?
00:22:45
Entonces, esto espero que os cueste ya también menos
00:22:48
y que me digáis.
00:22:51
Bueno, vamos a ver.
00:22:56
Aquí se han examinado 100 lavadoras
00:22:58
de distintas marcas comerciales
00:23:01
y se ha notado el número de averías que ha tenido a lo largo de 10 años.
00:23:04
¿Sí?
00:23:10
Bueno, primera cosa.
00:23:10
Primera cosa.
00:23:12
Esto es XY y esto es su frecuencia. No es que en una lavadora de cero averías tenga que esto ha sido 30 años.
00:23:13
Yo lo que estoy diciendo es que aquí hay 30 lavadoras que han tenido cero averías. 28 que han tenido una, 17 que han tenido dos, 15 que han tenido tres y 10 que han tenido seis.
00:23:31
Cuidado con esto cuando tengáis una tabla que veáis lo primero, si esto es una distribución unidimensional o bidimensional.
00:23:44
En este caso es unidimensional.
00:23:52
Bueno, ¿por qué lo sé?
00:23:58
Pues porque estas son las frecuencias.
00:24:00
No es lo mismo el otro, que era un niño que tenía tantos años y su peso era este.
00:24:04
Eran dos datos distintos que habíamos recogido de un mismo individuo.
00:24:12
Estos son cien balabadoras y estamos viendo qué datos está repitiendo cada vez. Entonces, llegado aquí y alguien me ha escrito con la siguiente. La media y la desviación típica. Si la hago con la calculadora, ¿tengo que escribir algo? La respuesta es no. Y ya os digo, podéis hacerlo como queráis.
00:24:15
ahora bien
00:24:38
que lo hacéis con calculadora
00:24:40
es que lo siento
00:24:43
porque es que en esta calculadora
00:24:44
no sé por qué no funciona
00:24:46
ah bueno
00:24:48
no, es que este es el otro tipo
00:24:50
de calculadora, entonces no os puedo
00:24:52
explicar cómo se hace con esta calculadora
00:24:54
que creo que era la más complicada
00:24:56
bueno, entonces
00:24:58
yo voy a hacer con la calculadora
00:25:00
mía, la que tengo aquí
00:25:02
la media y la desviación típica
00:25:04
si lo hacéis con calculadora
00:25:06
media y desviación
00:25:08
típica. Si lo hacéis con
00:25:18
calculadora, solo tenéis
00:25:25
que escribir el resultado.
00:25:29
Entonces, la media
00:25:32
de la X y
00:25:33
la desviación típica de la X.
00:25:35
Y ahora, ¿qué diferencia
00:25:38
hay con los de estadística
00:25:39
unidimensional?
00:25:41
Primera cosa,
00:25:43
quiero hacerme de desviación típica
00:25:45
o recuerdo, SIF
00:25:47
CLIAR, SIF 9, le dais a 1.
00:25:49
Ya están todos los datos borrados. Y ahora, con esta calculadora, que no es la otra, a ver, ¿cómo hago la media? A ver, tengo con cero averías, pongo cero, y ahora, para poner que hay 30 lavadoras que tienen cero averías, tengo que darle a SIF y a la coma.
00:25:52
sale un punto y una coma en la pantalla
00:26:16
y pongo 30
00:26:19
si ahora le doy a n más
00:26:20
me pone n igual a
00:26:22
30, ¿por qué? porque he metido
00:26:25
30 datos de golpe
00:26:27
ahora quiero meter
00:26:28
que con una avería
00:26:30
o sea, uno, hay 28
00:26:32
lavadoras, pues le doy
00:26:35
shift coma 28
00:26:36
le doy a n más
00:26:39
y os pondrá 58
00:26:41
¿por qué 58?
00:26:43
Pues las 30 primeras y estas 28, 58. Continúo con 2, 6, 17. M más. Me salen 75. 3, 6, 15. M más. Me salen 90.
00:26:44
Y por último, 6, 5, 10 en menos. Y me salen 100 datos. Es precisamente las simuladoras que me salen. O sea, que todo esto parece que está correcto. Y ahora le doy así, 2, 1. Igual, que no se os olvide, y sale 1,67 averías por término medio. El promedio es 1,67.
00:27:08
Y ahora, se espera que después de dos años, pues que, vamos, un poco antes de dos años, sea la primera variable. Y ahora, la desviación típica sería, si 2, le dais al 2, al igual, y sale aproximadamente 1,77.
00:27:34
Le pongo 1,77. Como veis, la media no es muy alta y la desviación típica en relación con la media es bastante alta. O sea, hay lavadoras que posiblemente se estropeen muy pronto y otras que van a tardar, pues, tres años por lo menos.
00:28:00
bueno y ahora
00:28:21
¿cómo hago la mediana y la moda?
00:28:23
pues para hacer la mediana y la moda
00:28:25
para hacer la mediana y la moda
00:28:27
pues bueno, la moda
00:28:36
se ve
00:28:38
que es cero averías
00:28:38
porque es el valor
00:28:41
la frecuencia mayor
00:28:48
que estrella
00:28:51
y para hacer la mediana
00:28:52
a mí me gusta más ponerla en columnas
00:28:54
estos ya son mías
00:28:57
a ver, esto sería el número de averías
00:28:58
Esto sería la frecuencia. Entonces, cogería la frecuencia acumulada. Número de averías. 0, 1, 2, 3 y 6. Frecuencia. 30, 28, 17, 15 y 10.
00:29:01
Y ahora, las acumuladas acordadas. Cero averías, 30 lavadoras. Cero o una avería, 30 más 28, 58 lavadoras. Cero o una o dos averías, 58 más 17, 75 lavadoras. Hasta tres averías serían 90 y hasta cuatro averías, hasta seis averías serían 100.
00:29:23
¿Sí? Entonces, si yo ordeno de menor a mayor el término medio, bueno, los términos medios de 100 elementos, pues acordaos que son, como el número es par, hay dos.
00:29:46
Son el 50 y el 51. Los dos están aquí. Los dos están, valen uno. Entonces, la mediana vale uno.
00:30:20
O sea, la mitad de las lavadoras van a tener menos de una avería o una avería y la otra mitad menos de una avería o menos, ¿vale? Pues esta es la idea de Borobudur.
00:30:51
Este es el repaso de cómo se calculan las medidas de centralización y, bueno, aunque no lo pide, recuerdo que el rango es el mayor valor, valor menos el menor, pues sería 6 menos 0, que es 6.
00:31:08
La mediana también son averías, una avería y aquí, he equivocado, porque la media y la desviación típica también son averías.
00:31:42
O sea que en 10 años la media de averías es 1,63.
00:32:07
Bueno, pues esto es un ejercicio básico de parametrización y dispersión.
00:32:15
Bueno, si veis el examen del curso pasado, en este algo creo que había que calcular. Vamos, son los tres ejercicios típicos.
00:32:27
Este es un ejercicio de regresión. Vamos a hacerlo.
00:32:46
La siguiente tabla relaciona las horas dedicadas al estudio diario y el número de suspensos que obtiene un alumno a final de curso.
00:32:59
Y se calcula la covarianza, el coeficiente de correlación.
00:33:11
Bueno, pues esto ya os digo.
00:33:16
De la forma más rápida posible lo vamos a ir haciendo.
00:33:18
A ver, cuestiones previas.
00:33:22
Tengo que calcular la media de la X, la media de la Y, la desviación típica de la X y la desviación típica de la Y.
00:33:24
Esto seguramente será aproximado con dos decimales.
00:33:36
entonces, esto sé que es un ejercicio
00:33:39
de correlación, porque esto es X
00:33:43
y esto es Y, no son frecuencias
00:33:45
esto quiere decir que hay un alumno
00:33:48
aquí, a ver, hay 1, 2, 3
00:33:51
4, 5, 6, 7 y 8 datos
00:33:54
¿no? entonces se supone
00:34:00
que es un alumno que si estudia a hacer horas
00:34:05
suspende 7, si estudia a una
00:34:09
suspender 7, suspender 2, suspender 5
00:34:12
y ya estudiando 6 horas
00:34:14
o 7 horas luego
00:34:16
como pudiera
00:34:17
suspendería hacer
00:34:18
acordaos, número de datos
00:34:21
8
00:34:24
bueno, entonces
00:34:24
nos ponemos
00:34:28
directamente con la calculadora
00:34:29
ya os digo que
00:34:32
lo voy haciendo
00:34:34
a ver, mirad
00:34:35
como no he guardado los datos, me sabía que tenía
00:34:37
100 datos
00:34:39
ahora creo que ya está
00:34:40
0 m más
00:34:43
1 m más
00:34:45
2 m más
00:34:47
3 m más
00:34:49
4 m más
00:34:50
5 m más
00:34:51
6 m más
00:34:54
7 m más
00:34:55
me salen muchos datos
00:34:56
la media es 3,5
00:34:57
que es lo lógico entre 0 y 7
00:35:01
la media es 0,5
00:35:03
es 3,5
00:35:04
esto horas
00:35:06
y la desviación típica sería
00:35:08
Así, 2, 2, que aproximadamente es 2,20.
00:35:10
Esto lo hago rápido porque se supone que lo vais a hacer también vosotros con la calculadora.
00:35:15
Y ahora cojo los datos.
00:35:20
Y pongo 7 y más, 7 y más, 5 y más, 4 y más, 1 y más, 1 y más, 0 y más, 0 y más.
00:35:22
Me salen de nuevo 8 datos y ahora le doy 2, 1 a la media. Sale aproximadamente, cuidado, son dos decimales, pues 3, como pone 125 es 3,13.
00:35:40
Y la desviación típica, si 2, 2, me doy al igual y me sale aproximadamente 2,80. Conviene que pongáis el último decimal, porque así sabéis que habéis aproximado a las centésimas. Estos son suspensos.
00:35:55
Y ahora, bueno, voy a colocar aquí, no me he dado cuenta aquí de dejar un espacio, los productos 0x7, 0, 7x1, 7, 2x5, 10, 3x4, 12, 4x1, 4, estas son las x y por y sub i.
00:36:13
5x1, 5, 6x0, 0 y 7x0, 0.
00:36:49
Entonces, si sumo, la suma de más xy por y sub i, esto se puede hacer mentalmente, 22, 29, 33, 38.
00:36:53
Entonces, ya dice, calcula la covarianza. Bueno, pues ya puedo hacer la covarianza.
00:37:07
La covarianza es este número, 38, dividido entre el número de datos, que es 8, menos el producto de las medias, que es 3,5 por 3,13.
00:37:12
Esto aproximadamente vale... 38 dividido entre 8, menos 2,5 por 3,13.
00:37:30
Negativo, curioso, menos 6,21. Aproximadamente menos 6,21.
00:37:59
No voy a aportar los redondeos, siempre bien hechos, ¿no?
00:38:06
Entonces, ¿cómo es la relación entre las dos variables?
00:38:10
Pues tienen correlación negativa.
00:38:14
Es normal, ¿eh?
00:38:24
Porque se supone que a mayor número de los estudios diarios, el número de suspensos va a ser menor.
00:38:25
Y ahora, ¿para hacer el coeficiente de correlación?
00:38:33
El coeficiente de correlación es la covarianza partido por el producto de las desviaciones típicas.
00:38:35
Pues la covarianza es menos 6,21 dividido entre 2,29 por 2,80.
00:38:41
Si esto es más pequeño que menos 1, me he equivocado.
00:38:53
Pues luego con la calculadora quiero hacerlo en vuestras narices para que no os equivoquéis.
00:39:00
menos 6,21 dividido, abro paréntesis, 2,29 por 2,80, cierro y sale menos 0,97.
00:39:05
Pues esto dice que la correlación es negativa y muy fuerte porque se acerca mucho a menos 1.
00:39:28
Y ahora, para hacer la recta de regresión, para tener el apartado B, la recta de regresión, que sepáis que yo intento notar un término de memoria, pongo a la Y la recta submedia, a la X la recta submedia, y aquí pongo, esto sí que me lo tengo que saber, la covarianza y abajo la desviación típica de la X al parámetro.
00:39:34
Entonces, en este caso dice tres horas y cuarto. Tres horas y cuarto es 3,25. Pues si la x vale 3,25, os recuerdo que esto que está restando pasa sumando, pues cogería la covarianza que es menos 6,21.
00:40:06
partido por la desviación típica de la x al cuadrado
00:40:35
por 3,25
00:40:40
menos la media que es 3,5
00:40:45
y ahora este menos pasa con más y la media de las y es 3,13.
00:40:50
Para hacerlo, menos 6,21
00:40:57
dividido entre 2,29 al cuadrado
00:41:10
por 3,25 menos 3,5, cierro, más 3,3.
00:41:15
Y me sale 3,43.
00:41:27
Aproximadamente 3,43.
00:41:32
Bueno, aquí entonces la respuesta sería
00:41:35
que tendrá entre 3 y 4 suspensos.
00:41:38
Esto es, como os digo, que tengáis otro ejercicio de correlación en vuestro repertorio para que veáis que esto es repetitivo.
00:41:49
Hay una cosa, y aunque no lo ponga aquí, vuelve a ser muy fiable. Es muy fiable. ¿Por qué?
00:41:57
¿Por qué? Porque 3,25 está entre 0 y 7 y porque el coeficiente de correlación se acerca mucho a menos 1.
00:42:11
A mí me gusta preguntar la fiabilidad y para eso tenéis que comprobar si se cumplen esas dos cosas.
00:42:35
Si yo dijera que se estudia 23 horas diarias, pues eso no tiene ninguna fiabilidad, porque además este señor seguramente lo ha hecho por un mal examen. O si el coeficiente de correlación es 0,25, pues yo diría que esto es muy poco fiable porque la correlación es 9.
00:42:43
Bueno, pues este es el tema de correlación que lo he repasado y como mínimo…
00:43:01
A ver, este es otro distinto, lo podría hacer el próximo día en la próxima clase para que tengáis alguno distinto y lo pregúntale.
00:43:16
Y, bueno, este, que es un poquito diferente, dice, en una muestra de 75 clases eléctricas se han obtenido estos datos sobre su relación. Entonces, dice, calcula la media y la desnudación típica. Y luego calcula la media.
00:43:31
Vamos a ver. Si yo tengo esto por intervalos, acordaos que aquí la marca de clase, por lógica, entre 25 y 30, hago la media.
00:43:57
25 más 30 dividido entre 2 y esto sale 27,5.
00:44:14
Por favor, hacedlo con calculadora porque os voy a decir lo que suele pasar.
00:44:22
Si vosotros hacéis 25 más 30 dividido entre 2, os sale una cosa rarísima.
00:44:29
40. 40 no está entre 25 y 30.
00:44:37
¿Qué es lo que ocurre?
00:44:40
Que para hacer eso, primero por jerarquía de operaciones, hay que hacer la suma.
00:44:42
Y para eso hay que poner un paréntesis.
00:44:47
Y después el resultado se divide entre 2.
00:44:49
Y aquí ya sale todo. Sale 27,5.
00:44:51
Bueno, así voy haciendo el siguiente.
00:44:55
Y voy poniendo X, Y, F, Y y pongo 27,53. Este entre 30 y 35, pues sería 32,5, pues tiene una frecuencia de 5.
00:44:57
Acordaos lo que era la marca de clase. Entre 35 y 40, 37,5. Cogeis 21. 45, 42,5 con una frecuencia de 28.
00:45:19
Y bueno, entonces aquí el total es 75. Este es el tamaño de la muestra. Y a ver, 42,5. ¿Qué más? Y ahí 57,1. Esto no me gusta.
00:45:34
entre 57 y 70
00:45:52
voy a hacerlo
00:45:54
57 y 70
00:45:55
perdón, entre 55 y 70
00:45:57
hago la media
00:46:03
y me sale
00:46:06
62,5
00:46:08
esto, a mí me gusta
00:46:10
que los intervalos sean todos iguales
00:46:13
este se nos ha escapado un poquito
00:46:15
pero bueno, ahí lo hacemos
00:46:17
¿no? entonces
00:46:19
bueno, ya que he hecho la tabla
00:46:21
la tabla nos va a servir
00:46:22
para dos cosas
00:46:25
Si hago las frecuencias acumuladas acordadas en este primer intervalo que está representado por 7,5 por 27,5 hay tres valores.
00:46:26
Pues habría 3 más 5 que son 8 más 21 que es 29, 29 más 28 que es 57 y por último tengo 75 datos.
00:46:39
Las frecuencias acumuladas serían para calcular la media.
00:46:51
Mediano. Bueno, si yo cojo 75 datos, sumo 75 más 1, divido entre 2, me sale 36. Esto me quiere decir que el dato mediano es el que ocupa el lugar 36.
00:46:55
Y el 36 está aquí. Porque aquí están desde el 30 hasta el 57. La mediana es 42,5.
00:47:19
y la media aritmética y la desviación típica
00:47:35
hacerla con calculadora
00:47:45
hacerla con calculadora
00:47:46
a partir de esta tabla
00:47:49
con estos valores
00:47:51
con calculadora
00:47:53
os digo que lo hagáis con calculadora
00:47:55
por un tema que me parece muy importante
00:47:57
que es que hay un ejercicio que os di
00:48:00
que también cayó
00:48:03
estoy poniendo todo lo que puede caer en el examen
00:48:04
Pero el que cayó el año pasado no es exactamente este, pero es muy parecido. A ver, aquí tenemos el peso de cinco chicos y sus alturas representativas respectivas.
00:48:07
Se dice que comparemos la variación, la dispersión de cada una de esas dos variables.
00:48:24
Entonces, este ejercicio, si no, por ejemplo, voy a repasarlo,
00:48:31
porque el ejercicio de variación permite comparar series de datos.
00:48:36
Entonces, yo al peso lo llamo X y a la altura lo llamo Y, con calculador.
00:48:40
El que quiera hacer la mano, queda la mano.
00:48:52
Calculado. Voy a hacer la media y la desviación típica de la X. La media y la desviación típica de la Y. Esto espero que ya con vuestras calculadoras lo habéis consultado.
00:48:54
Os recuerdo, y por eso os estoy repitiendo los cálculos, que parece que no significan nada, pero lo que os vayáis escuchando estará bien. Borro los datos.
00:49:13
shift-clear
00:49:24
shift-clear
00:49:25
1. Poner igual
00:49:28
y ya puedo empezar. Pongo
00:49:30
55n más
00:49:32
63n más
00:49:33
57n más
00:49:36
66n más
00:49:39
y 65n más
00:49:42
Me doy
00:49:44
y calculo la media
00:49:45
shift-2
00:49:47
1. La media me sale
00:49:50
61,2
00:49:52
veo que es una cosa
00:49:53
razonable, entonces espero no haberme
00:49:55
equivocado en los datos, 61,2
00:49:57
kilogramos
00:49:59
desviación típica
00:50:00
622, tendría que ser igual
00:50:02
4,4, que es raro
00:50:04
que sea exacto
00:50:07
pero también son kilogramos
00:50:08
y ahora, para las alturas
00:50:10
recordad
00:50:13
borrar los datos
00:50:15
y no tendréis a la igual
00:50:16
y ahora vais poniendo
00:50:18
175
00:50:21
Este dato, 175, 168, 175 M más, 168 M más, 154 M más, 179 M más, 181 M más.
00:50:23
Le doy así, 2, 1, me sale la media, 175,4 centímetros y la desviación típica aproximadamente es 4,50.
00:50:40
Pongo el 4,49, 8, aunque sea 4,50 o un cero, pongo el cero porque eso indica que estáis delineando con dos decimitas.
00:51:07
El coeficiente de variación del peso es la desviación típica partido por la media, que en este caso es 4,4 dividido entre 61,2.
00:51:17
Voy a hacer 4,4 entre 61,2 y me sale 0,01719.
00:51:33
0,0719.
00:51:56
Esto pasaba porcentaje, sabéis que es, cuando esto es aproximado,
00:52:04
Esto es el 7,19%. En cambio, el coeficiente de variación de las alturas es la desviación típica de la Y partido por la media de la Y, que en este caso será 4,50 partido por 175,4.
00:52:09
Esto va a salir más pequeño. 4,50. 4,50 dividido entre 175 puntos.
00:52:34
Y sale igual, sale 0,0257 por un grado. 2,57. Y esto es un 2,57%.
00:52:48
Entonces, los pesos están más dispersos que las alturas. Esta es la conclusión a la que tenéis que llegar. Ejercicio importante, ¿sí? Esta es la conclusión.
00:53:05
Incluso lo de la dispersión puede valer para distintas cosas. Hay gente que lo utiliza en el deporte, por ejemplo, y yo tengo la media de tiros de unos jugadores de baloncesto y voy ganando.
00:53:27
generalmente me interesa
00:53:50
coger a los que son más regulares
00:53:52
a los que tienen menos dispersión
00:53:54
para tomar los menores riesgos posibles
00:53:56
si son, si voy
00:53:58
perdiendo, por lo normal
00:54:00
es que
00:54:02
es que tome
00:54:03
el equipo
00:54:06
que tenga más dispersión
00:54:08
porque tomo más riesgos
00:54:10
y existe la posibilidad de que saquen
00:54:12
los puntos, de la misma
00:54:14
forma que tengo la posibilidad de
00:54:15
tener menos puntos
00:54:18
bueno pues esta es la clase de hoy
00:54:19
el próximo día intentaré hacer algún ejercicio
00:54:22
un poco distinto para que tengáis un poco
00:54:24
las clases variadas pero
00:54:26
más o menos son los que tenemos en la hoja
00:54:28
de acuerdo
00:54:31
en cuanto pueda subo la clase
00:54:31
detengo la grabación
00:54:34
- Autor/es:
- Javier M.
- Subido por:
- Francisco J. M.
- Licencia:
- Reconocimiento
- Visualizaciones:
- 6
- Fecha:
- 4 de marzo de 2024 - 19:41
- Visibilidad:
- Público
- Centro:
- IES LOPE DE VEGA
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1920x1080 píxeles
- Tamaño:
- 63.12 MBytes