Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

4-3BSO1 - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 4 de marzo de 2024 por Francisco J. M.

6 visualizaciones

Descargar la transcripción

En principio de la clase os voy a preguntar que si alguien tiene algún inconveniente en que la grabemos, pues dejamos de grabar y nos olvidamos del tema. 00:00:00
Y si no, pues supongo que estáis de acuerdo, que nos favorece el que tengáis la grabación de la clase. 00:00:11
¿De acuerdo? Bueno, pues dicho eso, vamos a verlo. Vamos a compartir la pantalla y vamos a la clase de hoy. 00:00:20
La clase del viernes no la subí porque era idéntica a la del lunes pasado. La del lunes creo que me quedó bastante mejor y en la del viernes hubo un par de interrupciones y no sé, pensé que era mejor. 00:00:32
Mejor dejarla que está porque es que para el caso todo era... 00:00:48
Bueno, en esta evaluación os recuerdo que tenemos el bloque que es de probabilidad estadística. 00:00:55
De estadística hay un tema que es de variables unidimensionales que es el que ocupa la novena quincena y la décima quincena está con distribuciones estadísticas bidimensionales. 00:01:04
Os dije que esto en realidad es un ejercicio, es un ejercicio tipo, yo creo que es un ejercicio bastante asequible, que merece la pena que lo hagáis. 00:01:16
y bueno, además que de vez en cuando tenéis una pista para saber si el ejercicio os ha salido bien o no. 00:01:35
Me refiero sobre todo cuando calculáis el coeficiente de correlación. 00:01:45
Bueno, entonces, el otro día vimos la gran distribución bidimensional, 00:01:50
vimos que no íbamos a ver tablas de doble entrada, o sea, que esto sin frecuencias 00:01:55
y vimos lo que era la nube de puntos 00:02:01
para hacernos una idea de que va la correlación lineal 00:02:05
insisto, lineal 00:02:08
que todo lo que sea lineal es relativo a rectas 00:02:10
a nubes de puntos que se pueden aproximar por rectas 00:02:15
y bueno, las fórmulas que tenéis que saber 00:02:18
son la de la recta de regresión 00:02:22
bueno, para la recta de regresión necesitáis conocer 00:02:25
Lo primero, lo que es la covarianza. La covarianza, si os acordáis, se calcula añadiendo una columna o una fila en la serie de datos, dividiendo entre el número de datos y restando el producto de las medias. De tal forma que conviene que calculeis la media de cada una de las variables con la calculadora. 00:02:28
Bueno, insisto, el que no sepa hacerlo con la calculadora lo tendría que hacer a mano. Yo hice un ejemplo el primer día. Creo que no merece la pena. Os he dejado los dos tutoriales, según la calculadora que utilicéis, los dos más típicos. 00:02:52
O si alguien tiene una calculadora un poco más extraña, pues que me lo diga y ya le busque un tutorial al uso. 00:03:10
La covariación de una distribución bidimensional puede ser positiva o negativa. 00:03:19
Es muy raro que se haga cero. 00:03:25
Y, bueno, si la correlación es positiva, se supone que la correlación entre las dos variables implica que a mayor valor de la X le va a salir mayor valor de la Y. 00:03:26
Esto puede ser con más o menos seguridad dependiendo luego del coeficiente de correlación. 00:03:46
Entonces, esta era en principio la interpretación de la covarianza, si la correlación es positiva o negativa, luego tenéis que saber la fórmula de la recta de regresión, yo me la aprendo muy fácil cogiendo a la x le resto su media, a la y le resto su media y luego esto sí que es un poco más extraño. 00:03:52
La covarianza, que es lo que habéis calculado antes, y abajo se pone el cuadrado de la desviación típica, que esa se ha hecho con un calzado. 00:04:18
Por otra parte, fijaos entre esto y esto, es muy parecido. 00:04:28
La covarianza, para hacer el coeficiente de correlación, la covarianza siempre está en el numerador. 00:04:33
Y aquí en vez de ser el cuadrado de la desviación típica de la X, se multiplican las dos desviaciones típicas que nos han sido. 00:04:39
Es importante, el valor del coeficiente de correlación no puede ser ni más pequeño que menos uno, ni mayor que uno. 00:04:45
Si pasa eso es que el ejercicio no está bien. 00:04:55
Salvo, a veces puede quedar un 1,01 porque ha habido un redondeo y entonces los datos no son exactamente precisos, pero bueno, esto es lo más raro. 00:05:00
Entonces, el coeficiente de correlación es un número que está comprendido entre menos 1 y 1. 00:05:10
Cuanto más se acerca a 1 o a menos 1, la correlación es más fuerte. 00:05:18
Y cuanto más próximo es a 0, la correlación es débil. 00:05:24
Insisto, la correlación es lineal. 00:05:33
Eso quiere decir que no van a estar muy aproximadas las nubes de puntos a una recta, aunque sí pueden adoptar alguna figura, alguna forma que sea parecida. 00:05:36
Bueno, este ejercicio, yo no sé si lo hicimos el otro día, creo que lo hicimos en la clase, pero bueno. Vamos a hacerlo para recordar un poco lo que era el coeficiente de correlación y cómo se puede aplicar a un D. 00:05:50
Esto es la idea intuitiva. Luego, al final, lo que vale en realidad son las cuentas. Las cuentas es el ejercicio que os digo que es en lo que se basa todo el tema. Todo el tema es un ejercicio que suele caer, por supuesto. 00:06:23
Bueno, a ver, aquí nos dice, los coeficientes de correlación de estas distribuciones bidimensionales son en valor absoluto 0,55, 0,75, 0,87 y 0,96. 00:06:42
Entonces, dice, asigna cada ruido cambiando el signo cuando proceda, porque aquí dice en valor absoluto. 00:06:55
A ver, yo diría que los términos que se aproximan más a una recta son la nube de puntos que se parecen más a una recta, yo diría que es esto. 00:07:01
Entonces, aquí el valor absoluto se tiene que acercar lo más posible a 1. 00:07:17
El valor más cerca a 1 a 1 es 0,96. 00:07:23
¿Pero qué es lo que ocurre? 00:07:27
Que aquí esta recta tiene pendiente negativa. 00:07:29
La correlación es negativa, por lo cual yo diría que este es el coeficiente de correlación que está asociado a esta nube de puntos. 00:07:33
Después de este, pues yo diría que lo que más se parece a una recta, a la nube de puntos que se aproxima más a una recta, yo diría que es este. 00:07:44
Esto hay gente que lo hace muy bien a ojo, a mí no me sale muy bien, pero vamos, yo diría que si tomo esta recta que es más dispersa. 00:07:55
Aquí los puntos están más separados y aquí los puntos están muy separados. 00:08:08
Yo diría que aquí esta recta debería ser positiva, pero alguno podría decir que se acerca más una de aquí. 00:08:14
Entonces, ya os digo, esto es un poco subjetivo. 00:08:21
bueno, la segunda 00:08:25
correlación más fuerte es esta 00:08:28
y vuelve a ser negativa 00:08:30
pues menos 0,87 00:08:32
yo aquí sí que diría 00:08:34
que la correlación es positiva 00:08:38
es 0,75 00:08:40
no es tan fuerte 00:08:41
como la anterior 00:08:44
más o menos 00:08:45
sigue la trayectoria más recta 00:08:46
pero para nada 00:08:50
se parece eso más recta 00:08:51
Y aquí está muchísimo, esto ya diríamos, de 0.5 para abajo la correlación es débil. 00:08:53
Entonces esta es media tirando a débil. 00:09:01
Entonces con este color, pues estaría que es menos 0.5. 00:09:07
Esto es la idea. ¿Por qué os doy esta idea? 00:09:11
Pues porque yo creo que si os doy una recta de regresión con esta nube de puntos o con esta nube de puntos 00:09:15
Y dais un valor intermedio, que es lo que vamos a hacer al final, pues aquí veis que la estimación es bastante fiable. En cambio aquí es menos fiable. No creo que sea demasiado mala, pero no es fiable. Pero aquí se ve que los datos están mucho más dispersos. 00:09:22
Bueno, pues vamos al caso que es, vamos ya al ejercicio. Voy a hacer uno porque este es exactamente, a mí esto es lo que me gusta preguntar en un examen, exactamente esto. 00:09:42
No están dos series de datos, en este caso de edades y pesos, y se obtienen determinados resultados. Y lo que queremos hacer es la estimación, una estimación y ver si es fiable esa estimación. 00:10:06
A mí eso es lo que me doy mucha importancia, porque le veis la utilidad. Cuando hacéis una estimación, ¿va a ser buena o tenéis que decir, bueno, espero que sea esto, pero tampoco os esperéis gran precisión, ¿no? 00:10:24
vamos a ver 00:10:39
se observan las edades de 5 niñas 00:10:42
y sus pesos respectivos y se obtienen 00:10:45
los siguientes 00:10:47
entonces, yo tengo una serie 00:10:47
de datos 00:10:52
que es X, de la cual 00:10:53
puedo calcular una media y una desmedida 00:10:56
y eso como lo hago 00:10:58
con el cauto 00:11:00
si la tenéis a mano 00:11:01
y podéis hacerla conmigo 00:11:04
estupendo, si tenéis el otro 00:11:06
modelo, pues 00:11:08
También podréis hacerlo si ya habéis visto el tutorial. 00:11:10
Tengo cinco niños. 00:11:17
Primero tengo que poner la calculadora en modo estadístico. 00:11:21
Yo ahora mismo la tengo. 00:11:24
Tengo que borrar los datos anteriores, que serían SID, LIAB o NO. 00:11:26
Pero igual, se supone que no tengo datos. 00:11:32
y entonces pongo 2m más, 4,5m más, 6m más, 7,2m más, 8m más. 00:11:34
Me pone la calculadora n igual a 5, le doy a SIF 2, 1 y la media me sale 5,54. 00:11:48
Aquí siempre os diré, coged siempre dos decimales. Esto como sale 5,54 exacto, pongo igual. 00:11:58
Pero a la hora de hacer la desviación típica, la desviación típica generalmente no sale exacta, sale aproximadamente 2,13. 00:12:08
Si sale 2,13, pongo el signo de aproximado. 2,13. 00:12:16
Esto serían años. Esos niños tienen una media de 5,54 años y una desviación típica de 2 puntos. 00:12:21
Lo que estoy viendo es si el peso va aumentando con la edad según una recta o la cosa se dispara o se queda una cosa más parecida a una parábola o una cosa un poco más parecida a una función logarítmica. 00:12:35
Bueno, entonces yo tengo una serie de datos que es X y ahora tengo una serie de datos Y. Borro los datos. Os voy diciendo las cosas en las que soléis olvidar. La primera, que no se os olvide, borrar los datos. 00:12:54
SIF, CLIA, 1, les sale igual, ya tengo 0 datos y ahora 15, N más, 19, N más, 25, N más, 33, N más y 34. 00:13:11
a muchos se os olvida 00:13:29
dar el último M más 00:13:31
en la calculadora 00:13:33
en la pantalla pone N igual a 5 00:13:35
y ahora la media sería 00:13:37
6, 2, 1 00:13:39
aquí hay veces que se os olvida darle al igual 00:13:41
25,2 00:13:46
y la desviación típica 00:13:47
de la I pues hago 00:13:53
6, 2, 2 00:13:55
y me sale 7,40 00:13:56
esto sería 00:14:00
kilogramos 00:14:02
Entonces, para hacer la covarianza, tengo aquí que hacer la columna, bueno, en este caso la fila, xy por yy. 00:14:02
Tengo que ir multiplicando. 2 por 15, 30. 00:14:14
4,5 por 19, 85,5. 00:14:18
6 por 25, 150. 00:14:27
7,2 por 33, 236. 00:14:34
237,6 y 8 por 34 que sería 250. Sumo todos estos datos. Esto se llama la suma de x y por y sub i. 00:14:41
A mi me sale 272 más 237,6 más 150 más 85,5 más 30. 00:15:01
Y me sale 775,1. 00:15:17
Estos son todos los cálculos previos a todo lo que me va a meter. 00:15:23
Ahora, ¿cómo hago la covarianza? 00:15:28
Pues la covarianza consiste en tomar esa suma que nos ha salido, 775,1, dividir entre el número de datos, que son 5, y restarle el producto de las medias, que son 5,54 por 25,2. 00:15:29
Hago esto. La covarianza no tiene unidades porque mezcla años con kilos. 775,1 dividido entre 5, menos 5,54 por 5,2. 00:15:55
Me sale 15, aproximadamente, 15,41. ¿Sí? Entonces, ya puedo hacer todas las pruebas. 00:16:12
En el apartado A, estos son los cálculos previos, apartado A, coeficiente de correlación. El coeficiente de correlación es la covarianza partido por el producto de las desviaciones típicas. 00:16:28
Pues ya está, 15,41 dividido entre 2,13 por 7,49. Acordaos que aquí con la calculadora que tenéis vosotros hay que hacerlo con pánico. 00:16:44
Voy a hacer con la calculadora que tengo aquí, para que no tengáis ningún fallo, porque esto tiene que salir un número que está entre menos uno y uno. 00:17:05
A ver, sería 15,41 dividido entre, abrís paréntesis, 2,13 por 7,41. 00:17:16
Y esto sale 0,97 aproximadamente, aproximadamente 0,97. Como veis es menor que 1, con lo cual yo supongo que está bien. 00:17:30
Bueno, esto me dice que la correlación es muy fuerte, porque se acerca muy fuerte y positiva. 00:17:48
O sea, que entre los 2 y los 8 años parece que los pesos van subiendo como en línea recta y parece que se va a poder hacer una bonanza. 00:17:57
Bueno, el apartado D dice ¿qué peso correspondería a un niño de 5 años? 00:18:12
Para un niño de 5 años lo que tengo que hacer es, acordaos, como un acuerdo de la fórmula de la recta de progresión. 00:18:16
A y le resto su media, a x le resto su media y aquí la pendiente de la recta hemos dicho que era la covarianza partido por la desviación típica de x al cuadrado, que es lo mismo que la varianza. 00:18:26
Bueno, pues aquí sustituís y cogéis y igual a sigma xy es 15,41 partido por la desviación típica que es 2,13 al cuadrado por x. 00:18:41
X es igual a 5 00:19:02
¿Qué peso le corresponde 00:19:07
al número de 5X? 00:19:13
Pues hago 5 menos 00:19:15
la media de la X que es 00:19:17
5,50 y que no se os olvide 00:19:19
que tenéis aquí una cosa razonable 00:19:23
que esto que está restando 00:19:24
va a pasar 00:19:26
subido, o sea que aquí sería 00:19:29
la media de la X 00:19:32
que es 25,2 00:19:36
Esto lo hacemos con la calculadora. 00:19:38
11,91 dividido entre 2,13 al cuadrado por 5 menos 5,54 más 25,2 y me sale 23,37. 00:19:40
3,37 00:20:14
por coherencia redondea los dos decimales 00:20:17
hace buenos redondeos 00:20:20
tenéis que saber si se redondea a 36 00:20:22
por último 00:20:25
¿es fiable la estimación? 00:20:28
pues vamos a ver 00:20:33
primera cosa 00:20:35
el valor de x 00:20:37
x es igual a 5 00:20:39
es un valor 00:20:43
entre 00:20:45
2 y 8. 00:20:47
Si yo pusiera, por ejemplo, 00:20:50
x igual a 95, 00:20:51
pues una persona de 95 00:20:54
años que debe saber yo lo que va a saber 00:20:55
el otro. 00:20:58
Eso se llama extrapolar. 00:20:59
Esto es solamente 00:21:02
un poder. Esto, en principio, 00:21:03
parece que 00:21:05
los valores de las edades 00:21:06
están entre 2 y 8. 00:21:09
Y, por otra parte, 00:21:11
El coeficiente de correlación es 0,97. Por lo cual, la correlación es muy fuerte. Esto se acerca muchísimo a 1. Muy fuerte. Entonces, yo sabiendo estas dos cosas, yo diría que es fiable. 00:21:13
Es fiable. ¿Puede haber fallos? Sí, pero yo diría que es bastante probable que nos acerquemos bastante al peso de este niño. 00:21:33
bueno, pues esto es 00:21:45
este es el ejercicio 00:21:50
típico 00:21:52
si alguno lo tiene hecho 00:21:53
ya de la semana pasada, que es posible 00:22:00
es repetirlo 00:22:02
porque es que es lo mismo 00:22:04
y ya a partir de ahí que hagáis uno o dos 00:22:05
y que, vamos 00:22:08
los que necesitéis hasta que os salga 00:22:10
porque este ejercicio 00:22:12
es muy asequible y os tiene que salir. 00:22:13
¿Vale? 00:22:16
Bueno, dicho eso, 00:22:18
la próxima quincena 00:22:19
vamos a 00:22:22
empezar el tema de probabilidad. 00:22:23
En esos temas de probabilidad 00:22:29
ya estamos cambiando bastante 00:22:31
de tercio. 00:22:32
Con lo cual, 00:22:37
hoy quería aprovechar 00:22:38
para hacer algunos ejercicios de repaso 00:22:39
para que recordéis lo fundamental de las unidades de ejercicio. 00:22:42
¿De acuerdo? 00:22:45
Entonces, esto espero que os cueste ya también menos 00:22:48
y que me digáis. 00:22:51
Bueno, vamos a ver. 00:22:56
Aquí se han examinado 100 lavadoras 00:22:58
de distintas marcas comerciales 00:23:01
y se ha notado el número de averías que ha tenido a lo largo de 10 años. 00:23:04
¿Sí? 00:23:10
Bueno, primera cosa. 00:23:10
Primera cosa. 00:23:12
Esto es XY y esto es su frecuencia. No es que en una lavadora de cero averías tenga que esto ha sido 30 años. 00:23:13
Yo lo que estoy diciendo es que aquí hay 30 lavadoras que han tenido cero averías. 28 que han tenido una, 17 que han tenido dos, 15 que han tenido tres y 10 que han tenido seis. 00:23:31
Cuidado con esto cuando tengáis una tabla que veáis lo primero, si esto es una distribución unidimensional o bidimensional. 00:23:44
En este caso es unidimensional. 00:23:52
Bueno, ¿por qué lo sé? 00:23:58
Pues porque estas son las frecuencias. 00:24:00
No es lo mismo el otro, que era un niño que tenía tantos años y su peso era este. 00:24:04
Eran dos datos distintos que habíamos recogido de un mismo individuo. 00:24:12
Estos son cien balabadoras y estamos viendo qué datos está repitiendo cada vez. Entonces, llegado aquí y alguien me ha escrito con la siguiente. La media y la desviación típica. Si la hago con la calculadora, ¿tengo que escribir algo? La respuesta es no. Y ya os digo, podéis hacerlo como queráis. 00:24:15
ahora bien 00:24:38
que lo hacéis con calculadora 00:24:40
es que lo siento 00:24:43
porque es que en esta calculadora 00:24:44
no sé por qué no funciona 00:24:46
ah bueno 00:24:48
no, es que este es el otro tipo 00:24:50
de calculadora, entonces no os puedo 00:24:52
explicar cómo se hace con esta calculadora 00:24:54
que creo que era la más complicada 00:24:56
bueno, entonces 00:24:58
yo voy a hacer con la calculadora 00:25:00
mía, la que tengo aquí 00:25:02
la media y la desviación típica 00:25:04
si lo hacéis con calculadora 00:25:06
media y desviación 00:25:08
típica. Si lo hacéis con 00:25:18
calculadora, solo tenéis 00:25:25
que escribir el resultado. 00:25:29
Entonces, la media 00:25:32
de la X y 00:25:33
la desviación típica de la X. 00:25:35
Y ahora, ¿qué diferencia 00:25:38
hay con los de estadística 00:25:39
unidimensional? 00:25:41
Primera cosa, 00:25:43
quiero hacerme de desviación típica 00:25:45
o recuerdo, SIF 00:25:47
CLIAR, SIF 9, le dais a 1. 00:25:49
Ya están todos los datos borrados. Y ahora, con esta calculadora, que no es la otra, a ver, ¿cómo hago la media? A ver, tengo con cero averías, pongo cero, y ahora, para poner que hay 30 lavadoras que tienen cero averías, tengo que darle a SIF y a la coma. 00:25:52
sale un punto y una coma en la pantalla 00:26:16
y pongo 30 00:26:19
si ahora le doy a n más 00:26:20
me pone n igual a 00:26:22
30, ¿por qué? porque he metido 00:26:25
30 datos de golpe 00:26:27
ahora quiero meter 00:26:28
que con una avería 00:26:30
o sea, uno, hay 28 00:26:32
lavadoras, pues le doy 00:26:35
shift coma 28 00:26:36
le doy a n más 00:26:39
y os pondrá 58 00:26:41
¿por qué 58? 00:26:43
Pues las 30 primeras y estas 28, 58. Continúo con 2, 6, 17. M más. Me salen 75. 3, 6, 15. M más. Me salen 90. 00:26:44
Y por último, 6, 5, 10 en menos. Y me salen 100 datos. Es precisamente las simuladoras que me salen. O sea, que todo esto parece que está correcto. Y ahora le doy así, 2, 1. Igual, que no se os olvide, y sale 1,67 averías por término medio. El promedio es 1,67. 00:27:08
Y ahora, se espera que después de dos años, pues que, vamos, un poco antes de dos años, sea la primera variable. Y ahora, la desviación típica sería, si 2, le dais al 2, al igual, y sale aproximadamente 1,77. 00:27:34
Le pongo 1,77. Como veis, la media no es muy alta y la desviación típica en relación con la media es bastante alta. O sea, hay lavadoras que posiblemente se estropeen muy pronto y otras que van a tardar, pues, tres años por lo menos. 00:28:00
bueno y ahora 00:28:21
¿cómo hago la mediana y la moda? 00:28:23
pues para hacer la mediana y la moda 00:28:25
para hacer la mediana y la moda 00:28:27
pues bueno, la moda 00:28:36
se ve 00:28:38
que es cero averías 00:28:38
porque es el valor 00:28:41
la frecuencia mayor 00:28:48
que estrella 00:28:51
y para hacer la mediana 00:28:52
a mí me gusta más ponerla en columnas 00:28:54
estos ya son mías 00:28:57
a ver, esto sería el número de averías 00:28:58
Esto sería la frecuencia. Entonces, cogería la frecuencia acumulada. Número de averías. 0, 1, 2, 3 y 6. Frecuencia. 30, 28, 17, 15 y 10. 00:29:01
Y ahora, las acumuladas acordadas. Cero averías, 30 lavadoras. Cero o una avería, 30 más 28, 58 lavadoras. Cero o una o dos averías, 58 más 17, 75 lavadoras. Hasta tres averías serían 90 y hasta cuatro averías, hasta seis averías serían 100. 00:29:23
¿Sí? Entonces, si yo ordeno de menor a mayor el término medio, bueno, los términos medios de 100 elementos, pues acordaos que son, como el número es par, hay dos. 00:29:46
Son el 50 y el 51. Los dos están aquí. Los dos están, valen uno. Entonces, la mediana vale uno. 00:30:20
O sea, la mitad de las lavadoras van a tener menos de una avería o una avería y la otra mitad menos de una avería o menos, ¿vale? Pues esta es la idea de Borobudur. 00:30:51
Este es el repaso de cómo se calculan las medidas de centralización y, bueno, aunque no lo pide, recuerdo que el rango es el mayor valor, valor menos el menor, pues sería 6 menos 0, que es 6. 00:31:08
La mediana también son averías, una avería y aquí, he equivocado, porque la media y la desviación típica también son averías. 00:31:42
O sea que en 10 años la media de averías es 1,63. 00:32:07
Bueno, pues esto es un ejercicio básico de parametrización y dispersión. 00:32:15
Bueno, si veis el examen del curso pasado, en este algo creo que había que calcular. Vamos, son los tres ejercicios típicos. 00:32:27
Este es un ejercicio de regresión. Vamos a hacerlo. 00:32:46
La siguiente tabla relaciona las horas dedicadas al estudio diario y el número de suspensos que obtiene un alumno a final de curso. 00:32:59
Y se calcula la covarianza, el coeficiente de correlación. 00:33:11
Bueno, pues esto ya os digo. 00:33:16
De la forma más rápida posible lo vamos a ir haciendo. 00:33:18
A ver, cuestiones previas. 00:33:22
Tengo que calcular la media de la X, la media de la Y, la desviación típica de la X y la desviación típica de la Y. 00:33:24
Esto seguramente será aproximado con dos decimales. 00:33:36
entonces, esto sé que es un ejercicio 00:33:39
de correlación, porque esto es X 00:33:43
y esto es Y, no son frecuencias 00:33:45
esto quiere decir que hay un alumno 00:33:48
aquí, a ver, hay 1, 2, 3 00:33:51
4, 5, 6, 7 y 8 datos 00:33:54
¿no? entonces se supone 00:34:00
que es un alumno que si estudia a hacer horas 00:34:05
suspende 7, si estudia a una 00:34:09
suspender 7, suspender 2, suspender 5 00:34:12
y ya estudiando 6 horas 00:34:14
o 7 horas luego 00:34:16
como pudiera 00:34:17
suspendería hacer 00:34:18
acordaos, número de datos 00:34:21
bueno, entonces 00:34:24
nos ponemos 00:34:28
directamente con la calculadora 00:34:29
ya os digo que 00:34:32
lo voy haciendo 00:34:34
a ver, mirad 00:34:35
como no he guardado los datos, me sabía que tenía 00:34:37
100 datos 00:34:39
ahora creo que ya está 00:34:40
0 m más 00:34:43
1 m más 00:34:45
2 m más 00:34:47
3 m más 00:34:49
4 m más 00:34:50
5 m más 00:34:51
6 m más 00:34:54
7 m más 00:34:55
me salen muchos datos 00:34:56
la media es 3,5 00:34:57
que es lo lógico entre 0 y 7 00:35:01
la media es 0,5 00:35:03
es 3,5 00:35:04
esto horas 00:35:06
y la desviación típica sería 00:35:08
Así, 2, 2, que aproximadamente es 2,20. 00:35:10
Esto lo hago rápido porque se supone que lo vais a hacer también vosotros con la calculadora. 00:35:15
Y ahora cojo los datos. 00:35:20
Y pongo 7 y más, 7 y más, 5 y más, 4 y más, 1 y más, 1 y más, 0 y más, 0 y más. 00:35:22
Me salen de nuevo 8 datos y ahora le doy 2, 1 a la media. Sale aproximadamente, cuidado, son dos decimales, pues 3, como pone 125 es 3,13. 00:35:40
Y la desviación típica, si 2, 2, me doy al igual y me sale aproximadamente 2,80. Conviene que pongáis el último decimal, porque así sabéis que habéis aproximado a las centésimas. Estos son suspensos. 00:35:55
Y ahora, bueno, voy a colocar aquí, no me he dado cuenta aquí de dejar un espacio, los productos 0x7, 0, 7x1, 7, 2x5, 10, 3x4, 12, 4x1, 4, estas son las x y por y sub i. 00:36:13
5x1, 5, 6x0, 0 y 7x0, 0. 00:36:49
Entonces, si sumo, la suma de más xy por y sub i, esto se puede hacer mentalmente, 22, 29, 33, 38. 00:36:53
Entonces, ya dice, calcula la covarianza. Bueno, pues ya puedo hacer la covarianza. 00:37:07
La covarianza es este número, 38, dividido entre el número de datos, que es 8, menos el producto de las medias, que es 3,5 por 3,13. 00:37:12
Esto aproximadamente vale... 38 dividido entre 8, menos 2,5 por 3,13. 00:37:30
Negativo, curioso, menos 6,21. Aproximadamente menos 6,21. 00:37:59
No voy a aportar los redondeos, siempre bien hechos, ¿no? 00:38:06
Entonces, ¿cómo es la relación entre las dos variables? 00:38:10
Pues tienen correlación negativa. 00:38:14
Es normal, ¿eh? 00:38:24
Porque se supone que a mayor número de los estudios diarios, el número de suspensos va a ser menor. 00:38:25
Y ahora, ¿para hacer el coeficiente de correlación? 00:38:33
El coeficiente de correlación es la covarianza partido por el producto de las desviaciones típicas. 00:38:35
Pues la covarianza es menos 6,21 dividido entre 2,29 por 2,80. 00:38:41
Si esto es más pequeño que menos 1, me he equivocado. 00:38:53
Pues luego con la calculadora quiero hacerlo en vuestras narices para que no os equivoquéis. 00:39:00
menos 6,21 dividido, abro paréntesis, 2,29 por 2,80, cierro y sale menos 0,97. 00:39:05
Pues esto dice que la correlación es negativa y muy fuerte porque se acerca mucho a menos 1. 00:39:28
Y ahora, para hacer la recta de regresión, para tener el apartado B, la recta de regresión, que sepáis que yo intento notar un término de memoria, pongo a la Y la recta submedia, a la X la recta submedia, y aquí pongo, esto sí que me lo tengo que saber, la covarianza y abajo la desviación típica de la X al parámetro. 00:39:34
Entonces, en este caso dice tres horas y cuarto. Tres horas y cuarto es 3,25. Pues si la x vale 3,25, os recuerdo que esto que está restando pasa sumando, pues cogería la covarianza que es menos 6,21. 00:40:06
partido por la desviación típica de la x al cuadrado 00:40:35
por 3,25 00:40:40
menos la media que es 3,5 00:40:45
y ahora este menos pasa con más y la media de las y es 3,13. 00:40:50
Para hacerlo, menos 6,21 00:40:57
dividido entre 2,29 al cuadrado 00:41:10
por 3,25 menos 3,5, cierro, más 3,3. 00:41:15
Y me sale 3,43. 00:41:27
Aproximadamente 3,43. 00:41:32
Bueno, aquí entonces la respuesta sería 00:41:35
que tendrá entre 3 y 4 suspensos. 00:41:38
Esto es, como os digo, que tengáis otro ejercicio de correlación en vuestro repertorio para que veáis que esto es repetitivo. 00:41:49
Hay una cosa, y aunque no lo ponga aquí, vuelve a ser muy fiable. Es muy fiable. ¿Por qué? 00:41:57
¿Por qué? Porque 3,25 está entre 0 y 7 y porque el coeficiente de correlación se acerca mucho a menos 1. 00:42:11
A mí me gusta preguntar la fiabilidad y para eso tenéis que comprobar si se cumplen esas dos cosas. 00:42:35
Si yo dijera que se estudia 23 horas diarias, pues eso no tiene ninguna fiabilidad, porque además este señor seguramente lo ha hecho por un mal examen. O si el coeficiente de correlación es 0,25, pues yo diría que esto es muy poco fiable porque la correlación es 9. 00:42:43
Bueno, pues este es el tema de correlación que lo he repasado y como mínimo… 00:43:01
A ver, este es otro distinto, lo podría hacer el próximo día en la próxima clase para que tengáis alguno distinto y lo pregúntale. 00:43:16
Y, bueno, este, que es un poquito diferente, dice, en una muestra de 75 clases eléctricas se han obtenido estos datos sobre su relación. Entonces, dice, calcula la media y la desnudación típica. Y luego calcula la media. 00:43:31
Vamos a ver. Si yo tengo esto por intervalos, acordaos que aquí la marca de clase, por lógica, entre 25 y 30, hago la media. 00:43:57
25 más 30 dividido entre 2 y esto sale 27,5. 00:44:14
Por favor, hacedlo con calculadora porque os voy a decir lo que suele pasar. 00:44:22
Si vosotros hacéis 25 más 30 dividido entre 2, os sale una cosa rarísima. 00:44:29
40. 40 no está entre 25 y 30. 00:44:37
¿Qué es lo que ocurre? 00:44:40
Que para hacer eso, primero por jerarquía de operaciones, hay que hacer la suma. 00:44:42
Y para eso hay que poner un paréntesis. 00:44:47
Y después el resultado se divide entre 2. 00:44:49
Y aquí ya sale todo. Sale 27,5. 00:44:51
Bueno, así voy haciendo el siguiente. 00:44:55
Y voy poniendo X, Y, F, Y y pongo 27,53. Este entre 30 y 35, pues sería 32,5, pues tiene una frecuencia de 5. 00:44:57
Acordaos lo que era la marca de clase. Entre 35 y 40, 37,5. Cogeis 21. 45, 42,5 con una frecuencia de 28. 00:45:19
Y bueno, entonces aquí el total es 75. Este es el tamaño de la muestra. Y a ver, 42,5. ¿Qué más? Y ahí 57,1. Esto no me gusta. 00:45:34
entre 57 y 70 00:45:52
voy a hacerlo 00:45:54
57 y 70 00:45:55
perdón, entre 55 y 70 00:45:57
hago la media 00:46:03
y me sale 00:46:06
62,5 00:46:08
esto, a mí me gusta 00:46:10
que los intervalos sean todos iguales 00:46:13
este se nos ha escapado un poquito 00:46:15
pero bueno, ahí lo hacemos 00:46:17
¿no? entonces 00:46:19
bueno, ya que he hecho la tabla 00:46:21
la tabla nos va a servir 00:46:22
para dos cosas 00:46:25
Si hago las frecuencias acumuladas acordadas en este primer intervalo que está representado por 7,5 por 27,5 hay tres valores. 00:46:26
Pues habría 3 más 5 que son 8 más 21 que es 29, 29 más 28 que es 57 y por último tengo 75 datos. 00:46:39
Las frecuencias acumuladas serían para calcular la media. 00:46:51
Mediano. Bueno, si yo cojo 75 datos, sumo 75 más 1, divido entre 2, me sale 36. Esto me quiere decir que el dato mediano es el que ocupa el lugar 36. 00:46:55
Y el 36 está aquí. Porque aquí están desde el 30 hasta el 57. La mediana es 42,5. 00:47:19
y la media aritmética y la desviación típica 00:47:35
hacerla con calculadora 00:47:45
hacerla con calculadora 00:47:46
a partir de esta tabla 00:47:49
con estos valores 00:47:51
con calculadora 00:47:53
os digo que lo hagáis con calculadora 00:47:55
por un tema que me parece muy importante 00:47:57
que es que hay un ejercicio que os di 00:48:00
que también cayó 00:48:03
estoy poniendo todo lo que puede caer en el examen 00:48:04
Pero el que cayó el año pasado no es exactamente este, pero es muy parecido. A ver, aquí tenemos el peso de cinco chicos y sus alturas representativas respectivas. 00:48:07
Se dice que comparemos la variación, la dispersión de cada una de esas dos variables. 00:48:24
Entonces, este ejercicio, si no, por ejemplo, voy a repasarlo, 00:48:31
porque el ejercicio de variación permite comparar series de datos. 00:48:36
Entonces, yo al peso lo llamo X y a la altura lo llamo Y, con calculador. 00:48:40
El que quiera hacer la mano, queda la mano. 00:48:52
Calculado. Voy a hacer la media y la desviación típica de la X. La media y la desviación típica de la Y. Esto espero que ya con vuestras calculadoras lo habéis consultado. 00:48:54
Os recuerdo, y por eso os estoy repitiendo los cálculos, que parece que no significan nada, pero lo que os vayáis escuchando estará bien. Borro los datos. 00:49:13
shift-clear 00:49:24
shift-clear 00:49:25
1. Poner igual 00:49:28
y ya puedo empezar. Pongo 00:49:30
55n más 00:49:32
63n más 00:49:33
57n más 00:49:36
66n más 00:49:39
y 65n más 00:49:42
Me doy 00:49:44
y calculo la media 00:49:45
shift-2 00:49:47
1. La media me sale 00:49:50
61,2 00:49:52
veo que es una cosa 00:49:53
razonable, entonces espero no haberme 00:49:55
equivocado en los datos, 61,2 00:49:57
kilogramos 00:49:59
desviación típica 00:50:00
622, tendría que ser igual 00:50:02
4,4, que es raro 00:50:04
que sea exacto 00:50:07
pero también son kilogramos 00:50:08
y ahora, para las alturas 00:50:10
recordad 00:50:13
borrar los datos 00:50:15
y no tendréis a la igual 00:50:16
y ahora vais poniendo 00:50:18
175 00:50:21
Este dato, 175, 168, 175 M más, 168 M más, 154 M más, 179 M más, 181 M más. 00:50:23
Le doy así, 2, 1, me sale la media, 175,4 centímetros y la desviación típica aproximadamente es 4,50. 00:50:40
Pongo el 4,49, 8, aunque sea 4,50 o un cero, pongo el cero porque eso indica que estáis delineando con dos decimitas. 00:51:07
El coeficiente de variación del peso es la desviación típica partido por la media, que en este caso es 4,4 dividido entre 61,2. 00:51:17
Voy a hacer 4,4 entre 61,2 y me sale 0,01719. 00:51:33
0,0719. 00:51:56
Esto pasaba porcentaje, sabéis que es, cuando esto es aproximado, 00:52:04
Esto es el 7,19%. En cambio, el coeficiente de variación de las alturas es la desviación típica de la Y partido por la media de la Y, que en este caso será 4,50 partido por 175,4. 00:52:09
Esto va a salir más pequeño. 4,50. 4,50 dividido entre 175 puntos. 00:52:34
Y sale igual, sale 0,0257 por un grado. 2,57. Y esto es un 2,57%. 00:52:48
Entonces, los pesos están más dispersos que las alturas. Esta es la conclusión a la que tenéis que llegar. Ejercicio importante, ¿sí? Esta es la conclusión. 00:53:05
Incluso lo de la dispersión puede valer para distintas cosas. Hay gente que lo utiliza en el deporte, por ejemplo, y yo tengo la media de tiros de unos jugadores de baloncesto y voy ganando. 00:53:27
generalmente me interesa 00:53:50
coger a los que son más regulares 00:53:52
a los que tienen menos dispersión 00:53:54
para tomar los menores riesgos posibles 00:53:56
si son, si voy 00:53:58
perdiendo, por lo normal 00:54:00
es que 00:54:02
es que tome 00:54:03
el equipo 00:54:06
que tenga más dispersión 00:54:08
porque tomo más riesgos 00:54:10
y existe la posibilidad de que saquen 00:54:12
los puntos, de la misma 00:54:14
forma que tengo la posibilidad de 00:54:15
tener menos puntos 00:54:18
bueno pues esta es la clase de hoy 00:54:19
el próximo día intentaré hacer algún ejercicio 00:54:22
un poco distinto para que tengáis un poco 00:54:24
las clases variadas pero 00:54:26
más o menos son los que tenemos en la hoja 00:54:28
de acuerdo 00:54:31
en cuanto pueda subo la clase 00:54:31
detengo la grabación 00:54:34
Autor/es:
Javier M.
Subido por:
Francisco J. M.
Licencia:
Reconocimiento
Visualizaciones:
6
Fecha:
4 de marzo de 2024 - 19:41
Visibilidad:
Público
Centro:
IES LOPE DE VEGA
Relación de aspecto:
1.78:1
Resolución:
1920x1080 píxeles
Tamaño:
63.12 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid