Saltar navegación

26-2BSO1 - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 26 de febrero de 2024 por Francisco J. M.

15 visualizaciones

Descargar la transcripción

Diciendo que esta clase va a ser grabada, por si alguien tiene algún inconveniente que lo diga ahora mismo. Y si no, pues vamos directamente, entramos en materia. ¿De acuerdo? 00:00:00
Bueno, entonces, estamos en la decima quincena, esta es la primera clase y, bueno, os tengo que decir que estos dos temas de estadística yo creo que son bastante asequibles, tenéis que revisar las cuentas. 00:00:13
Os recomiendo que uséis, os recomiendo que siempre que uséis la calculadora, yo os voy a dar la opción de hacer las cuentas a mano o a calculadora, como queráis. 00:00:31
No, las tablas siempre hay que confeccionarlas y, bueno, las tablas cuando os dan los datos en bruto, pero vamos, que luego los calculo, lo podéis hacer a mano o a máquina, ¿vale? 00:00:43
Bueno, un truco. Del tema anterior necesitáis saber calcular las medidas de centralización, las de dispersión. 00:00:57
En particular, las más importantes son media, desviación típica y coeficiente de variación. 00:01:04
Si veis los exámenes del año pasado, para calcular el coeficiente de variación necesitáis la medida de desviación típica, con lo cual, pues, vamos, ahí ya está incluido el mayor cuerpo del examen. 00:01:09
y luego de la unidad 11 00:01:26
del libro os tengo que decir 00:01:30
que este tema es un ejercicio 00:01:32
que generalmente 00:01:34
cae, pues un 90% os puedo decir 00:01:36
que cae 00:01:38
y para eso tenéis que tener 00:01:38
claro que con la calculadora 00:01:42
las cuentas son 00:01:44
muchísimo más cortas 00:01:46
las cuentas son muchísimo más cortas 00:01:48
y que el ejercicio es muy tinto 00:01:51
entonces 00:01:54
¿De qué dan estos ejercicios? Bueno, pues de que tenemos una población, tenemos una muestra que generalmente no es muy grande. Bueno, os tengo que decir que las tablas de doble entrada no las vamos a ver, solo vamos a ver los datos en bruto. 00:01:55
Entonces, si os fijáis aquí hay 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10. Son individuos de la misma población. Esto no es dato y frecuencia, sino que aquí tengo dos variables distintas. 00:02:18
En este caso es la relación entre la mortalidad en cada país y el número de camas por cada mil habitantes. Se supone que por cada mil habitantes la mortalidad infantil es de 50, en este caso, y en ese mismo país el número de camas por cada mil habitantes es de 5. 00:02:34
Aquí, aparentemente, pues eso, en un país donde la mortalidad es el doble, pues el número de camas por cada mil habitantes es la mitad. 00:02:58
Aquí es un poco superior, de 50 pasa a 70, y el número de camas es la mitad, ¿no? 00:03:08
Parece que hay una relación entre las variables. 00:03:15
Yo diría que a mayor cantidad de mortalidad es menor el número de camas, ¿no? 00:03:19
¿no? Cuidado que no es lo mismo relación que causalidad. Puede que estén dos cosas 00:03:23
que vayan a la par, pero que una no sea causa de la otra. Por ejemplo, lo normal es que, 00:03:33
como consecuencia del número de camas por cada mil habitantes, la mortalidad infantil 00:03:43
aumente, pero que la mortalidad aumente no produce que el número de camas sea mayor 00:03:48
o menor. Supongo que entendéis la diferencia entre relación y causalidad. En este caso 00:04:03
yo diría que una variable implica a la otra, pero la otra no implica a la primera. Bueno, 00:04:10
Entonces, como veis, esto es una tabla de una distribución bidimensional, también se llaman variables estadísticas dobles, porque cada una de las columnas, bueno, en este caso columnas, a mí me gusta más ponerlo en filas, es un doble dato. 00:04:19
Es un dato de una variable y otra variable de la otra. Y la correlación y la regresión consiste en hacer estimaciones de lo que correspondería a un dato que no está de esto, 00:04:41
hay un valor de la X que desconocemos, por ejemplo el 80 no está aquí, pues qué valor correspondería a la Y. Y la regresión consiste en decir si esa aproximación es buena o no es buena. 00:04:55
La estimación aquí siempre va a ser lineal, o sea, respecto de una recta. 00:05:12
Entonces, como veis, bueno, esto es una tabla, dos datos, ¿no? 00:05:19
Y lo primero que vamos a hacer es una nube de puntos. 00:05:26
A partir de la nube de puntos, pues vamos a empezar a ver cómo se pueden relacionar las cosas. 00:05:29
Este es el ejemplo que os he dicho antes. 00:05:39
Entonces, la primera parte es sencilla, representar los puntos. Conviene tener una cierta lógica para hacer eso. 00:05:41
Alguien todavía no lo ha contestado, en una duda me ha dicho que en un ejercicio que cómo marcaba los intervalos. Los intervalos se suelen marcar por sentido común y vamos intentando que la gráfica sea lo más clara posible. 00:06:01
O que la tabla sea lo más clara posible. Entonces, a ver, yo aquí tengo datos que están entre el 30 y el 200. Pues podría tomar, por ejemplo, de 20 en 20, 20, 40, 60, 80, 100, 120, 40, 50, 60, 50, 80 y 200. 00:06:18
Y el valor de la I está entre, a ver, el mayor valor es 7, pues casi pondría en unidades, ¿no? 4, 5, 6 y 7. Voy a indicar aquí el primer número. El primero siempre hay que ponerlo porque es el que nos da la escala, que significa cada rayita, ¿no? 00:06:44
Y aquí tendría que poner la relación entre la mortalidad infantil, entonces es mortalidad o número de muertos por mil habitantes, supongo que sabéis que tanto por mil se pone así, y aquí el número de camas por mil habitantes, tanto por mil se pone con dos celdas. 00:07:06
entonces, la nube de puntos 00:07:28
pues consiste en 00:07:31
el 55 00:07:33
50 más o menos 00:07:37
está por aquí, 5 está por aquí 00:07:40
este es el primer punto 00:07:41
el 102 00:07:43
voy a poner aquí 100 para que 00:07:49
para que sea más claro 00:07:51
habría que poner todos los valores 00:07:53
es lo más normal 00:07:55
pero para ahorrar tiempo 00:07:57
el 102 pues vendría 00:07:59
por aquí 00:08:02
72,5 00:08:03
este sería 60 00:08:09
en medio del 70 00:08:11
2,5 vendría por aquí 00:08:12
63,75 00:08:15
60 está un poquito 00:08:21
voy a agarrar la derecha 00:08:22
no me gusta como lo he colocado 00:08:24
aquí más el centro 00:08:26
a la 63,75 00:08:27
pues estaría un poquito más abajo 00:08:31
de lo 4 00:08:33
El 124, más o menos sale por aquí. 181, 200, 1,25. Hay el 250, quizá debería haberlo puesto de 25 en 25, pero bueno. 00:08:33
este sería el 260, con lo cual el 250, 0,75, pues sería el más bajo de todos, por aquí, 37, 00:09:06
este es el más alto de todos hasta el momento, y 93, 93 más o menos está por aquí. 00:09:19
Bueno, pues esto como veis es una nube, no tiene una forma específica, es una gráfica amorfa en cierta manera, 00:09:31
pero yo creo que se deja ver que hay una tendencia a que a mayor valor de la x, el valor de la y va descendiendo. 00:09:44
Si yo cogiera una recta, esto es lo que luego vamos a hacer. 00:09:55
Esto hay gente que lo sabe hacer muy bien, a mí se me da regular. 00:10:00
Si yo cogiera una recta que aproxima mejor los puntos, pues más o menos sería así. 00:10:05
La pendiente de esa recta sería negativa. 00:10:11
Entonces, cuando voy a dejar como la mitad de los puntos hacia un lado, la mitad hacia el otro, más o menos sería eso. 00:10:15
Y esto nos podría permitir calcular, por ejemplo, para x igual a 140, cuál es el valor de la y esperado. Esto es a lo que vamos a llegar. 00:10:20
Bueno, yo aquí lo que sí que podría decir es que la pendiente, si hay una recta que se aproxima a estos puntos, esa recta va a tener pendiente negativa. 00:10:33
Eso es lo que se llama correlación negativa. Tiene pendiente negativa. No tienen por qué ser los valores negativos, sino que a medida que avanzamos de izquierda a derecha, los valores de la Y van descendiendo. 00:10:41
Vamos a hacer otra nube de puntos. Esta es la tabla de natalidad por cada mil habitantes de una determinada ciudad de España. 00:10:59
Bueno, entonces, vamos a hacer lo mismo y vamos a ver, bueno, esto nos va a marcar una tendencia y vamos a ver cuál es esa tendencia. 00:11:10
Entonces, aquí, ¿qué diferencia hay con el anterior? 00:11:27
Bueno, así. Y ahora voy a hacer una cosa extraña. 00:11:31
A ver, aquí tengo del año 96 al 2001, ¿no? 00:11:45
Bueno, pues voy a hacer lo que se llama un eje quebrado. 00:11:55
Esto es como si hubiera comprimido esto. 00:12:00
Y aquí voy a poner el primer año, que es el 1996. 00:12:02
Sería 97, 98, 99, 2000, 2001. 00:12:06
O sea, aquí pongo el año. 00:12:14
Y aquí tengo que poner la natalidad que se mide en tantos por mil. 00:12:16
Eso es eso ya, como hemos visto. 00:12:28
Aquí podría quebrar el eje, pero quizás se vea más claro, esto ya depende un poco del gusto de cada uno, ¿no? 00:12:31
pues como el mayor valor es 21, pues voy a poner 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 y 22. 00:12:41
Vamos, si podéis poner todos, rellenar la escala, mejor, 2, 3, 4, 5, 6, 7, 8, 9, 10 y 11. 00:12:55
Entonces, en 1996 la natalidad fue de 20. 20 por 1.096. En 1997 fue 21. Es un poquito más alta. En 1998 fue de 19. Es un poquito más baja. 00:13:02
Este 97 tendría que estar aquí. 21. Luego el 19. Estaría un poquito más bajo. Aquí está el año 98. 00:13:26
El 99, el 17. Un poquito más baja todavía. El 2015 un poquito más baja también. Y el 2001 sería la 14. 00:13:45
Bueno, pues esta es la nube de puntos. También parece ser que hay una tendencia descendente, que hay una correlación negativa y yo creo que más o menos una curva que tomara los puntos más o menos que se aproximara a ella sería esa. 00:14:01
Eso no importa demasiado dibujarlo, eso hay gente, ya os digo, que lo hace con mucha precisión, a mí no se me da tan bien, pero los cálculos que se van a hacer son los cálculos y esos son los que vale. 00:14:18
Entonces, vamos a ver este ejemplo, que es decidir si hay una relación entre las dos variables de momento a simple vista. 00:14:31
A ver, yo diría que de todos estos casos, bueno, os sigo hablando, se llama correlación lineal, 00:14:56
Porque hay cosas que se pueden aproximar mediante parábolas o mediante otro tipo de funciones. Yo diría que lo más parecido a una recta son los datos que hay aquí. Yo aquí diría que hay una correlación que es bastante fuerte, aunque no sigan exactamente en la línea recta, todos se agrupan mucho respecto de esa recta. 00:15:09
Y esa recta va hacia abajo, entonces es negativa. Entonces, de estos tres datos que quedan, yo diría que esto es lo que menos se acerca a una recta. Yo aquí diría que la correlación es débil. A simple vista, luego ya veremos cómo se puede determinar eso. 00:15:43
A simple vista, yo diría que de los segundos que se más parecen, se parecen a recta, es esto. 00:16:09
Más o menos, están unos por encima, unos por debajo. 00:16:18
Este es un dato que a veces puede ocasionarse por un error en la medición, o que puede ser ese, 00:16:21
y que sea un dato que no se cumple, pero yo diría que aquí la correlación es media. 00:16:27
y negativo. 00:16:43
Y es media a media fuerte. 00:16:48
Esta yo diría que es fuerte incluso. 00:16:50
Diría que esta es fuerte 00:16:52
y esta media 00:16:53
entre media y fuerte. 00:16:57
Y aquí, pues yo diría 00:17:01
que hay una correlación 00:17:03
bueno, esta podría decir 00:17:04
que es muy débil. 00:17:06
Yo diría que la correlación es débil 00:17:11
pero en caso de 00:17:13
haber alguna correlación entre las dos 00:17:15
variables, pues más bien tiende al ascenso. Débil y positivo. Esto es buscarle un sentido 00:17:17
a los cálculos que vamos a hacer ahora, porque los cálculos luego son bastante abstractos 00:17:34
y no vamos a ver mucho. Bueno, entonces, vamos ya directamente a los cálculos. La recta 00:17:39
de regresión, la recta de regresión es esta recta que yo he dibujado aquí de forma aproximada. 00:17:52
La recta de regresión tiene esta forma. Que no cunda el pánico que esto no está en conjunto. 00:18:03
A ver, la recta de regresión. Tenéis que calcular la media. Tenéis que calcular la media de la X, 00:18:12
La media de la Y y tenéis que calcular la covarianza. Y bueno, la desviación típica al cuadrado de la X. 00:18:19
Todo se va a hacer con calculadora, excepto la covarianza que vamos a hacer una parte que es entera. 00:18:29
Vamos a ver el ejemplo, porque ya os digo que esto en principio os parece muy extraño, pero luego el ejercicio es bastante mecánico. 00:18:38
Tengo seis institutos de la misma zona, se ha estudiado la nota media de los estudiantes de primero de bachillerato en matemáticas en inglés. Se obtiene la siguiente información que se recoge en la estampa. Entonces tengo uno, dos, tres, cuatro, cinco y seis alumnos. 00:19:03
O sea, el número de datos es eso. En cada individuo, los datos que he recogido son la nota en matemáticas, esta es la del primer individuo en matemáticas, esta es la del primer individuo en inglés. 00:19:18
Entonces, vamos a tomar eso y para no asustarnos, vamos a copiar las fórmulas que ya os digo que esto hacéis dos o tres y lo mecanizáis perfectamente. 00:19:39
Entonces, esto es lo que se llama la covarianza. 00:19:54
Para hacer la covarianza, primero, tengo que calcular la media. 00:20:03
Y aquí, ya os tengo que decir, esto, si no sabéis hacerlo con calculadora, tenéis que hacerlo a mano y es bastante largo. 00:20:11
Entonces, voy a hacer unos cálculos previos. 00:20:20
Cálculos previos. 00:20:27
¿Qué es lo que necesito? 00:20:29
cito 00:20:35
la media de la X 00:20:37
la desviación típica de la X 00:20:39
y la media de L 00:20:45
con eso casi tenemos la covariaz 00:20:49
entonces ahora 00:20:54
si tenéis la calculadora que os dije el otro día 00:20:56
por favor hacerlo conmigo 00:21:00
y si no intentad hacerlo bien 00:21:02
se supone que ya habéis mirado el tutorial 00:21:05
y que ya sabéis hacer una media y una desviación típica 00:21:07
Entonces, los que tenéis la calculadora que os dije el otro día, os recuerdo que tenéis que darle a SID CLEAR. 00:21:10
Luego le dais al 1 y le dais al 1. 00:21:20
Tenéis que comprobar que vuestra calculadora está en modo estadístico. 00:21:24
Acordaos que es SD. 00:21:29
Si podéis hacerlo ahora, fenomenal. 00:21:31
Si tenéis alguna duda sobre alguna tecla en particular, ya os digo, esta es la FX82. 00:21:34
ms por similares son las que tienen aunque no sean casi un botoncito gris en medio pues en algunas 00:21:40
creo que es azul también amarillo pero es un botón así muy claro y grande que pone replay entonces 00:21:50
cómo se meten los datos acordaos que he borrado los datos por si acaso he borrado los datos por 00:21:57
Por si acaso, me quedan los de otro día. 00:22:06
Si yo le doy a SIF 1 y le doy al igual, 00:22:09
y uno a la vez me tiene que dar N igual a 0. 00:22:14
Y ahora voy metiendo los datos. 00:22:18
Y os recuerdo que es 6.5 M más. 00:22:20
Sale N igual a 1. 00:22:24
5.2 M más. 00:22:26
6 M más. 00:22:32
6.5 M más. 00:22:35
7, n más 00:22:37
y 6, n más 00:22:41
esto conviene hacerlo dos veces 00:22:43
se supone que en la calculadora pone n igual a 6 00:22:47
porque habéis metido 6 datos 00:22:50
y ahora, si queréis calcular la media 00:22:51
le dais SIF 00:22:55
2, 1 00:22:57
le dais al igual y sale 6,2 00:23:00
esto no es 1, no sé si nos haría 00:23:04
6,2 00:23:07
y la desviación típica 00:23:10
le dais shift 2 00:23:13
y le dais al 2 y el igual 00:23:15
y sale, este número es aproximado 00:23:18
utilizad los decimales, mientras no se os llegue a lo contrario 00:23:21
los decimales, sale aproximadamente 00:23:25
0,56 00:23:28
esta es la primera parte que ya os digo 00:23:30
buscad el tutorial porque esto se hace en un libro 00:23:36
Y ahora tengo que calcular la media de ley. Lo que os he dicho antes, no os olvidéis de borrar los datos. Le dais a seed, donde ponemos que es un amarillo clear, le dais a 1 y a igual. 00:23:39
Y ahora voy a calcular, solo necesito la media. 7m más, 5m más, 5m más, 6m más, 7.5m más y 5m más. 00:23:56
Y la media nos sale, acordaos, 6, 2, 1. Y os sale aproximadamente 5,92. Haced bien los redondeos, porque sale 5,916666. 5,92. 00:24:15
Bueno, yo primero me tendría a decir 00:24:37
¿están bien hechas estas cuentas? Pues yo creo que sí 00:24:41
porque valores que están entre 5,2 y 7 00:24:44
que la media salga 6,2 me parece razonable 00:24:48
y valores que están entre 5 y 7 00:24:51
que salga una media de 5,92 00:24:54
me parece razonable 00:24:57
Siempre en caso de un examen o cuando estéis haciendo un ejercicio 00:24:58
repasadlo, lo hacéis otra vez y que queden los números 00:25:03
¿Vale? Bueno, entonces, dejo la calculadora por un momento y ahora tengo que hacer este cálculo. Bueno, me diréis, ¿por qué he calculado la desviación típica si no sale aquí? 00:25:06
Porque es que ese dato lo voy a necesitar. Esta columna, acordaos, xy por y sub y consiste en multiplicar este número por este. 00:25:23
Entonces voy a ir haciéndolo con la calculadora. 6,5 por 7 y sale 45,5. 00:25:42
En este ejercicio, que veáis que es bastante rollo, pero al hacer 2 o 3 ya os lo sabéis, 5,2 por 5, 26. 6 por 5 que es 30. 00:25:49
Bueno, 6,5 por 6 es 3,9. Perdón, 39. Ahora 7 por 7,5 creo que es 5,5. 52,5. Y aquí hay otro 6 por 5 que es 30. Pues hay dos alumnos que han sacado las mismas notas. 00:26:08
Puede ocurrir. Entonces, si yo sumo todos estos datos, me sale la suma de los productos X, Y por Y. Bueno, pues voy a sumarlo. 00:26:40
52,5 más 30, más 39, más 30 otra vez, más 26, más 45,5. Y sale 223 por ciento. 00:26:57
¿Sí? Entonces, ya estoy en condiciones de calcular la covarianza. La covarianza es 223, que es la suma que nos ha salido, partido por el número de datos. 00:27:20
Esto el otro día dije que era en minúscula, pero bueno, esto es el número de datos. 223 dividido entre 6, que aproximadamente es 37,17. 00:27:34
Ah, no, perdón, que tengo que sumarle para menos, que tengo que restarle 6,2 por 5,92. 00:27:56
Menos 6,2 por 5,92. 00:28:11
Y esto, si no me equivoco, sale aproximadamente 0,46. 00:28:17
Aproximadamente 0,46, remontado con dos decimales. 00:28:24
Bueno, aquí la covarianza es positiva. Y bueno, si la covarianza es positiva, nos va a decir que la correlación es positiva. 00:28:28
Vale. Y ahora, para no asustaros, aquí. Vale. Os voy a poner la fórmula de la recta de Rennes. Bueno, es muy raro que la covarianza sea exactamente cero, ¿no? 00:28:40
Pero si la covarianza es negativa, la correlación se dice que es negativa o inversa. Esta es la recta, la ecuación de la recta que yo antes dibujaba de forma próxima. 00:29:04
Y ahora os digo, ¿cómo se aprende uno esta fórmula? Pues vamos a ver. A la Y le resto la media de las X, que la he calculado, 5,92. A la X le resto la media de las X, que es 6,2. 00:29:15
Y esto de aquí, pues es un poquito más largo, pero acordaos siempre que es la covarianza, que es lo que hemos hecho, 0,46 partido por el cuadrado de este número que nos habíamos reservado antes, 0,56 al cuadrado. 00:29:42
una cosa en el libro creo que hace 00:30:05
la recta de regresión de x sobre y 00:30:09
y la de y sobre x 00:30:11
yo solo voy a hacer esta que es la de y sobre x 00:30:13
para no liar las cosas 00:30:15
siempre vamos a utilizar 00:30:17
entonces esto 00:30:19
lo hago con la calculadora 00:30:21
0,46 00:30:22
dividido entre 0,56 00:30:30
al cuadrado 00:30:33
y si no me equivoco sale 00:30:34
Entonces, el ejercicio nos pedía hacer una estimación de la nota de inglés 00:30:36
que correspondería a un estudiante que sacaba un 5,5 en matemáticas. 00:30:58
Entonces, esta es la nota de inglés. 00:31:06
Con estos datos, yo puedo decir que y menos 5,92 es igual a 1,47 por x menos la media de la x, que es 6,2. 00:31:08
Vale. Entonces, hago los cálculos. Será y igual a el 5, bueno, primero voy a multiplicar 1,47 por x menos 1,47 por 6,2. 00:31:30
1,47 por 6,12. 00:32:03
Aproximadamente me sale 9,11. 00:32:07
Y este menos pasa con más. 00:32:15
Más 5,92. 00:32:17
Entonces me queda que la recta de regresión es igual a 1,47x. 00:32:20
Y ahora, menos 9,11 más 5,92 es menos 3,19. 00:32:27
Entonces, nos está diciendo que si la nota, conclusión, si la nota en matemáticas es 5,5, quiere decir que X es 5,5. 00:32:39
Entonces, la nota en inglés es 1,47 por 5,5 menos 3,19, que esto sale 1,47 por 5,5 menos 3,19. 00:33:17
Sale 4,85. Pues la conclusión que sería, se espera que en inglés tenga, como las notas están andadas con un decimal, lo redondeamos y nos sale un 4,85. 00:33:41
Bueno, este ejercicio, que aparentemente os puede resultar muy complicado, consiste en que con la calculadora sepáis hacer la media de la X, la media de la Y y la desviación típica de la X. 00:34:11
que a mano hagáis 00:34:34
la columna esta de x y por 00:34:36
y subí y que apliquéis 00:34:38
esas dos fórmulas 00:34:40
cuando hacéis dos o tres os quedáis 00:34:41
con todo ello, yo creo que este es un problema 00:34:44
de los que compense 00:34:46
y creo que de cara al año 00:34:47
que viene creo que luego van a empezar 00:34:50
a volver a poner en la evao 00:34:52
que a veces ha sido el temario de primero 00:34:53
a veces ha sido el temario de segundo 00:34:56
entonces, bueno esta es la idea 00:34:57
de lo que es la 00:35:02
recta de regresión 00:35:04
Porque la recta que yo había dibujado a ojo tiene explícitamente un número asociado, ¿vale? 00:35:05
Perdón, tiene una ecuación asociada que es exactamente esa y a partir de ahí se pueden hacer estimaciones. 00:35:16
Pero ahora, como hemos visto al principio, las nubes de punto a veces son muy dispersas y a veces se acercan mucho a una recta. 00:35:23
Entonces, ¿cómo se mide si la correlación es muy fuerte, es fuerte, es funcional, o es débil o no hay correlación? 00:35:32
Bueno, pues para eso tenemos que calcular un número que se llama el coeficiente de correlación. 00:35:47
Ese número viene dado por esta fórmula, entonces fijaos que lo que tenemos que hacer con la calculadora son la media de la x, la media de la y y luego hacer la covarianza como habéis hecho antes. 00:35:56
Entonces los cálculos que hemos hecho antes se pueden aproximar con una fórmula. 00:36:09
Bueno, una cosa muy importante, si calculáis el coeficiente de correlación, si os sale más pequeño que menos uno o más grande que uno, está mal. 00:36:15
Si en el examen no encontráis el fallo, por lo menos decir que ese valor no es correcto, ¿vale? 00:36:25
Ahora, ¿cómo se interpreta ese valor? 00:36:32
Si el valor de ese coeficiente vale exactamente 1, la correlación es perfecta. 00:36:36
Todos los puntos están perfectamente en una línea recta y la correlación es positiva. 00:36:43
O sea, esa recta va a hacer 1. 00:36:49
Si vale menos 1, la correlación también es perfecta. 00:36:52
Se llama funcional. La diferencia es que la recta en vez de ser creciente es decreciente. Al mayor valor de un valor nos sale otro. ¿Sí? Ahora, cuanto más se acerca a 1 o a menos 1, la correlación es fuerte. 00:36:55
esto más o menos 00:37:10
pues ya en cada ejercicio 00:37:13
pues ya se irá diciendo lo que para mí es fuerte 00:37:15
muy fuerte, porque en los textos generalmente 00:37:17
no lo detallan y yo creo que depende 00:37:19
un poco de los tipos de datos que se 00:37:21
manejen, se puede considerar fuerte 00:37:23
o muy fuerte, pero si el valor 00:37:25
es próximo a cero, la correlación es débil 00:37:27
¿vale? sea positiva o negativa 00:37:29
si es exactamente cero es que 00:37:31
no hay correlación 00:37:33
correlación lineal 00:37:34
eso 00:37:37
Eso no excluye que puedan tener una relación parabólica o de cúbica o de otro tipo, ¿no? Entonces, vamos a hacer un ejemplo de esto y de gráfico y luego vamos a hacer los cálculos y el tema, que sepáis que está dado. 00:37:38
Lo que hay que hacer ahora es repasar y ya os digo, practicar dos o tres de estos porque es un ejercicio que en mi opinión es bastante asequible. Tengo un trabajo de aprender a hacer la media con la calculadora. 00:38:03
Bueno, aquí te dice los números 0, 2, menos 0, 9, menos 0, 7 y 0, 6 corresponden a coeficientes de correlación. 00:38:16
Dice, asigna cada una gráfica al 5. 00:38:24
A ver, yo aquí pondría, aquí la correlación es positiva, ¿no? 00:38:28
Esta es la más grande de todas. 00:38:35
Pues yo diría que esta correlación es de 0, 6. 00:38:37
¿Por qué? Porque es positiva y es la más fuerte que hay, es la que más se acerca a 1. 00:38:41
Ahora, tengo estos valores y estos valores. Yo diría que los que se acercan más a una recta son estos. Esto como veis es una cuestión bastante subjetiva y por eso luego se hacen las cuentas. 00:38:46
Yo diría que este es el del menos 0,9, porque parece que estos datos están un poquito más dispersos. 00:39:00
Pues yo diría que aquí es menos 0,9 y aquí es menos 0,5. 00:39:07
Es fuerte, pero no tanto. 00:39:15
Y aquí los valores se acercan mucho a cero correlación débil. 00:39:17
Vamos a ver el otro ejemplo que hay ahí. 00:39:22
Para ver si... Bueno, aquí nos dicen que las correlaciones no nos dicen si son positivas o negativas. Y nos dicen que... A ver, yo diría que la correlación más fuerte es esta. Esta es la más fuerte. La más fuerte. 00:39:24
yo creo que los puntos que se acercan más a una recta son estos 00:39:52
entonces aquí la correlación es 0.96 00:39:59
pero como se ajusta a una recta que va hacia abajo 00:40:02
yo diría que la correlación es negativa 00:40:06
la siguiente correlación fuerte que diría yo 00:40:08
pues yo diría que son estos 00:40:12
0.87 y de nuevo la correlación es negativa 00:40:14
Estos yo veo que tienen muy poca relación. 00:40:23
Yo diría que estos tienen una correlación de 0,55. 00:40:25
Y no me atreví a saber, a decir si es positiva o negativa. 00:40:29
Yo diría que sí, que más bien parece positiva que negativa. 00:40:32
Y esta, pues sí, parece que es positiva. 00:40:37
Esta sí. 00:40:41
Pero vamos, esta sí de 0,55, yo diría que es positiva. 00:40:42
Como veis, esto se hace a ojo. 00:40:46
No os voy a pedir que hagáis nada a ojo. 00:40:48
Esto es orientativo. 00:40:50
para que veáis luego cómo se hace de una forma más científica. 00:40:52
Entonces, vamos a hacerlo con la altura de unos niños 00:40:58
y que sepáis que esto es un problema de examen, tal cual. 00:41:03
Este 3 es un problema de examen, así tal cual. 00:41:06
Y, bueno, si tenemos tiempo para hacerlo, 00:41:10
a ver, sería bueno, como mínimo, 00:41:19
que hagáis los ejercicios 9 y 10 de la página 00:41:22
que hay el 275, en la página siguiente, y que veáis un ejercicio completo. 00:41:25
Esto, si vais a hacer luego los cálculos con calculadoras, podéis saltar lo primero 8 minutos. 00:41:33
Pero esto ya os digo, este es tal cual un ejercicio de un examen. 00:41:38
Podéis verlo en los exámenes del curso pasado. 00:41:41
¿Vale? Entonces, si observamos las edades de cinco niños y niñas en sus pesos respectivos y se obtienen estos datos. 00:41:47
Como veis, hay cinco datos. 00:41:57
Nos dice, coeficiente de correlación lineal, rectas de regresión de y sobre x. 00:42:03
Esto ya lo hemos hecho antes. 00:42:08
¿Qué peso correspondería a un niño de cinco años? 00:42:10
Entonces, os recuerdo, tenemos que calcular la media de la x, 00:42:13
la desviación típica de la x, 00:42:19
la media de la Y 00:42:21
y la desviación típica de la Y 00:42:23
consejo que lo hagáis con calculador 00:42:25
entonces 00:42:28
si la tenéis a mano y ya habéis aprendido 00:42:30
a hacerlo, acordaos de 00:42:32
borrar los datos 00:42:34
SIF mode 1 00:42:35
acordaos de darle al igual 00:42:38
ya están los datos borrados 00:42:40
voy a comprobarlo 00:42:42
si están todos borrados 00:42:46
ahora, introduzco los datos de la X 00:42:47
2M más 00:42:50
No hace falta poner el punto y la coma que poníamos el otro día porque simplemente tenéis esos datos. Ahora, porque se repiten una vez. 4,5n más, 6n más, 7.2n más y 8n más. 00:42:52
hay un error muy común 00:43:14
es que es que cuando metéis el último dato 00:43:16
se os olvida darle el ónimos 00:43:18
o a mí por lo menos me pasa 00:43:19
¿vale? 00:43:21
entonces, una vez hecho eso 00:43:23
tenéis que en la pantalla 00:43:25
ponerme igual a 5 00:43:27
y le dais a SIF 00:43:28
y os sale la media 5,54 00:43:34
parece un valor razonable 00:43:38
pues la apunto 00:43:40
5,54 00:43:40
es más correcto que pongáis 00:43:43
en ambos 00:43:46
años 00:43:49
las unidades pues siempre quedan 00:43:52
ahora la desviación 00:43:54
típica le dais 00:43:56
SIF 2 00:43:58
y ahora le dais al 2 que no se os olvide 00:43:59
darle al igual 00:44:02
y sale aproximadamente 2,13 00:44:03
2,13 00:44:06
y esto serían 00:44:09
años también 00:44:11
Entonces, nos olvidamos de la X, borramos los datos, SIG CLEAR, sale igual, borrado 00:44:12
los datos, lo compruebo y ya está. Bueno, y ahora meto los datos de los pesos, 15 M 00:44:28
más, 19 m más, 25 m más, 33 m más, 34 m más y 34 m más. Le doy a ver si he metido 00:44:37
los datos, si he metido 100 datos. Ahora me doy a la media, SIF 2, 1, igual 25,2. Como 00:44:56
me parece un resultado razonable entre 15 y 34, pues pongo aproximadamente, no, no, exactamente 00:45:07
25,2. Como son pesos, pongo kilogramos. Ahora le doy sí, 2, 2, le doy al igual y me sale 00:45:14
7,49. Este es aproximado. Lo aproximo con dos cifras decimales, 7,49 kilogramos. Entonces, 00:45:24
Ahora, necesito calcular la covarianza. Para hacer la covarianza, acordaos que tengo que hacer x y por y sub i. 00:45:35
Entonces pongo aquí 2 por 15 que es 30, 19 por 4,5 que es 85,5, 25 por 6 que es 150, 00:45:45
P2 por 33, que es 237,6, y 34 por 8, que es 270. 00:46:10
Bueno, esto podría haberlo hecho con la calculadora. 00:46:32
Bueno, entonces voy a hacer la suma de xy por y sub i. 00:46:35
Y la suma es 30 más 85,5 más 150 más 237,6 más 272. 00:46:42
Sale 775,1. 00:47:01
Entonces la covarianza, hemos dicho que era la suma de las xy, o sea lo que calculo ahora, dividido entre n menos el producto de las medias. 00:47:03
Pues me sale 775,1 dividido entre 5 datos menos la media de la X que es 5,54 por la media de la Y que es 25,2. 00:47:23
Lo hago, divido entre 5, menos 5,54 por 25,2. Y sale 15,412, pongo aproximadamente 15,30. 00:47:46
esto no tiene un día 00:48:11
no son de kilos, ni están mezclados los kilos 00:48:16
con los kilos 00:48:18
es lo normal que a mayor edad 00:48:19
corresponda a mayor peso, la correlación es positiva 00:48:22
y bueno, y ahora, el coeficiente de correlación 00:48:25
que es E 00:48:40
todavía estoy en el apartado A 00:48:40
coeficiente 00:48:45
de correlación 00:48:48
en algunos sitios lo ponen con la R griega 00:48:52
pero creo que lo he puesto con la R 00:48:56
es la covarianza partido por el producto 00:48:57
de las desviaciones típicas 00:49:01
y esto tiene que ser un número entre 0 y 1 00:49:03
porque si no me he equivocado en las cuentas 00:49:06
perdón 00:49:08
entre 00:49:10
menos 1 y he dicho entre 0 y 1 00:49:13
porque sé que la correlación es positiva 00:49:16
pero siempre menos 1 00:49:18
Bueno, entonces, la covarianza es 15,41 y las desviaciones típicas son 2,13 y 7,49. 00:49:19
Es posible que si la correlación es muy buena, que os salga un 1,01 por lo redondeado. 00:49:35
Acordaos de esto. Mirad, lo voy a hacer con calculadora. 00:49:42
Ah, no, no, que la calculadora está en la zona. 00:49:46
A ver, os voy a enseñar la calculadora, porque la parte de estadística no la puedo hacer. A ver, sería 15,41 dividido, poned paréntesis, los que no tenéis la fracción, la tecla de fracciones, a 2,13 por 7,49. 00:49:50
Cierro paréntesis y sale 0,97 aproximadamente. 0,97. Sale menor que 1, o sea que esté bien, pero es que además esto me dice que la correlación es muy fuerte, porque se acerca mucho a 1. 00:50:21
Y ahora, para hacer la recta de regresión, sabéis que a y le resto la media, a x le resto la media, y la pendiente de esta recta es, aquí tengo sigma xy, la cobranza, y aquí pongo, acordaos de que es la desviación típica al cuadrado. 00:50:40
Entonces, aquí me queda y menos y barra, la media de y es 25,2, es igual a sigma xy, que está la covarianza, que es 15,41. 00:51:24
15,41 partido por la desviación típica, que es 2,13 al cuadrado, por X menos la media de la X, que es 5,54. 00:51:43
Bueno, entonces, os dice, ¿qué peso corresponde? Si queréis lo podéis dejar así, ¿vale? 00:52:02
Ahora, apartado 1. ¿Qué peso correspondería a un niño de 5 años? 00:52:10
Pues si x es igual a 5, yo tomo la recta de regresión y lo único que hago es igual a, lo digo para que quede con más precisión, 15,41 partido por 2,13 al cuadrado por x que vale 5, 5 menos 5,54 y este menos 25,2 pasa como más 25,2. 00:52:15
Y esto lo hago con la calculadora, 15,41 dividido entre 2,13 elevado al cuadrado, por paréntesis, 5 menos 5,54, 00:52:47
paréntesis, más 25,2, igual a aproximadamente 23,37, aproximadamente 23,37. 00:53:11
¿Qué peso? Kilogramos, 23,35, 37, 37, ¿sí? 00:53:29
Y ahora, la tercera parte. ¿Es fiable esta estimación? Sí. Por dos razones. ¿Por qué? 5 está en medio de los datos. Los datos oscilan entre 2 y 8. 00:53:46
entre 2 y 8 00:54:10
y lo más importante 00:54:18
que es lo que he dicho antes 00:54:19
porque la correlación 00:54:21
es muy fuerte 00:54:24
bueno, pues con esto os tengo que decir 00:54:27
que está dado todo el tema 00:54:35
que lo que tenéis que hacer 00:54:36
es practicar los ejercicios 00:54:41
si queréis primero lo hacéis con el tutorial 00:54:43
luego lo hacéis con los del libro 00:54:45
son 5 o 6 00:54:47
con esto se supone 00:54:51
que tenéis bastante práctica 00:54:53
para hacer esto 00:54:56
la próxima clase 00:54:58
prácticamente de repaso 00:55:00
si queréis está colgada si no me equivoco 00:55:04
entonces bueno 00:55:06
finalizamos la grabación 00:55:08
os sigo insistiendo que si nadie 00:55:10
tiene inconveniente la voy a colgar 00:55:12
cuando pueda 00:55:14
y bueno 00:55:15
como siempre que tengáis una gran semana 00:55:17
y que contéis siempre con las 00:55:20
tutorías individuales 00:55:22
bueno 00:55:24
pues espero 00:55:26
veros pronto y 00:55:27
nada, dadle duro, esta parte 00:55:30
es muy sencilla para los que os cuesta más 00:55:31
entonces aprovechad y 00:55:34
intentad hacerlo 00:55:35
a lo mejor que podéis, ¿de acuerdo? 00:55:37
bueno, hasta pronto 00:55:39
Valoración:
  • 1
  • 2
  • 3
  • 4
  • 5
Eres el primero. Inicia sesión para valorar el vídeo.
Autor/es:
Javier M.
Subido por:
Francisco J. M.
Licencia:
Reconocimiento
Visualizaciones:
15
Fecha:
26 de febrero de 2024 - 23:14
Visibilidad:
Clave
Centro:
IES LOPE DE VEGA
Relación de aspecto:
1.78:1
Resolución:
1920x1080 píxeles
Tamaño:
63.59 MBytes

Del mismo autor…

Ver más del mismo autor

Comentarios

Para publicar comentarios debes entrar con tu nombre de usuario de EducaMadrid.

Comentarios

Este vídeo todavía no tiene comentarios. Sé el primero en comentar.



EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid