26-2BSO1 - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Diciendo que esta clase va a ser grabada, por si alguien tiene algún inconveniente que lo diga ahora mismo. Y si no, pues vamos directamente, entramos en materia. ¿De acuerdo?
00:00:00
Bueno, entonces, estamos en la decima quincena, esta es la primera clase y, bueno, os tengo que decir que estos dos temas de estadística yo creo que son bastante asequibles, tenéis que revisar las cuentas.
00:00:13
Os recomiendo que uséis, os recomiendo que siempre que uséis la calculadora, yo os voy a dar la opción de hacer las cuentas a mano o a calculadora, como queráis.
00:00:31
No, las tablas siempre hay que confeccionarlas y, bueno, las tablas cuando os dan los datos en bruto, pero vamos, que luego los calculo, lo podéis hacer a mano o a máquina, ¿vale?
00:00:43
Bueno, un truco. Del tema anterior necesitáis saber calcular las medidas de centralización, las de dispersión.
00:00:57
En particular, las más importantes son media, desviación típica y coeficiente de variación.
00:01:04
Si veis los exámenes del año pasado, para calcular el coeficiente de variación necesitáis la medida de desviación típica, con lo cual, pues, vamos, ahí ya está incluido el mayor cuerpo del examen.
00:01:09
y luego de la unidad 11
00:01:26
del libro os tengo que decir
00:01:30
que este tema es un ejercicio
00:01:32
que generalmente
00:01:34
cae, pues un 90% os puedo decir
00:01:36
que cae
00:01:38
y para eso tenéis que tener
00:01:38
claro que con la calculadora
00:01:42
las cuentas son
00:01:44
muchísimo más cortas
00:01:46
las cuentas son muchísimo más cortas
00:01:48
y que el ejercicio es muy tinto
00:01:51
entonces
00:01:54
¿De qué dan estos ejercicios? Bueno, pues de que tenemos una población, tenemos una muestra que generalmente no es muy grande. Bueno, os tengo que decir que las tablas de doble entrada no las vamos a ver, solo vamos a ver los datos en bruto.
00:01:55
Entonces, si os fijáis aquí hay 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10. Son individuos de la misma población. Esto no es dato y frecuencia, sino que aquí tengo dos variables distintas.
00:02:18
En este caso es la relación entre la mortalidad en cada país y el número de camas por cada mil habitantes. Se supone que por cada mil habitantes la mortalidad infantil es de 50, en este caso, y en ese mismo país el número de camas por cada mil habitantes es de 5.
00:02:34
Aquí, aparentemente, pues eso, en un país donde la mortalidad es el doble, pues el número de camas por cada mil habitantes es la mitad.
00:02:58
Aquí es un poco superior, de 50 pasa a 70, y el número de camas es la mitad, ¿no?
00:03:08
Parece que hay una relación entre las variables.
00:03:15
Yo diría que a mayor cantidad de mortalidad es menor el número de camas, ¿no?
00:03:19
¿no? Cuidado que no es lo mismo relación que causalidad. Puede que estén dos cosas
00:03:23
que vayan a la par, pero que una no sea causa de la otra. Por ejemplo, lo normal es que,
00:03:33
como consecuencia del número de camas por cada mil habitantes, la mortalidad infantil
00:03:43
aumente, pero que la mortalidad aumente no produce que el número de camas sea mayor
00:03:48
o menor. Supongo que entendéis la diferencia entre relación y causalidad. En este caso
00:04:03
yo diría que una variable implica a la otra, pero la otra no implica a la primera. Bueno,
00:04:10
Entonces, como veis, esto es una tabla de una distribución bidimensional, también se llaman variables estadísticas dobles, porque cada una de las columnas, bueno, en este caso columnas, a mí me gusta más ponerlo en filas, es un doble dato.
00:04:19
Es un dato de una variable y otra variable de la otra. Y la correlación y la regresión consiste en hacer estimaciones de lo que correspondería a un dato que no está de esto,
00:04:41
hay un valor de la X que desconocemos, por ejemplo el 80 no está aquí, pues qué valor correspondería a la Y. Y la regresión consiste en decir si esa aproximación es buena o no es buena.
00:04:55
La estimación aquí siempre va a ser lineal, o sea, respecto de una recta.
00:05:12
Entonces, como veis, bueno, esto es una tabla, dos datos, ¿no?
00:05:19
Y lo primero que vamos a hacer es una nube de puntos.
00:05:26
A partir de la nube de puntos, pues vamos a empezar a ver cómo se pueden relacionar las cosas.
00:05:29
Este es el ejemplo que os he dicho antes.
00:05:39
Entonces, la primera parte es sencilla, representar los puntos. Conviene tener una cierta lógica para hacer eso.
00:05:41
Alguien todavía no lo ha contestado, en una duda me ha dicho que en un ejercicio que cómo marcaba los intervalos. Los intervalos se suelen marcar por sentido común y vamos intentando que la gráfica sea lo más clara posible.
00:06:01
O que la tabla sea lo más clara posible. Entonces, a ver, yo aquí tengo datos que están entre el 30 y el 200. Pues podría tomar, por ejemplo, de 20 en 20, 20, 40, 60, 80, 100, 120, 40, 50, 60, 50, 80 y 200.
00:06:18
Y el valor de la I está entre, a ver, el mayor valor es 7, pues casi pondría en unidades, ¿no? 4, 5, 6 y 7. Voy a indicar aquí el primer número. El primero siempre hay que ponerlo porque es el que nos da la escala, que significa cada rayita, ¿no?
00:06:44
Y aquí tendría que poner la relación entre la mortalidad infantil, entonces es mortalidad o número de muertos por mil habitantes, supongo que sabéis que tanto por mil se pone así, y aquí el número de camas por mil habitantes, tanto por mil se pone con dos celdas.
00:07:06
entonces, la nube de puntos
00:07:28
pues consiste en
00:07:31
el 55
00:07:33
50 más o menos
00:07:37
está por aquí, 5 está por aquí
00:07:40
este es el primer punto
00:07:41
el 102
00:07:43
60
00:07:46
80
00:07:48
voy a poner aquí 100 para que
00:07:49
para que sea más claro
00:07:51
habría que poner todos los valores
00:07:53
es lo más normal
00:07:55
pero para ahorrar tiempo
00:07:57
el 102 pues vendría
00:07:59
por aquí
00:08:02
72,5
00:08:03
este sería 60
00:08:09
en medio del 70
00:08:11
2,5 vendría por aquí
00:08:12
63,75
00:08:15
60 está un poquito
00:08:21
voy a agarrar la derecha
00:08:22
no me gusta como lo he colocado
00:08:24
aquí más el centro
00:08:26
a la 63,75
00:08:27
pues estaría un poquito más abajo
00:08:31
de lo 4
00:08:33
El 124, más o menos sale por aquí. 181, 200, 1,25. Hay el 250, quizá debería haberlo puesto de 25 en 25, pero bueno.
00:08:33
este sería el 260, con lo cual el 250, 0,75, pues sería el más bajo de todos, por aquí, 37,
00:09:06
este es el más alto de todos hasta el momento, y 93, 93 más o menos está por aquí.
00:09:19
Bueno, pues esto como veis es una nube, no tiene una forma específica, es una gráfica amorfa en cierta manera,
00:09:31
pero yo creo que se deja ver que hay una tendencia a que a mayor valor de la x, el valor de la y va descendiendo.
00:09:44
Si yo cogiera una recta, esto es lo que luego vamos a hacer.
00:09:55
Esto hay gente que lo sabe hacer muy bien, a mí se me da regular.
00:10:00
Si yo cogiera una recta que aproxima mejor los puntos, pues más o menos sería así.
00:10:05
La pendiente de esa recta sería negativa.
00:10:11
Entonces, cuando voy a dejar como la mitad de los puntos hacia un lado, la mitad hacia el otro, más o menos sería eso.
00:10:15
Y esto nos podría permitir calcular, por ejemplo, para x igual a 140, cuál es el valor de la y esperado. Esto es a lo que vamos a llegar.
00:10:20
Bueno, yo aquí lo que sí que podría decir es que la pendiente, si hay una recta que se aproxima a estos puntos, esa recta va a tener pendiente negativa.
00:10:33
Eso es lo que se llama correlación negativa. Tiene pendiente negativa. No tienen por qué ser los valores negativos, sino que a medida que avanzamos de izquierda a derecha, los valores de la Y van descendiendo.
00:10:41
Vamos a hacer otra nube de puntos. Esta es la tabla de natalidad por cada mil habitantes de una determinada ciudad de España.
00:10:59
Bueno, entonces, vamos a hacer lo mismo y vamos a ver, bueno, esto nos va a marcar una tendencia y vamos a ver cuál es esa tendencia.
00:11:10
Entonces, aquí, ¿qué diferencia hay con el anterior?
00:11:27
Bueno, así. Y ahora voy a hacer una cosa extraña.
00:11:31
A ver, aquí tengo del año 96 al 2001, ¿no?
00:11:45
Bueno, pues voy a hacer lo que se llama un eje quebrado.
00:11:55
Esto es como si hubiera comprimido esto.
00:12:00
Y aquí voy a poner el primer año, que es el 1996.
00:12:02
Sería 97, 98, 99, 2000, 2001.
00:12:06
O sea, aquí pongo el año.
00:12:14
Y aquí tengo que poner la natalidad que se mide en tantos por mil.
00:12:16
Eso es eso ya, como hemos visto.
00:12:28
Aquí podría quebrar el eje, pero quizás se vea más claro, esto ya depende un poco del gusto de cada uno, ¿no?
00:12:31
pues como el mayor valor es 21, pues voy a poner 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 y 22.
00:12:41
Vamos, si podéis poner todos, rellenar la escala, mejor, 2, 3, 4, 5, 6, 7, 8, 9, 10 y 11.
00:12:55
Entonces, en 1996 la natalidad fue de 20. 20 por 1.096. En 1997 fue 21. Es un poquito más alta. En 1998 fue de 19. Es un poquito más baja.
00:13:02
Este 97 tendría que estar aquí. 21. Luego el 19. Estaría un poquito más bajo. Aquí está el año 98.
00:13:26
El 99, el 17. Un poquito más baja todavía. El 2015 un poquito más baja también. Y el 2001 sería la 14.
00:13:45
Bueno, pues esta es la nube de puntos. También parece ser que hay una tendencia descendente, que hay una correlación negativa y yo creo que más o menos una curva que tomara los puntos más o menos que se aproximara a ella sería esa.
00:14:01
Eso no importa demasiado dibujarlo, eso hay gente, ya os digo, que lo hace con mucha precisión, a mí no se me da tan bien, pero los cálculos que se van a hacer son los cálculos y esos son los que vale.
00:14:18
Entonces, vamos a ver este ejemplo, que es decidir si hay una relación entre las dos variables de momento a simple vista.
00:14:31
A ver, yo diría que de todos estos casos, bueno, os sigo hablando, se llama correlación lineal,
00:14:56
Porque hay cosas que se pueden aproximar mediante parábolas o mediante otro tipo de funciones. Yo diría que lo más parecido a una recta son los datos que hay aquí. Yo aquí diría que hay una correlación que es bastante fuerte, aunque no sigan exactamente en la línea recta, todos se agrupan mucho respecto de esa recta.
00:15:09
Y esa recta va hacia abajo, entonces es negativa. Entonces, de estos tres datos que quedan, yo diría que esto es lo que menos se acerca a una recta. Yo aquí diría que la correlación es débil. A simple vista, luego ya veremos cómo se puede determinar eso.
00:15:43
A simple vista, yo diría que de los segundos que se más parecen, se parecen a recta, es esto.
00:16:09
Más o menos, están unos por encima, unos por debajo.
00:16:18
Este es un dato que a veces puede ocasionarse por un error en la medición, o que puede ser ese,
00:16:21
y que sea un dato que no se cumple, pero yo diría que aquí la correlación es media.
00:16:27
y negativo.
00:16:43
Y es media a media fuerte.
00:16:48
Esta yo diría que es fuerte incluso.
00:16:50
Diría que esta es fuerte
00:16:52
y esta media
00:16:53
entre media y fuerte.
00:16:57
Y aquí, pues yo diría
00:17:01
que hay una correlación
00:17:03
bueno, esta podría decir
00:17:04
que es muy débil.
00:17:06
Yo diría que la correlación es débil
00:17:11
pero en caso de
00:17:13
haber alguna correlación entre las dos
00:17:15
variables, pues más bien tiende al ascenso. Débil y positivo. Esto es buscarle un sentido
00:17:17
a los cálculos que vamos a hacer ahora, porque los cálculos luego son bastante abstractos
00:17:34
y no vamos a ver mucho. Bueno, entonces, vamos ya directamente a los cálculos. La recta
00:17:39
de regresión, la recta de regresión es esta recta que yo he dibujado aquí de forma aproximada.
00:17:52
La recta de regresión tiene esta forma. Que no cunda el pánico que esto no está en conjunto.
00:18:03
A ver, la recta de regresión. Tenéis que calcular la media. Tenéis que calcular la media de la X,
00:18:12
La media de la Y y tenéis que calcular la covarianza. Y bueno, la desviación típica al cuadrado de la X.
00:18:19
Todo se va a hacer con calculadora, excepto la covarianza que vamos a hacer una parte que es entera.
00:18:29
Vamos a ver el ejemplo, porque ya os digo que esto en principio os parece muy extraño, pero luego el ejercicio es bastante mecánico.
00:18:38
Tengo seis institutos de la misma zona, se ha estudiado la nota media de los estudiantes de primero de bachillerato en matemáticas en inglés. Se obtiene la siguiente información que se recoge en la estampa. Entonces tengo uno, dos, tres, cuatro, cinco y seis alumnos.
00:19:03
O sea, el número de datos es eso. En cada individuo, los datos que he recogido son la nota en matemáticas, esta es la del primer individuo en matemáticas, esta es la del primer individuo en inglés.
00:19:18
Entonces, vamos a tomar eso y para no asustarnos, vamos a copiar las fórmulas que ya os digo que esto hacéis dos o tres y lo mecanizáis perfectamente.
00:19:39
Entonces, esto es lo que se llama la covarianza.
00:19:54
Para hacer la covarianza, primero, tengo que calcular la media.
00:20:03
Y aquí, ya os tengo que decir, esto, si no sabéis hacerlo con calculadora, tenéis que hacerlo a mano y es bastante largo.
00:20:11
Entonces, voy a hacer unos cálculos previos.
00:20:20
Cálculos previos.
00:20:27
¿Qué es lo que necesito?
00:20:29
cito
00:20:35
la media de la X
00:20:37
la desviación típica de la X
00:20:39
y la media de L
00:20:45
con eso casi tenemos la covariaz
00:20:49
entonces ahora
00:20:54
si tenéis la calculadora que os dije el otro día
00:20:56
por favor hacerlo conmigo
00:21:00
y si no intentad hacerlo bien
00:21:02
se supone que ya habéis mirado el tutorial
00:21:05
y que ya sabéis hacer una media y una desviación típica
00:21:07
Entonces, los que tenéis la calculadora que os dije el otro día, os recuerdo que tenéis que darle a SID CLEAR.
00:21:10
Luego le dais al 1 y le dais al 1.
00:21:20
Tenéis que comprobar que vuestra calculadora está en modo estadístico.
00:21:24
Acordaos que es SD.
00:21:29
Si podéis hacerlo ahora, fenomenal.
00:21:31
Si tenéis alguna duda sobre alguna tecla en particular, ya os digo, esta es la FX82.
00:21:34
ms por similares son las que tienen aunque no sean casi un botoncito gris en medio pues en algunas
00:21:40
creo que es azul también amarillo pero es un botón así muy claro y grande que pone replay entonces
00:21:50
cómo se meten los datos acordaos que he borrado los datos por si acaso he borrado los datos por
00:21:57
Por si acaso, me quedan los de otro día.
00:22:06
Si yo le doy a SIF 1 y le doy al igual,
00:22:09
y uno a la vez me tiene que dar N igual a 0.
00:22:14
Y ahora voy metiendo los datos.
00:22:18
Y os recuerdo que es 6.5 M más.
00:22:20
Sale N igual a 1.
00:22:24
5.2 M más.
00:22:26
6 M más.
00:22:32
6.5 M más.
00:22:35
7, n más
00:22:37
y 6, n más
00:22:41
esto conviene hacerlo dos veces
00:22:43
se supone que en la calculadora pone n igual a 6
00:22:47
porque habéis metido 6 datos
00:22:50
y ahora, si queréis calcular la media
00:22:51
le dais SIF
00:22:55
2, 1
00:22:57
le dais al igual y sale 6,2
00:23:00
esto no es 1, no sé si nos haría
00:23:04
6,2
00:23:07
y la desviación típica
00:23:10
le dais shift 2
00:23:13
y le dais al 2 y el igual
00:23:15
y sale, este número es aproximado
00:23:18
utilizad los decimales, mientras no se os llegue a lo contrario
00:23:21
los decimales, sale aproximadamente
00:23:25
0,56
00:23:28
esta es la primera parte que ya os digo
00:23:30
buscad el tutorial porque esto se hace en un libro
00:23:36
Y ahora tengo que calcular la media de ley. Lo que os he dicho antes, no os olvidéis de borrar los datos. Le dais a seed, donde ponemos que es un amarillo clear, le dais a 1 y a igual.
00:23:39
Y ahora voy a calcular, solo necesito la media. 7m más, 5m más, 5m más, 6m más, 7.5m más y 5m más.
00:23:56
Y la media nos sale, acordaos, 6, 2, 1. Y os sale aproximadamente 5,92. Haced bien los redondeos, porque sale 5,916666. 5,92.
00:24:15
Bueno, yo primero me tendría a decir
00:24:37
¿están bien hechas estas cuentas? Pues yo creo que sí
00:24:41
porque valores que están entre 5,2 y 7
00:24:44
que la media salga 6,2 me parece razonable
00:24:48
y valores que están entre 5 y 7
00:24:51
que salga una media de 5,92
00:24:54
me parece razonable
00:24:57
Siempre en caso de un examen o cuando estéis haciendo un ejercicio
00:24:58
repasadlo, lo hacéis otra vez y que queden los números
00:25:03
¿Vale? Bueno, entonces, dejo la calculadora por un momento y ahora tengo que hacer este cálculo. Bueno, me diréis, ¿por qué he calculado la desviación típica si no sale aquí?
00:25:06
Porque es que ese dato lo voy a necesitar. Esta columna, acordaos, xy por y sub y consiste en multiplicar este número por este.
00:25:23
Entonces voy a ir haciéndolo con la calculadora. 6,5 por 7 y sale 45,5.
00:25:42
En este ejercicio, que veáis que es bastante rollo, pero al hacer 2 o 3 ya os lo sabéis, 5,2 por 5, 26. 6 por 5 que es 30.
00:25:49
Bueno, 6,5 por 6 es 3,9. Perdón, 39. Ahora 7 por 7,5 creo que es 5,5. 52,5. Y aquí hay otro 6 por 5 que es 30. Pues hay dos alumnos que han sacado las mismas notas.
00:26:08
Puede ocurrir. Entonces, si yo sumo todos estos datos, me sale la suma de los productos X, Y por Y. Bueno, pues voy a sumarlo.
00:26:40
52,5 más 30, más 39, más 30 otra vez, más 26, más 45,5. Y sale 223 por ciento.
00:26:57
¿Sí? Entonces, ya estoy en condiciones de calcular la covarianza. La covarianza es 223, que es la suma que nos ha salido, partido por el número de datos.
00:27:20
Esto el otro día dije que era en minúscula, pero bueno, esto es el número de datos. 223 dividido entre 6, que aproximadamente es 37,17.
00:27:34
Ah, no, perdón, que tengo que sumarle para menos, que tengo que restarle 6,2 por 5,92.
00:27:56
Menos 6,2 por 5,92.
00:28:11
Y esto, si no me equivoco, sale aproximadamente 0,46.
00:28:17
Aproximadamente 0,46, remontado con dos decimales.
00:28:24
Bueno, aquí la covarianza es positiva. Y bueno, si la covarianza es positiva, nos va a decir que la correlación es positiva.
00:28:28
Vale. Y ahora, para no asustaros, aquí. Vale. Os voy a poner la fórmula de la recta de Rennes. Bueno, es muy raro que la covarianza sea exactamente cero, ¿no?
00:28:40
Pero si la covarianza es negativa, la correlación se dice que es negativa o inversa. Esta es la recta, la ecuación de la recta que yo antes dibujaba de forma próxima.
00:29:04
Y ahora os digo, ¿cómo se aprende uno esta fórmula? Pues vamos a ver. A la Y le resto la media de las X, que la he calculado, 5,92. A la X le resto la media de las X, que es 6,2.
00:29:15
Y esto de aquí, pues es un poquito más largo, pero acordaos siempre que es la covarianza, que es lo que hemos hecho, 0,46 partido por el cuadrado de este número que nos habíamos reservado antes, 0,56 al cuadrado.
00:29:42
una cosa en el libro creo que hace
00:30:05
la recta de regresión de x sobre y
00:30:09
y la de y sobre x
00:30:11
yo solo voy a hacer esta que es la de y sobre x
00:30:13
para no liar las cosas
00:30:15
siempre vamos a utilizar
00:30:17
entonces esto
00:30:19
lo hago con la calculadora
00:30:21
0,46
00:30:22
dividido entre 0,56
00:30:30
al cuadrado
00:30:33
y si no me equivoco sale
00:30:34
Entonces, el ejercicio nos pedía hacer una estimación de la nota de inglés
00:30:36
que correspondería a un estudiante que sacaba un 5,5 en matemáticas.
00:30:58
Entonces, esta es la nota de inglés.
00:31:06
Con estos datos, yo puedo decir que y menos 5,92 es igual a 1,47 por x menos la media de la x, que es 6,2.
00:31:08
Vale. Entonces, hago los cálculos. Será y igual a el 5, bueno, primero voy a multiplicar 1,47 por x menos 1,47 por 6,2.
00:31:30
1,47 por 6,12.
00:32:03
Aproximadamente me sale 9,11.
00:32:07
Y este menos pasa con más.
00:32:15
Más 5,92.
00:32:17
Entonces me queda que la recta de regresión es igual a 1,47x.
00:32:20
Y ahora, menos 9,11 más 5,92 es menos 3,19.
00:32:27
Entonces, nos está diciendo que si la nota, conclusión, si la nota en matemáticas es 5,5, quiere decir que X es 5,5.
00:32:39
Entonces, la nota en inglés es 1,47 por 5,5 menos 3,19, que esto sale 1,47 por 5,5 menos 3,19.
00:33:17
Sale 4,85. Pues la conclusión que sería, se espera que en inglés tenga, como las notas están andadas con un decimal, lo redondeamos y nos sale un 4,85.
00:33:41
Bueno, este ejercicio, que aparentemente os puede resultar muy complicado, consiste en que con la calculadora sepáis hacer la media de la X, la media de la Y y la desviación típica de la X.
00:34:11
que a mano hagáis
00:34:34
la columna esta de x y por
00:34:36
y subí y que apliquéis
00:34:38
esas dos fórmulas
00:34:40
cuando hacéis dos o tres os quedáis
00:34:41
con todo ello, yo creo que este es un problema
00:34:44
de los que compense
00:34:46
y creo que de cara al año
00:34:47
que viene creo que luego van a empezar
00:34:50
a volver a poner en la evao
00:34:52
que a veces ha sido el temario de primero
00:34:53
a veces ha sido el temario de segundo
00:34:56
entonces, bueno esta es la idea
00:34:57
de lo que es la
00:35:02
recta de regresión
00:35:04
Porque la recta que yo había dibujado a ojo tiene explícitamente un número asociado, ¿vale?
00:35:05
Perdón, tiene una ecuación asociada que es exactamente esa y a partir de ahí se pueden hacer estimaciones.
00:35:16
Pero ahora, como hemos visto al principio, las nubes de punto a veces son muy dispersas y a veces se acercan mucho a una recta.
00:35:23
Entonces, ¿cómo se mide si la correlación es muy fuerte, es fuerte, es funcional, o es débil o no hay correlación?
00:35:32
Bueno, pues para eso tenemos que calcular un número que se llama el coeficiente de correlación.
00:35:47
Ese número viene dado por esta fórmula, entonces fijaos que lo que tenemos que hacer con la calculadora son la media de la x, la media de la y y luego hacer la covarianza como habéis hecho antes.
00:35:56
Entonces los cálculos que hemos hecho antes se pueden aproximar con una fórmula.
00:36:09
Bueno, una cosa muy importante, si calculáis el coeficiente de correlación, si os sale más pequeño que menos uno o más grande que uno, está mal.
00:36:15
Si en el examen no encontráis el fallo, por lo menos decir que ese valor no es correcto, ¿vale?
00:36:25
Ahora, ¿cómo se interpreta ese valor?
00:36:32
Si el valor de ese coeficiente vale exactamente 1, la correlación es perfecta.
00:36:36
Todos los puntos están perfectamente en una línea recta y la correlación es positiva.
00:36:43
O sea, esa recta va a hacer 1.
00:36:49
Si vale menos 1, la correlación también es perfecta.
00:36:52
Se llama funcional. La diferencia es que la recta en vez de ser creciente es decreciente. Al mayor valor de un valor nos sale otro. ¿Sí? Ahora, cuanto más se acerca a 1 o a menos 1, la correlación es fuerte.
00:36:55
esto más o menos
00:37:10
pues ya en cada ejercicio
00:37:13
pues ya se irá diciendo lo que para mí es fuerte
00:37:15
muy fuerte, porque en los textos generalmente
00:37:17
no lo detallan y yo creo que depende
00:37:19
un poco de los tipos de datos que se
00:37:21
manejen, se puede considerar fuerte
00:37:23
o muy fuerte, pero si el valor
00:37:25
es próximo a cero, la correlación es débil
00:37:27
¿vale? sea positiva o negativa
00:37:29
si es exactamente cero es que
00:37:31
no hay correlación
00:37:33
correlación lineal
00:37:34
eso
00:37:37
Eso no excluye que puedan tener una relación parabólica o de cúbica o de otro tipo, ¿no? Entonces, vamos a hacer un ejemplo de esto y de gráfico y luego vamos a hacer los cálculos y el tema, que sepáis que está dado.
00:37:38
Lo que hay que hacer ahora es repasar y ya os digo, practicar dos o tres de estos porque es un ejercicio que en mi opinión es bastante asequible. Tengo un trabajo de aprender a hacer la media con la calculadora.
00:38:03
Bueno, aquí te dice los números 0, 2, menos 0, 9, menos 0, 7 y 0, 6 corresponden a coeficientes de correlación.
00:38:16
Dice, asigna cada una gráfica al 5.
00:38:24
A ver, yo aquí pondría, aquí la correlación es positiva, ¿no?
00:38:28
Esta es la más grande de todas.
00:38:35
Pues yo diría que esta correlación es de 0, 6.
00:38:37
¿Por qué? Porque es positiva y es la más fuerte que hay, es la que más se acerca a 1.
00:38:41
Ahora, tengo estos valores y estos valores. Yo diría que los que se acercan más a una recta son estos. Esto como veis es una cuestión bastante subjetiva y por eso luego se hacen las cuentas.
00:38:46
Yo diría que este es el del menos 0,9, porque parece que estos datos están un poquito más dispersos.
00:39:00
Pues yo diría que aquí es menos 0,9 y aquí es menos 0,5.
00:39:07
Es fuerte, pero no tanto.
00:39:15
Y aquí los valores se acercan mucho a cero correlación débil.
00:39:17
Vamos a ver el otro ejemplo que hay ahí.
00:39:22
Para ver si... Bueno, aquí nos dicen que las correlaciones no nos dicen si son positivas o negativas. Y nos dicen que... A ver, yo diría que la correlación más fuerte es esta. Esta es la más fuerte. La más fuerte.
00:39:24
yo creo que los puntos que se acercan más a una recta son estos
00:39:52
entonces aquí la correlación es 0.96
00:39:59
pero como se ajusta a una recta que va hacia abajo
00:40:02
yo diría que la correlación es negativa
00:40:06
la siguiente correlación fuerte que diría yo
00:40:08
pues yo diría que son estos
00:40:12
0.87 y de nuevo la correlación es negativa
00:40:14
Estos yo veo que tienen muy poca relación.
00:40:23
Yo diría que estos tienen una correlación de 0,55.
00:40:25
Y no me atreví a saber, a decir si es positiva o negativa.
00:40:29
Yo diría que sí, que más bien parece positiva que negativa.
00:40:32
Y esta, pues sí, parece que es positiva.
00:40:37
Esta sí.
00:40:41
Pero vamos, esta sí de 0,55, yo diría que es positiva.
00:40:42
Como veis, esto se hace a ojo.
00:40:46
No os voy a pedir que hagáis nada a ojo.
00:40:48
Esto es orientativo.
00:40:50
para que veáis luego cómo se hace de una forma más científica.
00:40:52
Entonces, vamos a hacerlo con la altura de unos niños
00:40:58
y que sepáis que esto es un problema de examen, tal cual.
00:41:03
Este 3 es un problema de examen, así tal cual.
00:41:06
Y, bueno, si tenemos tiempo para hacerlo,
00:41:10
a ver, sería bueno, como mínimo,
00:41:19
que hagáis los ejercicios 9 y 10 de la página
00:41:22
que hay el 275, en la página siguiente, y que veáis un ejercicio completo.
00:41:25
Esto, si vais a hacer luego los cálculos con calculadoras, podéis saltar lo primero 8 minutos.
00:41:33
Pero esto ya os digo, este es tal cual un ejercicio de un examen.
00:41:38
Podéis verlo en los exámenes del curso pasado.
00:41:41
¿Vale? Entonces, si observamos las edades de cinco niños y niñas en sus pesos respectivos y se obtienen estos datos.
00:41:47
Como veis, hay cinco datos.
00:41:57
Nos dice, coeficiente de correlación lineal, rectas de regresión de y sobre x.
00:42:03
Esto ya lo hemos hecho antes.
00:42:08
¿Qué peso correspondería a un niño de cinco años?
00:42:10
Entonces, os recuerdo, tenemos que calcular la media de la x,
00:42:13
la desviación típica de la x,
00:42:19
la media de la Y
00:42:21
y la desviación típica de la Y
00:42:23
consejo que lo hagáis con calculador
00:42:25
entonces
00:42:28
si la tenéis a mano y ya habéis aprendido
00:42:30
a hacerlo, acordaos de
00:42:32
borrar los datos
00:42:34
SIF mode 1
00:42:35
acordaos de darle al igual
00:42:38
ya están los datos borrados
00:42:40
voy a comprobarlo
00:42:42
si están todos borrados
00:42:46
ahora, introduzco los datos de la X
00:42:47
2M más
00:42:50
No hace falta poner el punto y la coma que poníamos el otro día porque simplemente tenéis esos datos. Ahora, porque se repiten una vez. 4,5n más, 6n más, 7.2n más y 8n más.
00:42:52
hay un error muy común
00:43:14
es que es que cuando metéis el último dato
00:43:16
se os olvida darle el ónimos
00:43:18
o a mí por lo menos me pasa
00:43:19
¿vale?
00:43:21
entonces, una vez hecho eso
00:43:23
tenéis que en la pantalla
00:43:25
ponerme igual a 5
00:43:27
y le dais a SIF
00:43:28
2
00:43:31
1
00:43:33
y os sale la media 5,54
00:43:34
parece un valor razonable
00:43:38
pues la apunto
00:43:40
5,54
00:43:40
es más correcto que pongáis
00:43:43
en ambos
00:43:46
años
00:43:49
las unidades pues siempre quedan
00:43:52
ahora la desviación
00:43:54
típica le dais
00:43:56
SIF 2
00:43:58
y ahora le dais al 2 que no se os olvide
00:43:59
darle al igual
00:44:02
y sale aproximadamente 2,13
00:44:03
2,13
00:44:06
y esto serían
00:44:09
años también
00:44:11
Entonces, nos olvidamos de la X, borramos los datos, SIG CLEAR, sale igual, borrado
00:44:12
los datos, lo compruebo y ya está. Bueno, y ahora meto los datos de los pesos, 15 M
00:44:28
más, 19 m más, 25 m más, 33 m más, 34 m más y 34 m más. Le doy a ver si he metido
00:44:37
los datos, si he metido 100 datos. Ahora me doy a la media, SIF 2, 1, igual 25,2. Como
00:44:56
me parece un resultado razonable entre 15 y 34, pues pongo aproximadamente, no, no, exactamente
00:45:07
25,2. Como son pesos, pongo kilogramos. Ahora le doy sí, 2, 2, le doy al igual y me sale
00:45:14
7,49. Este es aproximado. Lo aproximo con dos cifras decimales, 7,49 kilogramos. Entonces,
00:45:24
Ahora, necesito calcular la covarianza. Para hacer la covarianza, acordaos que tengo que hacer x y por y sub i.
00:45:35
Entonces pongo aquí 2 por 15 que es 30, 19 por 4,5 que es 85,5, 25 por 6 que es 150,
00:45:45
P2 por 33, que es 237,6, y 34 por 8, que es 270.
00:46:10
Bueno, esto podría haberlo hecho con la calculadora.
00:46:32
Bueno, entonces voy a hacer la suma de xy por y sub i.
00:46:35
Y la suma es 30 más 85,5 más 150 más 237,6 más 272.
00:46:42
Sale 775,1.
00:47:01
Entonces la covarianza, hemos dicho que era la suma de las xy, o sea lo que calculo ahora, dividido entre n menos el producto de las medias.
00:47:03
Pues me sale 775,1 dividido entre 5 datos menos la media de la X que es 5,54 por la media de la Y que es 25,2.
00:47:23
Lo hago, divido entre 5, menos 5,54 por 25,2. Y sale 15,412, pongo aproximadamente 15,30.
00:47:46
esto no tiene un día
00:48:11
no son de kilos, ni están mezclados los kilos
00:48:16
con los kilos
00:48:18
es lo normal que a mayor edad
00:48:19
corresponda a mayor peso, la correlación es positiva
00:48:22
y bueno, y ahora, el coeficiente de correlación
00:48:25
que es E
00:48:40
todavía estoy en el apartado A
00:48:40
coeficiente
00:48:45
de correlación
00:48:48
en algunos sitios lo ponen con la R griega
00:48:52
pero creo que lo he puesto con la R
00:48:56
es la covarianza partido por el producto
00:48:57
de las desviaciones típicas
00:49:01
y esto tiene que ser un número entre 0 y 1
00:49:03
porque si no me he equivocado en las cuentas
00:49:06
perdón
00:49:08
entre
00:49:10
menos 1 y he dicho entre 0 y 1
00:49:13
porque sé que la correlación es positiva
00:49:16
pero siempre menos 1
00:49:18
Bueno, entonces, la covarianza es 15,41 y las desviaciones típicas son 2,13 y 7,49.
00:49:19
Es posible que si la correlación es muy buena, que os salga un 1,01 por lo redondeado.
00:49:35
Acordaos de esto. Mirad, lo voy a hacer con calculadora.
00:49:42
Ah, no, no, que la calculadora está en la zona.
00:49:46
A ver, os voy a enseñar la calculadora, porque la parte de estadística no la puedo hacer. A ver, sería 15,41 dividido, poned paréntesis, los que no tenéis la fracción, la tecla de fracciones, a 2,13 por 7,49.
00:49:50
Cierro paréntesis y sale 0,97 aproximadamente. 0,97. Sale menor que 1, o sea que esté bien, pero es que además esto me dice que la correlación es muy fuerte, porque se acerca mucho a 1.
00:50:21
Y ahora, para hacer la recta de regresión, sabéis que a y le resto la media, a x le resto la media, y la pendiente de esta recta es, aquí tengo sigma xy, la cobranza, y aquí pongo, acordaos de que es la desviación típica al cuadrado.
00:50:40
Entonces, aquí me queda y menos y barra, la media de y es 25,2, es igual a sigma xy, que está la covarianza, que es 15,41.
00:51:24
15,41 partido por la desviación típica, que es 2,13 al cuadrado, por X menos la media de la X, que es 5,54.
00:51:43
Bueno, entonces, os dice, ¿qué peso corresponde? Si queréis lo podéis dejar así, ¿vale?
00:52:02
Ahora, apartado 1. ¿Qué peso correspondería a un niño de 5 años?
00:52:10
Pues si x es igual a 5, yo tomo la recta de regresión y lo único que hago es igual a, lo digo para que quede con más precisión, 15,41 partido por 2,13 al cuadrado por x que vale 5, 5 menos 5,54 y este menos 25,2 pasa como más 25,2.
00:52:15
Y esto lo hago con la calculadora, 15,41 dividido entre 2,13 elevado al cuadrado, por paréntesis, 5 menos 5,54,
00:52:47
paréntesis, más 25,2, igual a aproximadamente 23,37, aproximadamente 23,37.
00:53:11
¿Qué peso? Kilogramos, 23,35, 37, 37, ¿sí?
00:53:29
Y ahora, la tercera parte. ¿Es fiable esta estimación? Sí. Por dos razones. ¿Por qué? 5 está en medio de los datos. Los datos oscilan entre 2 y 8.
00:53:46
entre 2 y 8
00:54:10
y lo más importante
00:54:18
que es lo que he dicho antes
00:54:19
porque la correlación
00:54:21
es muy fuerte
00:54:24
bueno, pues con esto os tengo que decir
00:54:27
que está dado todo el tema
00:54:35
que lo que tenéis que hacer
00:54:36
es practicar los ejercicios
00:54:41
si queréis primero lo hacéis con el tutorial
00:54:43
luego lo hacéis con los del libro
00:54:45
son 5 o 6
00:54:47
con esto se supone
00:54:51
que tenéis bastante práctica
00:54:53
para hacer esto
00:54:56
la próxima clase
00:54:58
es
00:54:59
prácticamente de repaso
00:55:00
si queréis está colgada si no me equivoco
00:55:04
entonces bueno
00:55:06
finalizamos la grabación
00:55:08
os sigo insistiendo que si nadie
00:55:10
tiene inconveniente la voy a colgar
00:55:12
cuando pueda
00:55:14
y bueno
00:55:15
como siempre que tengáis una gran semana
00:55:17
y que contéis siempre con las
00:55:20
tutorías individuales
00:55:22
bueno
00:55:24
pues espero
00:55:26
veros pronto y
00:55:27
nada, dadle duro, esta parte
00:55:30
es muy sencilla para los que os cuesta más
00:55:31
entonces aprovechad y
00:55:34
intentad hacerlo
00:55:35
a lo mejor que podéis, ¿de acuerdo?
00:55:37
bueno, hasta pronto
00:55:39
- Valoración:
- Eres el primero. Inicia sesión para valorar el vídeo.
- 1
- 2
- 3
- 4
- 5
- Autor/es:
- Javier M.
- Subido por:
- Francisco J. M.
- Licencia:
- Reconocimiento
- Visualizaciones:
- 15
- Fecha:
- 26 de febrero de 2024 - 23:14
- Visibilidad:
- Clave
- Centro:
- IES LOPE DE VEGA
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1920x1080 píxeles
- Tamaño:
- 63.59 MBytes
Para publicar comentarios debes entrar con tu nombre de usuario de EducaMadrid.
Comentarios
Este vídeo todavía no tiene comentarios. Sé el primero en comentar.