correlación parte 1 - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Hola, vamos a estudiar en esta nueva sesión lo que es la correlación.
00:00:00
La correlación ya sabemos teóricamente lo que es,
00:00:05
que es la relación que existe entre dos variables estadísticas unidimensionales,
00:00:09
que a su vez constituyen en sí una variable estadística bidimensional.
00:00:15
Sería, a ver, en primera aproximación ya vimos que cuando tenemos en nuestro eje X
00:00:23
y en nuestro eje Y cada una de las variables, pues establecíamos cada punto sería lo que corresponde a un par, ¿vale?
00:00:29
Una pareja X y Y de valores, ¿no? De la variable X y de la variable Y.
00:00:39
Y obteníamos un conjunto de puntos que llamamos nube de puntos, ¿vale?
00:00:46
Entonces, así a primera vista, el grado de la correlación que puede existir entre ambas variables puede ser lineal, como por ejemplo en el caso del peso y la altura de unos alumnos, podemos establecer o ajustar esos puntos que están cerca de una recta.
00:00:51
Por tanto, la correlación sería lineal. Y dentro de esta correlación lineal puede ser positiva, es decir, positiva o directa, es decir, que a medida que aumenta una variable, aumenta, por ejemplo, la x, entonces aumenta también la y.
00:01:12
Es decir, la pendiente de esta recta a la cual ajustamos la nube de puntos sería positiva.
00:01:29
Por ejemplo, en este caso, pues bueno, habla del número de horas que hemos visto un ejemplo por ahí dedicadas al estudio de matemáticas y, en teoría, la calificación obtenida.
00:01:37
¿Qué otro tipo de correlación lineal podemos tener?
00:01:51
pues negativa o inversa, es decir, si aumenta una variable, sería este caso,
00:01:55
aquí tenemos nuestra variable x y la variable y, esa sería nuestra, lo que vamos a llamar luego recta de regresión,
00:02:01
pero en este caso vamos a considerar que es la relación que existe entre la variable x y la variable y
00:02:09
y resulta que a medida que va aumentando la x, ¿qué pasa? Pues que la y disminuye,
00:02:14
Es decir, para X, por ejemplo, imagínate 1, vamos a ver el caso, tenemos esta cantidad. Pues para X, 3, vaya, vamos a tener esta cantidad que es mucho menor. Con lo cual, este tipo de correlación se llama negativa.
00:02:21
Por ejemplo, dice el número de vacunas administradas por cada 1.000 habitantes y el número de casos registrados de la enfermedad que tratemos de ejemplificar.
00:02:40
Por ejemplo, nunca más de moda que ahora, más en la realidad que ahora mismo.
00:02:51
A medida que aumente el número de vacunas, que sería la variable x, pues evidentemente van a disminuir el número de enfermos.
00:02:58
Con lo cual, lo que voy a tener es una correlación negativa.
00:03:12
Luego, eso sería dentro de que veamos el caso que sea lineal.
00:03:16
Lineal es porque se ajusta a una recta de este tipo.
00:03:21
Ahora puede ser curvilínea.
00:03:24
¿Vale? Curvilínea. Quiere decir que, bueno, podemos ajustar estos puntos a un tipo de función cuadrática o similar.
00:03:26
Entonces, dice, la nueva punto está distribuida alrededor de una curva.
00:03:37
Esta curva, bueno, puede ser una cuadrática, puede ser un logaritmo, puede ser una exponencial, se ajustaría, hay distintos tipos de ajuste.
00:03:41
Y luego tenemos pues nula, es decir, cuando no hay ningún tipo de correlación entre ambos, es decir, no hay ningún tipo de relación, por ejemplo, la altura de un grupo de individuos y su coeficiente intelectual.
00:03:50
a ver, no hay en principio ninguna relación, que los más altos vayan a ser más listos, ni mucho menos.
00:04:04
No hay relación, por lo cual en este caso diríamos que no hay ninguna relación, por tanto la correlación sería nula.
00:04:14
Entonces, una vez que ya hemos visto, dice, la correlación entre las variables será más fuerte
00:04:22
cuanto más cerca estén de los puntos en torno al cual se distribuyen,
00:04:28
Es decir, si tenemos aquí una dispersión mucho mayor, es decir, por aquí más lejos, es decir, pues este punto respecto de aquí va a haber una mayor distancia.
00:04:34
El ajuste va a ser peor, que se llama.
00:04:46
Entonces, la correlación dice será más fuerte cuanto más cerca estén los puntos.
00:04:50
Aquí la correlación sería menor que, por ejemplo, si tenemos todos los puntos ajustados, a lo mejor, como teníamos antes.
00:04:53
aquí, bueno, ahora ya
00:05:02
del todo
00:05:05
a ver
00:05:05
como por ejemplo
00:05:07
si tenemos, a ver un segundito
00:05:10
si logro hacer esto, vale
00:05:13
como teníamos antes que estaban los puntos
00:05:14
más cerquita de
00:05:17
de la recta
00:05:18
ahora vamos con la fórmula
00:05:21
es decir, hasta ahora hemos visto
00:05:23
gráficamente más o menos
00:05:24
como podemos, o como puede ser
00:05:26
esa correlación, una línea
00:05:28
que sería lineal o curva, curvilínea o nula, que no hay relación.
00:05:30
Vamos a ver ahora cómo vamos a medir esto.
00:05:34
Pues bueno, en realidad ya hemos visto que si miramos nuestras distribuciones marginales,
00:05:37
pues correspondería lo mismo a tener la x sola o la y sola,
00:05:43
con lo cual podemos calcular de la x, es decir, de la variable x,
00:05:48
pues podemos calcular su media, su varianza, su desviación típica y el coeficiente de variación de la variable,
00:05:53
que es de forma independiente si tenemos su distribución marginable.
00:06:02
Igualmente para la Y, es decir, podemos hacer lo mismo.
00:06:06
Entonces, es lo que nos viene a contar aquí, que podemos calcular para cada una de las variables los parámetros.
00:06:10
Pues bueno, el punto que se denomina, o sea, el punto P, digamos, que engloba, que tiene como coordenada X la media de la X y coordenada Y la media de la Y, se llama punto medio de la distribución bidimensional.
00:06:17
Y esta sería como el centro de, digamos, de gravedad, ¿vale? El centro de gravedad de la distribución, es decir, si colgamos de ahí apoyándolo en ese diagrama, apoyamos ese con un boli, ¿vale? Ahí la punta se quedaría estable, lo que viene a ser un centro de gravedad.
00:06:34
Entonces, vamos ahora a introducir un nuevo parámetro estadístico. Ya sabemos, conocemos la varianza de x y conocemos la varianza de y, que se calculaba, como sabíamos, haciendo x sub i menos x media al cuadrado partido por n y multiplicando por la f sub i.
00:06:53
¿Vale? Eso lo calculábamos así o lo que aún nosotros lo hacíamos mejor haciendo el sumatorio de x sub i al cuadrado por f sub i partido por n menos x media al cuadrado. Así es como lo hemos calculado cuando hacíamos unidimensional.
00:07:15
¿Vale? Hacíamos lo mismo para la y. Pues bueno, ahora vamos a definir lo que se llama la covarianza, ¿vale? De una variable bidimensional que se llama sigma xy.
00:07:35
Sería la media aritmética, es decir, en vez de tener aquí el cuadrado, ¿vale? Como tendríamos, como si no estuviera esta, ¿vale? Pues en realidad sería tener cada producto de cada dato menos su media.
00:07:46
Cada dato menos su media. O podríamos hacer, cuando calculamos la tabla, cuando tenemos la tabla para calcular que teníamos x sub i, teníamos la f sub i y tenemos aquí la y sub i, pues ahora vamos a hacer un nuevo producto que sería x sub i por f sub i y además por y sub i.
00:08:00
Con lo cual, podemos también hallar de esta manera la covarianza, bien como el producto de x sub i menos x media, que lo podemos calcular aquí en otra columna si nos gusta más de esta manera, o bien calculándolo así.
00:08:22
Bien, si observamos las expresiones para la desviación típica de x, la de y y la covarianza, se comprende porque la sigma x y recibe el nombre de covarianza, es decir, es como una varianza conjunta de las dos variables.
00:08:38
Entonces dice la covarianza positiva, ¿qué significa? Pues va a significar que esto y esto tienen el mismo signo, o bien ambas son positivas o bien ambas negativas, porque más por más sería más o menos por menos sería menos.
00:08:57
Si la covarianza es negativa, ¿qué significará? Pues que o bien esta es negativa o se van a tener distintos signos y esta positiva o al revés, siguen signos opuestos.
00:09:13
Es decir, cuando una de las variables se encuentra por encima de su media, la otra está por debajo o lo que es lo mismo, cuando aumenta una de las variables disminuye la otra, es decir, la correlación sería negativa.
00:09:25
Es decir, una covarianza x y positiva implica que la correlación es positiva, ¿vale? Sería una relación tal que así, que aumenta una, va a aumentar la x y va a aumentar la y.
00:09:37
Y una covarianza x y negativa implica que la correlación sería negativa, por lo tanto sería el aspecto que tendrías así, que una aumenta y la otra disminuye o al revés, da igual.
00:09:53
Con lo cual es la teoría que tendríamos que ver hasta ahora. Vamos a pasar luego a resolver este ejercicio que viene ya resuelto, pero vamos a hacerlo con la calculadora y para ver las dudas que podáis tener.
00:10:08
- Subido por:
- Maria Belen P.
- Licencia:
- Todos los derechos reservados
- Visualizaciones:
- 65
- Fecha:
- 25 de abril de 2021 - 18:32
- Visibilidad:
- Clave
- Centro:
- IES LAS VEREDILLAS
- Duración:
- 10′ 27″
- Relación de aspecto:
- 4:3 Hasta 2009 fue el estándar utilizado en la televisión PAL; muchas pantallas de ordenador y televisores usan este estándar, erróneamente llamado cuadrado, cuando en la realidad es rectangular o wide.
- Resolución:
- 1440x1080 píxeles
- Tamaño:
- 400.35 MBytes