1 00:00:00,000 --> 00:00:07,360 Estamos en la página 214 de vuestro libro y vamos a ver la regresión lineal del coeficiente de Pearson. 2 00:00:08,839 --> 00:00:11,880 Todo esto ya lo hemos contado, salvo el coeficiente de Pearson. 3 00:00:12,580 --> 00:00:23,539 Si cuando observamos la relación que existía entre dos variables x e y, veíamos que podría existir más o menos 4 00:00:23,539 --> 00:00:33,960 que las dos variables estaban bastante correlacionadas, existía un coeficiente de correlación que era positivo, 5 00:00:34,320 --> 00:00:43,539 la covarianza decíamos sigma de xy positivo cuando teníamos que al aumentar una aumentaba la otra, 6 00:00:43,539 --> 00:00:51,759 o al revés que unas negativas, xy negativo cuando al aumentar una disminuía la otra 7 00:00:51,759 --> 00:00:58,640 y en este caso teníamos un gráfico de este estilo, es decir, que en este caso era justo al revés, ¿vale? 8 00:00:58,859 --> 00:01:02,439 La nube de puntos está por aquí, una correlación más o menos lineal. 9 00:01:02,520 --> 00:01:08,060 Pues bueno, hay una forma de cuantificar la correlación lineal entre los variables 10 00:01:08,060 --> 00:01:17,219 y es mediante lo que se llama el R, que es el coeficiente de correlación lineal, este, de Pearson, ¿vale? 11 00:01:17,219 --> 00:01:32,659 que va a venir dado de esta manera, es decir, va a venir dado, va a ser la covarianza entre el producto de las desviaciones típicas y R está comprendido entre menos 1 y 1, ¿vale? 12 00:01:32,659 --> 00:01:39,579 Perdón, sí, ¿cómo va a tener? Evidentemente el sigma va a ser el mismo que el que indique la covarianza. 13 00:01:39,739 --> 00:01:44,159 ¿Por qué? Porque la sigma de x es positiva y la sigma de y es positiva también. 14 00:01:44,159 --> 00:01:50,280 ¿Por qué? Porque viene sigma de x, no viene de otra cosa de tomar la raíz cuadrada de la varianza. 15 00:01:50,519 --> 00:01:54,099 Con lo cual, esto siempre dijimos que las desviaciones típicas eran siempre positivas. 16 00:01:54,560 --> 00:01:58,840 Por lo tanto, si la covarianza es positiva, r va a ser positiva. 17 00:01:58,840 --> 00:02:27,379 ¿De acuerdo? Vamos a ver, si está entre, lo que viene aquí a decir que si es negativo, si está entre 0 y menos 1, la correlación es negativa y será tanto más fuerte cuanto más se aproxime a menos 1, es decir, un r igual a menos, muy cerca de menos 1, es decir, menos 0.9, por ejemplo, indica que las dos variables están muy correlacionadas y negativamente. 18 00:02:27,379 --> 00:02:43,180 Pasa lo mismo R muy cercano a 1, por ejemplo, muy cercano a 1 es 0,9. La correlación es positiva, es decir, aumenta una y también va a aumentar la otra y va a ser fuerte, una correlación fuerte. 19 00:02:43,719 --> 00:02:55,060 Sin embargo, si la R es 0, no existe correlación, es nula entre los variables. Es cuando veíamos que no, pues como veíamos la altura y el cociente intelectual. 20 00:02:55,060 --> 00:03:17,300 En este caso dice si R es 1 o es menos 1 existe lo que se llama una dependencia funcional lineal, es decir, en este caso justamente tendríamos que el punto estaría justo en la recta, es decir, es como del tipo y igual a x más b verifica justamente la recta. 21 00:03:17,300 --> 00:03:24,939 porque en este caso si meto el valor, por ejemplo, de x, pues unívocamente me devuelve y. 22 00:03:24,939 --> 00:03:29,360 Eso sería cuando r es 1 o r es menos 1, ¿vale? 23 00:03:29,599 --> 00:03:39,800 En otro caso dice, bueno, pues no tiene la variable terminal y en este caso pues no hay sentido de hacer un estudio estadístico bidimensional. 24 00:03:39,800 --> 00:03:49,939 Y bueno, aquí tenéis un estudio que te da dos variables, por un lado x la altura del mar y luego la presión atmosférica. 25 00:03:50,300 --> 00:03:53,800 Vamos a ver cómo depende la presión atmosférica de la altura. 26 00:03:54,460 --> 00:04:01,180 Pues tenemos las dos variables, ¿vale? Hacemos los cálculos y tenemos aquí los sumatorios independientes 27 00:04:01,180 --> 00:04:05,860 y tenemos aquí también el sumatorio de x sub i por y sub i. 28 00:04:05,860 --> 00:04:16,319 Como la f sub i en este caso es 1, pues bueno, tendríamos que la x media, o bien metemos todos estos datos, lo que meteríamos en nuestra calculadora sería esto, ¿vale? 29 00:04:16,319 --> 00:04:28,560 Y obtendríamos, pues bueno, los sumatorios, los distintos sumatorios para poder calcular, aparte, la x media, ¿vale? La i media, ¿cuánto vale la covarianza? 30 00:04:28,560 --> 00:04:42,079 que sería el producto menos el producto de xy por y media, fijaos que me queda una covarianza negativa, es decir, cuando aumente la altura sobre el nivel del mar, 31 00:04:42,300 --> 00:04:55,860 se supone que va a disminuir y que sería la presión atmosférica. La varianza de x, es decir, cómo varían en este caso, cómo están dispersos, y la varianza de y. 32 00:04:55,860 --> 00:05:01,860 Y luego hacemos el cálculo y fijaos que me queda que están muy correlacionados y de forma negativa.