1 00:00:00,750 --> 00:00:21,750 Buenos días, hoy vamos a resolver este ejercicio que ya lo hemos resuelto en otro vídeo, pero lo hemos resuelto aplicando fórmulas matemáticas. Ahora lo quiero resolver a través de Excel. Repito lo enunciado, ¿vale? Es una inmobiliaria que realiza un estudio acerca del precio al que se han vendido los pisos de un determinado barrio de Madrid en función de la superficie de los mismos. 2 00:00:21,750 --> 00:00:46,350 De dicho estudio se desprenden los siguientes datos. Tenemos los metros cuadrados y el precio en miles de euros. Esas son nuestras dos variables. Forma parte de nosotros nombrarlas respectivamente. Los metros cuadrados, he puesto aquí que era la X, la variable independiente, y el precio en miles de euros, la Y, la variable dependiente, porque el precio de un inmueble depende, entre otros factores, de los metros cuadrados de la superficie del mismo, ¿no? 3 00:00:46,350 --> 00:01:00,390 Bien, nos va pidiendo una serie de cosas. Vamos a ir haciendo cada uno de estos apartados lo que nos pida a través de fórmulas de Excel, que veréis que es mucho más rápido y además va a ser mucho más exacto que como lo hicimos en el anterior vídeo. 4 00:01:01,109 --> 00:01:07,530 En primer lugar, calcular el precio medio al que se han vendido los pisos de dicho barrio, es decir, nos está pidiendo la media de Y. 5 00:01:08,030 --> 00:01:12,189 Entonces, lo que nos está pidiendo es la media de Y. ¿Y cómo se calcula la media de Y? 6 00:01:12,329 --> 00:01:17,109 Bueno, pues tenemos que calcular el promedio de todos los valores de Y. 7 00:01:17,209 --> 00:01:20,969 Esto no lo tenemos que saber, que tenemos que calcular el promedio para calcular la media. 8 00:01:21,310 --> 00:01:28,730 Si no, lo que tendríamos que hacer es el sumatorio de las distintas variables que toma la Y por su frecuencia absoluta a partir del número total de datos, que en este caso es diario, ¿no? 9 00:01:28,730 --> 00:01:56,469 Pero si sabemos que la fórmula en Excel es la de promedio, aplicamos y nos sale 212,7. Voy a darle un poquito de formato para que nos quede más chulo. 212,7 es la media de I. Recordemos que la I estaba en miles de euros, así que podemos decir que son 212.700 euros. Es la media a la que se han vendido los pisos de esta zona. 10 00:01:56,469 --> 00:02:01,329 En el B, calcular e interpretar el coeficiente de correlación entre las dos variables 11 00:02:01,329 --> 00:02:05,969 ¿Cómo calculamos el coeficiente de correlación? 12 00:02:06,109 --> 00:02:08,590 El coeficiente de correlación lo calculamos con la siguiente fórmula 13 00:02:08,590 --> 00:02:11,430 coef.de.correr 14 00:02:11,430 --> 00:02:15,969 y seleccionamos en primer lugar el rango de datos de una de las variables 15 00:02:15,969 --> 00:02:20,650 punto y coma y seleccionamos el rango de datos de la otra variable 16 00:02:20,650 --> 00:02:24,469 y nos da 0,754324 17 00:02:24,469 --> 00:02:29,110 Quiero que solo me salgan 4 decimales, así que lo voy a cortar en el cuarto decimal. 18 00:02:29,569 --> 00:02:33,629 Ahora me toca interpretarlo. ¿Qué quiere decir 0,7543? 19 00:02:33,870 --> 00:02:38,509 En primer lugar, acordaos que el valor del coeficiente de correlación estaba entre menos 1 y 1. 20 00:02:38,629 --> 00:02:40,469 Es decir, podía ser negativo o podía ser positivo. 21 00:02:41,129 --> 00:02:48,229 Si era positivo, es decir, si es mayor que 0, como ocurre aquí, podemos decir que la relación es positiva entre las dos variables. 22 00:02:48,229 --> 00:03:06,009 Existe una correlación positiva entre la variable de la superficie y la variable del precio del inmueble. Si sube la superficie, si suben los metros cuadrados de un piso, tenderá a subir el precio de ese piso y viceversa. Si a medida que reducimos los metros cuadrados de un piso, reduciremos su precio. 23 00:03:06,009 --> 00:03:15,849 Y por otro lado, acordaos que cuanto más cerca estuviese el coeficiente de correlación de 1, más fuerte era la correlación existente entre las variables estudiadas. 24 00:03:16,370 --> 00:03:23,629 Cuanto más cercano fuese el coeficiente de correlación a 0, más débil sería la relación entre las dos variables estudiadas. 25 00:03:23,789 --> 00:03:31,009 En este caso, como es 0,7543, podemos decir que está bastante cerca de 1 y por tanto la correlación entre las dos variables es fuerte. 26 00:03:31,210 --> 00:03:34,069 Estas serían las conclusiones que tendríamos que sacar al respecto. 27 00:03:34,069 --> 00:03:38,310 Apartado C, calcular e interpretar el coeficiente de determinación 28 00:03:38,310 --> 00:03:43,509 Entonces calculamos el coeficiente de determinación, es decir, mi R cuadrado 29 00:03:43,509 --> 00:03:47,530 Coeficiente punto R2 30 00:03:47,530 --> 00:03:50,830 Esa es la fórmula para calcular el coeficiente de determinación 31 00:03:50,830 --> 00:03:54,849 Seleccionamos el rango de datos de una de las variables 32 00:03:54,849 --> 00:03:58,210 Punto y coma, seleccionamos el rango de datos de la otra variable 33 00:03:58,210 --> 00:04:03,229 Y nos sale esta cifra, puedo quitarle decimales 34 00:04:03,229 --> 00:04:18,629 vamos a dejarlo en 4, y ahora nos queda la interpretación. Acordaos que esto lo pasábamos a porcentaje y decíamos que el 56,90% de las variaciones en el precio de un inmueble vienen explicadas por las variaciones en los metros cuadrados de dicho inmueble. 35 00:04:18,629 --> 00:04:33,850 Y el resto de variaciones en el precio vienen explicadas por otros factores, como podrían ser, pues en este caso, lo antiguo o nuevo que sea el piso, la cercanía de determinados servicios públicos como, por ejemplo, un centro de salud o la cercanía a distintos medios de transporte, etc. 36 00:04:34,610 --> 00:04:40,509 Perfecto, apartado C hecho, vamos a por el B. Hallar la recta de regresión de la variable dependiente sobre la variable independiente. 37 00:04:40,509 --> 00:04:50,430 Para calcular la recta de regresión lo podemos hacer si insertamos un gráfico y vamos a insertar una nube de puntos, ¿de acuerdo? 38 00:04:51,290 --> 00:05:07,370 Vamos a X y dispersión, aunque nos salga de esta manera, seleccionamos el gráfico y como podéis ver, nos sale ya representado el precio en el eje de ordenadas y en el eje de abscisas se nos representan los metros cuadrados, ¿vale? 39 00:05:07,370 --> 00:05:25,149 Esto lo podemos llamar diagrama de dispersión o nube de puntos. Voy a poner nube de puntos más recta de regresión. Voy a representar aquí también la recta de regresión. ¿Que no me gusta este gráfico? Pues acordaos que aquí le podemos dar distintos estilos de diseño. 40 00:05:25,149 --> 00:05:40,689 No, a mí me va a gustar este de aquí, ¿vale? Y ahora, ¿qué es lo que tenemos que hacer para hallar la recta de regresión? Pulsamos sobre cualquiera de los puntos, por ejemplo, este botón derecho y le damos a agregar línea de tendencia. 41 00:05:40,689 --> 00:05:56,129 Vale, pues esa línea de tendencia ya es la recta de regresión y veis que al haberle dado a agregar recta de tendencia aquí a la derecha me sale un panel en el que puedo seleccionar que me presente, he bajado la barra y me sale aquí, presentar ecuación en el gráfico. 42 00:05:56,129 --> 00:06:04,970 Bien, pues esa sería la ecuación de la recta de regresión, no hace falta hacer ningún cálculo, me lo hace directamente Excel, si represento los datos en una nube de puntos. 43 00:06:05,949 --> 00:06:13,430 Y también fijaos que me permitía hasta presentar el valor r al cuadrado en el gráfico, es decir, que tampoco hubiese hecho falta calcular la fórmula que hemos hecho aquí, 44 00:06:13,790 --> 00:06:20,850 porque ya directamente en este gráfico nos sale que r al cuadrado son 0,569. 45 00:06:20,850 --> 00:06:25,410 si yo esto lo quiero poner más grande 46 00:06:25,410 --> 00:06:28,029 pues lo modifico, lo pongo 47 00:06:28,029 --> 00:06:31,269 en un tamaño más grande, quizá pues a lo mejor 48 00:06:31,269 --> 00:06:33,269 la recta de regresión incluso la pongo en negrita 49 00:06:33,269 --> 00:06:35,990 y ya lo tendría, vale 50 00:06:35,990 --> 00:06:40,230 recordad que el R cuadrado no era necesario calcularlo dentro del gráfico 51 00:06:40,230 --> 00:06:43,209 porque ya lo habíamos calculado anteriormente pero es otra manera de calcular 52 00:06:43,209 --> 00:06:44,870 también el coeficiente de determinación 53 00:06:44,870 --> 00:06:49,189 y que nos pide en el apartado E, en el apartado E nos pide 54 00:06:49,189 --> 00:06:53,170 realizar una predicción sobre el precio al que se vendería un piso de 90 metros cuadrados 55 00:06:53,170 --> 00:06:57,189 en dicho barrio, ¿vale? Pues entonces, ¿esto cómo lo hacemos? Pues podemos 56 00:06:57,189 --> 00:07:00,949 crear una especie de simulador, ¿vale? Podemos crear aquí algo que se llame 57 00:07:00,949 --> 00:07:05,009 simulador, vamos a calcular esto de lo que nos pide en este 58 00:07:05,009 --> 00:07:09,410 caso, pero vamos a modificar, vamos a 59 00:07:09,410 --> 00:07:13,290 crearlo de tal manera que podamos modificar el valor de la X que metemos para que 60 00:07:13,290 --> 00:07:17,470 nos responda con la Y, ¿vale? Que nos haga una predicción siempre en torno 61 00:07:17,470 --> 00:07:32,970 Y la x es la variable independiente, por tanto, esa será la variable que nosotros tendremos que ir introduciendo. Ahora vamos a calcular, ¿cómo calcularíamos la variable dependiente en función de la independiente? ¿Cómo lo haríamos? Pues a través de la recta de regresión, así que la voy copiando. 62 00:07:32,970 --> 00:07:49,410 2,9619 por el valor que introduzcamos de X, menos 15,364. Genial. Es decir, si yo a la X le doy un valor de 90, me dará una Y de 251,207. 63 00:07:49,410 --> 00:08:02,769 Por tanto, para un piso de 90 metros cuadrados, podemos predecir que su precio será de 251,207 miles de euros, es decir, 251,207 euros. 64 00:08:02,970 --> 00:08:17,730 ¿Vale? Así quedaría resuelto este ejercicio, que ya lo resumimos en un vídeo anterior aplicando las fórmulas matemáticas, con Excel es más rápido y más exacto y nada, espero que os haya sido de utilidad este vídeo y nos vemos en siguientes vídeos. ¡Saludos!