Saltar navegación

recta de regresión - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 25 de abril de 2021 por Maria Belen P.

67 visualizaciones

Descargar la transcripción

Vamos a estudiar ahora la recta de regresión, que bueno, la hemos visto ya, es decir, tengo mi relación entre x, la variable x, la variable y, 00:00:00
tengo la nube de puntos y esta recta de aquí sería la recta de regresión, ¿vale? 00:00:12
Esta recta de regresión, hemos visto la nube de puntos, de la nube de puntos que teníamos obteníamos el coeficiente r que no era otra cosa que sigma x y la covarianza partido sigma x sigma y y que era el coeficiente r de Pearson de correlación. 00:00:19
Entonces ahora vamos a hallar la recta de regresión. Estamos con una regresión que va a ser tipo lineal, es decir, igual a x más b. 00:00:42
Estamos buscando una recta la que mejor se ajuste a estos puntos y para hallar esta recta lo que aplicamos es el método de mínimos cuadrados. 00:00:58
es la recta de regresión de y sobre x, es decir, y como una cierta función de x, 00:01:08
pues calcularemos la distancia que hay entre un valor de y y su valor correspondiente a la recta real, 00:01:17
es decir, a la recta de regresión. Lo que calcularemos sería, si yo tengo, a ver, por ejemplo, aquí, 00:01:28
Este sería un cierto valor y su i de este punto. 00:01:35
Pues bueno, el valor que le corresponde a la recta, que el punto estuviera aquí en esta recta, pues sería este trocito de aquí. 00:01:39
Es decir, este valor de aquí sería el i sub r sub i. 00:01:53
¿De acuerdo? Entonces, la distancia entre I sub i menos I ri sería justo este tramo. 00:01:58
Sería este tramo de aquí. Pues así iríamos calculando para todos los puntos y los elevaríamos al cuadrado. 00:02:09
Y haríamos que esa distancia fuera mínima. 00:02:19
Entonces, haciendo esos cálculos, los cálculos necesarios, que no es competencia vuestra, pues llegamos a esta recta, que es la recta de reversión de y sobre x, donde y va a ser el valor que se espera y x en este caso sería también el valor que se espera. 00:02:23
Esto sería la X media y la Y media. Esto sería la covarianza y esto sería la varianza de la X. 00:02:42
Fijaos que esta fórmula permite calcular el valor estimado de Y. 00:02:52
Normalmente en la calculadora aparece como una especie de Y así con gorro, un valor estimado, 00:02:56
y aparece de esta manera A más B por X estimado. 00:03:02
De manera que luego entramos en el menú de regresión y nos sale ya directamente esta recta de aquí, nos sale calculada con este aspecto y luego meteríamos, si queremos saber un valor estimado determinado de y para un determinado valor de x, pues meteríamos o bien el x con gorro este o el y con gorro para obtener uno u otro. 00:03:07
Pero también podemos obtener lo que se llama la recta de regresión de x sobre y, que lo que haríamos sería justo al revés, obtener en vez de la distancia sobre, lo que haríamos en realidad sería cambiar básicamente las x por las y, ¿vale? 00:03:29
y obtendríamos la distancia en vez de sobre el eje de las y, es decir, mirando x sub y sub y menos y sub de la recta, la y sub r y, 00:03:46
pues lo miraríamos sobre las x, la distancia que habría desde el punto hasta el que le correspondería justo situado en la recta 00:03:57
Y todo esto lo elevaríamos al cuadrado y esa distancia tiene que ser mínima, de manera que me va a quedar justo lo mismo x menos x media, es decir, cambiando las x, fijaos, por las y, aquí tendríamos y menos y media. 00:04:11
En vez de tener aquí la varianza de x, tendríamos la varianza de y, ¿vale? Y la covarianza no varía. 00:04:26
Con lo cual, normalmente obtenemos este tipo que sería de recta de regresión de y sobre x, es decir, del tipo y igual a más bx. 00:04:34
Y si la correlación es positiva, pues las rectas de regresión tendrán pendiente positiva. 00:04:47
Esto ya lo hemos comentado, si es negativa, el coeficiente de correlación sería negativo, ¿vale? 00:04:52
Obviamente la pendiente es justo cuando nos la dan de esta manera. 00:04:58
Ya sabemos que la pendiente sería justo la b, que es lo que corresponde a esto de aquí, que sería la pendiente de la recta. 00:05:05
Con lo cual si el coeficiente de la sigma x al cuadrado esto siempre va a ser positivo 00:05:19
Entonces obviamente la pendiente solo depende de la covarianza 00:05:29
Y la covarianza hemos visto que estaba relacionada con el coeficiente de correlación 00:05:34
Con lo cual el signo de r va a dar el signo de la covarianza y va a dar el signo de la pendiente 00:05:39
Que es lo que llevamos diciendo 00:05:46
Y ahora, dentro de que tenemos lo más importante, la recta de revisión, ¿para qué nos sirve? Pues eso, para calcular el valor estimado para una de las variables estadísticas en función de la otra. 00:05:47
Es lo que decíamos, tendríamos que tener un Y estimado, va a ser igual a A más BX estimado. 00:06:03
Y esto nos va a parecer, lo podemos calcular de la manera que lo hemos calculado antes, 00:06:12
es decir, con la recta de regresión de Y sobre X, o al revés, esta sería de Y sobre X, 00:06:18
o bien esto nos lo da en el menú de regresión de la calculadora, que es como lo vamos a utilizar. 00:06:25
fundamentalmente dice, las rectas de división serán tanto más representativas de la distribución bidimensional 00:06:33
cuanto más próximo esté a 1 el valor absoluto del coeficiente de correlación. 00:06:39
Claro, ya hemos dicho que si tenemos un r que es 1 o menos 1, estamos diciendo que se trata de una función, ¿vale? 00:06:45
Una función, en este caso sería una recta, ¿vale? 00:06:54
Y si el R es pequeño, pues, ¿qué estamos diciendo? Para un R0, ¿qué pasaba? Que no había correlación. Entonces, la recta de regresión, pues, no va a representar para nada, ¿no? No va a ser representativo y el ajuste, lo que se llama ajustar la nube de puntos a una recta, no va a tener sentido. 00:06:57
Entonces, en ocasiones, dice, con el fin de calcular la calidad o lo que se llama bondad del ajuste realizado, 00:07:15
se utiliza, por la recta de regresión, se utiliza, y claro, evidentemente, si yo tengo una recta que no representa esos puntos 00:07:21
o que no es muy fiable, vaya, pues me da igual lo que meta que voy a tener datos erróneos. 00:07:30
Entonces, para ver si ese ajuste está bien hecho o no, si representa o no esa recta, esos puntos, existe lo que se llama el coeficiente de determinación. 00:07:37
El coeficiente de determinación R cuadrado es el R que conocemos, es decir, el coeficiente de Pearson, pero elevado al cuadrado. 00:07:50
igual te va a dar la covarianza al cuadrado y en este caso sigma x, sigma y partido por la varianza de x, varianza de y, ¿vale? 00:08:01
Entonces, y esto va a ser en tanto por ciento, es decir, lo voy a multiplicar por 100 y me va a dar si se trata de un ajuste, o sea, que es bueno, ¿vale? 00:08:10
Ya os digo la bondad del ajuste, si es bueno o no, nos da el porcentaje en el que la variable x se justifica por el valor de la variable y, 00:08:20
Es decir, si está bien hecho o no está bien hecho. Entonces, fijaos aquí este ejercicio que viene resuelto, que indica, bueno, inversiones en millones de euros en un sector económico. 00:08:28
Determina la recta de reacción lineal que detalla o que relaciona el año de la inversión para utilizarla para estimar en el año del 2020 qué va a ocurrir. 00:08:39
Bueno, también tienes que calcular la bondad del ajuste, es decir, en base a unos datos que es para lo que se utiliza, tú haces una estimación, vas a ajustar esos datos a una recta de revisión y a partir de ahí vas a poder hacer estimaciones o predicciones en el futuro si no hay otras variables que interfieran. 00:08:49
Entonces, tomas la variable X y la inversión como variable Y. X tienes los años y los millones de euros. Calculamos X cuadrado, Y cuadrado, X por Y. Hacemos los sumatorios, los vemos en la calculadora y tenemos justo aquí, lo veis, cuánto vale la X media, la covarianza, la desviación típica. 00:09:09
Y calculamos la recta de regresión de y sobre x, es decir, y menos y media es igual a sigma x y partido sigma cuadrado, bla, bla, y tenemos que nos queda esta recta. 00:09:38
Esta recta, ¿vale?, es la que nos va a aparecer en la calculadora, que nos aparece, ya os he dicho, como y igual a a más bx, la que se llama la recta de regresión o el menú de regresión, ¿vale?, aparece normalmente tal que así. 00:09:49
Entonces dice la inversión estimada para el año 2020, pues yo para el año 2020 lo que haré, le meteré el año, que sería el X, sería 2020 y me va a dar la I estimada, ¿de acuerdo? 00:10:02
Entonces, ahí estimada me sale que sería esto. Con lo cual, si mi bondad dice, ¿es bueno este ajuste? Pues no lo sé. Vamos a calcular R cuadrado, ¿vale? R cuadrado, tendríamos sigma x y que ya lo tengo. 00:10:16
me hace falta calcular la desviación típica, que la desviación típica es la raíz cuadrada de la varianza, haría estos cálculos, me sale esto y total que me sale que R es esto, pues R, vemos que es un R, una correlación, están muy correlacionados estos datos porque están muy próximos además a 1 00:10:33
Y la punta del ajuste sería, fíjate, del 94%, que sería R cuadrado y por 100. Por lo tanto, entiendo que es un ajuste bueno el que he hecho por esta recta y que los datos que estoy prediciendo, ¿vale? De Y, respecto a la variable Y que estoy estimando, son buenos. 00:10:54
Y fijaos, aquí al revés, aquí lo que tenemos que calcular, dice porque ahora me dan los datos del ejemplo y te pidan determinar el año, es decir, te están pidiendo cuál es la x, ¿vale? La x estimada. 00:11:13
Pues bueno, en este caso sería hacer la estimación de X, o sea, la regresión de X sobre Y. 00:11:27
Pues bueno, hacemos los cálculos. Esta es mi ecuación de recta que me tengo que apuntar. 00:11:33
Obviamente me tengo que aprender y aquí veis lo que tengo que meter es justamente, en este caso, mi dato X. 00:11:39
Como veis, la recta es otra y el año en el cual se va a superar sería este. 00:11:49
Y luego te dice aquí, dibuja la nube de puntos que corresponde a los dos ejemplos anteriores de las rectas de regresión. Esta es la primera, la de y sobre x, y esta es la segunda, que era la de x sobre y. 00:11:56
vale y bueno pues vas viendo y bueno van a quedar muy muy muy como veis tanto la de y sobre x como 00:12:09
la de x sobre y difieren muy poco no dice se puede observar en la figura del margen que las 00:12:19
dos rectas de regresión se cortan en el punto que se llama centro de gravedad es decir tanto 00:12:25
la de x sobre y como la de y sobre x se cortan en el centro de gravedad que es x media y media 00:12:31
Y bueno, por último la regresión curvilínea que no da lugar a utilizarla en este libro, aunque en la calculadora veréis que hay posibilidad de coger la lineal, coger logarítmica, coger parabólica, exponencial y se trata igualmente mediante métodos de mínimos cuadrados, pues intentar ajustar a ese tipo de curva. 00:12:38
Subido por:
Maria Belen P.
Licencia:
Todos los derechos reservados
Visualizaciones:
67
Fecha:
25 de abril de 2021 - 20:26
Visibilidad:
Clave
Centro:
IES LAS VEREDILLAS
Duración:
13′ 02″
Relación de aspecto:
4:3 Hasta 2009 fue el estándar utilizado en la televisión PAL; muchas pantallas de ordenador y televisores usan este estándar, erróneamente llamado cuadrado, cuando en la realidad es rectangular o wide.
Resolución:
1440x1080 píxeles
Tamaño:
528.95 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid