1 00:00:00,000 --> 00:00:08,599 Hola a todos, en este tutorial vamos a calcular la recta MX más B que hace mínima el error de la nube de puntos con respecto a ella. 2 00:00:10,099 --> 00:00:14,919 Como tenemos una función en dos variables, la vamos a descomponer en dos funciones de una variable, 3 00:00:15,400 --> 00:00:24,339 de forma que esta función que depende de mi B será mínima si las funciones que sólo dependen de M o de B son mínimas. 4 00:00:24,339 --> 00:00:36,579 Para ello hacemos el cambio variable b minúscula igual a b mayúscula menos mx y entonces nuestra diferencia de los cuadrados adopta la siguiente forma. 5 00:00:37,159 --> 00:00:49,079 Si vamos descomponiendo en dos partes, primero lo que tiene m y segundo lo que no tiene m, podemos descomponer la fórmula de la siguiente manera. 6 00:00:49,079 --> 00:00:55,460 m cuadrado el sumatorio de la diferencia de los puntos menos su media 7 00:00:55,460 --> 00:01:00,500 más 2m veces la diferencia de los puntos menos su media 8 00:01:00,500 --> 00:01:03,299 que multiplica al parámetro b menos i sub i 9 00:01:03,299 --> 00:01:06,480 y nos queda por último b menos i sub i al cuadrado 10 00:01:06,480 --> 00:01:13,599 seguimos descomponiendo esto para quedarnos como dos funciones 11 00:01:13,599 --> 00:01:17,180 una que dependa de m y otra que dependa solo de b 12 00:01:17,180 --> 00:01:30,519 Y lo que vemos es que el tercer término, el que es el sumatorio, el segundo término, el que es el sumatorio de las b, x, y, menos x, va a ser cero. 13 00:01:31,519 --> 00:01:42,000 ¿Por qué? Porque el sumatorio, si a una serie de puntos, de los n puntos, le restamos a cada uno de ellos su media, obtenemos que sale cero. 14 00:01:42,000 --> 00:01:52,319 como podemos comprobar ahora perfectamente sacamos fuera 2 mb y lo 15 00:01:52,319 --> 00:01:59,459 que tenemos en los puntos menos su media es decir lo que suman todos los puntos 16 00:01:59,459 --> 00:02:05,129 menos n veces su medias que es exactamente lo que suman los puntos así 17 00:02:05,129 --> 00:02:09,370 ya hemos construido dos funciones una que depende de mi minúscula y una de b 18 00:02:09,370 --> 00:02:14,629 mayúscula que van a ser dos parábolas y las 19 00:02:14,629 --> 00:02:21,949 parábolas si son cóncavas sabemos calcular su vértice que es el término 20 00:02:21,949 --> 00:02:25,909 entremedio partido entre dos veces el primero que en el caso de que sea 21 00:02:25,909 --> 00:02:31,669 cóncava será su mínimo en este caso el mínimo de la función f 22 00:02:31,669 --> 00:02:38,629 va a ser el segundo término cambiado de signo 23 00:02:38,629 --> 00:02:45,189 entre dos veces el primer término hay que recordar que el parámetro la 24 00:02:45,189 --> 00:02:58,680 variable es la m si cancelamos los dos es de arriba y abajo nos queda una 25 00:02:58,680 --> 00:03:06,139 expresión un poco más amable que si además dividimos tanto arriba y 26 00:03:06,139 --> 00:03:12,199 abajo vamos a tener parámetros estadísticos ya conocidos 27 00:03:12,199 --> 00:03:21,979 El parámetro de abajo vemos que es el error cuadrático de unos valores de puntos con respecto a su media, que es a lo que le llamamos siempre la varianza. 28 00:03:22,659 --> 00:03:25,419 Y lo de arriba es una expresión que desarrollaremos más adelante. 29 00:03:26,759 --> 00:03:41,759 En cambio, si nos fijamos en la función b, que es una parábola también cóncava, como lo que estamos es restando al número b la serie de puntos, pues el mínimo se alcanza exactamente en su valor medio. 30 00:03:42,199 --> 00:04:07,590 Además, vamos a poder descomponer ese numerador que tenía esa pinta tan extraña como dos sumatorios en el que el segundo se va a convertir en el producto de las medias. 31 00:04:07,590 --> 00:04:22,000 Es decir, que si pensamos en todo el sumatorio, los x y su y partido de n y menos el producto de las medias, tenemos por definición la covarianza. 32 00:04:23,180 --> 00:04:34,699 Así, nuestro parámetro m ha quedado como la covarianza entre la varianza de x y nuestro parámetro b es justamente la media de y. 33 00:04:34,699 --> 00:04:50,079 Que si deshacemos el cambio de variable, lo que obtenemos es que la ecuación de la recta que estamos buscando va a ser la covarianza entre la varianza por x más la media de la y menos la covarianza entre la varianza de x. 34 00:04:50,680 --> 00:05:00,199 Agrupando esta covarianza entre la varianza, tenemos la ecuación de la recta de regresión típica que estudiamos siempre en todos los libros. 35 00:05:00,680 --> 00:05:03,079 Bueno, espero que os haya gustado. Un saludo.