1 00:00:00,500 --> 00:00:05,160 ¿Cómo situamos en una tabla las dos variables? 2 00:00:05,400 --> 00:00:11,019 Pues bueno, vamos a utilizar lo que se llama una tabla de doble entrada. 3 00:00:11,640 --> 00:00:17,179 En esta tabla de doble entrada nos sirve sobre todo para tener organizados los datos. 4 00:00:17,960 --> 00:00:26,019 Pues fijaos, por ejemplo, en este caso, dice vamos a estudiar las notas de matemáticas y de lengua de 30 alumnos de primero de bachillerato. 5 00:00:26,019 --> 00:00:38,579 Entonces, lo que nos hacemos claramente es lo que se llama así una doble entrada, ¿de acuerdo? En esta zona de aquí pondría las de mates y en esta zona de aquí pues pondría las de lengua, ¿de acuerdo? 6 00:00:38,859 --> 00:00:52,500 Entonces, a la variable nota que saca en matemáticas le llamo x y a la variable nota que saca en lengua pues le llamo y. Ya tengo dos variables a estudiar, la x y la y. 7 00:00:52,500 --> 00:01:19,980 Y bueno, ¿qué valores en este caso? Como cuando tenemos aquí, ¿vale? Por separado nuestra x, ¿verdad? Lo tendríamos tal que así y luego aquí tendríamos la f sub i, la frecuencia, es decir, en este caso por separado tendríamos la x sub i, que en este caso sería insuficiente, que sería en el tramo desde 2 hasta, no, desde 2,5 hasta 5, ¿vale? 8 00:01:19,980 --> 00:01:36,079 Luego suficiente que iría desde 5 hasta 6. Luego iría el bien, que sería el 6 incluido hasta el 7. Y luego el notable que va desde el 7 hasta, en este caso, hasta el 8.5. 9 00:01:36,079 --> 00:01:44,079 Y luego el sobresaliente, que iría desde el 8.5 incluido hasta el 10. 10 00:01:44,219 --> 00:01:46,219 Bueno, estos son los criterios que siguen el 10. 11 00:01:46,540 --> 00:01:48,439 En este caso sería matrícula, ¿vale? 12 00:01:48,519 --> 00:01:52,019 Pero bueno, iría tal que así, mejor puesto para allá. 13 00:01:52,700 --> 00:01:55,939 La frecuencia, pues la que nos ha dado aquí de matemáticas. 14 00:01:56,540 --> 00:02:00,269 Si nos damos cuenta, ¿vale? 15 00:02:00,370 --> 00:02:03,709 Aquí colocaríamos las frecuencias. 16 00:02:03,709 --> 00:02:06,689 frecuencias estas de aquí que bueno 17 00:02:06,689 --> 00:02:08,469 van a ir justo 18 00:02:08,469 --> 00:02:09,889 son las de aquí abajo 19 00:02:09,889 --> 00:02:13,780 en este caso son las marginales 20 00:02:13,780 --> 00:02:14,919 que se llaman las marginales 21 00:02:14,919 --> 00:02:17,419 igualmente haríamos para la isui 22 00:02:17,419 --> 00:02:20,099 colocaríamos aquí 23 00:02:20,099 --> 00:02:22,219 las frecuencias y aquí pues igual 24 00:02:22,219 --> 00:02:24,400 prácticamente es lo mismo 25 00:02:24,400 --> 00:02:26,139 la misma en isui 26 00:02:26,139 --> 00:02:28,120 y aquí tendríamos pues la frecuencia 27 00:02:28,120 --> 00:02:29,819 en este caso de 28 00:02:29,819 --> 00:02:32,020 los datos relativos a isui 29 00:02:32,020 --> 00:02:33,719 que va a ser justo 30 00:02:33,719 --> 00:02:40,719 el total sería este de aquí, ¿vale? Que serían las frecuencias, en este caso, marginales. 31 00:02:41,460 --> 00:02:44,500 Pero bueno, entre medias tenemos una relación que hay entre ambas. 32 00:02:44,620 --> 00:02:50,719 A ver, el que ha sacado un insuficiente en mates y insuficiente en lengua, pues tenemos cuatro personas. 33 00:02:52,199 --> 00:02:59,259 Quien ha sacado insuficiente en lengua y suficientes en mates, pues bueno, así iríamos rellenando toda esta tabla. 34 00:03:00,180 --> 00:03:02,780 Y así tenemos la relación que hay entre ambas. 35 00:03:02,780 --> 00:03:09,340 Cuando estudiamos la tabla tal cual, las dos características de esta tabla 36 00:03:09,340 --> 00:03:13,539 Lo que decimos que estamos estudiando la distribución conjunta 37 00:03:13,539 --> 00:03:17,180 La distribución conjunta de X e Y 38 00:03:17,180 --> 00:03:22,000 Y luego, respecto también a la forma de hablar 39 00:03:22,000 --> 00:03:26,960 Este tipo de tablas se llaman, para variables en este caso 40 00:03:26,960 --> 00:03:30,879 Bueno, aquí estamos con variables, estamos contando 41 00:03:30,879 --> 00:03:41,939 Están con números, no estamos hablando quizá cualidades porque numéricamente podemos distribuir esto. 42 00:03:43,039 --> 00:03:49,960 Se llaman tablas de doble entrada y se llaman tablas de correlación. 43 00:03:50,780 --> 00:03:59,000 Ahora bien, cuando los datos que recogen son de variables cualitativas, se llaman tablas de contingencia. 44 00:03:59,000 --> 00:04:07,819 respecto de tablas, ambas son tablas de correlación, pero específicamente las que recogen tablas, 45 00:04:08,919 --> 00:04:12,120 o sea, datos cualitativos serían de contingencia. 46 00:04:12,340 --> 00:04:14,599 ¿Qué son las distribuciones marginales? 47 00:04:14,599 --> 00:04:20,420 Pues bueno, lo que he contado antes, es decir, las tablas de doble entrada es posible obtener 48 00:04:20,420 --> 00:04:24,519 las distribuciones de cada una de las variables estadísticas unidimensionales. 49 00:04:24,519 --> 00:04:33,240 En este caso, para la F, para las matemáticas, ¿vale? En este caso, obtendría aquí, perdón, obtendría aquí abajo, ¿vale? 50 00:04:33,740 --> 00:04:40,199 Aquí abajo habría un 7, aquí habría un 9, aquí habría un 8, un 3, un 3, ¿vale? 51 00:04:40,199 --> 00:04:49,720 Porque sería la suma desglosada, ¿lo veis? De todas las, de toda la variable, en este caso, aquí la tendría desglosada, 52 00:04:49,720 --> 00:04:57,639 pero aquí la voy a tener en conjunto y corresponde a la suma, pues eso es lo que se llama tabla de frecuencias que se llama marginal, ¿vale? 53 00:04:58,240 --> 00:05:14,029 Y igualmente podemos utilizar la marginal de i, ¿vale? De la i de la de lengua, sumando todo nos tiene que dar justo el número de datos que tengo, es decir, n, el número de alumnos que era 30. 54 00:05:14,029 --> 00:05:27,430 ¿Para qué me sirve esto? Pues para calcular por separado, pues en este caso la x media, la sigma, la distribución o la varianza de x, 55 00:05:27,610 --> 00:05:39,089 también voy a poder utilizar la desviación típica de x, voy a poder utilizar también el coeficiente de variación de la variable x 56 00:05:39,089 --> 00:05:53,550 y voy a poder utilizar de este lado también la y media, la sigma sub y media y la varianza, perdón, la varianza y la desviación típica de la y 57 00:05:53,550 --> 00:06:01,009 y aquí también el coeficiente de variación de la y y luego podré utilizar otra cosa que estudiaremos que se llama la covarianza 58 00:06:01,009 --> 00:06:14,029 que sería sigma x, sigma y, ¿vale? Con una fórmula que veremos a continuación, que nos va a dar la relación que hay entre ambas variables. 59 00:06:15,350 --> 00:06:24,329 ¿Qué más tenemos a ver? Bueno, las distribuciones condicionales. Bueno, dice al estudiar la variable bidimensional, si fijo un valor en una, 60 00:06:24,329 --> 00:06:39,410 Pues, por ejemplo, imagínate, voy a estudiar la nota que tienen en matemáticas, ¿vale? La nota que tienen en matemáticas, que era la X, dado que la Y, por ejemplo, en este caso, en la Y tienen un bien. 61 00:06:39,410 --> 00:06:50,470 Es decir, dado que en MATA, es decir, dato sería X, dado que, esto por eso es condición, condicionada, dado que, o la condición, ¿vale? 62 00:06:53,529 --> 00:06:58,329 Que en la Y tienen un bien, ¿vale? 63 00:06:58,569 --> 00:07:02,310 Si en la Y tienen un bien, pues me iría aquí a ver si en la Y tienen un bien. 64 00:07:03,149 --> 00:07:08,810 Sería justo, la Y tienen un bien, sería justo tal que aquí. 65 00:07:09,410 --> 00:07:15,490 Entonces, si la y tienen un bien, mi distribución en este caso sería x, 66 00:07:17,920 --> 00:07:22,579 tomaría en este caso el valor, bueno, de insuficiente, de suficiente, 67 00:07:23,439 --> 00:07:27,300 de bien, de notable y de sobresaliente, eso es para la x, 68 00:07:27,300 --> 00:07:31,519 y cuánto vale esa x, ¿lo veis? 69 00:07:32,439 --> 00:07:39,939 Dado que en la y tienen un bien, pues entonces sería aquí 1, 2, 3, 70 00:07:40,439 --> 00:08:01,399 O sea, se ve claramente que quien saca un notable o un sobresaliente, o sea, quien saca un bien en lengua no tiene ni un notable ni un sobresaliente en matemáticas, ¿vale? 71 00:08:03,240 --> 00:08:10,639 Total de elementos, que nos faltaría el total, serían seis personas que han sacado, que es esta de aquí, el bien. 72 00:08:10,639 --> 00:08:15,120 Entonces, en este caso se llama distribución condicionada, ¿vale? 73 00:08:15,399 --> 00:08:33,509 ¿Y cómo se escribe? Pues, claro, en este caso sería igual, dice, dado que y es un bien, pues se escribe, en este caso, la nota de x, dado que y es igual a bien, ¿de acuerdo? 74 00:08:33,850 --> 00:08:38,850 Y aquí dice, ¿cuáles son las notas de lengua condicionada a que la nota del enmate sea un notable? 75 00:08:38,850 --> 00:09:00,809 Es decir, la nota de lengua, dado que la i es un notable, pues si la i es un notable, estaremos tal que la nota de lengua, la i es un notable, voy a situarme aquí en el verde, si la i es un notable, sería justo esta de aquí, porque la i es un notable. 76 00:09:00,809 --> 00:09:22,690 Entonces serían las notas de lengua. Lo veis, es esta que acabo de poner ahí. La i va a tomar los valores de siempre. La lengua, insuficiente, suficiente, bien, notable, sobre, saliente. Y aquí es justo. ¿Cuántos elementos que han sacado un notable suspenden lengua? Ninguno. 77 00:09:22,690 --> 00:09:27,110 ¿Cuántos han sacado en mates un notable? 78 00:09:27,610 --> 00:09:29,190 Y han sacado un sufín lengua 79 00:09:29,190 --> 00:09:36,230 Bien, es decir, y tenemos aquí todos los elementos de esta columna 80 00:09:36,230 --> 00:09:40,269 Que se llama distribución, en este caso, condicionada 81 00:09:40,269 --> 00:09:44,149 Te da la de una, es decir, la de X o la de Y 82 00:09:44,149 --> 00:09:49,210 Condicionada a que la otra sea fija 83 00:09:49,210 --> 00:10:09,600 Y, bueno, pues nada, poco más, porque ahora tendremos que ver lo que es el diagrama de dispersión, que, como os indicaba en el primer ejemplo, un diagrama de dispersión que nos va a dar la correlación que hay, o qué relación hay entre ambos. 84 00:10:09,600 --> 00:10:30,480 Tenemos la estatura en centímetros y aquí tenemos el peso en kilos. Aquí le tendríamos la x, ¿vale? Y esta sería la otra variable y. Y vamos tomando, aquí solamente tenemos puntuales, valores puntuales, ¿lo veis? Aquí vamos tomando, le hemos preguntado a uno qué pasa por allí. Bueno, a uno no. A uno, dos, tres, cuatro, cinco, seis, siete, ocho. Tendríamos ocho datos, ¿vale? 85 00:10:30,480 --> 00:10:48,980 Si tuviésemos 100 datos, esto al final no dejaría de ser como una especie de nube de puntos que era lo que os decía al principio, que se llama nube de puntos al conjunto que se obtiene, lo que se llama el diagrama de dispersión. 86 00:10:48,980 --> 00:10:59,559 Es representar gráficamente la variable en un eje y la otra variable, x en centímetros y la otra variable 87 00:10:59,559 --> 00:11:06,580 e ir anotando cada uno de los valores de los pares de puntos que obtenemos para x y para y. 88 00:11:07,000 --> 00:11:14,039 Cada uno de estos me va a salir un punto y así obtengo toda la nube completa.