1 00:00:05,320 --> 00:00:21,079 Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES 2 00:00:21,079 --> 00:00:25,579 Arquitecto Pedro Gumiel de Alcalá de Henares y os doy la bienvenida a esta serie de videoclases 3 00:00:25,579 --> 00:00:28,800 de la unidad ES2 dedicada a la estadística bivariante. 4 00:00:29,980 --> 00:00:39,270 En la videoclase de hoy estudiaremos las tablas de frecuencias. 5 00:00:40,090 --> 00:00:52,140 En esta videoclase vamos a estudiar las tablas de frecuencias para distribuciones bidimensionales. 6 00:00:52,399 --> 00:00:56,659 Las tablas de frecuencias, como vimos en la unidad anterior, son ordenaciones en forma 7 00:00:56,659 --> 00:01:01,640 de tabla de los datos estadísticos. Y dependiendo de cómo sean estos, cómo sean los datos 8 00:01:01,640 --> 00:01:06,019 de la variable bidimensional, tendremos distintos tipos de tablas, que serán unos más útiles 9 00:01:06,019 --> 00:01:11,120 que otros. La tabla de frecuencias más sencilla es la que se llama tabla bidimensional simple, 10 00:01:11,640 --> 00:01:17,260 que recoge los vectores de datos x y de forma individual. Aquí vemos, por ejemplo, una 11 00:01:17,260 --> 00:01:23,500 tabla donde tenemos los datos a lo largo de una misma fila. Tenemos una primera columna 12 00:01:23,500 --> 00:01:28,140 de encabezados donde se nos identifica cuál es la variable estadística x, cuál es la variable 13 00:01:28,140 --> 00:01:33,439 estadística y y a partir de aquí lo que tenemos es en cada una de estas columnas los distintos 14 00:01:33,439 --> 00:01:38,659 valores que hemos recogido en cada una de las mediciones. x1 y 1 se correspondería con el 15 00:01:38,659 --> 00:01:45,480 primer vector, la observación del primer elemento de la población o muestra, x2 y 2 el vector de 16 00:01:45,480 --> 00:01:51,620 dados que corresponde al segundo elemento de la población o muestra y así hasta xn y n el que 17 00:01:51,620 --> 00:01:57,959 corresponde al enésimo miembro de la población o muestra. Aquí lo que tenemos recogido son n 18 00:01:57,959 --> 00:02:03,359 vectores de datos porque hemos realizado n observaciones, siendo n minúscula el tamaño o 19 00:02:03,359 --> 00:02:09,560 bien de la población o bien de la muestra. Este tipo de tabla bidimensional simple es útil cuando 20 00:02:09,560 --> 00:02:15,280 el número de datos, el tamaño de la población o muestra, es pequeño, de tal forma que los 21 00:02:15,280 --> 00:02:20,120 vectores de datos no se repiten. También se suele utilizar cuando los vectores de datos corresponden 22 00:02:20,120 --> 00:02:26,259 a observaciones a lo largo del tiempo y lo que tenemos es la medición de un par de magnitudes 23 00:02:26,259 --> 00:02:31,139 y lo que tenemos es un proceso que va evolucionando a lo largo del tiempo, realizamos observaciones 24 00:02:31,139 --> 00:02:35,919 en distintos instantes, en instante 1, instante 2 y aquí lo que hemos hecho es realizar n 25 00:02:35,919 --> 00:02:42,439 observaciones en n instantes de tiempo diferentes. Una segunda forma de representar estos datos 26 00:02:42,439 --> 00:02:47,819 es con lo que se llama tabla bidimensional simple con frecuencias absolutas. Se parece 27 00:02:47,819 --> 00:02:53,120 mucho a la anterior, lo que ocurre es que la anterior era útil cuando los vectores de datos 28 00:02:53,120 --> 00:02:58,800 no se repetían y en este caso lo que tenemos son vectores de datos en una cantidad pequeña en donde 29 00:02:58,800 --> 00:03:04,939 puede haber repeticiones. Y entonces lo que tenemos son tres filas, puesto que lo tenemos todo ordenado 30 00:03:04,939 --> 00:03:11,800 a lo largo de filas, el encabezado corresponde con la identificación de cuál es la variable 31 00:03:11,800 --> 00:03:16,259 aleatoria x, la identificación de cuál es la variable aleatoria y, y lo que tenemos es a lo 32 00:03:16,259 --> 00:03:24,259 largo de las columnas igual que antes los distintos vectores de datos x1 y 1, x2 y 2 y así hasta xc y c. 33 00:03:24,919 --> 00:03:30,860 En este caso c no es el número de elementos en la población o muestra, no es el número de 34 00:03:30,860 --> 00:03:35,979 observaciones, es el número de vectores de datos posibles. Podemos llamarlo número de categorías 35 00:03:35,979 --> 00:03:42,139 de la c. En esta tercera fila lo que estamos representando son las frecuencias absolutas de 36 00:03:42,139 --> 00:03:48,740 cada uno de estos vectores de datos. Si x1 y 1 es un vector de datos concreto, este n1 representa 37 00:03:48,740 --> 00:03:54,580 el número de observaciones en las cuales hemos obtenido el vector de datos x1 y 1. Como veis 38 00:03:54,580 --> 00:04:01,979 aquí tenemos como cabecera para esta fila n sub i, n frecuencias absolutas. Igual en todos los demás, 39 00:04:02,360 --> 00:04:08,800 el vector de datos x2 y 2 ha sido observado n dos veces y así hasta xc y c, el último de los 40 00:04:08,800 --> 00:04:14,319 vectores de datos posibles ha sido observado n c veces. ¿Cuál es el tamaño de población o muestra? 41 00:04:14,419 --> 00:04:19,720 Se corresponde con la suma de todas las frecuencias absolutas y como ves aquí n minúscula, tamaño de 42 00:04:19,720 --> 00:04:25,839 población o muestra, es la suma desde 1 hasta c de estos n sub i, de todas estas frecuencias 43 00:04:25,839 --> 00:04:33,839 absolutas. En el caso en el que tenemos muchas observaciones es más útil hacer una representación 44 00:04:33,839 --> 00:04:38,319 de la tabla de frecuencias que se llama tabla de doble entrada como esta que vemos aquí. 45 00:04:38,800 --> 00:04:55,000 Lo que tenemos es, por columnas, la variable aleatoria x, que puede tomar valores x1, x2, hasta xcx. Cx representa el número de categorías posible para la variable aleatoria x. 46 00:04:55,540 --> 00:05:03,000 Tenemos por filas y, la variable aleatoria y, que puede tomar valores y1, y2, etc. hasta y sub ci, 47 00:05:03,600 --> 00:05:12,180 siendo ci el número de categorías para la variable y, representa el número de valores posible para la variable aleatoria y. 48 00:05:13,620 --> 00:05:19,980 Tenemos esta ordenación por filas y por columnas y aquí lo que tenemos son una cuadrícula con las intersecciones. 49 00:05:19,980 --> 00:05:32,180 Lo que se recoge dentro de esta cuadrícula son las frecuencias absolutas que corresponden a las observaciones de los pares de valores x e y que corresponden con dicha intersección. 50 00:05:32,319 --> 00:05:40,899 Y me explico. En esta primera celda lo que tenemos como un cabezado es x1 y como un cabezado de fila y1. 51 00:05:41,519 --> 00:05:48,060 Este n11 corresponde con el número de observaciones en las cuales el vector de datos será x1 y1. 52 00:05:48,060 --> 00:06:00,579 A continuación tenemos n12. Estas son la frecuencia absoluta, el número de observaciones, en los cuales se ha obtenido como vector de datos el que corresponde con x2 y 1. 53 00:06:01,319 --> 00:06:08,079 Siempre empezando por el encabezado de las columnas y a continuación el encabezado de las filas. 54 00:06:09,079 --> 00:06:17,939 En los subíndices, que van a ser siempre 2, el primero se corresponde con el número de fila y el segundo con el número de columna. 55 00:06:18,060 --> 00:06:32,560 Así, por ejemplo, este n2cx, 2 es el número de fila, se corresponde con el valor de y y sub 2, y cx se corresponde con el número de columna, se corresponde con el valor de x que está en la columna cx. 56 00:06:33,259 --> 00:06:39,439 Insisto, todos estos valores de n sub ij en general se corresponden con frecuencias absolutas, 57 00:06:39,560 --> 00:06:45,639 la que corresponde al valor de x que está en la columna j, el segundo número me indica la columna, 58 00:06:45,740 --> 00:06:51,139 así que se corresponde con xj, y con el número de fila que se corresponde con el primer índice, 59 00:06:51,139 --> 00:07:01,060 así que se corresponde con el valor de i sub i. n ij es la frecuencia absoluta que corresponde al vector de datos xj i sub i. 60 00:07:01,980 --> 00:07:07,519 Esto que tenemos aquí, veremos más adelante, en segundo de bachillerato, que es una matriz numérica. 61 00:07:07,660 --> 00:07:15,360 Una matriz no es más que una serie, un conjunto de valores numéricos, en este caso, que están ordenados por filas y columnas. 62 00:07:15,480 --> 00:07:19,339 Y con carácter general nos referiremos a ellos con dos subíndices. 63 00:07:19,899 --> 00:07:24,060 El primero va a indicar siempre el número de filas, el segundo va a indicar siempre el número de columnas. 64 00:07:25,560 --> 00:07:30,720 Habitualmente las frecuencias en IJ que son nulas no se suelen escribir dejando la celda en blanco. 65 00:07:30,720 --> 00:07:38,959 De tal forma que veremos únicamente los valores de las frecuencias absolutas que se corresponden con vectores de datos que han sido realmente observados. 66 00:07:39,920 --> 00:07:57,279 Fijaos que x1, 2 hasta xcx, cx es el número de categorías para la variable aleatoria x, y sub 1 y sub 2 hasta y sub ci, ci representa el número de categorías, el número de valores posibles de la variable aleatoria y. 67 00:07:57,279 --> 00:08:02,660 griega. En cuanto al tamaño de población y muestra no está aquí recogido directamente, sería igual que 68 00:08:02,660 --> 00:08:08,019 pasaba anteriormente la suma de todas las frecuencias absolutas y el tamaño de la población 69 00:08:08,019 --> 00:08:15,319 y muestra será n igual a la suma de todos estos valores de n sub ij. Hablaremos de ello un poco 70 00:08:15,319 --> 00:08:22,189 más adelante. Vamos a ver a continuación un primer ejemplo de construcción de una tabla de frecuencias 71 00:08:22,189 --> 00:08:28,490 para una variable bidimensional. En este caso se nos dice que se realiza un estudio conjunto del 72 00:08:28,490 --> 00:08:34,269 consumo de combustible y la distancia recorrida por un cierto vehículo y tenemos aquí los vectores 73 00:08:34,269 --> 00:08:40,470 de datos que corresponden a las observaciones x y donde como vemos se nos dice que x denota la 74 00:08:40,470 --> 00:08:47,309 distancia recorrida en kilómetros e y el volumen de combustible consumido en litros. Tenemos 10 75 00:08:47,309 --> 00:08:52,549 vectores de datos que corresponden como vemos aquí a 10 trayectos del vehículo y cuando leemos 100 76 00:08:52,549 --> 00:09:00,590 6,5 debemos interpretar que se recorren 100 kilómetros consumiéndose 6,5 litros de combustible. 77 00:09:00,929 --> 00:09:06,730 Cuando en el siguiente vector de datos leemos 80, 6,0 hemos de interpretar que se recorren 80 78 00:09:06,730 --> 00:09:13,029 kilómetros y se consumen 6,0 litros de combustible y así sucesivamente. En este caso se nos pide que 79 00:09:13,029 --> 00:09:17,730 construyamos la correspondiente tabla bidimensional simple porque tenemos un número pequeño de 80 00:09:17,730 --> 00:09:22,090 vectores de datos y no tenemos repeticiones. Cada uno de ellos es distinto de todos los anteriores. 81 00:09:22,549 --> 00:09:41,169 Vamos a hacer como antes, vamos a representar todo esto a lo largo de filas y lo que tenemos es en la primera fila la variable aleatoria x, la variable estadística x, distancia recorrida en kilómetros y en la segunda fila la variable estadística y, volumen de combustible consumido en litros, tal y como se nos indica en el enunciado. 82 00:09:41,169 --> 00:10:06,809 Y lo que hemos hecho ha sido poner los distintos vectores uno a continuación del otro. El vector 100, 6,5, pues lo tenemos aquí, x1 sería 100 y sub1 es 6,5. El siguiente es 80, 6,0, pues aquí tenemos x2 es 80 y sub2 es 6,0. 1, 2, 3, etcétera, lo que me indica es cuál es el vector de datos, el orden con respecto a los datos que se nos han dado, los datos brutos. 83 00:10:06,809 --> 00:10:11,529 es habitual utilizar la misma ordenación 84 00:10:11,529 --> 00:10:12,750 es lo que hemos hecho aquí 85 00:10:12,750 --> 00:10:16,669 otra posibilidad alternativa en el caso en el que la ordenación no sea relevante 86 00:10:16,669 --> 00:10:19,309 podría haber sido haberlos ordenado 87 00:10:19,309 --> 00:10:20,649 siempre que se puedan ordenar 88 00:10:20,649 --> 00:10:24,870 en este caso son todos x y son variables cuantitativas 89 00:10:24,870 --> 00:10:26,409 así que existe un orden numérico 90 00:10:26,409 --> 00:10:29,409 podría haberse ordenado los vectores de datos 91 00:10:29,409 --> 00:10:32,370 primero en orden creciente o decreciente 92 00:10:32,370 --> 00:10:35,269 según hubiéramos deseado de la variable aleatoria x 93 00:10:35,269 --> 00:10:40,509 y para un mismo valor de x a continuación en un valor en orden creciente o decreciente de la 94 00:10:40,509 --> 00:10:46,009 variable aleatoria y cualquiera de las dos posibilidades es habitual y también lo es 95 00:10:46,009 --> 00:10:50,889 esta que hemos utilizado la de utilizar el mismo orden que nosotros teníamos en los datos brutos 96 00:10:50,889 --> 00:10:56,960 en este siguiente ejemplo se nos plantea un estudio conjunto del número de suspensos en 97 00:10:56,960 --> 00:11:01,080 una cierta evaluación y el tiempo diario medio de estudio de los estudiantes de un cierto grupo 98 00:11:01,080 --> 00:11:07,419 de bachillerato. Aquí tenemos los vectores de datos, tenemos 30 vectores porque se nos dice que 99 00:11:07,419 --> 00:11:13,980 estos datos corresponden a los 30 estudiantes del grupo y tenemos valores x y y se nos dice que x, 100 00:11:14,299 --> 00:11:19,919 la primera variable estadística, denota el tiempo diario medio de estudio en horas e y, la segunda 101 00:11:19,919 --> 00:11:25,340 variable, el número de suspensos en la evaluación. Así que cuando tenemos este vector 0,4 lo que 102 00:11:25,340 --> 00:11:30,759 debemos leer es que estudiando un promedio de 0 horas diarias se obtienen 4 suspensos en la 103 00:11:30,759 --> 00:11:37,120 evaluación. En el siguiente vector de datos, que cuando se estudian dos horas diarias en promedio, 104 00:11:37,259 --> 00:11:42,279 se obtiene un único suspenso en la evaluación y así sucesivamente. Se nos pide que construyamos 105 00:11:42,279 --> 00:11:46,720 la correspondiente tabla de doble entrada porque lo que tenemos es un número apreciable de vectores 106 00:11:46,720 --> 00:11:52,600 de datos. No son 10 como antes, ahora son 30. Si tuviéramos que poner una fila con 30 o incluso 107 00:11:52,600 --> 00:11:57,799 una tabla bidimensional simple con frecuencias absolutas porque se repiten, tendríamos una tabla 108 00:11:57,799 --> 00:12:03,320 que sería muy estrechita y muy alargada. No es útil. Se nos pide que construyamos la tabla de doble entrada. 109 00:12:03,919 --> 00:12:10,080 Para ello lo que tenemos que hacer es lo siguiente. Vamos a construir esta tabla y lo que tenemos es, 110 00:12:10,840 --> 00:12:19,720 aquí arriba, colocado por columnas, nuestra variable estadística x. Se nos dice que es tiempo diario medio de estudio en horas. 111 00:12:20,539 --> 00:12:25,899 La variable estadística la tenemos aquí y los valores posibles son x sub j. 112 00:12:26,419 --> 00:12:28,340 Y aquí tenemos las unidades en horas. 113 00:12:29,399 --> 00:12:32,860 Aquí lo que vamos a hacer es poner por filas la variable estadística y. 114 00:12:33,279 --> 00:12:36,419 En este caso se nos dice que es el número de suspensos, aquí lo tenemos. 115 00:12:37,259 --> 00:12:41,139 Y los valores posibles que tenemos aquí van a ser y sub i. 116 00:12:41,539 --> 00:12:47,179 Os recuerdo que siempre tenemos y sub i para la variable estadística y, que la tenemos por filas. 117 00:12:47,179 --> 00:12:53,259 y x sub j los valores posibles de la variable estadística x que tendremos por filas. 118 00:12:54,500 --> 00:12:59,899 Estos valores 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5 son los valores observados, 119 00:13:00,379 --> 00:13:03,759 los llamaremos también los valores posibles, puesto que son observados, 120 00:13:04,120 --> 00:13:06,360 para la variable estadística x e y. 121 00:13:06,759 --> 00:13:08,500 Se determinan por observación. 122 00:13:09,039 --> 00:13:14,620 Por ejemplo, para la variable estadística x viramos los primeros valores en todos los vectores de datos 123 00:13:14,620 --> 00:13:21,620 y vemos que tenemos valores naturales, el valor más pequeño vemos que es 0, 2, 4, 1, 3... 124 00:13:22,139 --> 00:13:27,100 Si revisamos todos vemos que el valor más alto posible para la x es 4, el más pequeño es 0. 125 00:13:27,639 --> 00:13:34,100 Valores naturales entre 0 y 4, pues aquí tenemos los distintos valores observados, valores posibles para x, 126 00:13:34,460 --> 00:13:39,279 que llamaremos x sub j, empezando en 0, 1, 2, 3 y 4, ordenados. 127 00:13:39,899 --> 00:13:44,340 0 es el valor de x1, el que hemos puesto en la primera columna porque es el más pequeño, 128 00:13:44,620 --> 00:14:02,720 1 es el valor de x2, es el que tenemos en la segunda columna, este 2 es x3, este 3 es x4, este 4 es x5, es el que está en la quinta columna y el número de categorías posibles para la variable estadística x es 5. 129 00:14:02,720 --> 00:14:08,659 Hay cinco valores posibles que hemos puesto en las cinco columnas, columna 1, 2, 3, 4 y 5. 130 00:14:09,179 --> 00:14:13,679 Cuando la variable estadística es numérica y sobre todo cuando toma valores naturales, 131 00:14:13,960 --> 00:14:19,600 hay que tener mucho cuidado de no confundir el valor numérico de x, j con el valor de j. 132 00:14:20,100 --> 00:14:25,919 j denota en qué columna tenemos el valor correspondiente de x y x, j es el valor correspondiente. 133 00:14:26,200 --> 00:14:29,679 Insisto, con j igual a 3 es la tercera columna. 134 00:14:29,679 --> 00:14:39,399 X, J es el valor de X que está en la tercera columna. X, J vale 2 cuando la J vale 3. X, 3 vale 2. Hay que tener mucho cuidado con no confundirlo. 135 00:14:40,340 --> 00:14:48,259 Ahora haremos lo mismo con la variable estadística Y. Nos vamos a los segundos valores, que es donde tenemos la variable estadística Y, y miramos. 136 00:14:48,840 --> 00:14:58,919 Vemos que también son valores naturales. El valor más pequeño es este 0 que tenemos aquí. 1, 4, 3, 2, etc. Aquí veo un 5. Otra vez 5. 137 00:14:58,919 --> 00:15:01,679 Bueno, el valor más pequeño es 0, el valor más grande es 5. 138 00:15:02,320 --> 00:15:09,480 Así que los valores observados, los valores posibles, porque son observados, son, empezando en 0, 1, 2, 3, 4 y 5. 139 00:15:10,299 --> 00:15:14,679 Vemos que tenemos en total 6 valores, hemos puesto 6 filas. 140 00:15:14,679 --> 00:15:19,419 Así que en este caso, y sub 1, el valor que se encuentra en la primera fila es 0. 141 00:15:19,899 --> 00:15:24,159 Y sub 2, el siguiente valor mayor que se encuentra en la segunda fila es 1. 142 00:15:24,600 --> 00:15:27,519 Y así hasta y sub 6, que vale 5. 143 00:15:27,519 --> 00:15:34,480 es el valor mayor que hemos observado. 6 es el número de categorías de la variable estadística 144 00:15:34,480 --> 00:15:40,620 y, igual que aquí 5, era el número de categorías de la variable estadística x. El número de valores 145 00:15:40,620 --> 00:15:45,919 observados, el número de valores posibles. Aquí lo que tenemos en las celdas son las 146 00:15:45,919 --> 00:15:50,539 correspondientes frecuencias absolutas, las que se corresponden con las intersecciones de fila y 147 00:15:50,539 --> 00:15:56,120 columna. Por ejemplo, aquí la primera celda, la que tenemos en la primera fila, primera columna, 148 00:15:56,120 --> 00:16:05,220 sería n11. Se corresponde al vector de datos con x1, que vale 0, e y1, que también vale 0. 149 00:16:05,820 --> 00:16:11,559 Deberíamos ir al conjunto de vectores de datos y contar cuántas veces nos aparece dentro de estas 150 00:16:11,559 --> 00:16:18,320 30 el vector 0, 0. No aparece ninguna. No ponemos la frecuencia absoluta cuando vale 0, dejamos la 151 00:16:18,320 --> 00:16:22,980 celda en blanco indicando que no hay observaciones que correspondan a este valor. Pasamos al siguiente. 152 00:16:22,980 --> 00:16:28,460 siguiente. Seguimos con la primera fila y hemos pasado a la segunda columna. Esta frecuencia 153 00:16:28,460 --> 00:16:35,799 absoluta sería n12, primera fila, segunda columna. Se corresponde con el valor de x2, que en este 154 00:16:35,799 --> 00:16:42,080 caso es 1, y con el valor de y1, que en este caso es 0. Vamos a mirar en los 30 vectores de datos 155 00:16:42,080 --> 00:16:48,320 cuántos de ellos son el vector 1, 0. Vemos que no aparece en ningún momento, así que dejamos la 156 00:16:48,320 --> 00:16:54,019 celda en blanco, indicando que la observación, el número de observaciones es cero. Pasamos a la 157 00:16:54,019 --> 00:17:01,659 siguiente celda. Sería fila 1, columna 3. Esto sería el valor de frecuencia absoluta n sub 1, 3. 158 00:17:01,940 --> 00:17:10,240 Fila 1, columna 3. x3, el valor de x que está en la tercera columna, es 2 horas. Y sub 1, el valor 159 00:17:10,240 --> 00:17:14,400 de y que está en la primera fila, sigue siendo cero, cero suspensos. Así que lo que vamos a hacer es 160 00:17:14,400 --> 00:17:19,880 ir a los 30 vectores de datos y contar en cuántos el vector es el vector 2, 0. 161 00:17:20,420 --> 00:17:26,900 Nos lo encontramos aquí, una primera ocasión, y nos lo encontramos en una segunda ocasión. 162 00:17:27,460 --> 00:17:28,859 A ver, ¿dónde estaba? 163 00:17:30,440 --> 00:17:34,420 Aquí teníamos el primero, 2, 0, y aquí lo tenemos en la segunda, 2, 0. 164 00:17:34,920 --> 00:17:41,579 Así pues, la frecuencia n sub 1, 3, la que corresponde a estudiar en promedio dos horas diarias y obtener cero suspensos, 165 00:17:41,579 --> 00:17:48,259 la hemos obtenido dos veces, así que el valor de frecuencia absoluta n1,3 es 2, y este sí lo vamos a apuntar. 166 00:17:49,259 --> 00:17:53,480 Así con todos los demás, hasta completar todas las observaciones. 167 00:17:53,839 --> 00:18:00,579 Por ejemplo, este valor 2 que tenemos aquí, se encuentra para el valor de x igual a 1, 168 00:18:00,940 --> 00:18:07,779 hemos estudiado en promedio una hora diaria, y para el valor de y igual a 3, y hemos obtenido tres suspensos. 169 00:18:08,579 --> 00:18:12,460 Este se encuentra en la cuarta fila y segunda columna. 170 00:18:12,579 --> 00:18:13,119 No me dejes contar. 171 00:18:13,980 --> 00:18:17,819 Así pues, se trata de la frecuencia n sub 4, 2. 172 00:18:18,359 --> 00:18:20,299 Cuarta fila, segunda columna. 173 00:18:20,740 --> 00:18:29,539 Es el número de observaciones, el número de vectores de datos que se han observado y que coinciden con el vector 1, 3. 174 00:18:30,140 --> 00:18:34,440 Hemos estudiado una hora diaria, hemos obtenido tres suspensos. 175 00:18:35,299 --> 00:18:42,720 Es la observación 4, 2, así que la x correspondiente es x sub 2, la que se encuentra en la segunda columna, es una hora, 176 00:18:43,559 --> 00:18:49,180 y el valor de y que corresponde es y sub 4, es, he obtenido tres suspensos. 177 00:18:49,400 --> 00:18:57,000 Insisto en que hay que tener cuidado en que el subíndice que me enumera fila o columna no tiene por qué coincidir con el valor de la x o de la y. 178 00:18:57,000 --> 00:19:04,559 vieja. En este caso si buscamos cuántos vectores de estos 30 son el vector 1, 3, si está todo bien 179 00:19:04,559 --> 00:19:10,960 hecho deberíamos encontrarlo en dos ocasiones. Una de ellas es esta, aquí tenemos el vector 1, 3 y la 180 00:19:10,960 --> 00:19:16,940 otra es esta otra, el vector 1, 3 y no hay más. Cuando hemos acabado con toda la tabla de frecuencias 181 00:19:16,940 --> 00:19:23,720 lo que tenemos aquí son el número de observaciones que corresponde con cada uno de los vectores de 182 00:19:23,720 --> 00:19:29,740 datos intersección de fila y columna o columna y fila según queramos ver el orden y la suma de 183 00:19:29,740 --> 00:19:34,279 todas estas frecuencias absolutas debe coincidir con el número total de observaciones. En este 184 00:19:34,279 --> 00:19:43,710 caso debería ser 30. En el aula virtual de la asignatura tenéis disponibles otros recursos 185 00:19:43,710 --> 00:19:50,589 y cuestionarios. Asimismo tenéis más información en las fuentes bibliográficas y en la web. No 186 00:19:50,589 --> 00:19:55,190 dudéis en traer vuestras dudas e inquietudes a clase o al foro de dudas en el aula virtual. 187 00:19:55,190 --> 00:19:57,170 Un saludo y hasta pronto.