Activa JavaScript para disfrutar de los vídeos de la Mediateca.
ES2. 2 Tablas de frecuencias. Ejercicios 1 y 2 resueltos - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES
00:00:05
Arquitecto Pedro Gumiel de Alcalá de Henares y os doy la bienvenida a esta serie de videoclases
00:00:21
de la unidad ES2 dedicada a la estadística bivariante.
00:00:25
En la videoclase de hoy estudiaremos las tablas de frecuencias.
00:00:29
En esta videoclase vamos a estudiar las tablas de frecuencias para distribuciones bidimensionales.
00:00:40
Las tablas de frecuencias, como vimos en la unidad anterior, son ordenaciones en forma
00:00:52
de tabla de los datos estadísticos. Y dependiendo de cómo sean estos, cómo sean los datos
00:00:56
de la variable bidimensional, tendremos distintos tipos de tablas, que serán unos más útiles
00:01:01
que otros. La tabla de frecuencias más sencilla es la que se llama tabla bidimensional simple,
00:01:06
que recoge los vectores de datos x y de forma individual. Aquí vemos, por ejemplo, una
00:01:11
tabla donde tenemos los datos a lo largo de una misma fila. Tenemos una primera columna
00:01:17
de encabezados donde se nos identifica cuál es la variable estadística x, cuál es la variable
00:01:23
estadística y y a partir de aquí lo que tenemos es en cada una de estas columnas los distintos
00:01:28
valores que hemos recogido en cada una de las mediciones. x1 y 1 se correspondería con el
00:01:33
primer vector, la observación del primer elemento de la población o muestra, x2 y 2 el vector de
00:01:38
dados que corresponde al segundo elemento de la población o muestra y así hasta xn y n el que
00:01:45
corresponde al enésimo miembro de la población o muestra. Aquí lo que tenemos recogido son n
00:01:51
vectores de datos porque hemos realizado n observaciones, siendo n minúscula el tamaño o
00:01:57
bien de la población o bien de la muestra. Este tipo de tabla bidimensional simple es útil cuando
00:02:03
el número de datos, el tamaño de la población o muestra, es pequeño, de tal forma que los
00:02:09
vectores de datos no se repiten. También se suele utilizar cuando los vectores de datos corresponden
00:02:15
a observaciones a lo largo del tiempo y lo que tenemos es la medición de un par de magnitudes
00:02:20
y lo que tenemos es un proceso que va evolucionando a lo largo del tiempo, realizamos observaciones
00:02:26
en distintos instantes, en instante 1, instante 2 y aquí lo que hemos hecho es realizar n
00:02:31
observaciones en n instantes de tiempo diferentes. Una segunda forma de representar estos datos
00:02:35
es con lo que se llama tabla bidimensional simple con frecuencias absolutas. Se parece
00:02:42
mucho a la anterior, lo que ocurre es que la anterior era útil cuando los vectores de datos
00:02:47
no se repetían y en este caso lo que tenemos son vectores de datos en una cantidad pequeña en donde
00:02:53
puede haber repeticiones. Y entonces lo que tenemos son tres filas, puesto que lo tenemos todo ordenado
00:02:58
a lo largo de filas, el encabezado corresponde con la identificación de cuál es la variable
00:03:04
aleatoria x, la identificación de cuál es la variable aleatoria y, y lo que tenemos es a lo
00:03:11
largo de las columnas igual que antes los distintos vectores de datos x1 y 1, x2 y 2 y así hasta xc y c.
00:03:16
En este caso c no es el número de elementos en la población o muestra, no es el número de
00:03:24
observaciones, es el número de vectores de datos posibles. Podemos llamarlo número de categorías
00:03:30
de la c. En esta tercera fila lo que estamos representando son las frecuencias absolutas de
00:03:35
cada uno de estos vectores de datos. Si x1 y 1 es un vector de datos concreto, este n1 representa
00:03:42
el número de observaciones en las cuales hemos obtenido el vector de datos x1 y 1. Como veis
00:03:48
aquí tenemos como cabecera para esta fila n sub i, n frecuencias absolutas. Igual en todos los demás,
00:03:54
el vector de datos x2 y 2 ha sido observado n dos veces y así hasta xc y c, el último de los
00:04:02
vectores de datos posibles ha sido observado n c veces. ¿Cuál es el tamaño de población o muestra?
00:04:08
Se corresponde con la suma de todas las frecuencias absolutas y como ves aquí n minúscula, tamaño de
00:04:14
población o muestra, es la suma desde 1 hasta c de estos n sub i, de todas estas frecuencias
00:04:19
absolutas. En el caso en el que tenemos muchas observaciones es más útil hacer una representación
00:04:25
de la tabla de frecuencias que se llama tabla de doble entrada como esta que vemos aquí.
00:04:33
Lo que tenemos es, por columnas, la variable aleatoria x, que puede tomar valores x1, x2, hasta xcx. Cx representa el número de categorías posible para la variable aleatoria x.
00:04:38
Tenemos por filas y, la variable aleatoria y, que puede tomar valores y1, y2, etc. hasta y sub ci,
00:04:55
siendo ci el número de categorías para la variable y, representa el número de valores posible para la variable aleatoria y.
00:05:03
Tenemos esta ordenación por filas y por columnas y aquí lo que tenemos son una cuadrícula con las intersecciones.
00:05:13
Lo que se recoge dentro de esta cuadrícula son las frecuencias absolutas que corresponden a las observaciones de los pares de valores x e y que corresponden con dicha intersección.
00:05:19
Y me explico. En esta primera celda lo que tenemos como un cabezado es x1 y como un cabezado de fila y1.
00:05:32
Este n11 corresponde con el número de observaciones en las cuales el vector de datos será x1 y1.
00:05:41
A continuación tenemos n12. Estas son la frecuencia absoluta, el número de observaciones, en los cuales se ha obtenido como vector de datos el que corresponde con x2 y 1.
00:05:48
Siempre empezando por el encabezado de las columnas y a continuación el encabezado de las filas.
00:06:01
En los subíndices, que van a ser siempre 2, el primero se corresponde con el número de fila y el segundo con el número de columna.
00:06:09
Así, por ejemplo, este n2cx, 2 es el número de fila, se corresponde con el valor de y y sub 2, y cx se corresponde con el número de columna, se corresponde con el valor de x que está en la columna cx.
00:06:18
Insisto, todos estos valores de n sub ij en general se corresponden con frecuencias absolutas,
00:06:33
la que corresponde al valor de x que está en la columna j, el segundo número me indica la columna,
00:06:39
así que se corresponde con xj, y con el número de fila que se corresponde con el primer índice,
00:06:45
así que se corresponde con el valor de i sub i. n ij es la frecuencia absoluta que corresponde al vector de datos xj i sub i.
00:06:51
Esto que tenemos aquí, veremos más adelante, en segundo de bachillerato, que es una matriz numérica.
00:07:01
Una matriz no es más que una serie, un conjunto de valores numéricos, en este caso, que están ordenados por filas y columnas.
00:07:07
Y con carácter general nos referiremos a ellos con dos subíndices.
00:07:15
El primero va a indicar siempre el número de filas, el segundo va a indicar siempre el número de columnas.
00:07:19
Habitualmente las frecuencias en IJ que son nulas no se suelen escribir dejando la celda en blanco.
00:07:25
De tal forma que veremos únicamente los valores de las frecuencias absolutas que se corresponden con vectores de datos que han sido realmente observados.
00:07:30
Fijaos que x1, 2 hasta xcx, cx es el número de categorías para la variable aleatoria x, y sub 1 y sub 2 hasta y sub ci, ci representa el número de categorías, el número de valores posibles de la variable aleatoria y.
00:07:39
griega. En cuanto al tamaño de población y muestra no está aquí recogido directamente, sería igual que
00:07:57
pasaba anteriormente la suma de todas las frecuencias absolutas y el tamaño de la población
00:08:02
y muestra será n igual a la suma de todos estos valores de n sub ij. Hablaremos de ello un poco
00:08:08
más adelante. Vamos a ver a continuación un primer ejemplo de construcción de una tabla de frecuencias
00:08:15
para una variable bidimensional. En este caso se nos dice que se realiza un estudio conjunto del
00:08:22
consumo de combustible y la distancia recorrida por un cierto vehículo y tenemos aquí los vectores
00:08:28
de datos que corresponden a las observaciones x y donde como vemos se nos dice que x denota la
00:08:34
distancia recorrida en kilómetros e y el volumen de combustible consumido en litros. Tenemos 10
00:08:40
vectores de datos que corresponden como vemos aquí a 10 trayectos del vehículo y cuando leemos 100
00:08:47
6,5 debemos interpretar que se recorren 100 kilómetros consumiéndose 6,5 litros de combustible.
00:08:52
Cuando en el siguiente vector de datos leemos 80, 6,0 hemos de interpretar que se recorren 80
00:09:00
kilómetros y se consumen 6,0 litros de combustible y así sucesivamente. En este caso se nos pide que
00:09:06
construyamos la correspondiente tabla bidimensional simple porque tenemos un número pequeño de
00:09:13
vectores de datos y no tenemos repeticiones. Cada uno de ellos es distinto de todos los anteriores.
00:09:17
Vamos a hacer como antes, vamos a representar todo esto a lo largo de filas y lo que tenemos es en la primera fila la variable aleatoria x, la variable estadística x, distancia recorrida en kilómetros y en la segunda fila la variable estadística y, volumen de combustible consumido en litros, tal y como se nos indica en el enunciado.
00:09:22
Y lo que hemos hecho ha sido poner los distintos vectores uno a continuación del otro. El vector 100, 6,5, pues lo tenemos aquí, x1 sería 100 y sub1 es 6,5. El siguiente es 80, 6,0, pues aquí tenemos x2 es 80 y sub2 es 6,0. 1, 2, 3, etcétera, lo que me indica es cuál es el vector de datos, el orden con respecto a los datos que se nos han dado, los datos brutos.
00:09:41
es habitual utilizar la misma ordenación
00:10:06
es lo que hemos hecho aquí
00:10:11
otra posibilidad alternativa en el caso en el que la ordenación no sea relevante
00:10:12
podría haber sido haberlos ordenado
00:10:16
siempre que se puedan ordenar
00:10:19
en este caso son todos x y son variables cuantitativas
00:10:20
así que existe un orden numérico
00:10:24
podría haberse ordenado los vectores de datos
00:10:26
primero en orden creciente o decreciente
00:10:29
según hubiéramos deseado de la variable aleatoria x
00:10:32
y para un mismo valor de x a continuación en un valor en orden creciente o decreciente de la
00:10:35
variable aleatoria y cualquiera de las dos posibilidades es habitual y también lo es
00:10:40
esta que hemos utilizado la de utilizar el mismo orden que nosotros teníamos en los datos brutos
00:10:46
en este siguiente ejemplo se nos plantea un estudio conjunto del número de suspensos en
00:10:50
una cierta evaluación y el tiempo diario medio de estudio de los estudiantes de un cierto grupo
00:10:56
de bachillerato. Aquí tenemos los vectores de datos, tenemos 30 vectores porque se nos dice que
00:11:01
estos datos corresponden a los 30 estudiantes del grupo y tenemos valores x y y se nos dice que x,
00:11:07
la primera variable estadística, denota el tiempo diario medio de estudio en horas e y, la segunda
00:11:14
variable, el número de suspensos en la evaluación. Así que cuando tenemos este vector 0,4 lo que
00:11:19
debemos leer es que estudiando un promedio de 0 horas diarias se obtienen 4 suspensos en la
00:11:25
evaluación. En el siguiente vector de datos, que cuando se estudian dos horas diarias en promedio,
00:11:30
se obtiene un único suspenso en la evaluación y así sucesivamente. Se nos pide que construyamos
00:11:37
la correspondiente tabla de doble entrada porque lo que tenemos es un número apreciable de vectores
00:11:42
de datos. No son 10 como antes, ahora son 30. Si tuviéramos que poner una fila con 30 o incluso
00:11:46
una tabla bidimensional simple con frecuencias absolutas porque se repiten, tendríamos una tabla
00:11:52
que sería muy estrechita y muy alargada. No es útil. Se nos pide que construyamos la tabla de doble entrada.
00:11:57
Para ello lo que tenemos que hacer es lo siguiente. Vamos a construir esta tabla y lo que tenemos es,
00:12:03
aquí arriba, colocado por columnas, nuestra variable estadística x. Se nos dice que es tiempo diario medio de estudio en horas.
00:12:10
La variable estadística la tenemos aquí y los valores posibles son x sub j.
00:12:20
Y aquí tenemos las unidades en horas.
00:12:26
Aquí lo que vamos a hacer es poner por filas la variable estadística y.
00:12:29
En este caso se nos dice que es el número de suspensos, aquí lo tenemos.
00:12:33
Y los valores posibles que tenemos aquí van a ser y sub i.
00:12:37
Os recuerdo que siempre tenemos y sub i para la variable estadística y, que la tenemos por filas.
00:12:41
y x sub j los valores posibles de la variable estadística x que tendremos por filas.
00:12:47
Estos valores 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5 son los valores observados,
00:12:54
los llamaremos también los valores posibles, puesto que son observados,
00:13:00
para la variable estadística x e y.
00:13:04
Se determinan por observación.
00:13:06
Por ejemplo, para la variable estadística x viramos los primeros valores en todos los vectores de datos
00:13:09
y vemos que tenemos valores naturales, el valor más pequeño vemos que es 0, 2, 4, 1, 3...
00:13:14
Si revisamos todos vemos que el valor más alto posible para la x es 4, el más pequeño es 0.
00:13:22
Valores naturales entre 0 y 4, pues aquí tenemos los distintos valores observados, valores posibles para x,
00:13:27
que llamaremos x sub j, empezando en 0, 1, 2, 3 y 4, ordenados.
00:13:34
0 es el valor de x1, el que hemos puesto en la primera columna porque es el más pequeño,
00:13:39
1 es el valor de x2, es el que tenemos en la segunda columna, este 2 es x3, este 3 es x4, este 4 es x5, es el que está en la quinta columna y el número de categorías posibles para la variable estadística x es 5.
00:13:44
Hay cinco valores posibles que hemos puesto en las cinco columnas, columna 1, 2, 3, 4 y 5.
00:14:02
Cuando la variable estadística es numérica y sobre todo cuando toma valores naturales,
00:14:09
hay que tener mucho cuidado de no confundir el valor numérico de x, j con el valor de j.
00:14:13
j denota en qué columna tenemos el valor correspondiente de x y x, j es el valor correspondiente.
00:14:20
Insisto, con j igual a 3 es la tercera columna.
00:14:26
X, J es el valor de X que está en la tercera columna. X, J vale 2 cuando la J vale 3. X, 3 vale 2. Hay que tener mucho cuidado con no confundirlo.
00:14:29
Ahora haremos lo mismo con la variable estadística Y. Nos vamos a los segundos valores, que es donde tenemos la variable estadística Y, y miramos.
00:14:40
Vemos que también son valores naturales. El valor más pequeño es este 0 que tenemos aquí. 1, 4, 3, 2, etc. Aquí veo un 5. Otra vez 5.
00:14:48
Bueno, el valor más pequeño es 0, el valor más grande es 5.
00:14:58
Así que los valores observados, los valores posibles, porque son observados, son, empezando en 0, 1, 2, 3, 4 y 5.
00:15:02
Vemos que tenemos en total 6 valores, hemos puesto 6 filas.
00:15:10
Así que en este caso, y sub 1, el valor que se encuentra en la primera fila es 0.
00:15:14
Y sub 2, el siguiente valor mayor que se encuentra en la segunda fila es 1.
00:15:19
Y así hasta y sub 6, que vale 5.
00:15:24
es el valor mayor que hemos observado. 6 es el número de categorías de la variable estadística
00:15:27
y, igual que aquí 5, era el número de categorías de la variable estadística x. El número de valores
00:15:34
observados, el número de valores posibles. Aquí lo que tenemos en las celdas son las
00:15:40
correspondientes frecuencias absolutas, las que se corresponden con las intersecciones de fila y
00:15:45
columna. Por ejemplo, aquí la primera celda, la que tenemos en la primera fila, primera columna,
00:15:50
sería n11. Se corresponde al vector de datos con x1, que vale 0, e y1, que también vale 0.
00:15:56
Deberíamos ir al conjunto de vectores de datos y contar cuántas veces nos aparece dentro de estas
00:16:05
30 el vector 0, 0. No aparece ninguna. No ponemos la frecuencia absoluta cuando vale 0, dejamos la
00:16:11
celda en blanco indicando que no hay observaciones que correspondan a este valor. Pasamos al siguiente.
00:16:18
siguiente. Seguimos con la primera fila y hemos pasado a la segunda columna. Esta frecuencia
00:16:22
absoluta sería n12, primera fila, segunda columna. Se corresponde con el valor de x2, que en este
00:16:28
caso es 1, y con el valor de y1, que en este caso es 0. Vamos a mirar en los 30 vectores de datos
00:16:35
cuántos de ellos son el vector 1, 0. Vemos que no aparece en ningún momento, así que dejamos la
00:16:42
celda en blanco, indicando que la observación, el número de observaciones es cero. Pasamos a la
00:16:48
siguiente celda. Sería fila 1, columna 3. Esto sería el valor de frecuencia absoluta n sub 1, 3.
00:16:54
Fila 1, columna 3. x3, el valor de x que está en la tercera columna, es 2 horas. Y sub 1, el valor
00:17:01
de y que está en la primera fila, sigue siendo cero, cero suspensos. Así que lo que vamos a hacer es
00:17:10
ir a los 30 vectores de datos y contar en cuántos el vector es el vector 2, 0.
00:17:14
Nos lo encontramos aquí, una primera ocasión, y nos lo encontramos en una segunda ocasión.
00:17:20
A ver, ¿dónde estaba?
00:17:27
Aquí teníamos el primero, 2, 0, y aquí lo tenemos en la segunda, 2, 0.
00:17:30
Así pues, la frecuencia n sub 1, 3, la que corresponde a estudiar en promedio dos horas diarias y obtener cero suspensos,
00:17:34
la hemos obtenido dos veces, así que el valor de frecuencia absoluta n1,3 es 2, y este sí lo vamos a apuntar.
00:17:41
Así con todos los demás, hasta completar todas las observaciones.
00:17:49
Por ejemplo, este valor 2 que tenemos aquí, se encuentra para el valor de x igual a 1,
00:17:53
hemos estudiado en promedio una hora diaria, y para el valor de y igual a 3, y hemos obtenido tres suspensos.
00:18:00
Este se encuentra en la cuarta fila y segunda columna.
00:18:08
No me dejes contar.
00:18:12
Así pues, se trata de la frecuencia n sub 4, 2.
00:18:13
Cuarta fila, segunda columna.
00:18:18
Es el número de observaciones, el número de vectores de datos que se han observado y que coinciden con el vector 1, 3.
00:18:20
Hemos estudiado una hora diaria, hemos obtenido tres suspensos.
00:18:30
Es la observación 4, 2, así que la x correspondiente es x sub 2, la que se encuentra en la segunda columna, es una hora,
00:18:35
y el valor de y que corresponde es y sub 4, es, he obtenido tres suspensos.
00:18:43
Insisto en que hay que tener cuidado en que el subíndice que me enumera fila o columna no tiene por qué coincidir con el valor de la x o de la y.
00:18:49
vieja. En este caso si buscamos cuántos vectores de estos 30 son el vector 1, 3, si está todo bien
00:18:57
hecho deberíamos encontrarlo en dos ocasiones. Una de ellas es esta, aquí tenemos el vector 1, 3 y la
00:19:04
otra es esta otra, el vector 1, 3 y no hay más. Cuando hemos acabado con toda la tabla de frecuencias
00:19:10
lo que tenemos aquí son el número de observaciones que corresponde con cada uno de los vectores de
00:19:16
datos intersección de fila y columna o columna y fila según queramos ver el orden y la suma de
00:19:23
todas estas frecuencias absolutas debe coincidir con el número total de observaciones. En este
00:19:29
caso debería ser 30. En el aula virtual de la asignatura tenéis disponibles otros recursos
00:19:34
y cuestionarios. Asimismo tenéis más información en las fuentes bibliográficas y en la web. No
00:19:43
dudéis en traer vuestras dudas e inquietudes a clase o al foro de dudas en el aula virtual.
00:19:50
Un saludo y hasta pronto.
00:19:55
- Idioma/s:
- Materias:
- Matemáticas
- Etiquetas:
- Flipped Classroom
- Niveles educativos:
- ▼ Mostrar / ocultar niveles
- Bachillerato
- Primer Curso
- Autor/es:
- Raúl Corraliza Nieto
- Subido por:
- Raúl C.
- Licencia:
- Reconocimiento - No comercial - Sin obra derivada
- Visualizaciones:
- 2
- Fecha:
- 17 de noviembre de 2025 - 11:31
- Visibilidad:
- Público
- Centro:
- IES ARQUITECTO PEDRO GUMIEL
- Duración:
- 20′ 23″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1280x720 píxeles
- Tamaño:
- 49.69 MBytes