Activa JavaScript para disfrutar de los vídeos de la Mediateca.
Tema 7.- Estadística 2ª Sesión 06-05-2025 - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Buenas tardes, esta es la clase de matemáticas del día 6 de mayo.
00:00:00
Estamos con el tema de estadística.
00:00:06
En la última clase estuvimos viendo los tipos de variables que teníamos en los estudios estadísticos
00:00:09
que eran variables cualitativas, cuando expresaban cualidades que no se iban a poder medir numéricamente
00:00:17
y variables cuantitativas, que es cuando se expresan cantidades que sí que puedo medir numéricamente.
00:00:26
Cuando estábamos estas variables cuantitativas, podíamos encontrarnos dos tipos distintos,
00:00:33
que eran las discretas, que eran aquellas que tomaban valores puntuales,
00:00:41
decíamos que no había decimales, y variables continuas,
00:00:46
que eran las que tomaban valores dentro de intervalos, y entonces sí que podía haber decimales.
00:00:50
Como iba a haber muchísimos datos, pues los agrupábamos en intervalos para poder representarlos mejor.
00:00:56
Estuvimos viendo cómo hacer las tablas de frecuencia de los recuentos de los datos de estas variables,
00:01:04
viendo esa frecuencia absoluta, la frecuencia acumulada, la relativa, la relativa acumulada.
00:01:11
Vimos también los tipos de representación que podíamos utilizar para cada tipo de variable
00:01:19
estábamos por ejemplo diciendo que utilizábamos diagrama de sectores
00:01:25
cuando la variable era cualitativa o cuando era cuantitativa
00:01:30
y esa representación era simplemente llevar a porciones de un círculo
00:01:35
el número de datos que correspondía a cada una de las variables
00:01:40
teníamos otro tipo de representación que era el diagrama de barras
00:01:46
que se utilizaba o en variables cualitativas o en cuantitativas discretas, que eran barritas que me decían con su altura la frecuencia de aparición de cada uno de los datos.
00:01:51
Por otra parte, teníamos otras barras, pero que eran distintas, que eran barras pegadas, y se llamaba entonces histograma, la representación,
00:02:09
que lo utilizábamos para las variables cuantitativas continuas.
00:02:18
Estas barras eran de anchas como la longitud del intervalo que estábamos intentando representar
00:02:23
y de altas como la frecuencia de los datos que caían dentro de ese intervalo,
00:02:31
el número de datos que caían en ese intervalo.
00:02:37
Y por último teníamos el polígono de frecuencias que se utilizaba tanto con diagrama de barras
00:02:39
como con histograma que lo que hacía era unirme los puntos más altos de cada una de estas barras
00:02:46
y de otra forma de representar más esquemáticamente esas frecuencias de aparición de esos datos.
00:02:53
Bueno, pues visto cómo hacer el recuento de datos con esas tablas de frecuencias
00:03:01
y cómo poder representarlo gráficamente para ver los datos de una forma más rápida
00:03:06
Y con un formato más visual, que nos llame más la atención, vamos a ver qué otros estudios podemos hacer sobre esas series de datos que habíamos encontrado en nuestra estadística, en nuestro estudio estadístico.
00:03:12
Y vamos a empezar primero viendo lo que son las medidas de centralización, también llamadas medidas de posición, ¿vale?
00:03:27
Que lo que me van a decir es cómo se ordenan estos datos dentro de mi estudio estadístico, ¿vale?
00:03:38
La primera de esas medidas de centralización sería la media. Todos hemos hecho alguna vez la media de nuestras notas en el instituto, o ahora mismo, este año. ¿Cómo hacemos la media de nuestras notas? Pues sumando las notas de todas las asignaturas y dividiendo entre el número de asignaturas.
00:03:48
Bueno, pues eso cuando estoy con una serie de datos más grande, ir sumando uno a uno no es práctico.
00:04:09
Entonces, ¿qué es lo que vamos a hacer?
00:04:19
Vamos a aprovecharnos de la tabla de frecuencias con la que habíamos registrado el recuento de nuestros datos
00:04:21
para poder calcular esta media de una forma más rápida.
00:04:28
Vemos aquí en el ejemplo que dice, si yo tengo que he hecho un estudio, por ejemplo,
00:04:34
del número de días que faltó al trabajo en un año y tengo dos personas que han faltado 10 días,
00:04:41
una persona que ha faltado 12, una persona que ha faltado 14 y una que ha faltado 13.
00:04:50
Yo podría sumar todas esas faltas y dividirlo entre el total de dos datos que sería la suma de todos que es 52 o puedo hacer una tabla de frecuencias para el ejemplo 2 en el que digo si hay que hayan faltado 5 días 4 personas, que hayan faltado 10 días 6 personas, 15 días 7 personas, 20 días 9 personas, 25 días 4 personas,
00:04:56
30 días, 6 personas, pues si me genero una columna
00:05:25
en la que haga la multiplicación
00:05:30
de los días faltados por la frecuencia
00:05:33
que se ha repetido ese número de faltas, en ese caso
00:05:38
estas 4 personas, pues me dará que en total se han faltado
00:05:41
20 días, lo mismo para todos los demás, o sea voy multiplicando
00:05:46
el valor de la variable, que es el número de días que se ha faltado
00:05:50
nuestro ejemplo, por la frecuencia de aparición de ese valor, que sería el número de personas
00:05:54
que han faltado 5 días, 10 días, 15 días, y sumo esa columna de variable por su frecuencia.
00:06:02
Si el total de esa suma lo divido entre el total de personas a las que había hecho la encuesta,
00:06:13
que será la suma de estas frecuencias absolutas que en este caso es 36
00:06:19
y hago el cociente entre la suma de la aparición de cada uno de los datos
00:06:23
y el total de personas a las que he preguntado
00:06:30
me saldrá la media aritmética que estábamos buscando
00:06:32
entonces resumiendo lo que estamos haciendo aquí
00:06:36
cuando tengo muchísimos datos y lo hago desde la tabla de frecuencias
00:06:40
es multiplicar cada valor de la variable por su frecuencia
00:06:44
y sumárselo al resto de variables por sus frecuencias
00:06:49
y dividirlo en el resultado final, esta e rara significa sumatorio de todo,
00:06:54
suma de todos estos términos, dividirlo entre el número total de datos que tenía,
00:07:01
entre el número total de personas a las que hice la encuesta,
00:07:07
que sería igual que la suma de la frecuencia, este 36, y esa sería mi forma de hacer la media aritmética.
00:07:11
Si tengo pocos datos los puedo sumar directamente, pero cuando tengo muchos me es más práctico utilizar esta pequeña fórmula.
00:07:20
Otro parámetro de centralización es la moda.
00:07:30
todos sabemos de nuestro día a día que decimos que algo está de moda cuando lo lleva o lo hace mucha gente
00:07:36
pues aquí en estadística es lo mismo, la moda vamos a llamarla aquel valor que se repita más asiduamente
00:07:44
o sea que la forma de encontrar la moda mirando una tabla de datos estadísticos de frecuencias
00:07:53
es buscar aquel o aquellos datos que tienen la frecuencia más alta
00:07:59
entonces en el ejemplo que vimos anterior
00:08:04
lo que tengo que hacer es buscar
00:08:08
qué dato, qué valor de la variable
00:08:10
tiene la frecuencia más alta
00:08:13
en el primer ejemplo veo que
00:08:15
los que tienen frecuencia más alta son el 5
00:08:18
que aparece 8 veces
00:08:20
y el 20 que aparece 8 veces
00:08:22
pues entonces diremos que la moda
00:08:24
en este primer ejemplo son el 5 y el 20
00:08:27
puede haber más de una cosa dentro de la moda
00:08:30
yo por ejemplo si hablo de ropa pues puede ser que la moda sea
00:08:35
llevar pantalones vaqueros o que la moda sea
00:08:38
llevar pantalones vaqueros con una camiseta blanca
00:08:41
o sea que puede haber más de un elemento dentro de la moda
00:08:44
más de un valor de la variable
00:08:47
en el segundo ejemplo pues hago lo mismo
00:08:48
ordeno los valores de la variable
00:08:52
miro sus frecuencias y veo que en este caso
00:08:54
quien tiene la frecuencia más alta es el 600
00:08:58
que tiene frecuencia 9, pues diré que en este segundo caso la moda
00:09:02
solo es el 600, entonces nos quedamos con esa idea
00:09:06
que la moda mirada dentro de una distribución estadística
00:09:11
es el valor de la variable que más se repite
00:09:15
y eso lo veo en la tabla de frecuencias buscando el valor
00:09:18
o valores que tenga la frecuencia absoluta más alta
00:09:23
bueno, seguimos con otra medida
00:09:26
de posición, que sería
00:09:30
a ver, un segundito
00:09:33
sería la mediana
00:09:36
y la mediana, si nosotros pensamos
00:09:41
la medida que tenemos nosotros de mediana es
00:09:45
pues una carretera o una calle
00:09:48
que tiene un muro que me divide
00:09:50
los carriles del lado izquierdo y los carriles del lado derecho
00:09:52
Cuando yo voy pensando en una carretera, la mediana es esa franja de terreno que hay entre unos carriles y otros que me separan la carretera en dos partes iguales.
00:09:57
Bueno, pues aquí va a ser la misma idea. La mediana es el valor que ocupa la posición central de todos los datos que tengo yo en mi estadística cuando están ordenados.
00:10:06
O sea que si yo quisiese hacerlo por el camino largo lo que haría es ordenar todos los datos, ponerlos de menor a mayor y luego buscar qué dato es el que me deja la misma cantidad de datos por debajo que por encima.
00:10:20
Claro, eso lo puedo hacer cuando tenga estudios estadísticos con poquitos datos
00:10:35
Pero si tengo muchos, no es práctico ordenar todos los datos uno por uno
00:10:41
Vuelvo una vez más a valerme de la tabla de frecuencias para poder hacer este cálculo
00:10:44
Entonces, vemos por ejemplo, aquí en el ejemplo
00:10:50
Que los valores distintos que me han salido son del 1 al 5
00:10:54
Y aquí tengo sus frecuencias absolutas
00:10:57
El 1 ha aparecido 10 veces, el 2 20 veces, el 3 17
00:11:00
el 4 doce veces y el 5 diecisiete
00:11:04
o sea que en total tengo 10, 20
00:11:07
37, 49 y
00:11:11
66 datos, ¿vale? que era
00:11:15
el último valor de la frecuencia absoluta acumulada, entonces hay
00:11:19
66 datos, tengo que buscar cuál de esos
00:11:23
66 datos me deja la mitad por debajo y la mitad por encima
00:11:27
O sea, ¿cuál me deja 33 datos por debajo y cuál me deja 33 datos por encima?
00:11:31
Otra forma de verlo, ¿cuál me deja el 50% de los datos por debajo y el 50% por encima?
00:11:38
Pues lo que vamos a hacer es mirar en la tabla de frecuencias quién es el dato que ocuparía esa posición 33, que es la mitad de ese 66.
00:11:44
Bueno, los 10 primeros números eran 1. Los 10 números siguientes eran 2. O sea, ya he colocado los 20 primeros datos. Y ahora, de ese dato 20, que era un 2, al dato 37, lo que hay son 3. Pero yo no quería llegar tan lejos. Yo solo quería llegar a la posición 33, que era la mitad de este 66, que era el número total de datos que había en mi tabla estadística.
00:11:55
Pues si yo pienso en qué dato está en esa posición 33, me encuentro que en la posición 33 habrá un 3, porque tenía 10 unos, 10 doses, 10 treses, el 11, la posición 31 será también un 3, la 32 será un 3, la 33 será un 3, la 34 será un 3.
00:12:22
Así está la posición 37, entonces, en la posición 33, que es la que yo quería controlar, hay un 3, si yo los hubiese puesto todos en fila y ordenaditos.
00:12:48
Esta misma idea la vamos a utilizar para el siguiente parámetro de centralización, que son los cuartiles, que es la misma idea que en la mediana.
00:13:01
Ahora, los cuartiles son tres, y son como tres, digamos, paredes que me dividen mi distribución de datos estadísticos en cuatro cajitas igual de grandes, fijaos aquí en el dibujo, entonces, ¿qué ocurrirá?
00:13:11
que el primer cuartil me va a dejar un cuarto de los datos
00:13:30
por debajo, o sea, el 25% de los datos por debajo. El segundo
00:13:34
cuartil me va a dejar la mitad de los datos por debajo, o sea, el 50%
00:13:38
de los datos. Luego el segundo cuartil siempre va a
00:13:42
coincidir con el valor de la mediana. Y el tercer cuartil
00:13:46
es el que me deja el 75% de los datos por debajo, o sea, tres cuartas
00:13:50
partes, ¿vale? Por eso se llaman cuartiles, porque divido
00:13:54
mi distribución de datos en cuartos, ¿vale?
00:13:59
Primer cuarto, llego al primer cuartil.
00:14:04
Segundo cuarto, cuando he cogido la mitad de los datos,
00:14:07
llego al segundo cuartil.
00:14:09
Tercer cuartil, cuando llego al tercer cuarto.
00:14:11
Entonces, vuelvo a hacer la misma historia de antes.
00:14:14
Aquí en la tabla me lo he hecho calculando los porcentajes.
00:14:17
Es una forma de hacerlo.
00:14:20
O puedo hacer el mismo recuento que antes.
00:14:22
Bueno, la cuarta parte de 66, perdón, la mitad de 66 era 33 y en la posición 33 vimos que había un 3, o sea que el cuartil 2 va a ser igual que la mediana que es un 3.
00:14:24
Ahora digo, ¿quién es la mitad de ese 33? ¿Quién es la mitad de esa mitad que hemos visto con la mediana? Pues será el dato que esté en la posición 16 y medio, digamos, 16 por abajo y 16 por arriba, para llegar a esos 33 datos que juntaba con la mediana.
00:14:41
Pues voy a ver, a contar hasta que llegue ese dato 16.
00:15:02
10 unos y ahora 10 doses, pues la posición 16 la ocupará uno de esos doses, pues el cuartil 1 es un 2.
00:15:07
Si quiero calcular el cuartil 3, lo puedo hacer de dos formas.
00:15:18
Creo que la segunda que os voy a hacer va a ser más cómoda.
00:15:23
Puedo decir, buscar cuál es el dato que me deja tres cuartas partes por debajo.
00:15:26
que es el 75%, o hacer la misma cuenta que he hecho para el cuartil 1
00:15:32
pensando en qué dato es el que me deja un cuarto de los datos por encima.
00:15:37
¿Cuál es el que me deja por encima el 25% de los datos?
00:15:42
Pues como hemos dicho que la mediana está en la posición 33,
00:15:46
que la mitad es el 66, pues si yo pienso el mismo razonamiento
00:15:50
que hice para el cuartil 1, pero pensando desde el último dato hacia atrás,
00:15:56
lo que necesito es saber qué dato hay en la posición 16,5
00:16:01
que decíamos que es la mitad del 33
00:16:06
y entonces me fijaría en mi tabla de frecuencias
00:16:08
pero empezando por el final
00:16:11
digo, los 17 últimos datos son 5
00:16:12
pero yo no quería los 17 últimos datos
00:16:17
me bastaba con los 16 últimos datos
00:16:20
¿qué hay en la posición 16 empezando por el final?
00:16:22
pues un 5
00:16:27
pues mi cuartil tercero es ese 5
00:16:27
¿vale? si lo pensamos de
00:16:32
la forma de utilizar los porcentajes
00:16:35
lo que tengo que ir es calculando que porcentaje
00:16:39
de repetición tiene cada uno de esos datos que he estado mirando
00:16:44
y digo, sería hacer una regla de 3, si 66
00:16:48
datos es el 100%, pues 10 datos sería un 15%
00:16:52
El 2, que sería el dato 20, 10 y 10, 20, pues los 20 primeros datos serían el 30%, que es el doble que es el 15.
00:16:57
Los 20 más los 17, 37 datos serían el 56%, el 56%.
00:17:07
Esos 17 más estos otros 12, los 49 primeros datos serían el 74%.
00:17:14
Y los últimos 16 datos serían ya completar el 100%.
00:17:20
Pues la forma de buscar la mediana es buscar qué dato está dentro del 50%, que sería un 3, qué dato estaría dentro de la posición del 25%, que sería un 2, y qué dato estaría en la posición del 75%, que sería un 5.
00:17:26
Como mejor lo veáis, con los porcentajes corro el riesgo de que si calculo mal el porcentaje, pues ponga ya mal esta columna y todo me salga mal.
00:17:44
¿Con el recuento de la frecuencia absoluta? Pues me es más cómodo, creo yo, a mí me gusta más porque solo es contar hasta llegar al dato que yo quiero llegar y ver, hasta llegar a la posición, perdón, que quiero llegar y ver luego qué dato ocupa esa posición.
00:17:56
pero lo podéis hacer de la forma que queráis
00:18:13
como os resulte más cómodo y lo veáis mejor
00:18:17
bueno, vistas estas medidas o parámetros de centralización
00:18:20
el diagrama de carga y bigotes
00:18:29
este no lo vamos a ver porque sería una forma de representar los cuartiles
00:18:33
pero no lo vamos a utilizar luego en los ejercicios
00:18:36
entonces que quede así solo como curiosidad
00:18:38
de cómo se representa esto gráficamente
00:18:41
igual que vimos la representación de los distintos tipos de variables
00:18:43
Pero no os lo voy a pedir, ¿vale? Ahora lo que sí que os voy a pedir es que sepáis calcular las medidas de dispersión. ¿Qué es esto de las medidas de dispersión? Pues las medidas de dispersión lo que me van a hacer es ver cómo de agrupados o separados están los datos de mi estudio estadístico, ¿vale?
00:18:46
Si los datos están muy agrupaditos, pues será un estudio muy homogéneo, una población muy homogénea a la que he estudiado, la gente es muy parecida.
00:19:09
Si los datos están muy dispersos, pues la población será muy heterogénea y, por decirlo de alguna manera, si estamos controlando los gustos que tienen, pues va a haber gustos muy dispares.
00:19:16
Si las medidas de dispersión están muy centralizadas, pues serán datos muy parejos y gustos muy parejos los que tendrá la gente.
00:19:28
bueno, vamos a ver quiénes son estos
00:19:37
medidas de dispersión o parámetros de dispersión
00:19:39
empezamos de más fáciles a más difíciles
00:19:43
por decirlo de alguna manera
00:19:46
la primera sería el rango recorrido
00:19:47
y el rango recorrido simplemente lo que me va a indicar
00:19:50
es entre qué valores me voy a mover
00:19:55
entonces el rango es
00:19:57
la diferencia entre el valor más alto
00:20:00
que me voy a encontrar en mi variable
00:20:03
y el valor más pequeño, o sea que lo que me va a indicar es la longitud
00:20:05
del intervalo en la que se están moviendo mis datos
00:20:09
¿vale? en este ejemplo que me dicen aquí, pues el dato
00:20:14
más pequeño, el valor más pequeño de mi variable era 5 y el más alto
00:20:17
era 30, pues el rango de mi estudio va a ser
00:20:21
30 menos 5, 25, o sea que estaré
00:20:25
diciendo con esta medida
00:20:29
que mis datos están
00:20:32
separados
00:20:35
25 unidades
00:20:38
entre el más pequeño y más grande, o sea que
00:20:41
el recorrido por el que me muevo
00:20:44
tiene una longitud, por así decirlo, de 25 unidades
00:20:47
en este caso, ¿vale? Entonces
00:20:51
no me da una información muy importante
00:20:53
pero ya me ayuda a ir
00:20:57
centrándome sobre qué valores
00:20:59
me estoy moviendo, ¿vale? Bueno, siguiente medida de dispersión sería lo que se llama
00:21:02
la desviación media. ¿Y en qué consiste la desviación media? Pues en hacer la media
00:21:09
que hay entre los valores absolutos de la diferencia entre la media aritmética y los
00:21:15
distintos datos que me he encontrado. Entonces, lo que estoy viendo aquí es cómo de separados
00:21:21
en valor medio están mis datos de esa media aritmética
00:21:27
¿Cómo haré para calcularlos?
00:21:32
Me puedo generar una nueva columna
00:21:36
que me diga, voy a ver cuánto vale
00:21:39
cada diferencia de el dato
00:21:42
que estoy mirando con la media, como los datos se están repitiendo
00:21:47
esta cuentecita la tendré que multiplicar
00:21:52
Por la frecuencia absoluta de las veces que se ha repetido el dato que estoy mirando.
00:21:55
¿Vale?
00:22:00
Entonces, lo pongo en valor absoluto porque me da igual que el dato esté por encima de la media que esté por debajo.
00:22:00
Yo solo quiero ver lo que me he separado de él.
00:22:07
Me da igual hacia adelante o hacia atrás.
00:22:11
Entonces, lo que diríamos si en nuestro ejercicio vamos a poner que la media salió que era el 3,
00:22:14
pues diríamos 3 menos 5, que sería menos 2.
00:22:20
como quiero valor absoluto, lo pongo en positivo, más 2
00:22:24
multiplicado por las dos veces que salió el 5
00:22:28
ese resultado me lo pongo en esta columna nueva que me he creado
00:22:31
y voy haciendo esa misma cuenta con todos los demás
00:22:37
3 menos 10, menos 7, al ponerlo en valor absoluto, más 7
00:22:40
pero como apareció una vez, pues menos 7 por 1
00:22:45
y sería ir haciendo esa cuenta todo el rato 1 por 1
00:22:48
Cuando tenga cada uno de los valores de cada una de las filas de los datos que he ido contrastando con la media aritmética, lo que hago es sumarlos, ¿vale?
00:22:53
Sumo todos los valores de esta columna y me da este 106,66.
00:23:05
como yo quiero compararlo con el total de datos que tenía
00:23:10
pues digo, esa desviación que se llama respecto a la media
00:23:15
la divido entre los 18 datos que tenía
00:23:19
que era la suma de las frecuencias absolutas
00:23:23
y el resultado de esta división
00:23:26
me da este 5,92 que es la desviación media
00:23:29
la media aritmética de lo que me he desviado
00:23:33
con respecto a la media en todo mi estudio estadístico
00:23:37
es un poco trabalenguas esto, pero bueno
00:23:41
no es difícil la cuenta, siempre va a ser la misma cuenta y os aconsejo
00:23:45
que en vez de irla haciendo por separado, os escribáis la columna
00:23:49
entera, haciendo uno para uno
00:23:54
la operación que hemos dicho, cuando la tenga entera hago la suma, divido entre el número total
00:23:57
de datos y ya está, que no hagáis cuentas parciales porque si no
00:24:01
Es muy fácil que me deje un dato atrás, que uno le ponga dos veces y ya la iría.
00:24:05
O cuando me confunda en uno de los operadores de esta suma que estoy haciendo en el numerador, me he cargado la operación.
00:24:11
Entonces mejor vamos completando la tabla, que ya veremos que nos va a hacer falta luego completarla más para mirar otros parámetros.
00:24:18
Y así me va a ser más cómodo luego aplicar las fórmulas finales.
00:24:27
Bueno, esa sería la desviación media.
00:24:31
después de la desviación media
00:24:33
tenemos una cosa que se llama varianza
00:24:35
y la varianza es algo parecido a la desviación media
00:24:37
pero lo que estoy haciendo es mirar
00:24:41
cómo se desvían en media los cuadrados
00:24:44
de estas desviaciones medias
00:24:47
es como rizar un poco el rizo
00:24:49
y bueno, voy a hacer otra vez la misma historia
00:24:51
la fórmula de la varianza sería lo que hay dentro aquí
00:24:55
de la raíz cuadrada
00:24:59
puesto que la desviación típica que es el siguiente parámetro
00:25:01
es hacer la raíz cuadrada de lo que me salió en la variada
00:25:04
lo puedo calcular de dos formas distintas
00:25:08
como resulte más cómodo, yo os cuento las dos
00:25:12
aquí en el ejemplo vienen las dos
00:25:14
la fórmula que más cómoda os sea de utilizar
00:25:15
hay quien le gusta más esta, quien le gusta más esta
00:25:18
en la primera lo que está haciendo es
00:25:21
lo mismo que hemos hecho antes con la desviación media
00:25:23
pero en vez de hacer el valor absoluto de la diferencia que había entre cada dato
00:25:26
y la media aritmética lo que hace es el cuadrado de esas diferencias
00:25:30
luego lo multiplica por las veces que se ha repetido ese dato
00:25:34
o sea, por su frecuencia absoluta
00:25:37
y al final la suma de todos ellos
00:25:39
lo divide entre el número total de datos
00:25:42
entonces, una vez más, consejo que os digo
00:25:44
que os hagáis la columna de todas esas cuentas
00:25:48
en vez de ir haciendo toda la fórmula entera
00:25:53
me hago la columna de lo que correspondería
00:25:55
a cada uno de los datos en su fila, digo el 5
00:26:00
menos la media, que era el 9 no sé cuánto
00:26:04
el resultado de esa resta le hago al cuadrado
00:26:07
y luego multiplico por 5, que eran las veces que se había repetido
00:26:11
ese 5, y lo pongo en su fila
00:26:16
hago la misma historia para el siguiente, para el siguiente, para el siguiente, cuando tenga todos
00:26:19
calculados, hago su suma y lo que me salga
00:26:24
lo divido entre los 19 datos que había y ya tendría calculada
00:26:27
la varianza, que luego quiero saber la desviación típica
00:26:32
pues simplemente hago la raíz cuadrada de lo que me hubiese
00:26:36
salido en la cuenta de la varianza, o sea la raíz cuadrada de lo que me salió
00:26:40
de dividir esto entre 19
00:26:44
otra opción que hay a quien le parece más cómoda
00:26:47
Que es usar esta segunda fórmula.
00:26:52
Y esta segunda fórmula puede ser más cómoda porque es más rápida de calcular en principio.
00:26:54
Porque no tengo que pensar en la media aritmética hasta el final.
00:27:02
Y es que vaya multiplicando la frecuencia de cada dato por el cuadrado del dato.
00:27:05
O sea, digo, 5 por 5, 25.
00:27:11
5 veces, 125.
00:27:14
10 al cuadrado, 100 por 1, 100.
00:27:17
15 al cuadrado, 225, por una vez que se repetía
00:27:20
225, entonces hago frecuencia por el cuadrado
00:27:24
del valor de la variable, sumo todo lo que me sale
00:27:28
en la columna esa, y a este 9975
00:27:32
le divido
00:27:36
primero entre los 19 datos que había
00:27:39
en mi estadística, y al resultado de esta división
00:27:44
le resto el cuadrado de lo que valiese la media aritmética
00:27:48
que ya había calculado previamente y voy a llegar al mismo resultado
00:27:53
fijaos que aquí ha hecho la cuenta con esta
00:27:57
primera modalidad, utilizando esta primera columna
00:28:01
aquí ha hecho la cuenta, utilizando las cuentas de esta segunda columna, de esta segunda fórmula
00:28:04
y llega exactamente al mismo resultado
00:28:09
lo que os resulte más cómodo, para hacerlo
00:28:12
sin calculadora, digamos, es más cómoda esta, para hacerlo con calculadora
00:28:17
pues la que me dé la gana, eso sí, si lo hago con calculadora
00:28:21
pues aún así yo me iría haciendo esas cuentas parciales
00:28:25
y poniéndolas aquí, para no perderme ninguna ni saltarme ningún
00:28:29
dato, aunque se podría escribir en la calculadora todo del tirón
00:28:33
como queráis, eso dependerá de la soltura que tengáis a la hora de
00:28:36
manejar la calculadora, bueno, lo haga como lo haga
00:28:41
sé que la desviación típica sale de hacer la raíz cuadrada de lo que me dio la varianza, ¿vale?
00:28:45
Y que para poder hacer la varianza necesito primero haber sabido la media aritmética.
00:28:52
¿Qué ocurrirán los ejercicios?
00:28:59
Que me darán mis numeritos, ahora volveremos haciendo uno paso a paso,
00:29:01
y me pedirán que calcule esta desviación típica y no me dirán nada más.
00:29:07
pero claro, para poder calcular esta desviación típica
00:29:13
me están obligando a que haga la tabla de frecuencias
00:29:16
a que calcule la media aritmética, a que calcule la varianza
00:29:18
y que por último llegue a la desviación típica
00:29:22
o sea, que preguntándome sólo una cosa
00:29:25
me están obligando a hacer todas las demás
00:29:28
porque las necesito para poder aplicar la fórmula
00:29:31
de esta desviación típica que me estarían pidiendo
00:29:34
o sea que yo lo hago tranquilamente
00:29:37
despacito y ya está
00:29:41
Y el último parámetro de dispersión es el coeficiente de variación, que como cuando hacía esta desviación típica iban a depender los resultados de unas unidades que medían la variable que yo estaba estudiando,
00:29:43
Si yo quisiese comparar dos estadísticas distintas
00:30:02
No podría hacerlo
00:30:06
Si yo quiero comparar los colores que le gusta a la gente
00:30:07
Con la edad que tienen
00:30:12
Pues no me permitiría hacer la comparación
00:30:13
Ahora, si yo utilizo este último coeficiente
00:30:16
Que es el coeficiente de variación
00:30:19
Si lo voy a poder hacer
00:30:20
Porque el coeficiente de variación no tiene unidades de medida
00:30:22
Porque el coeficiente de variación lo que hace es
00:30:25
Ver la relación entre la desviación típica
00:30:28
y la media aritmética, o sea, el coeficiente de variación es
00:30:32
dividir la desviación típica entre la media aritmética
00:30:37
y luego, pues, hay quien lo deja así, escrito como fracción
00:30:42
como decimales no me interesa nunca, o quien lo pone en porcentaje
00:30:47
pero, como he dividido unidades de desviación típica, que por ejemplo
00:30:51
serían edades entre unidades de la media que volverían a ser edades
00:30:56
pues edad entre edad desaparecería y se queda sin unidades de medida
00:31:01
y coeficiente de variación.
00:31:07
Y eso lo que me permite es comparar estudios estadísticos
00:31:09
que no tengan en principio nada que ver, como decíamos,
00:31:13
del gusto de los colores para vestir, con la edad de la gente,
00:31:17
simplemente viendo qué porcentaje me sale en esa comparación
00:31:23
de desviación típica contra media y el que tenga el porcentaje más alto
00:31:29
pues será el que corresponda a una población más heterogénea
00:31:36
y el que tenga el porcentaje de coeficiente de variación más bajo
00:31:43
me estará diciendo que los datos están más concentrados respecto a la media
00:31:46
y que esa gente tiene gustos más parecidos y entonces sí que podría
00:31:51
comparar ese gusto de colores con las edades
00:31:56
de la gente a las que le he hecho la encuesta. Esto es un poco
00:32:01
complicado a lo mejor de entender así, pero bueno
00:32:05
nosotros nos quedamos con que este último coeficiente de variación
00:32:09
lo que me hace es dividir la desviación típica entre la media
00:32:12
dinética, ya está. Si quiero el resultado de esa división
00:32:17
para verlo un poco más gráficamente, lo paso a porcentaje haciendo una regla
00:32:20
de 3. Si no quiero, pues no hace falta. Me da igual. Viéndolo simplemente como fracción
00:32:25
o como número decimal, voy a poder compararlos también perfectamente, porque sabemos ordenar
00:32:30
los números decimales y también sabemos ordenar fracciones. O sea que si yo quiero
00:32:37
comparar dos números decimales o quiero comparar dos fracciones, a estas alturas lo sabemos
00:32:40
hacer. ¿Qué me es más cómodo hacerlo con porcentaje? Pues lo pasáis a porcentaje con
00:32:46
esa regla de tres y se ve aún mejor y más rápido, bien es verdad, ¿vale? Bueno, lo
00:32:50
que voy a hacer ahora es irnos a un ejercicio en el que hagamos todo lo que hemos visto
00:32:57
en este tema, desde representación a medidas de descentralización, medidas de dispersión,
00:33:04
todo lo que me podrían preguntar un ejercicio visto sobre un ejemplo, para que veáis que
00:33:10
todo va como encadenado. Ese ejercicio
00:33:16
le vamos a hacer sobre uno de los resueltos que se da
00:33:19
en los ejercicios aquí resueltos y los que tenéis para practicar
00:33:23
para que así tengamos las cuentas hechas y pueda tardar un poco menos, pero
00:33:27
voy a ir explicando paso a paso que hago en cada cuenta de lo que
00:33:31
vamos haciendo. Bueno, pues imaginaos
00:33:35
me dicen que tengo este
00:33:41
estudio estadístico, que será de lo que Dios quiera que sea, me da igual. Los valores
00:33:45
que ha tomado la variable en ese estudio estadístico, los distintos valores que tenía la variable
00:33:53
eran 5, 10, 15, 20, 25 y 30. Y me dicen las frecuencias con las que ha aparecido cada
00:33:57
uno de estos datos. Me dice que el 5 ha aparecido 9 veces, el 10 2, el 15 3, el 25, el 25 9
00:34:06
y el 34. Luego, ya sé aquí de entrada que el número de datos que había en mi estadística es 32, que sería 9 más 2, 11, más 3, 14, 19, 28 y 32.
00:34:14
Pues acordaos que el número de datos es la suma de todas las frecuencias absolutas, ¿vale?
00:34:37
Que si yo lo pongo en forma de tabla, que es lo que a mí me va a interesar,
00:34:46
pues sería mi primera columna, los distintos valores de la variable,
00:34:50
sea lo que sea lo que esté estudiando, pues si pensamos en el de antes,
00:34:56
días que he faltado a trabajar en un mes, por ejemplo,
00:35:01
y personas que han faltado ese número de días
00:35:05
en mi segunda columna
00:35:10
la suma de todas esas frecuencias
00:35:11
absolutas me dará el total
00:35:13
de personas
00:35:15
sobre las que estoy haciendo la encuesta
00:35:16
sobre las que estoy haciendo el estudio
00:35:20
¿vale? y fijaos
00:35:21
me dice ¿cuál es
00:35:24
la desviación
00:35:27
típica?
00:35:29
¿vale? pues es que para hacer
00:35:31
la desviación típica necesito
00:35:33
saber la media aritmética
00:35:35
porque no necesitaba mi fórmula puesto que la desviación típica hemos dicho que era la raíz cuadrada de la varianza
00:35:37
que lo podemos poner así o la podemos poner también como sigma al cuadrado y esto era igual a la raíz cuadrada
00:35:47
vamos a utilizar la fórmula cortita puesto que tiene aquí la columna y es más rápida de ver las cuentas
00:35:55
Que era la suma de fi por xi al cuadrado, que era cada uno de los datos distintos que aparecía, dividido entre el número total de datos y menos el cuadrado de la media, ¿vale?
00:36:00
esa sería mi desviación típica
00:36:17
y lo que hay aquí dentro
00:36:20
si yo lo quisiese hacer en dos partes
00:36:23
lo que hay aquí dentro
00:36:25
¿vale? lo de dentro de la raíz
00:36:28
sería el valor de mi varianza
00:36:31
que hemos dicho que me pueden poner como var
00:36:37
o como sigma al cuadrado, son las dos formas de
00:36:39
representar la varianza
00:36:42
Bueno, pues digo, bueno, si utilizo esta segunda fórmula, que hemos dicho que es la más corta, la de usar, pues ¿qué haré?
00:36:45
Me olvido de esta columna. A ver, ¿por qué no me dejas escribir?
00:36:54
Me olvido de esta columna y me quedo con esta, mi tabla de frecuencias, en la que yo decía que tenía que multiplicar la frecuencia,
00:37:00
en este caso el 9, por el cuadrado del valor del dato que estaba mirando, por el cuadrado de 25.
00:37:10
Pues 9 por 25, o digo, perdón, por el cuadrado de 5, perdón, que se me ha ido la pinta.
00:37:16
5 al cuadrado, 25 por 9, 225.
00:37:24
Voy al siguiente.
00:37:28
10 al cuadrado, 100 por 2, 200.
00:37:29
Voy al siguiente.
00:37:32
15 al cuadrado, 225 por 3, 675.
00:37:33
20 al cuadrado, 400 por 5, 2000.
00:37:38
25 al cuadrado, pum, pum, pum.
00:37:42
Voy haciendo por filas la cuenta esta de multiplicar frecuencia por cuadrado del valor de mi variable.
00:37:43
Cuando tengo toda la columna hecha, sumo todos los resultados, que me dan en este caso 12.325,
00:37:54
y me acuerdo que ese 12.325, como estoy usando esta segunda fórmula,
00:38:03
lo tengo que dividir entre el número total de datos que tenía.
00:38:10
pero el número total de datos lo tenía aquí como suma de las frecuencias absolutas
00:38:12
o sea, 32 datos que ya lo vimos hacia arriba
00:38:16
entonces digo, 1.012.325
00:38:19
dividido entre 32
00:38:22
menos, ¿cuánto era la media?
00:38:23
no anda leches
00:38:29
me hace falta la media para la fórmula y no la he calculado
00:38:30
¿cómo se calculaba la media? pues si os acordáis
00:38:33
la media la calculamos diciendo
00:38:37
que mi media aritmética era la suma de
00:38:40
las frecuencias por cada uno de los datos
00:38:44
y dividido entre el total de datos
00:38:49
o sea que lo que hago es esta columna para ayudarme, digo 5 por 9
00:38:52
45, 10 por 2, 20, 15 por 3
00:38:56
45, 20 por 5, 100, pa pa pa pa pa pa
00:39:00
y la suma de todos, este 555
00:39:03
sería esta parte del numerador, ¿qué hago con ese numerador?
00:39:07
dividirlo entre 32 que era el número total de datos, pues
00:39:12
555 dividido entre 32 me da que la media es 17
00:39:15
con 34, pero bueno, pues si a ese
00:39:20
12.325 dividido entre 32 le resto
00:39:23
el cuadrado de ese 17 con 34, me estaría
00:39:28
dando el valor de la varianza, pero no me pedían el valor de la varianza
00:39:32
me pedían la desviación típica, no hay ningún problema
00:39:36
pues al resultado de ese valor de la varianza
00:39:39
le hago la raíz cuadrada y me sale la desviación
00:39:41
típica que quería, 9 con 18
00:39:45
y me dicen para rematar, bueno pero ese
00:39:48
9 con 18, si le quisiese
00:39:51
comparar con otro estudio estadístico
00:39:54
de otra variable distinta, no puedo porque va a depender
00:39:57
de las unidades de medida que tuviese la variable
00:40:00
que estaba estudiando, bueno, pues vamos a pasar coeficiente de variación
00:40:03
digo, ¿cómo se calculaba el coeficiente de variación?
00:40:07
pues el coeficiente de variación dijimos que era coger
00:40:11
esa desviación típica y dividirlo entre la media aritmética
00:40:15
pues cojo ese 9,18 y lo divido entre el
00:40:19
17,34 que es la media aritmética y me dará
00:40:23
pues una fracción que yo la puedo poner en decimal
00:40:27
dejarlo como fracción o
00:40:30
si lo quiero pasar a porcentaje
00:40:32
el resultado de esta división
00:40:35
lo único que tengo que pasarle es multiplicarle por 100
00:40:38
y me sale
00:40:40
transformo ese número decimal
00:40:42
del resultado de la división
00:40:45
en un porcentaje, en un tanto por ciento
00:40:46
me estaría diciendo que el coeficiente de variación aquí
00:40:49
es de un 52%
00:40:52
que el 52% de la gente está separado de la media
00:40:54
Entonces, si yo quiero interpretar si esta estadística está representando a datos muy dispersos o a datos muy concentrados, al ver que me salió un coeficiente de variación tan alto, que hay tanta gente que está lejos de la media, digo, uy, pues es que el estudio este que he hecho ha sido sobre una población tan sumamente heterogénea que aquí ha opinado la gente de forma muy, muy diversa.
00:40:58
No es una buena población si yo quiero sacar conclusiones de ella y hacer cosas con esas conclusiones porque son datos muy heterogéneos, ¿vale? Son datos muy dispersos.
00:41:27
bueno, y diréis, bueno, pero es que nos hemos dejado cosas sin hacer
00:41:42
pues ya que hemos visto esta última parte, que era la difícil
00:41:47
más despacito, vamos a hacer esas medidas de centralización
00:41:50
que nos faltaban, y entre esas medidas de centralización
00:41:54
teníamos que calcular la media aritmética
00:41:58
que la tenemos, o sea que sé que la media aritmética
00:42:02
nos salió 17,34, la tengo
00:42:05
tengo que calcular la mediana
00:42:09
y dijimos, la mediana era buscar
00:42:12
qué dato es el que ocupa la posición central
00:42:15
y os dije, solo es contar
00:42:19
veo que tengo 32 datos en total
00:42:21
entonces el dato que ocupe la posición central
00:42:24
estará en la posición 16,5
00:42:27
para dejarme 16 por abajo y 16 por arriba
00:42:29
y bueno, pues vamos a ver, a contar
00:42:33
los 5 primeros datos son 5
00:42:35
los dos siguientes, 10, ya llevo 11 datos
00:42:38
los tres siguientes son 15, 11 y 3, 14 datos
00:42:42
y ahora los cinco siguientes son 20
00:42:47
que con eso ya llegaría hasta la posición 19
00:42:50
pero es que yo quería la posición 16
00:42:55
¿quién va a ver en esa posición 16 si yo lo he puesto ordenados uno por uno?
00:42:57
pues lo que va a ver es un 20
00:43:03
Entonces, uno de esos 20 son los que me dejan 16 datos por debajo y 16 datos por encima. Vale, si sé la mediana, sé que cuando vaya a buscar los cuartiles, el cuartil 2, que era justo el que me dejaba el 50% de los datos por encima y el 50% de los datos por debajo, va a ser el mismo que la mediana, ¿vale?
00:43:05
Porque acordaos que dijimos que los cuartiles eran dividir en cuatro partes iguales mi distribución de datos.
00:43:33
Entonces, el cuartil 2, hemos dicho que es como la mediana, deja el 50% de datos por debajo y el otro 50% por arriba.
00:43:49
el cuartil 1 lo que me hace es dejarme
00:43:59
el 25% de los datos por debajo
00:44:03
o sea, la cuarta parte, pues voy a ver
00:44:06
¿quién sería la cuarta parte de 32? 8
00:44:08
¿qué dato estaría en esa posición 8?
00:44:12
bueno, me vuelvo otra vez a mi tabla de frecuencias
00:44:16
digo, los primeros 9 datos son 5
00:44:19
hombre, pues yo no quiero los primeros 9, quiero los primeros
00:44:21
quiero saber la posición 8
00:44:25
Pues ¿quién va a ver en la posición 8? Uno de esos 5. Pues el cuartil 1 es un 5. Si hago lo mismo mirando por detrás, digo, quiero ver quién está en la posición 8, pero contando de adelante hacia atrás.
00:44:27
digo, los primeros cuatro datos son treintas
00:44:46
y los siguientes nueve datos son veinticinco
00:44:49
o sea que el cuarto dato
00:44:52
que yo tengo que sumar a esto para llegar a la posición ocho
00:44:55
por detrás, ¿qué va a ser? un veinticinco
00:44:58
pues el cuartil tres que me dejaba
00:45:01
veinticinco por ciento
00:45:05
por encima y setenta y cinco por ciento por debajo
00:45:07
pues resulta que es
00:45:10
uno de esos veinticinco
00:45:12
¿vale? pues ya tengo
00:45:15
todos mis parámetros de centralización
00:45:18
media, mediana, cuartiles
00:45:21
a falta de la moda, solo me falta calcular
00:45:26
quién es la moda, la moda era el dato que más se repetía
00:45:30
y el dato que más se repite es el que tenga la frecuencia absoluta más alta
00:45:34
pues vengo otra vez a mi tabla y digo, bueno, las frecuencias absolutas
00:45:39
más altas son el C9 y S9. ¿Quiénes tienen esa frecuencia? Pues los 5 y los 25. Pues
00:45:42
la moda en este caso es 5 y 25. Hay dos datos que se repiten mucho más que los demás.
00:45:51
Pues ya tengo todos mis parámetros de centralización, media, mediana, moda y cuartiles y los de
00:46:00
dispersión, coeficiente de variación,
00:46:10
varianza y desviación típica.
00:46:13
Solo me faltaría el dato del rango,
00:46:16
¿cuánto es el rango de mi distribución?
00:46:20
Pues acordaos que el rango era la diferencia que había
00:46:24
entre el valor más alto y el valor más bajo.
00:46:27
Era la longitud que tenía mi distribución,
00:46:30
pues el rango en este caso es 25,
00:46:33
porque me he movido desde el 5 hasta el 30.
00:46:36
y ya tenemos todos los parámetros que hemos estudiado hoy
00:46:39
hechos en este ejemplo
00:46:43
espero que os hayáis entendido más o menos bien
00:46:45
con el resto de ejemplos que tengáis resueltos
00:46:49
y los ejercicios que hagáis pues que os salga más o menos esto bien
00:46:51
son muy pesadas las cuentas
00:46:55
hay que repetir muchas veces la misma cuenta
00:46:56
pero eso, por otro lado tengo la ventaja de que es siempre la misma cuenta
00:46:59
entonces si me prendo las formulitas
00:47:03
solo es tener paciencia para hacerme las tablitas despacio y con cuidado
00:47:05
para que no me equivoque en ninguno de los cálculos y me cargue todas las cuentas, ¿vale?
00:47:11
Bueno, pues lo dejamos aquí y habríamos terminado este tema de estadística, ¿vale?
00:47:16
Que tengáis buena tarde.
00:47:23
Si hay alguna duda, pues me contáis al próximo día, ¿vale?
00:47:25
Venga, buena tarde.
00:47:28
- Materias:
- Matemáticas
- Niveles educativos:
- ▼ Mostrar / ocultar niveles
- Educación de personas adultas
- Enseñanza básica para personas adultas
- Alfabetización
- Consolidación de conocimientos y técnicas instrumentales
- Enseñanzas Iniciales
- I 1º curso
- I 2º curso
- II 1º curso
- II 2º curso
- ESPAD
- Primer Curso
- Segundo Curso
- Tercer Curso
- Cuarto Curso
- Pruebas libres título G ESO
- Formación Técnico Profesional y Ocupacional
- Alfabetización en lengua castellana (español para inmigrantes)
- Enseñanzas para el desarrollo personal y la participación
- Bachillerato adultos y distancia
- Primer Curso
- Segundo Curso
- Enseñanza oficial de idiomas (That's English)
- Módulo 1
- Módulo 2
- Módulo 3
- Módulo 4
- Módulo 5
- Módulo 6
- Módulo 7
- Módulo 8
- Módulo 9
- Ciclo formativo grado medio a distancia
- Primer Curso
- Segundo Curso
- Ciclo formativo grado superior a distancia
- Primer Curso
- Segundo Curso
- Aulas Mentor
- Ciclo formativo de grado básico
- Primer Curso
- Segundo Curso
- Niveles para la obtención del título de E.S.O.
- Nivel I
- Nivel II
- Enseñanza básica para personas adultas
- Autor/es:
- Angel Luis Sanchez Sanchez
- Subido por:
- Angel Luis S.
- Licencia:
- Reconocimiento - No comercial - Compartir igual
- Visualizaciones:
- 25
- Fecha:
- 6 de mayo de 2025 - 17:19
- Visibilidad:
- Público
- Centro:
- CEPAPUB ORCASITAS
- Duración:
- 47′ 30″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1280x720 píxeles
- Tamaño:
- 1020.62 MBytes