Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

Tema 7.- Estadística 2ª Sesión 06-05-2025 - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 6 de mayo de 2025 por Angel Luis S.

25 visualizaciones

Descargar la transcripción

Buenas tardes, esta es la clase de matemáticas del día 6 de mayo. 00:00:00
Estamos con el tema de estadística. 00:00:06
En la última clase estuvimos viendo los tipos de variables que teníamos en los estudios estadísticos 00:00:09
que eran variables cualitativas, cuando expresaban cualidades que no se iban a poder medir numéricamente 00:00:17
y variables cuantitativas, que es cuando se expresan cantidades que sí que puedo medir numéricamente. 00:00:26
Cuando estábamos estas variables cuantitativas, podíamos encontrarnos dos tipos distintos, 00:00:33
que eran las discretas, que eran aquellas que tomaban valores puntuales, 00:00:41
decíamos que no había decimales, y variables continuas, 00:00:46
que eran las que tomaban valores dentro de intervalos, y entonces sí que podía haber decimales. 00:00:50
Como iba a haber muchísimos datos, pues los agrupábamos en intervalos para poder representarlos mejor. 00:00:56
Estuvimos viendo cómo hacer las tablas de frecuencia de los recuentos de los datos de estas variables, 00:01:04
viendo esa frecuencia absoluta, la frecuencia acumulada, la relativa, la relativa acumulada. 00:01:11
Vimos también los tipos de representación que podíamos utilizar para cada tipo de variable 00:01:19
estábamos por ejemplo diciendo que utilizábamos diagrama de sectores 00:01:25
cuando la variable era cualitativa o cuando era cuantitativa 00:01:30
y esa representación era simplemente llevar a porciones de un círculo 00:01:35
el número de datos que correspondía a cada una de las variables 00:01:40
teníamos otro tipo de representación que era el diagrama de barras 00:01:46
que se utilizaba o en variables cualitativas o en cuantitativas discretas, que eran barritas que me decían con su altura la frecuencia de aparición de cada uno de los datos. 00:01:51
Por otra parte, teníamos otras barras, pero que eran distintas, que eran barras pegadas, y se llamaba entonces histograma, la representación, 00:02:09
que lo utilizábamos para las variables cuantitativas continuas. 00:02:18
Estas barras eran de anchas como la longitud del intervalo que estábamos intentando representar 00:02:23
y de altas como la frecuencia de los datos que caían dentro de ese intervalo, 00:02:31
el número de datos que caían en ese intervalo. 00:02:37
Y por último teníamos el polígono de frecuencias que se utilizaba tanto con diagrama de barras 00:02:39
como con histograma que lo que hacía era unirme los puntos más altos de cada una de estas barras 00:02:46
y de otra forma de representar más esquemáticamente esas frecuencias de aparición de esos datos. 00:02:53
Bueno, pues visto cómo hacer el recuento de datos con esas tablas de frecuencias 00:03:01
y cómo poder representarlo gráficamente para ver los datos de una forma más rápida 00:03:06
Y con un formato más visual, que nos llame más la atención, vamos a ver qué otros estudios podemos hacer sobre esas series de datos que habíamos encontrado en nuestra estadística, en nuestro estudio estadístico. 00:03:12
Y vamos a empezar primero viendo lo que son las medidas de centralización, también llamadas medidas de posición, ¿vale? 00:03:27
Que lo que me van a decir es cómo se ordenan estos datos dentro de mi estudio estadístico, ¿vale? 00:03:38
La primera de esas medidas de centralización sería la media. Todos hemos hecho alguna vez la media de nuestras notas en el instituto, o ahora mismo, este año. ¿Cómo hacemos la media de nuestras notas? Pues sumando las notas de todas las asignaturas y dividiendo entre el número de asignaturas. 00:03:48
Bueno, pues eso cuando estoy con una serie de datos más grande, ir sumando uno a uno no es práctico. 00:04:09
Entonces, ¿qué es lo que vamos a hacer? 00:04:19
Vamos a aprovecharnos de la tabla de frecuencias con la que habíamos registrado el recuento de nuestros datos 00:04:21
para poder calcular esta media de una forma más rápida. 00:04:28
Vemos aquí en el ejemplo que dice, si yo tengo que he hecho un estudio, por ejemplo, 00:04:34
del número de días que faltó al trabajo en un año y tengo dos personas que han faltado 10 días, 00:04:41
una persona que ha faltado 12, una persona que ha faltado 14 y una que ha faltado 13. 00:04:50
Yo podría sumar todas esas faltas y dividirlo entre el total de dos datos que sería la suma de todos que es 52 o puedo hacer una tabla de frecuencias para el ejemplo 2 en el que digo si hay que hayan faltado 5 días 4 personas, que hayan faltado 10 días 6 personas, 15 días 7 personas, 20 días 9 personas, 25 días 4 personas, 00:04:56
30 días, 6 personas, pues si me genero una columna 00:05:25
en la que haga la multiplicación 00:05:30
de los días faltados por la frecuencia 00:05:33
que se ha repetido ese número de faltas, en ese caso 00:05:38
estas 4 personas, pues me dará que en total se han faltado 00:05:41
20 días, lo mismo para todos los demás, o sea voy multiplicando 00:05:46
el valor de la variable, que es el número de días que se ha faltado 00:05:50
nuestro ejemplo, por la frecuencia de aparición de ese valor, que sería el número de personas 00:05:54
que han faltado 5 días, 10 días, 15 días, y sumo esa columna de variable por su frecuencia. 00:06:02
Si el total de esa suma lo divido entre el total de personas a las que había hecho la encuesta, 00:06:13
que será la suma de estas frecuencias absolutas que en este caso es 36 00:06:19
y hago el cociente entre la suma de la aparición de cada uno de los datos 00:06:23
y el total de personas a las que he preguntado 00:06:30
me saldrá la media aritmética que estábamos buscando 00:06:32
entonces resumiendo lo que estamos haciendo aquí 00:06:36
cuando tengo muchísimos datos y lo hago desde la tabla de frecuencias 00:06:40
es multiplicar cada valor de la variable por su frecuencia 00:06:44
y sumárselo al resto de variables por sus frecuencias 00:06:49
y dividirlo en el resultado final, esta e rara significa sumatorio de todo, 00:06:54
suma de todos estos términos, dividirlo entre el número total de datos que tenía, 00:07:01
entre el número total de personas a las que hice la encuesta, 00:07:07
que sería igual que la suma de la frecuencia, este 36, y esa sería mi forma de hacer la media aritmética. 00:07:11
Si tengo pocos datos los puedo sumar directamente, pero cuando tengo muchos me es más práctico utilizar esta pequeña fórmula. 00:07:20
Otro parámetro de centralización es la moda. 00:07:30
todos sabemos de nuestro día a día que decimos que algo está de moda cuando lo lleva o lo hace mucha gente 00:07:36
pues aquí en estadística es lo mismo, la moda vamos a llamarla aquel valor que se repita más asiduamente 00:07:44
o sea que la forma de encontrar la moda mirando una tabla de datos estadísticos de frecuencias 00:07:53
es buscar aquel o aquellos datos que tienen la frecuencia más alta 00:07:59
entonces en el ejemplo que vimos anterior 00:08:04
lo que tengo que hacer es buscar 00:08:08
qué dato, qué valor de la variable 00:08:10
tiene la frecuencia más alta 00:08:13
en el primer ejemplo veo que 00:08:15
los que tienen frecuencia más alta son el 5 00:08:18
que aparece 8 veces 00:08:20
y el 20 que aparece 8 veces 00:08:22
pues entonces diremos que la moda 00:08:24
en este primer ejemplo son el 5 y el 20 00:08:27
puede haber más de una cosa dentro de la moda 00:08:30
yo por ejemplo si hablo de ropa pues puede ser que la moda sea 00:08:35
llevar pantalones vaqueros o que la moda sea 00:08:38
llevar pantalones vaqueros con una camiseta blanca 00:08:41
o sea que puede haber más de un elemento dentro de la moda 00:08:44
más de un valor de la variable 00:08:47
en el segundo ejemplo pues hago lo mismo 00:08:48
ordeno los valores de la variable 00:08:52
miro sus frecuencias y veo que en este caso 00:08:54
quien tiene la frecuencia más alta es el 600 00:08:58
que tiene frecuencia 9, pues diré que en este segundo caso la moda 00:09:02
solo es el 600, entonces nos quedamos con esa idea 00:09:06
que la moda mirada dentro de una distribución estadística 00:09:11
es el valor de la variable que más se repite 00:09:15
y eso lo veo en la tabla de frecuencias buscando el valor 00:09:18
o valores que tenga la frecuencia absoluta más alta 00:09:23
bueno, seguimos con otra medida 00:09:26
de posición, que sería 00:09:30
a ver, un segundito 00:09:33
sería la mediana 00:09:36
y la mediana, si nosotros pensamos 00:09:41
la medida que tenemos nosotros de mediana es 00:09:45
pues una carretera o una calle 00:09:48
que tiene un muro que me divide 00:09:50
los carriles del lado izquierdo y los carriles del lado derecho 00:09:52
Cuando yo voy pensando en una carretera, la mediana es esa franja de terreno que hay entre unos carriles y otros que me separan la carretera en dos partes iguales. 00:09:57
Bueno, pues aquí va a ser la misma idea. La mediana es el valor que ocupa la posición central de todos los datos que tengo yo en mi estadística cuando están ordenados. 00:10:06
O sea que si yo quisiese hacerlo por el camino largo lo que haría es ordenar todos los datos, ponerlos de menor a mayor y luego buscar qué dato es el que me deja la misma cantidad de datos por debajo que por encima. 00:10:20
Claro, eso lo puedo hacer cuando tenga estudios estadísticos con poquitos datos 00:10:35
Pero si tengo muchos, no es práctico ordenar todos los datos uno por uno 00:10:41
Vuelvo una vez más a valerme de la tabla de frecuencias para poder hacer este cálculo 00:10:44
Entonces, vemos por ejemplo, aquí en el ejemplo 00:10:50
Que los valores distintos que me han salido son del 1 al 5 00:10:54
Y aquí tengo sus frecuencias absolutas 00:10:57
El 1 ha aparecido 10 veces, el 2 20 veces, el 3 17 00:11:00
el 4 doce veces y el 5 diecisiete 00:11:04
o sea que en total tengo 10, 20 00:11:07
37, 49 y 00:11:11
66 datos, ¿vale? que era 00:11:15
el último valor de la frecuencia absoluta acumulada, entonces hay 00:11:19
66 datos, tengo que buscar cuál de esos 00:11:23
66 datos me deja la mitad por debajo y la mitad por encima 00:11:27
O sea, ¿cuál me deja 33 datos por debajo y cuál me deja 33 datos por encima? 00:11:31
Otra forma de verlo, ¿cuál me deja el 50% de los datos por debajo y el 50% por encima? 00:11:38
Pues lo que vamos a hacer es mirar en la tabla de frecuencias quién es el dato que ocuparía esa posición 33, que es la mitad de ese 66. 00:11:44
Bueno, los 10 primeros números eran 1. Los 10 números siguientes eran 2. O sea, ya he colocado los 20 primeros datos. Y ahora, de ese dato 20, que era un 2, al dato 37, lo que hay son 3. Pero yo no quería llegar tan lejos. Yo solo quería llegar a la posición 33, que era la mitad de este 66, que era el número total de datos que había en mi tabla estadística. 00:11:55
Pues si yo pienso en qué dato está en esa posición 33, me encuentro que en la posición 33 habrá un 3, porque tenía 10 unos, 10 doses, 10 treses, el 11, la posición 31 será también un 3, la 32 será un 3, la 33 será un 3, la 34 será un 3. 00:12:22
Así está la posición 37, entonces, en la posición 33, que es la que yo quería controlar, hay un 3, si yo los hubiese puesto todos en fila y ordenaditos. 00:12:48
Esta misma idea la vamos a utilizar para el siguiente parámetro de centralización, que son los cuartiles, que es la misma idea que en la mediana. 00:13:01
Ahora, los cuartiles son tres, y son como tres, digamos, paredes que me dividen mi distribución de datos estadísticos en cuatro cajitas igual de grandes, fijaos aquí en el dibujo, entonces, ¿qué ocurrirá? 00:13:11
que el primer cuartil me va a dejar un cuarto de los datos 00:13:30
por debajo, o sea, el 25% de los datos por debajo. El segundo 00:13:34
cuartil me va a dejar la mitad de los datos por debajo, o sea, el 50% 00:13:38
de los datos. Luego el segundo cuartil siempre va a 00:13:42
coincidir con el valor de la mediana. Y el tercer cuartil 00:13:46
es el que me deja el 75% de los datos por debajo, o sea, tres cuartas 00:13:50
partes, ¿vale? Por eso se llaman cuartiles, porque divido 00:13:54
mi distribución de datos en cuartos, ¿vale? 00:13:59
Primer cuarto, llego al primer cuartil. 00:14:04
Segundo cuarto, cuando he cogido la mitad de los datos, 00:14:07
llego al segundo cuartil. 00:14:09
Tercer cuartil, cuando llego al tercer cuarto. 00:14:11
Entonces, vuelvo a hacer la misma historia de antes. 00:14:14
Aquí en la tabla me lo he hecho calculando los porcentajes. 00:14:17
Es una forma de hacerlo. 00:14:20
O puedo hacer el mismo recuento que antes. 00:14:22
Bueno, la cuarta parte de 66, perdón, la mitad de 66 era 33 y en la posición 33 vimos que había un 3, o sea que el cuartil 2 va a ser igual que la mediana que es un 3. 00:14:24
Ahora digo, ¿quién es la mitad de ese 33? ¿Quién es la mitad de esa mitad que hemos visto con la mediana? Pues será el dato que esté en la posición 16 y medio, digamos, 16 por abajo y 16 por arriba, para llegar a esos 33 datos que juntaba con la mediana. 00:14:41
Pues voy a ver, a contar hasta que llegue ese dato 16. 00:15:02
10 unos y ahora 10 doses, pues la posición 16 la ocupará uno de esos doses, pues el cuartil 1 es un 2. 00:15:07
Si quiero calcular el cuartil 3, lo puedo hacer de dos formas. 00:15:18
Creo que la segunda que os voy a hacer va a ser más cómoda. 00:15:23
Puedo decir, buscar cuál es el dato que me deja tres cuartas partes por debajo. 00:15:26
que es el 75%, o hacer la misma cuenta que he hecho para el cuartil 1 00:15:32
pensando en qué dato es el que me deja un cuarto de los datos por encima. 00:15:37
¿Cuál es el que me deja por encima el 25% de los datos? 00:15:42
Pues como hemos dicho que la mediana está en la posición 33, 00:15:46
que la mitad es el 66, pues si yo pienso el mismo razonamiento 00:15:50
que hice para el cuartil 1, pero pensando desde el último dato hacia atrás, 00:15:56
lo que necesito es saber qué dato hay en la posición 16,5 00:16:01
que decíamos que es la mitad del 33 00:16:06
y entonces me fijaría en mi tabla de frecuencias 00:16:08
pero empezando por el final 00:16:11
digo, los 17 últimos datos son 5 00:16:12
pero yo no quería los 17 últimos datos 00:16:17
me bastaba con los 16 últimos datos 00:16:20
¿qué hay en la posición 16 empezando por el final? 00:16:22
pues un 5 00:16:27
pues mi cuartil tercero es ese 5 00:16:27
¿vale? si lo pensamos de 00:16:32
la forma de utilizar los porcentajes 00:16:35
lo que tengo que ir es calculando que porcentaje 00:16:39
de repetición tiene cada uno de esos datos que he estado mirando 00:16:44
y digo, sería hacer una regla de 3, si 66 00:16:48
datos es el 100%, pues 10 datos sería un 15% 00:16:52
El 2, que sería el dato 20, 10 y 10, 20, pues los 20 primeros datos serían el 30%, que es el doble que es el 15. 00:16:57
Los 20 más los 17, 37 datos serían el 56%, el 56%. 00:17:07
Esos 17 más estos otros 12, los 49 primeros datos serían el 74%. 00:17:14
Y los últimos 16 datos serían ya completar el 100%. 00:17:20
Pues la forma de buscar la mediana es buscar qué dato está dentro del 50%, que sería un 3, qué dato estaría dentro de la posición del 25%, que sería un 2, y qué dato estaría en la posición del 75%, que sería un 5. 00:17:26
Como mejor lo veáis, con los porcentajes corro el riesgo de que si calculo mal el porcentaje, pues ponga ya mal esta columna y todo me salga mal. 00:17:44
¿Con el recuento de la frecuencia absoluta? Pues me es más cómodo, creo yo, a mí me gusta más porque solo es contar hasta llegar al dato que yo quiero llegar y ver, hasta llegar a la posición, perdón, que quiero llegar y ver luego qué dato ocupa esa posición. 00:17:56
pero lo podéis hacer de la forma que queráis 00:18:13
como os resulte más cómodo y lo veáis mejor 00:18:17
bueno, vistas estas medidas o parámetros de centralización 00:18:20
el diagrama de carga y bigotes 00:18:29
este no lo vamos a ver porque sería una forma de representar los cuartiles 00:18:33
pero no lo vamos a utilizar luego en los ejercicios 00:18:36
entonces que quede así solo como curiosidad 00:18:38
de cómo se representa esto gráficamente 00:18:41
igual que vimos la representación de los distintos tipos de variables 00:18:43
Pero no os lo voy a pedir, ¿vale? Ahora lo que sí que os voy a pedir es que sepáis calcular las medidas de dispersión. ¿Qué es esto de las medidas de dispersión? Pues las medidas de dispersión lo que me van a hacer es ver cómo de agrupados o separados están los datos de mi estudio estadístico, ¿vale? 00:18:46
Si los datos están muy agrupaditos, pues será un estudio muy homogéneo, una población muy homogénea a la que he estudiado, la gente es muy parecida. 00:19:09
Si los datos están muy dispersos, pues la población será muy heterogénea y, por decirlo de alguna manera, si estamos controlando los gustos que tienen, pues va a haber gustos muy dispares. 00:19:16
Si las medidas de dispersión están muy centralizadas, pues serán datos muy parejos y gustos muy parejos los que tendrá la gente. 00:19:28
bueno, vamos a ver quiénes son estos 00:19:37
medidas de dispersión o parámetros de dispersión 00:19:39
empezamos de más fáciles a más difíciles 00:19:43
por decirlo de alguna manera 00:19:46
la primera sería el rango recorrido 00:19:47
y el rango recorrido simplemente lo que me va a indicar 00:19:50
es entre qué valores me voy a mover 00:19:55
entonces el rango es 00:19:57
la diferencia entre el valor más alto 00:20:00
que me voy a encontrar en mi variable 00:20:03
y el valor más pequeño, o sea que lo que me va a indicar es la longitud 00:20:05
del intervalo en la que se están moviendo mis datos 00:20:09
¿vale? en este ejemplo que me dicen aquí, pues el dato 00:20:14
más pequeño, el valor más pequeño de mi variable era 5 y el más alto 00:20:17
era 30, pues el rango de mi estudio va a ser 00:20:21
30 menos 5, 25, o sea que estaré 00:20:25
diciendo con esta medida 00:20:29
que mis datos están 00:20:32
separados 00:20:35
25 unidades 00:20:38
entre el más pequeño y más grande, o sea que 00:20:41
el recorrido por el que me muevo 00:20:44
tiene una longitud, por así decirlo, de 25 unidades 00:20:47
en este caso, ¿vale? Entonces 00:20:51
no me da una información muy importante 00:20:53
pero ya me ayuda a ir 00:20:57
centrándome sobre qué valores 00:20:59
me estoy moviendo, ¿vale? Bueno, siguiente medida de dispersión sería lo que se llama 00:21:02
la desviación media. ¿Y en qué consiste la desviación media? Pues en hacer la media 00:21:09
que hay entre los valores absolutos de la diferencia entre la media aritmética y los 00:21:15
distintos datos que me he encontrado. Entonces, lo que estoy viendo aquí es cómo de separados 00:21:21
en valor medio están mis datos de esa media aritmética 00:21:27
¿Cómo haré para calcularlos? 00:21:32
Me puedo generar una nueva columna 00:21:36
que me diga, voy a ver cuánto vale 00:21:39
cada diferencia de el dato 00:21:42
que estoy mirando con la media, como los datos se están repitiendo 00:21:47
esta cuentecita la tendré que multiplicar 00:21:52
Por la frecuencia absoluta de las veces que se ha repetido el dato que estoy mirando. 00:21:55
¿Vale? 00:22:00
Entonces, lo pongo en valor absoluto porque me da igual que el dato esté por encima de la media que esté por debajo. 00:22:00
Yo solo quiero ver lo que me he separado de él. 00:22:07
Me da igual hacia adelante o hacia atrás. 00:22:11
Entonces, lo que diríamos si en nuestro ejercicio vamos a poner que la media salió que era el 3, 00:22:14
pues diríamos 3 menos 5, que sería menos 2. 00:22:20
como quiero valor absoluto, lo pongo en positivo, más 2 00:22:24
multiplicado por las dos veces que salió el 5 00:22:28
ese resultado me lo pongo en esta columna nueva que me he creado 00:22:31
y voy haciendo esa misma cuenta con todos los demás 00:22:37
3 menos 10, menos 7, al ponerlo en valor absoluto, más 7 00:22:40
pero como apareció una vez, pues menos 7 por 1 00:22:45
y sería ir haciendo esa cuenta todo el rato 1 por 1 00:22:48
Cuando tenga cada uno de los valores de cada una de las filas de los datos que he ido contrastando con la media aritmética, lo que hago es sumarlos, ¿vale? 00:22:53
Sumo todos los valores de esta columna y me da este 106,66. 00:23:05
como yo quiero compararlo con el total de datos que tenía 00:23:10
pues digo, esa desviación que se llama respecto a la media 00:23:15
la divido entre los 18 datos que tenía 00:23:19
que era la suma de las frecuencias absolutas 00:23:23
y el resultado de esta división 00:23:26
me da este 5,92 que es la desviación media 00:23:29
la media aritmética de lo que me he desviado 00:23:33
con respecto a la media en todo mi estudio estadístico 00:23:37
es un poco trabalenguas esto, pero bueno 00:23:41
no es difícil la cuenta, siempre va a ser la misma cuenta y os aconsejo 00:23:45
que en vez de irla haciendo por separado, os escribáis la columna 00:23:49
entera, haciendo uno para uno 00:23:54
la operación que hemos dicho, cuando la tenga entera hago la suma, divido entre el número total 00:23:57
de datos y ya está, que no hagáis cuentas parciales porque si no 00:24:01
Es muy fácil que me deje un dato atrás, que uno le ponga dos veces y ya la iría. 00:24:05
O cuando me confunda en uno de los operadores de esta suma que estoy haciendo en el numerador, me he cargado la operación. 00:24:11
Entonces mejor vamos completando la tabla, que ya veremos que nos va a hacer falta luego completarla más para mirar otros parámetros. 00:24:18
Y así me va a ser más cómodo luego aplicar las fórmulas finales. 00:24:27
Bueno, esa sería la desviación media. 00:24:31
después de la desviación media 00:24:33
tenemos una cosa que se llama varianza 00:24:35
y la varianza es algo parecido a la desviación media 00:24:37
pero lo que estoy haciendo es mirar 00:24:41
cómo se desvían en media los cuadrados 00:24:44
de estas desviaciones medias 00:24:47
es como rizar un poco el rizo 00:24:49
y bueno, voy a hacer otra vez la misma historia 00:24:51
la fórmula de la varianza sería lo que hay dentro aquí 00:24:55
de la raíz cuadrada 00:24:59
puesto que la desviación típica que es el siguiente parámetro 00:25:01
es hacer la raíz cuadrada de lo que me salió en la variada 00:25:04
lo puedo calcular de dos formas distintas 00:25:08
como resulte más cómodo, yo os cuento las dos 00:25:12
aquí en el ejemplo vienen las dos 00:25:14
la fórmula que más cómoda os sea de utilizar 00:25:15
hay quien le gusta más esta, quien le gusta más esta 00:25:18
en la primera lo que está haciendo es 00:25:21
lo mismo que hemos hecho antes con la desviación media 00:25:23
pero en vez de hacer el valor absoluto de la diferencia que había entre cada dato 00:25:26
y la media aritmética lo que hace es el cuadrado de esas diferencias 00:25:30
luego lo multiplica por las veces que se ha repetido ese dato 00:25:34
o sea, por su frecuencia absoluta 00:25:37
y al final la suma de todos ellos 00:25:39
lo divide entre el número total de datos 00:25:42
entonces, una vez más, consejo que os digo 00:25:44
que os hagáis la columna de todas esas cuentas 00:25:48
en vez de ir haciendo toda la fórmula entera 00:25:53
me hago la columna de lo que correspondería 00:25:55
a cada uno de los datos en su fila, digo el 5 00:26:00
menos la media, que era el 9 no sé cuánto 00:26:04
el resultado de esa resta le hago al cuadrado 00:26:07
y luego multiplico por 5, que eran las veces que se había repetido 00:26:11
ese 5, y lo pongo en su fila 00:26:16
hago la misma historia para el siguiente, para el siguiente, para el siguiente, cuando tenga todos 00:26:19
calculados, hago su suma y lo que me salga 00:26:24
lo divido entre los 19 datos que había y ya tendría calculada 00:26:27
la varianza, que luego quiero saber la desviación típica 00:26:32
pues simplemente hago la raíz cuadrada de lo que me hubiese 00:26:36
salido en la cuenta de la varianza, o sea la raíz cuadrada de lo que me salió 00:26:40
de dividir esto entre 19 00:26:44
otra opción que hay a quien le parece más cómoda 00:26:47
Que es usar esta segunda fórmula. 00:26:52
Y esta segunda fórmula puede ser más cómoda porque es más rápida de calcular en principio. 00:26:54
Porque no tengo que pensar en la media aritmética hasta el final. 00:27:02
Y es que vaya multiplicando la frecuencia de cada dato por el cuadrado del dato. 00:27:05
O sea, digo, 5 por 5, 25. 00:27:11
5 veces, 125. 00:27:14
10 al cuadrado, 100 por 1, 100. 00:27:17
15 al cuadrado, 225, por una vez que se repetía 00:27:20
225, entonces hago frecuencia por el cuadrado 00:27:24
del valor de la variable, sumo todo lo que me sale 00:27:28
en la columna esa, y a este 9975 00:27:32
le divido 00:27:36
primero entre los 19 datos que había 00:27:39
en mi estadística, y al resultado de esta división 00:27:44
le resto el cuadrado de lo que valiese la media aritmética 00:27:48
que ya había calculado previamente y voy a llegar al mismo resultado 00:27:53
fijaos que aquí ha hecho la cuenta con esta 00:27:57
primera modalidad, utilizando esta primera columna 00:28:01
aquí ha hecho la cuenta, utilizando las cuentas de esta segunda columna, de esta segunda fórmula 00:28:04
y llega exactamente al mismo resultado 00:28:09
lo que os resulte más cómodo, para hacerlo 00:28:12
sin calculadora, digamos, es más cómoda esta, para hacerlo con calculadora 00:28:17
pues la que me dé la gana, eso sí, si lo hago con calculadora 00:28:21
pues aún así yo me iría haciendo esas cuentas parciales 00:28:25
y poniéndolas aquí, para no perderme ninguna ni saltarme ningún 00:28:29
dato, aunque se podría escribir en la calculadora todo del tirón 00:28:33
como queráis, eso dependerá de la soltura que tengáis a la hora de 00:28:36
manejar la calculadora, bueno, lo haga como lo haga 00:28:41
sé que la desviación típica sale de hacer la raíz cuadrada de lo que me dio la varianza, ¿vale? 00:28:45
Y que para poder hacer la varianza necesito primero haber sabido la media aritmética. 00:28:52
¿Qué ocurrirán los ejercicios? 00:28:59
Que me darán mis numeritos, ahora volveremos haciendo uno paso a paso, 00:29:01
y me pedirán que calcule esta desviación típica y no me dirán nada más. 00:29:07
pero claro, para poder calcular esta desviación típica 00:29:13
me están obligando a que haga la tabla de frecuencias 00:29:16
a que calcule la media aritmética, a que calcule la varianza 00:29:18
y que por último llegue a la desviación típica 00:29:22
o sea, que preguntándome sólo una cosa 00:29:25
me están obligando a hacer todas las demás 00:29:28
porque las necesito para poder aplicar la fórmula 00:29:31
de esta desviación típica que me estarían pidiendo 00:29:34
o sea que yo lo hago tranquilamente 00:29:37
despacito y ya está 00:29:41
Y el último parámetro de dispersión es el coeficiente de variación, que como cuando hacía esta desviación típica iban a depender los resultados de unas unidades que medían la variable que yo estaba estudiando, 00:29:43
Si yo quisiese comparar dos estadísticas distintas 00:30:02
No podría hacerlo 00:30:06
Si yo quiero comparar los colores que le gusta a la gente 00:30:07
Con la edad que tienen 00:30:12
Pues no me permitiría hacer la comparación 00:30:13
Ahora, si yo utilizo este último coeficiente 00:30:16
Que es el coeficiente de variación 00:30:19
Si lo voy a poder hacer 00:30:20
Porque el coeficiente de variación no tiene unidades de medida 00:30:22
Porque el coeficiente de variación lo que hace es 00:30:25
Ver la relación entre la desviación típica 00:30:28
y la media aritmética, o sea, el coeficiente de variación es 00:30:32
dividir la desviación típica entre la media aritmética 00:30:37
y luego, pues, hay quien lo deja así, escrito como fracción 00:30:42
como decimales no me interesa nunca, o quien lo pone en porcentaje 00:30:47
pero, como he dividido unidades de desviación típica, que por ejemplo 00:30:51
serían edades entre unidades de la media que volverían a ser edades 00:30:56
pues edad entre edad desaparecería y se queda sin unidades de medida 00:31:01
y coeficiente de variación. 00:31:07
Y eso lo que me permite es comparar estudios estadísticos 00:31:09
que no tengan en principio nada que ver, como decíamos, 00:31:13
del gusto de los colores para vestir, con la edad de la gente, 00:31:17
simplemente viendo qué porcentaje me sale en esa comparación 00:31:23
de desviación típica contra media y el que tenga el porcentaje más alto 00:31:29
pues será el que corresponda a una población más heterogénea 00:31:36
y el que tenga el porcentaje de coeficiente de variación más bajo 00:31:43
me estará diciendo que los datos están más concentrados respecto a la media 00:31:46
y que esa gente tiene gustos más parecidos y entonces sí que podría 00:31:51
comparar ese gusto de colores con las edades 00:31:56
de la gente a las que le he hecho la encuesta. Esto es un poco 00:32:01
complicado a lo mejor de entender así, pero bueno 00:32:05
nosotros nos quedamos con que este último coeficiente de variación 00:32:09
lo que me hace es dividir la desviación típica entre la media 00:32:12
dinética, ya está. Si quiero el resultado de esa división 00:32:17
para verlo un poco más gráficamente, lo paso a porcentaje haciendo una regla 00:32:20
de 3. Si no quiero, pues no hace falta. Me da igual. Viéndolo simplemente como fracción 00:32:25
o como número decimal, voy a poder compararlos también perfectamente, porque sabemos ordenar 00:32:30
los números decimales y también sabemos ordenar fracciones. O sea que si yo quiero 00:32:37
comparar dos números decimales o quiero comparar dos fracciones, a estas alturas lo sabemos 00:32:40
hacer. ¿Qué me es más cómodo hacerlo con porcentaje? Pues lo pasáis a porcentaje con 00:32:46
esa regla de tres y se ve aún mejor y más rápido, bien es verdad, ¿vale? Bueno, lo 00:32:50
que voy a hacer ahora es irnos a un ejercicio en el que hagamos todo lo que hemos visto 00:32:57
en este tema, desde representación a medidas de descentralización, medidas de dispersión, 00:33:04
todo lo que me podrían preguntar un ejercicio visto sobre un ejemplo, para que veáis que 00:33:10
todo va como encadenado. Ese ejercicio 00:33:16
le vamos a hacer sobre uno de los resueltos que se da 00:33:19
en los ejercicios aquí resueltos y los que tenéis para practicar 00:33:23
para que así tengamos las cuentas hechas y pueda tardar un poco menos, pero 00:33:27
voy a ir explicando paso a paso que hago en cada cuenta de lo que 00:33:31
vamos haciendo. Bueno, pues imaginaos 00:33:35
me dicen que tengo este 00:33:41
estudio estadístico, que será de lo que Dios quiera que sea, me da igual. Los valores 00:33:45
que ha tomado la variable en ese estudio estadístico, los distintos valores que tenía la variable 00:33:53
eran 5, 10, 15, 20, 25 y 30. Y me dicen las frecuencias con las que ha aparecido cada 00:33:57
uno de estos datos. Me dice que el 5 ha aparecido 9 veces, el 10 2, el 15 3, el 25, el 25 9 00:34:06
y el 34. Luego, ya sé aquí de entrada que el número de datos que había en mi estadística es 32, que sería 9 más 2, 11, más 3, 14, 19, 28 y 32. 00:34:14
Pues acordaos que el número de datos es la suma de todas las frecuencias absolutas, ¿vale? 00:34:37
Que si yo lo pongo en forma de tabla, que es lo que a mí me va a interesar, 00:34:46
pues sería mi primera columna, los distintos valores de la variable, 00:34:50
sea lo que sea lo que esté estudiando, pues si pensamos en el de antes, 00:34:56
días que he faltado a trabajar en un mes, por ejemplo, 00:35:01
y personas que han faltado ese número de días 00:35:05
en mi segunda columna 00:35:10
la suma de todas esas frecuencias 00:35:11
absolutas me dará el total 00:35:13
de personas 00:35:15
sobre las que estoy haciendo la encuesta 00:35:16
sobre las que estoy haciendo el estudio 00:35:20
¿vale? y fijaos 00:35:21
me dice ¿cuál es 00:35:24
la desviación 00:35:27
típica? 00:35:29
¿vale? pues es que para hacer 00:35:31
la desviación típica necesito 00:35:33
saber la media aritmética 00:35:35
porque no necesitaba mi fórmula puesto que la desviación típica hemos dicho que era la raíz cuadrada de la varianza 00:35:37
que lo podemos poner así o la podemos poner también como sigma al cuadrado y esto era igual a la raíz cuadrada 00:35:47
vamos a utilizar la fórmula cortita puesto que tiene aquí la columna y es más rápida de ver las cuentas 00:35:55
Que era la suma de fi por xi al cuadrado, que era cada uno de los datos distintos que aparecía, dividido entre el número total de datos y menos el cuadrado de la media, ¿vale? 00:36:00
esa sería mi desviación típica 00:36:17
y lo que hay aquí dentro 00:36:20
si yo lo quisiese hacer en dos partes 00:36:23
lo que hay aquí dentro 00:36:25
¿vale? lo de dentro de la raíz 00:36:28
sería el valor de mi varianza 00:36:31
que hemos dicho que me pueden poner como var 00:36:37
o como sigma al cuadrado, son las dos formas de 00:36:39
representar la varianza 00:36:42
Bueno, pues digo, bueno, si utilizo esta segunda fórmula, que hemos dicho que es la más corta, la de usar, pues ¿qué haré? 00:36:45
Me olvido de esta columna. A ver, ¿por qué no me dejas escribir? 00:36:54
Me olvido de esta columna y me quedo con esta, mi tabla de frecuencias, en la que yo decía que tenía que multiplicar la frecuencia, 00:37:00
en este caso el 9, por el cuadrado del valor del dato que estaba mirando, por el cuadrado de 25. 00:37:10
Pues 9 por 25, o digo, perdón, por el cuadrado de 5, perdón, que se me ha ido la pinta. 00:37:16
5 al cuadrado, 25 por 9, 225. 00:37:24
Voy al siguiente. 00:37:28
10 al cuadrado, 100 por 2, 200. 00:37:29
Voy al siguiente. 00:37:32
15 al cuadrado, 225 por 3, 675. 00:37:33
20 al cuadrado, 400 por 5, 2000. 00:37:38
25 al cuadrado, pum, pum, pum. 00:37:42
Voy haciendo por filas la cuenta esta de multiplicar frecuencia por cuadrado del valor de mi variable. 00:37:43
Cuando tengo toda la columna hecha, sumo todos los resultados, que me dan en este caso 12.325, 00:37:54
y me acuerdo que ese 12.325, como estoy usando esta segunda fórmula, 00:38:03
lo tengo que dividir entre el número total de datos que tenía. 00:38:10
pero el número total de datos lo tenía aquí como suma de las frecuencias absolutas 00:38:12
o sea, 32 datos que ya lo vimos hacia arriba 00:38:16
entonces digo, 1.012.325 00:38:19
dividido entre 32 00:38:22
menos, ¿cuánto era la media? 00:38:23
no anda leches 00:38:29
me hace falta la media para la fórmula y no la he calculado 00:38:30
¿cómo se calculaba la media? pues si os acordáis 00:38:33
la media la calculamos diciendo 00:38:37
que mi media aritmética era la suma de 00:38:40
las frecuencias por cada uno de los datos 00:38:44
y dividido entre el total de datos 00:38:49
o sea que lo que hago es esta columna para ayudarme, digo 5 por 9 00:38:52
45, 10 por 2, 20, 15 por 3 00:38:56
45, 20 por 5, 100, pa pa pa pa pa pa 00:39:00
y la suma de todos, este 555 00:39:03
sería esta parte del numerador, ¿qué hago con ese numerador? 00:39:07
dividirlo entre 32 que era el número total de datos, pues 00:39:12
555 dividido entre 32 me da que la media es 17 00:39:15
con 34, pero bueno, pues si a ese 00:39:20
12.325 dividido entre 32 le resto 00:39:23
el cuadrado de ese 17 con 34, me estaría 00:39:28
dando el valor de la varianza, pero no me pedían el valor de la varianza 00:39:32
me pedían la desviación típica, no hay ningún problema 00:39:36
pues al resultado de ese valor de la varianza 00:39:39
le hago la raíz cuadrada y me sale la desviación 00:39:41
típica que quería, 9 con 18 00:39:45
y me dicen para rematar, bueno pero ese 00:39:48
9 con 18, si le quisiese 00:39:51
comparar con otro estudio estadístico 00:39:54
de otra variable distinta, no puedo porque va a depender 00:39:57
de las unidades de medida que tuviese la variable 00:40:00
que estaba estudiando, bueno, pues vamos a pasar coeficiente de variación 00:40:03
digo, ¿cómo se calculaba el coeficiente de variación? 00:40:07
pues el coeficiente de variación dijimos que era coger 00:40:11
esa desviación típica y dividirlo entre la media aritmética 00:40:15
pues cojo ese 9,18 y lo divido entre el 00:40:19
17,34 que es la media aritmética y me dará 00:40:23
pues una fracción que yo la puedo poner en decimal 00:40:27
dejarlo como fracción o 00:40:30
si lo quiero pasar a porcentaje 00:40:32
el resultado de esta división 00:40:35
lo único que tengo que pasarle es multiplicarle por 100 00:40:38
y me sale 00:40:40
transformo ese número decimal 00:40:42
del resultado de la división 00:40:45
en un porcentaje, en un tanto por ciento 00:40:46
me estaría diciendo que el coeficiente de variación aquí 00:40:49
es de un 52% 00:40:52
que el 52% de la gente está separado de la media 00:40:54
Entonces, si yo quiero interpretar si esta estadística está representando a datos muy dispersos o a datos muy concentrados, al ver que me salió un coeficiente de variación tan alto, que hay tanta gente que está lejos de la media, digo, uy, pues es que el estudio este que he hecho ha sido sobre una población tan sumamente heterogénea que aquí ha opinado la gente de forma muy, muy diversa. 00:40:58
No es una buena población si yo quiero sacar conclusiones de ella y hacer cosas con esas conclusiones porque son datos muy heterogéneos, ¿vale? Son datos muy dispersos. 00:41:27
bueno, y diréis, bueno, pero es que nos hemos dejado cosas sin hacer 00:41:42
pues ya que hemos visto esta última parte, que era la difícil 00:41:47
más despacito, vamos a hacer esas medidas de centralización 00:41:50
que nos faltaban, y entre esas medidas de centralización 00:41:54
teníamos que calcular la media aritmética 00:41:58
que la tenemos, o sea que sé que la media aritmética 00:42:02
nos salió 17,34, la tengo 00:42:05
tengo que calcular la mediana 00:42:09
y dijimos, la mediana era buscar 00:42:12
qué dato es el que ocupa la posición central 00:42:15
y os dije, solo es contar 00:42:19
veo que tengo 32 datos en total 00:42:21
entonces el dato que ocupe la posición central 00:42:24
estará en la posición 16,5 00:42:27
para dejarme 16 por abajo y 16 por arriba 00:42:29
y bueno, pues vamos a ver, a contar 00:42:33
los 5 primeros datos son 5 00:42:35
los dos siguientes, 10, ya llevo 11 datos 00:42:38
los tres siguientes son 15, 11 y 3, 14 datos 00:42:42
y ahora los cinco siguientes son 20 00:42:47
que con eso ya llegaría hasta la posición 19 00:42:50
pero es que yo quería la posición 16 00:42:55
¿quién va a ver en esa posición 16 si yo lo he puesto ordenados uno por uno? 00:42:57
pues lo que va a ver es un 20 00:43:03
Entonces, uno de esos 20 son los que me dejan 16 datos por debajo y 16 datos por encima. Vale, si sé la mediana, sé que cuando vaya a buscar los cuartiles, el cuartil 2, que era justo el que me dejaba el 50% de los datos por encima y el 50% de los datos por debajo, va a ser el mismo que la mediana, ¿vale? 00:43:05
Porque acordaos que dijimos que los cuartiles eran dividir en cuatro partes iguales mi distribución de datos. 00:43:33
Entonces, el cuartil 2, hemos dicho que es como la mediana, deja el 50% de datos por debajo y el otro 50% por arriba. 00:43:49
el cuartil 1 lo que me hace es dejarme 00:43:59
el 25% de los datos por debajo 00:44:03
o sea, la cuarta parte, pues voy a ver 00:44:06
¿quién sería la cuarta parte de 32? 8 00:44:08
¿qué dato estaría en esa posición 8? 00:44:12
bueno, me vuelvo otra vez a mi tabla de frecuencias 00:44:16
digo, los primeros 9 datos son 5 00:44:19
hombre, pues yo no quiero los primeros 9, quiero los primeros 00:44:21
quiero saber la posición 8 00:44:25
Pues ¿quién va a ver en la posición 8? Uno de esos 5. Pues el cuartil 1 es un 5. Si hago lo mismo mirando por detrás, digo, quiero ver quién está en la posición 8, pero contando de adelante hacia atrás. 00:44:27
digo, los primeros cuatro datos son treintas 00:44:46
y los siguientes nueve datos son veinticinco 00:44:49
o sea que el cuarto dato 00:44:52
que yo tengo que sumar a esto para llegar a la posición ocho 00:44:55
por detrás, ¿qué va a ser? un veinticinco 00:44:58
pues el cuartil tres que me dejaba 00:45:01
veinticinco por ciento 00:45:05
por encima y setenta y cinco por ciento por debajo 00:45:07
pues resulta que es 00:45:10
uno de esos veinticinco 00:45:12
¿vale? pues ya tengo 00:45:15
todos mis parámetros de centralización 00:45:18
media, mediana, cuartiles 00:45:21
a falta de la moda, solo me falta calcular 00:45:26
quién es la moda, la moda era el dato que más se repetía 00:45:30
y el dato que más se repite es el que tenga la frecuencia absoluta más alta 00:45:34
pues vengo otra vez a mi tabla y digo, bueno, las frecuencias absolutas 00:45:39
más altas son el C9 y S9. ¿Quiénes tienen esa frecuencia? Pues los 5 y los 25. Pues 00:45:42
la moda en este caso es 5 y 25. Hay dos datos que se repiten mucho más que los demás. 00:45:51
Pues ya tengo todos mis parámetros de centralización, media, mediana, moda y cuartiles y los de 00:46:00
dispersión, coeficiente de variación, 00:46:10
varianza y desviación típica. 00:46:13
Solo me faltaría el dato del rango, 00:46:16
¿cuánto es el rango de mi distribución? 00:46:20
Pues acordaos que el rango era la diferencia que había 00:46:24
entre el valor más alto y el valor más bajo. 00:46:27
Era la longitud que tenía mi distribución, 00:46:30
pues el rango en este caso es 25, 00:46:33
porque me he movido desde el 5 hasta el 30. 00:46:36
y ya tenemos todos los parámetros que hemos estudiado hoy 00:46:39
hechos en este ejemplo 00:46:43
espero que os hayáis entendido más o menos bien 00:46:45
con el resto de ejemplos que tengáis resueltos 00:46:49
y los ejercicios que hagáis pues que os salga más o menos esto bien 00:46:51
son muy pesadas las cuentas 00:46:55
hay que repetir muchas veces la misma cuenta 00:46:56
pero eso, por otro lado tengo la ventaja de que es siempre la misma cuenta 00:46:59
entonces si me prendo las formulitas 00:47:03
solo es tener paciencia para hacerme las tablitas despacio y con cuidado 00:47:05
para que no me equivoque en ninguno de los cálculos y me cargue todas las cuentas, ¿vale? 00:47:11
Bueno, pues lo dejamos aquí y habríamos terminado este tema de estadística, ¿vale? 00:47:16
Que tengáis buena tarde. 00:47:23
Si hay alguna duda, pues me contáis al próximo día, ¿vale? 00:47:25
Venga, buena tarde. 00:47:28
Materias:
Matemáticas
Niveles educativos:
▼ Mostrar / ocultar niveles
  • Educación de personas adultas
    • Enseñanza básica para personas adultas
      • Alfabetización
      • Consolidación de conocimientos y técnicas instrumentales
    • Enseñanzas Iniciales
      • I 1º curso
      • I 2º curso
      • II 1º curso
      • II 2º curso
    • ESPAD
      • Primer Curso
      • Segundo Curso
      • Tercer Curso
      • Cuarto Curso
    • Pruebas libres título G ESO
    • Formación Técnico Profesional y Ocupacional
    • Alfabetización en lengua castellana (español para inmigrantes)
    • Enseñanzas para el desarrollo personal y la participación
    • Bachillerato adultos y distancia
      • Primer Curso
      • Segundo Curso
    • Enseñanza oficial de idiomas (That's English)
      • Módulo 1
      • Módulo 2
      • Módulo 3
      • Módulo 4
      • Módulo 5
      • Módulo 6
      • Módulo 7
      • Módulo 8
      • Módulo 9
    • Ciclo formativo grado medio a distancia
      • Primer Curso
      • Segundo Curso
    • Ciclo formativo grado superior a distancia
      • Primer Curso
      • Segundo Curso
    • Aulas Mentor
    • Ciclo formativo de grado básico
    • Primer Curso
    • Segundo Curso
    • Niveles para la obtención del título de E.S.O.
      • Nivel I
      • Nivel II
Autor/es:
Angel Luis Sanchez Sanchez
Subido por:
Angel Luis S.
Licencia:
Reconocimiento - No comercial - Compartir igual
Visualizaciones:
25
Fecha:
6 de mayo de 2025 - 17:19
Visibilidad:
Público
Centro:
CEPAPUB ORCASITAS
Duración:
47′ 30″
Relación de aspecto:
1.78:1
Resolución:
1280x720 píxeles
Tamaño:
1020.62 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid