Activa JavaScript para disfrutar de los vídeos de la Mediateca.
Clase 9-05-2024 Tema 8 - Estadística 2ªparte - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Una pequeña errata en el ejercicio que se explica. La Varianza es 1,7919 y la desviación típica 1,34
Pues continuamos con la segunda sesión dedicada a la estadística. El otro día vimos lo que es la introducción a la materia y nos metimos en cómo se trabaja con las tablas de frecuencia absolutas y relativas y vimos los parámetros estadísticos de centralización.
00:00:00
La media, la moda, la mediana y también vemos los percentiles y los cuartiles, ¿vale?
00:00:19
Nos quedaba por ver los parámetros estadísticos de dispersión, ¿vale?
00:00:26
Eso es lo que vamos a ver hoy.
00:00:31
Lo veremos rápidamente y nos pondremos a hacer un ejercicio lo más completo posible.
00:00:34
Es decir, en el examen, si yo pusiera todo, pues todo eso vendría en el ejercicio que vamos a hacer.
00:00:42
no quiere decir que os pregunte todo
00:00:48
pero que más o menos engloba un resumen muy amplio
00:00:51
de lo que hemos visto en este tema
00:00:56
entonces, las medidas de dispersión
00:00:58
lo que vienen a decir es
00:01:03
los datos, cómo se alejan
00:01:04
de un dato central
00:01:07
y en un rango cercano al dato que esté más
00:01:09
en la media
00:01:13
cuánto podremos encontrar
00:01:15
ahí de datos, porque
00:01:18
aquí viene un par de ejemplos
00:01:20
que son bastante
00:01:22
claros para explicarlo, y dice
00:01:23
la estadística es una ciencia según la cual
00:01:25
si yo me como un pollo y tú
00:01:28
no te comes ninguno
00:01:30
nos hemos comido como promedio
00:01:31
medio pollo cada uno
00:01:34
eso es así, pasos a la media
00:01:35
pero luego podemos encontrarnos
00:01:37
al mirar casos
00:01:39
aquí donde dice medir la dispersión
00:01:41
nos dice
00:01:44
Ese es el objetivo de estas medidas
00:01:45
Por ejemplo, los datos
00:01:47
Un dato es 20 y 20
00:01:49
Pues si yo calculo la media
00:01:51
Es 20
00:01:53
Y además los datos justo coinciden
00:01:54
Está todo muy centrado
00:01:56
Pero si yo tengo 15, 20, 20 y 25
00:01:58
La media
00:02:01
Sigue siendo 20
00:02:02
La moda, de hecho sigue siendo 20
00:02:04
Que es lo que más se repite en los dos casos
00:02:07
Y la mediana, si la calculáis
00:02:09
Es 20 también
00:02:11
luego aparentemente los datos
00:02:12
es lo mismo, misma media, misma moda
00:02:14
misma mediana, pero sobre esos datos
00:02:16
centrales, sobre ese 20
00:02:18
¿vale? resulta que en el segundo
00:02:20
caso tenemos datos que se alejan
00:02:22
el 15 y el 25
00:02:24
lo que pasa es que el que se pasa por exceso
00:02:26
compensa con el de defecto
00:02:29
¿vale?
00:02:31
entonces las medidas de centralización compensan
00:02:32
¿vale? y con la de dispersión
00:02:34
lo que se va a ver es los datos
00:02:36
en qué medidas se alejan o se
00:02:38
dispersan ¿vale?
00:02:40
por eso aquí nos dice
00:02:42
que para muestras
00:02:44
con una sola moda
00:02:46
y que son más o menos casi simétricas
00:02:48
alrededor de la media podemos considerar
00:02:51
un intervalo que contenga la mayoría de los datos
00:02:53
aquí ya viene un poco
00:02:55
de estadística, si dice por ejemplo
00:02:57
para una muestra con media 100 y desviación típica
00:02:58
10, que ahora os explicaré
00:03:01
qué es la desviación típica
00:03:03
quiere decir que 100 más 10 o 100 menos 10
00:03:04
puedo desviar 10 unidades
00:03:07
pues en el rango 90-110
00:03:08
voy a encontrar muchos datos. Aquí me dice
00:03:10
que voy a encontrar el 68%
00:03:12
de los datos. Si la desviación
00:03:14
fuera 20, es decir,
00:03:16
en este caso he ido 80, 120, voy a tener el 95%
00:03:18
de los datos.
00:03:21
Se van a ir alejando, pero
00:03:23
una gran mayoría están cerca de
00:03:24
ese valor, digamos, central.
00:03:26
Para eso nos va a servir estudiar
00:03:28
las medidas de dispersión.
00:03:30
¿Vale? Y nosotros
00:03:32
vamos a ver tres.
00:03:34
Vamos a ver el rango, que el otro día lo cité.
00:03:36
La variaz
00:03:39
Y la desviación típica. No vamos a entrar mucho en profundidad, ¿vale? El significado del rango es muy fácil. El rango es el intervalo que está definido entre el menor y el mayor de los datos que encontremos. Es decir, coger y restarlos.
00:03:40
Si en las notas de tu curso la nota más alta que has sacado es un 9 y la más baja es un 6, el rango será 9 menos 6, 3. Es decir, es la resta del valor más grande que encontramos con el más pequeño. Ese es el rango.
00:03:53
Es decir, para saber, nunca mejor dicho, en qué rango de datos nos estamos manejando, en qué intervalo vamos a encontrar los datos. Fuera de ese rango, ¿vale? No va a haber.
00:04:13
Varianza. Dice, la varianza es la media aritmética de los cuadrados de las diferencias de los datos con la media. Una frase que es difícil de entender.
00:04:24
tenemos aquí una fórmula
00:04:33
primero viene este simbolito
00:04:36
que es como una O pero arriba tiene como un rabillo
00:04:38
es una letra griega
00:04:41
que va a ser lo que significa
00:04:44
si está elevado al cuadrado la varianza
00:04:47
o también podemos verlo V igual
00:04:48
V sería la varianza en vez de este simbolito
00:04:50
y nos viene una fórmula
00:04:53
podemos coger esta primera
00:04:55
o podemos coger la segunda que es equivalente
00:04:57
si yo cojo la primera
00:04:59
este simbolito que es
00:05:00
el de sumatorio, que es la suma
00:05:02
¿la suma de qué? de las multiplicaciones
00:05:05
de f es la frecuencia
00:05:07
absoluta, es decir
00:05:09
de cada dato, ¿vale?
00:05:10
¿cuántas veces aparece multiplicado por
00:05:13
el dato menos la media?
00:05:15
claro, si el dato es
00:05:17
imaginar, 5 personas
00:05:18
han sacado un 8, ¿no?
00:05:20
pero la media de los exámenes es un 7
00:05:23
pues, ¿número de
00:05:25
frecuencia? 5 personas
00:05:27
por, nota, un 8
00:05:29
menos la media
00:05:31
La media puede ser un 6
00:05:31
Todo ello elevado al cuadrado
00:05:34
Sumar todo eso y luego dividirlo entre el número total de datos
00:05:36
Podría hacerlo de esta forma
00:05:41
O podría hacerlo sacando la media aquí
00:05:42
Al final
00:05:45
Nosotros vamos a usar
00:05:46
Para los ejercicios esta formulita
00:05:48
Mejor, ¿vale?
00:05:50
¿Vale? La segunda
00:05:53
Esta de aquí, ¿vale?
00:05:54
Porque para hacer las tablas
00:05:57
De frecuencias
00:05:58
de frecuencias, podemos añadir fácilmente
00:06:00
una nueva columna para poder
00:06:02
calcular estos productos.
00:06:04
¿Vale?
00:06:06
¿Perdona?
00:06:08
Sí, me da igual poner f sub i
00:06:10
por x sub i al cuadrado que ponerlo al revés.
00:06:12
Es lo mismo, ¿vale?
00:06:14
Y la desviación típica va a ser la raíz cuadrada
00:06:16
de la varianza.
00:06:18
Es decir, una vez que yo he calculado la varianza,
00:06:20
pues hago la raíz cuadrada.
00:06:22
Si la varianza
00:06:24
me da 16,
00:06:26
pues la desviación típica va a ser
00:06:28
4. Bien.
00:06:30
Estas fórmulas
00:06:35
os las daría
00:06:36
si aparecen en el examen.
00:06:39
Con todo esto,
00:06:42
nos vamos a ir a un ejercicio
00:06:43
porque vamos a entender mejor un poco
00:06:44
todo cómo se calcula. Repasamos
00:06:47
lo que ya vimos el otro día
00:06:49
y añadimos
00:06:51
cómo calcular, en este caso,
00:06:52
la varianza
00:06:56
y la desviación típica.
00:06:57
¿Sí? Pues nos vamos a ir
00:06:59
al papel.
00:07:01
Aquí. Y nos encontramos con este ejercicio. ¿Qué nos dice? En la vuelta de vacaciones, en un curso de segundo de la ESO, la profesora de matemáticas ha hecho una encuesta y ha preguntado a cada uno de los alumnos por el número de libros que ha leído durante el verano.
00:07:03
Al día siguiente, la profesora les ha traído el siguiente diagrama de barras basado en la encuesta del día anterior
00:07:22
A partir de ese diagrama, tenemos unas preguntas
00:07:30
En el examen os puedo poner una gráfica en la cual están los datos
00:07:34
Obvio, os puedo poner todos los datos y tendréis que hacer el conteo para saber las frecuencias
00:07:40
Luego, lo primero es entender la gráfica
00:07:45
Se ve aquí un poquito borroso, ¿vale? Pero en el eje horizontal, en el de las X, tenemos el número de libros leídos, es decir, se ha leído cero libros, uno, dos, tres, cuatro o cinco libros, y en el eje vertical, en el de las X, tenemos las frecuencias absolutas.
00:07:48
O lo que es lo mismo, ¿cuánta gente ha leído cero libros? Ningún libro, una persona. Un libro lo han leído cuatro personas. Dos libros lo han leído seis. Tres libros lo han leído cinco. Cuatro libros, cuatro. Y cinco libros lo han leído dos personas. Ahí tenemos los datos.
00:08:05
A partir de ahí me va a pedir, primero, que haga una tabla con las frecuencias absolutas y relativas, que esas las vimos el otro día.
00:08:28
Una vez que yo tengo la frecuencia absoluta y relativa, me sirve de ayuda para poder calcular los parámetros estadísticos de centralización.
00:08:34
Es decir, la media, la moda y la mediana.
00:08:44
También os podría pedir aquí el cuartil 3 o el percentil 10, con los datos que tendríamos calculados.
00:08:47
Y luego añadiríamos calcular los parámetros estadísticos de dispersión, rango, desviación típica y varianza, que es lo que hemos comentado antes, esas fórmulas, ¿vale?
00:08:57
Y yo os daría cuál es la varianza, os diría esta es la varianza, ¿vale? Y la desviación típica es la raíz cuadrada de la varianza.
00:09:08
En las fórmulas que comentabais antes me da igual encontrarme primero el x al cuadrado por la frecuencia
00:09:16
Que al revés, primero la f de la frecuencia por el x al cuadrado
00:09:24
No cambia nada
00:09:28
Y tendríamos que completar una tabla así, ¿vale?
00:09:30
En primer lugar tendríamos que poner los datos que me encuentre en este caso
00:09:35
Cero libros, un libro, dos libros, tres libros, cuatro libros y cinco libros, ¿no?
00:09:39
después tendría que completar las frecuencias absolutas
00:09:44
las frecuencias absolutas es
00:09:48
cuántas veces aparece cero libros
00:09:49
o dicho de otra forma, cuántas personas
00:09:52
no ha salido ningún libro
00:09:54
debo de mirar
00:09:55
lo que es la gráfica que tenemos
00:09:57
¿vale? no sé si la puedo poner aquí al lado
00:10:00
y si puede ver
00:10:02
teníamos que ningún libro
00:10:03
era una persona
00:10:06
pues la frecuencia absoluta de cero libros es uno
00:10:09
Un libro, cuatro personas. Dos libros, seis personas. Tres libros, cinco personas. Cuatro libros, cuatro personas. Y cinco libros, dos personas.
00:10:12
De esta forma ya he recogido todos los datos de la gráfica, ¿vale?
00:10:33
Y aquí puedo ver cuál es el número total de datos, el n, que llamábamos el otro día.
00:10:38
El número total de datos es la suma de las frecuencias absolutas, ¿vale?
00:10:43
1 y 4, 5, y 6, 11, y 5, 16, y 4, 20, y 2, 22.
00:10:47
Luego, total, son 22 alumnos.
00:10:54
Este es el número de datos.
00:10:58
con esto
00:11:00
yo puedo rellenar ahora mismo ya
00:11:03
las cuatro primeras columnas sin ninguna dificultad
00:11:05
me olvido de estas dos
00:11:07
que son las nuevas dos, ¿vale?
00:11:09
la frecuencia
00:11:11
absoluta acumulada
00:11:12
que es la F mayúscula
00:11:15
es el ir sumando las frecuencias
00:11:16
absolutas
00:11:19
yo lo
00:11:20
nazco de uno
00:11:21
un dato y cuatro datos
00:11:24
cinco
00:11:26
cinco y seis
00:11:28
11, 11 y 5
00:11:30
16, 16 y 4
00:11:32
20, 20 y 2
00:11:35
22
00:11:37
Siempre es igual, siempre sumando
00:11:38
con el siguiente
00:11:42
Sí, tiene que coincidir con el número total de datos
00:11:43
Ahora voy a ir
00:11:46
a las frecuencias relativas
00:11:48
Las frecuencias relativas son
00:11:51
las que, si yo quiero pensar
00:11:52
en una posición
00:11:54
¿Vale? Cuando digo la que está en el centro
00:11:56
el 50%, o un percentil, si os digo el percentil 10, yo buscaré ese 0,1, o lo que es lo mismo,
00:11:58
el 10%, y lo voy a buscar aquí. Por un lado está la frecuencia relativa y luego la acumulada,
00:12:06
¿vale? La relativa es número de datos 1 entre 22, ¿no? 1 entre 22. De momento lo
00:12:11
dejo así en forma de fracción, luego hacemos así
00:12:24
la división, ¿vale?
00:12:26
1 entre 22, este otro
00:12:28
es 4
00:12:30
entre 22
00:12:31
6
00:12:34
entre 22
00:12:35
5, perdón
00:12:37
5 entre 22
00:12:40
4 entre 22
00:12:41
y 2 entre
00:12:44
22, es decir, la frecuencia
00:12:45
entre el número
00:12:48
total de datos
00:12:50
¿sí?
00:12:52
Puedo hacer las divisiones, pues mirad, 1 entre 22, redondeando aproximadamente me da 0,045, 4 entre 22, 0,18, 6 entre 22, 0,27,
00:12:54
5 entre 22
00:13:18
0,23
00:13:23
4 entre 22
00:13:24
ya tenemos que era 0,18
00:13:28
y 2 entre 22
00:13:30
pues será 0,09
00:13:32
si yo sumo todo esto
00:13:35
me tiene que dar 1
00:13:37
o puede que me dé 0,99
00:13:39
por el tema de los decimales
00:13:41
que hemos ido quitando
00:13:43
de hecho si lo sumo
00:13:44
0,045
00:13:46
Más 0,18
00:13:49
Más 0,27
00:13:52
Más 0,23
00:13:54
Más 0,18
00:13:57
Más 0,09
00:14:00
En este caso
00:14:02
0,995
00:14:04
¿Vale?
00:14:07
0,995
00:14:09
Es decir, sí
00:14:12
Esto se aproxima a 1
00:14:12
Si os da 1,4
00:14:14
Pues habéis redondeado
00:14:17
un poquito mal, o habéis cogido
00:14:19
un poquito mal los decimales. Lo normal es que os dé
00:14:21
0,98, 0,99,
00:14:23
1,01, ¿vale?
00:14:25
Dependiendo cómo se
00:14:27
corten los decimales o se redondeen.
00:14:29
Vale. Frecuencia
00:14:31
relativa. La acumulada, ¿qué es?
00:14:33
Ir sumando.
00:14:35
Si yo ya he hecho la división, puedo sumar
00:14:37
la parte decimal.
00:14:39
Puedo trabajar con las fracciones y luego hacer
00:14:41
la división, también podría hacerlo.
00:14:43
Ya que tengo hechas las divisiones, pues sumo directamente.
00:14:45
¿Vale?
00:14:48
Igual que con la acumulada, en la relativa yo parto de 0,045 y ahora sumo a la siguiente, a 0,045 le sumamos el 0,18, ¿no? 0,045 más 0,18 y da 0,225.
00:14:49
¿Pero en los calculadores?
00:15:12
Ahora le sumamos 0,27
00:15:15
Más 0,27
00:15:20
Era 0,495
00:15:22
Le sumamos el siguiente que es 0,23
00:15:26
0,23
00:15:29
Por 0,725
00:15:31
Le sumamos 0,18
00:15:35
Por 0,905
00:15:38
Y le sumamos el 0,09
00:15:42
y me da 0,995
00:15:45
que era lo que esperábamos
00:15:49
ese casi y1
00:15:50
¿vale?
00:15:51
¿sí?
00:15:52
bien
00:15:54
esto
00:15:54
lo puedo dejar así
00:15:55
no tengo que hacer más
00:15:57
pero si yo quiero pensar en posiciones
00:15:57
que muchas veces
00:16:00
trabajamos mejor pensando
00:16:00
en porcentaje
00:16:02
¿vale?
00:16:04
es multiplicar por 100
00:16:05
si yo multiplico por 100
00:16:06
esto es el
00:16:08
4,5%
00:16:10
Este otro es el 22,5% de los datos, el 49,5%, el 72,5%, el 90,5% y bueno, el 99,5% de los datos o lo aproximamos al 100%, ¿vale?
00:16:13
Esto me va a servir para buscar también posiciones.
00:16:34
¿Con todo esto?
00:16:36
¿Sí?
00:16:40
¿Con todo esto pongamos el recetaje?
00:16:40
No es necesario
00:16:42
Porque vosotros mentalmente ya podéis saber que esto es el 4,5
00:16:43
Por eso lo he puesto con otro color también, ¿vale?
00:16:48
Pero que no sería necesario
00:16:51
Ahora vamos a las preguntas que me hacen
00:16:52
Calcula la media
00:16:54
La moda y la mediana
00:16:56
Paso a paso
00:16:59
La media
00:17:01
La media es
00:17:02
sumar
00:17:03
¿el qué?
00:17:06
¿qué tengo que hacer?
00:17:08
me falta hacer algo
00:17:12
¿para la media me falta algo?
00:17:13
la media es la suma de todos mis datos
00:17:21
¿no?
00:17:23
y dividido entre el número total de datos
00:17:24
¿qué me faltaría?
00:17:27
¿qué me faltaría?
00:17:31
me faltaría rellenar
00:17:31
esta columna
00:17:33
esta de aquí
00:17:35
Si recordáis. ¿Lo recordáis? La media es cero libros una vez, pues un cero. Un libro cuatro personas, pues es uno, uno, uno y uno y todo sumarlo. Es lo mismo sumar cuatro veces uno que hacer uno por cuatro.
00:17:37
El 2 han sido 6 personas
00:17:57
Luego yo tengo 2, 2, 2, 2, 2, 2
00:17:59
¿Vale?
00:18:02
La fórmula de la media
00:18:04
La media
00:18:06
La fórmula era
00:18:10
La suma del producto
00:18:11
De cada dato por su frecuencia
00:18:13
Absoluta, dividido entre el número total de datos
00:18:15
Luego aún me falta calcular este producto
00:18:18
¿Vale?
00:18:20
Y para eso tengo
00:18:22
Esta columna
00:18:23
¿Sí?
00:18:25
Esta columna es multiplicar
00:18:27
0 por 1, 1 por 4, 2 por 6, 3 por 5, 4 por 4, 5 por 2
00:18:30
Multiplico 0 por 1
00:18:33
1 por 4
00:18:38
4
00:18:40
2 por 6
00:18:42
12
00:18:43
3 por 5
00:18:44
15
00:18:46
4 por 4
00:18:47
16
00:18:48
Y 5 por 2
00:18:50
10
00:18:52
¿Y ahora qué hago?
00:18:54
Sumo todo esto
00:18:55
yo al sumar todo
00:18:56
aquí me voy a encontrar ya
00:18:58
aquí voy a tener que
00:19:00
el sumatorio
00:19:03
de las x y
00:19:04
por x y
00:19:06
más 4, 4 y 12, 16
00:19:10
y 15, 31
00:19:13
31 y 16
00:19:14
47 y 10
00:19:17
57
00:19:18
57 es la suma de
00:19:20
estos productos, es decir
00:19:24
mi media
00:19:25
que es
00:19:28
57 partido
00:19:29
del número de datos
00:19:32
¿qué número de datos era? 22
00:19:33
pues 57
00:19:36
partido de 22 es la media
00:19:38
y esa división
00:19:40
57 entre 22
00:19:42
me da 2,59
00:19:44
2,59
00:19:47
en el examen no haría falta que me pongáis
00:19:51
esta fórmula
00:19:55
si lo que sabemos es interpretar esto.
00:19:55
Si no es interpretarlo, lo pongo directamente.
00:19:59
¿Vale?
00:20:01
Luego, para la media, yo necesito sumar todos estos productos
00:20:02
y dividirlos entre el número total de datos.
00:20:07
Es decir, estos dos números tengo que dividirlos.
00:20:10
¿Vale?
00:20:14
Con eso tengo la media.
00:20:14
La moda es el dato que más se repite.
00:20:18
Y el dato que más se repite es el que tiene mayor frecuencia absoluta. ¿Cuál tiene mayor frecuencia absoluta? El 6. El 6 es la mayor frecuencia absoluta. Luego, la moda es el dato que corresponde a esta frecuencia. Es el 2.
00:20:21
Cuando yo me fijo digo, oye, la moda está aquí
00:20:40
Aquí está la moda
00:20:43
¿Vale?
00:20:46
Pues la moda
00:20:48
La moda es ¿Quién?
00:20:49
El 2, que está
00:20:55
6 veces
00:20:56
¿Vale?
00:20:59
Es el que tiene mayor frecuencia
00:21:01
Absoluta
00:21:03
¿Sí?
00:21:05
Vale
00:21:10
Ahora me voy a ir
00:21:11
a calcular
00:21:13
la mediana
00:21:14
¿vale?
00:21:16
y la mediana, es cierto que hubo en este ejercicio
00:21:18
como se han perdido por ahí decimales
00:21:21
bueno
00:21:23
podríamos encontrarnos con que la mediana
00:21:24
está entre dos datos, yo no le saben
00:21:27
o lo pondré, o intentaré ponerlo para que
00:21:28
que bueno, pues no quede entre dos datos
00:21:31
pero me voy a fijar aquí
00:21:33
en la frecuencia relativa acumulada
00:21:35
la mediana
00:21:37
es el dato que está en el 50%
00:21:39
¿vale?
00:21:40
Pues yo tengo que ver cuándo paso del 50%.
00:21:43
¿Cuándo paso del 50%?
00:21:45
Mirad, aquí llego al 4,5, al 22, al 49.
00:21:47
Aquí todavía no llega al 50.
00:21:52
En el siguiente intervalo paso del 50.
00:21:53
Luego, aquí estaría la mediana.
00:21:56
¿Vale?
00:21:59
Aquí.
00:22:00
Me fijo y aquí estaría, que se corresponde con el 3.
00:22:01
¿Vale?
00:22:05
La mediana es 3.
00:22:06
¿Vale?
00:22:13
El dato, el dato que se corresponde con este intervalo.
00:22:14
Un pequeño inciso, ¿vale?
00:22:19
Si alguien se fija muy al detalle, y me fijo en las frecuencias absolutas,
00:22:23
yo aquí he llegado hasta el 11, la mitad de 22 es 11.
00:22:28
Realmente la mediana estaría entre el dato 11 y el 12,
00:22:31
porque yo aquí he perdido decimales.
00:22:35
Como he perdido decimales, claro, aquí me debería de haber salido 0,5, exacto.
00:22:36
En ese caso, la mediana estaría entre los dos y tendría que hacer la media de 2 y 3 y la mediana sería 2 y medio. Si aquí me hubiera dado 50% exacto, ¿vale? Cualquiera de las dos interpretaciones la voy a dar por válida en el caso de que justo nos encontramos ahí, ¿vale?
00:22:41
Porque si yo miro la frecuencia relativa no llego al 50%.
00:23:00
En cambio, si yo me fijo en la acumulada, digo, oye, entre la posición 11 y 12,
00:23:03
luego estoy entre el 2 y el 3, la mediana realmente sería 2,5.
00:23:08
De hecho, sería más preciso decir 2,5.
00:23:12
Más preciso porque aquí no se ha perdido información y en la relativa acumulada sí.
00:23:15
¿Vale?
00:23:21
Pero es aquí donde yo me fijo.
00:23:23
De hecho, si yo os hubiera preguntado cuál es el percentil 20,
00:23:25
El percentil 20, yo tengo que ver cuándo paso del 20%.
00:23:30
El 20%, pues me fijo.
00:23:33
El 4 no llega todavía.
00:23:38
22, ya me he pasado del 20.
00:23:40
Pues aquí está, en este dato.
00:23:42
Pues el percentil 20, ¿quién sería?
00:23:44
Un 1, ¿vale?
00:23:47
Os pregunto el tercer cuartil, el Q3.
00:23:49
Ese es el 75%.
00:23:53
Los cuartiles son 25%, 50%, 75%.
00:23:55
Pues busca el 75. Con el 72 no ha llegado, pues el siguiente al 90.
00:24:00
Luego el tercer cuartil sería 4. ¿Vale? ¿Sí? Vale.
00:24:05
Con eso tenemos media moda y mediana, que es lo que vimos el otro día.
00:24:13
Ahora, ¿qué tenemos nuevo? Rango, desviación típica y varianza.
00:24:16
El rango es la diferencia entre el dato mayor y el menor.
00:24:22
Es decir, entre el mayor número de libros leídos y el menor número de libros leídos, que es lo que consiste este ejercicio. En nuestro caso, ¿el mayor dato cuál es? 5. ¿Y el menor dato es? 0. Pues el rango, ¿el rango quién es? 5 menos 0, 5. Ese es el rango. El rango es 5, ¿vale? Mayor menos menor. Esta es la parte fácil.
00:24:25
Ahora vamos a ir a
00:24:55
La desviación típica de la varianza
00:24:57
Que es esta fórmula
00:24:59
Puede parecer un poco rollo
00:25:02
Pero, mirad
00:25:05
Yo conozco quién es N
00:25:06
El número total de datos
00:25:08
A ver, aquí, que no se ve bien
00:25:09
Conozco quién es el número total de datos
00:25:12
Sí, es
00:25:14
22 datos, vale, pues este lo conozco
00:25:16
Conozco quién es la media
00:25:19
Esta X con la rayita es la media
00:25:20
Sí, la media la he calculado y es
00:25:22
2,59, ¿no?
00:25:24
Pues me dice que 2,59
00:25:26
al cuadrado.
00:25:28
Y luego va a ser sustituir.
00:25:31
Pero, ¿qué me queda? A mí me falta
00:25:32
este sumatorio.
00:25:34
Este sumatorio de
00:25:36
x sub i al cuadrado por f sub i.
00:25:38
Es decir, sumatorio de los datos al cuadrado
00:25:40
por su frecuencia.
00:25:42
Vale.
00:25:45
Mirad, yo aquí tengo otra columna
00:25:46
donde está el x al cuadrado por la frecuencia.
00:25:48
Que es lo que me viene.
00:25:51
El sumatorio va a ser la suma de toda esta columna
00:25:52
Luego lo que a mí me aparezca
00:25:55
Aquí abajo cuando suma de todo esto de aquí
00:25:58
Lo que me salga de esta casilla
00:26:01
Es lo que yo debo de poner aquí
00:26:03
¿Vale?
00:26:06
Luego voy a encontrarme una recta
00:26:09
Pero una división y una recta
00:26:12
Pero yo tengo que calcular primero
00:26:14
¿Quién va aquí?
00:26:15
Para ello debo de completar esta columna
00:26:17
¿Vale?
00:26:18
Como yo ya tengo
00:26:20
x por f
00:26:21
y ya tengo x cuadrado por f
00:26:24
¿qué tengo que hacer?
00:26:26
cada dato multiplicarlo
00:26:27
¿lo tengo que multiplicar por qué?
00:26:29
pues por el x y
00:26:32
me falta, porque solo tengo uno
00:26:33
va al cuadrado, es multiplicado otra vez por x
00:26:35
lo voy a multiplicar
00:26:37
por esta columna
00:26:39
0 por 0
00:26:40
1 por 4
00:26:44
4
00:26:46
2 por 12
00:26:48
24
00:26:50
3 por 15
00:26:52
45
00:26:54
4 por 16
00:26:57
64
00:26:59
y 5 por 10
00:27:03
50
00:27:05
ahora, tan solo
00:27:08
tenemos que sumar
00:27:11
tenemos que sumar 0
00:27:13
más 4
00:27:15
más 24
00:27:16
más 45
00:27:18
más 64
00:27:20
y más 50, que me da
00:27:22
187
00:27:24
187
00:27:26
este dato
00:27:29
este 187
00:27:31
es el que va a venir aquí arriba
00:27:32
es decir, yo le voy a calcular
00:27:34
la varianza
00:27:37
y la varianza
00:27:38
voy a copiar la fórmula aquí, ¿vale?
00:27:41
que es el sumatorio de x u y
00:27:43
al cuadrado
00:27:45
por la frecuencia absoluta
00:27:46
dividido entre el número de datos
00:27:49
menos la media al cuadrado
00:27:51
vale, aquí arriba
00:27:52
este sumatorio
00:27:56
es el dato que hemos calculado
00:27:57
es 187
00:28:00
pues sustituyo, digo, esto es igual a
00:28:02
aquí arriba va 187
00:28:04
partido entre el número de datos
00:28:06
¿cuántos datos tengo?
00:28:09
22
00:28:11
pues entre 22
00:28:11
y menos
00:28:13
lo que valga la
00:28:16
media al cuadrado
00:28:18
¿quiere la media?
00:28:21
Lo he calculado. 2,59. Vale, pues 2,59, todo ello al cuadrado. Y hay que hacer estas cuentas. Por supuesto que habría calculadoras en el examen.
00:28:23
Y esto sería igual
00:28:38
Hago primero la división
00:28:40
La de 187 entre 22
00:28:43
187 entre 22
00:28:46
Y da 8,5
00:28:51
Menos
00:28:53
Y ahora cojo 2,59
00:28:56
Por 2,59
00:28:59
Va al cuadrado
00:29:02
Y esto es
00:29:03
6,7081
00:29:05
y nos queda una resta
00:29:09
esta resta
00:29:13
8 menos
00:29:16
6,7081
00:29:18
es
00:29:21
1,2919
00:29:22
bueno, pues este numerito
00:29:26
este de aquí
00:29:27
es la varianza
00:29:29
¿vale?
00:29:31
y
00:29:33
la
00:29:33
la desviación típica es la raíz cuadrada de la varianza
00:29:36
luego
00:29:39
la desviación típica es
00:29:41
la raíz cuadrada de la varianza
00:29:43
fórmula que se verga
00:29:44
¿y qué sería la raíz cuadrada de qué?
00:29:46
de 1,29
00:29:49
19
00:29:52
y eso es
00:29:54
raíz cuadrada de
00:29:58
1,29
00:29:59
19
00:30:02
1,14 aproximadamente
00:30:02
pues 1,14
00:30:05
Pues esta sería la deducción típica. Esto sería un ejercicio, si yo os preguntara todo, que no quiere decir que en el examen os lo pregunte todo, porque os lleva mucho tiempo hacerlo.
00:30:08
¿Vale? Entonces, sería un ejercicio con todo lo más completo. ¿Sí? Incluso hemos comentado cómo se calculaban los percentiles y los cuartiles que no lo pedía el ejercicio.
00:30:21
¿Vale? Entonces, por resumir
00:30:32
Lo primero que hace falta es
00:30:35
Recopilar los datos
00:30:36
Puede que yo tenga el conteo
00:30:38
Y tenga que contarlo
00:30:40
O puede que me den una gráfica
00:30:41
Y con la gráfica yo interpreto
00:30:43
Y saco aquí cuáles son los datos
00:30:45
¿Vale? Tendré mis datos y mi frecuencia absoluta
00:30:47
¿Sí?
00:30:50
Sí
00:30:52
A partir de aquí es completar frecuencia absoluta con la acumulada
00:30:53
Que es ir sumando
00:30:55
La relativa es dividir entre el número de datos
00:30:56
Y la acumulada pues igual, cojo el primer dato y ya voy sumando
00:30:59
siempre comprobar que me tiene que dar
00:31:02
pues eso, o 1
00:31:05
o 100%
00:31:07
0,99
00:31:09
es decir, lo más próximo
00:31:11
si yo le hago 0,99
00:31:13
pues parece que la cosa
00:31:15
va más o menos bien calculada
00:31:17
si os sale una cosa muy lejana
00:31:19
os podéis haber equivocado
00:31:21
¿vale?
00:31:23
para calcular la moda
00:31:24
es el que tiene mayor frecuencia absoluta
00:31:27
para calcular
00:31:29
la media, yo tengo que
00:31:32
multiplicar el dato por su frecuencia
00:31:34
absoluta, el x sub i por f sub i
00:31:36
de todos ellos, ¿vale?
00:31:38
Lo multiplico y aquí abajo tengo
00:31:40
la suma. Y lo que hago después
00:31:42
esta suma la divido entre el número total
00:31:44
de datos, la media.
00:31:46
La mediana
00:31:49
es el segundo cuartil, es lo que ocupa
00:31:50
el 50%, está en el 50%
00:31:52
de los datos. Me fijo
00:31:54
en las frecuencias relativas acumuladas
00:31:56
y busco intervalos que
00:31:58
pase del 50%, ese es el que lo contiene
00:32:00
si me diera justo el 50%
00:32:02
pues entre ese intervalo y el siguiente
00:32:04
debo de hacer la media entre los datos
00:32:06
¿vale?
00:32:08
ya hemos comentado el caso peculiar
00:32:10
que se nos daba aquí, ¿vale?
00:32:12
¿percentiles?
00:32:16
pues igual, es buscar el porcentaje que
00:32:16
que se pida
00:32:19
¿vale?
00:32:20
y luego la parte, bueno, el rango, la diferencia
00:32:22
entre el mayor y el menor de los datos
00:32:24
y luego ya la desviación típica y varianza
00:32:26
necesito hacer esta columna extra
00:32:28
Y el valor que me da, sustituyo en la fórmula
00:32:30
Dividirlo entre el número de datos, entre la n
00:32:35
Y restarle la media que ya he calculado elevada al cuadrado
00:32:38
Y la desviación típica sería la raíz cuadrada de la varianza
00:32:41
Esto como ejercicio más completo
00:32:47
En los apuntes tenéis un montón de ejercicios
00:32:51
Con los que podéis practicar
00:32:55
¿Vale? Vienen ejercicios
00:32:57
Mirad, por ejemplo
00:32:59
Ahí va para abajo
00:33:01
Pero aquí vienen algunos resueltos
00:33:08
Incluso con pocos datos
00:33:09
Calcula la media y la desviación típica
00:33:11
Esto sin tabla
00:33:12
¿Vale? Otros con tablas
00:33:13
Recordad que si hablamos de intervalos
00:33:16
Yo tengo que poner cuál va a ser la marca de clase
00:33:19
Que va a ser el punto medio del intervalo
00:33:22
Como comentamos el otro día
00:33:24
Yo en el examen
00:33:25
No lo voy a complicar con intervalos
00:33:26
¿Vale? O lo daré ya directamente con datos
00:33:29
Y por aquí, más abajo
00:33:32
Esperar, pues viene el ejercicio
00:33:35
Por ejemplo
00:33:37
Pues aquí tienes un montón de datos
00:33:37
Y te dice, calcula el rango y la desviación media
00:33:40
De los datos
00:33:43
Aquí tienes el datos, hace el recuento
00:33:44
Y hace un diagrama de barras
00:33:51
Pero con todo eso podéis calcular
00:33:52
Mirad, datos, dice, calcula la media y la desviación típica
00:33:53
De los datos
00:33:57
Se puede calcular un poco todo
00:33:57
Cogéis cualquiera de estos y podéis calcular
00:34:00
Todo lo que hemos visto anteriormente
00:34:03
¿Vale?
00:34:05
Incluso viene por aquí
00:34:06
Fijaos este
00:34:07
Y se calcula la media de los datos
00:34:10
Dados por la tabla
00:34:12
Una vez que tenéis el X y la F
00:34:13
O sea, el dato X y la frecuencia absoluta
00:34:17
Ya podéis calcular todo
00:34:19
No solo la media
00:34:21
Todo
00:34:23
Porque al fin y al cabo
00:34:24
Esto es coger
00:34:25
Y tener a mano
00:34:27
bueno, hacerse una tabla
00:34:30
como la de antes
00:34:33
y a rellenar, no tiene más
00:34:34
¿vale?
00:34:38
entonces, con esto daríamos por finalizada
00:34:41
la parte de estadística
00:34:43
la semana que viene
00:34:45
vemos
00:34:47
la parte de probabilidad
00:34:49
y con ello tendríamos todo visto
00:34:50
para el examen del tercer trimestre
00:34:53
- Subido por:
- Diego R.
- Licencia:
- Reconocimiento - No comercial - Compartir igual
- Visualizaciones:
- 18
- Fecha:
- 9 de mayo de 2024 - 20:40
- Visibilidad:
- Público
- Centro:
- CEPAPUB SIERRA NORTE
- Duración:
- 34′ 58″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1920x1080 píxeles
- Tamaño:
- 897.61 MBytes