Activa JavaScript para disfrutar de los vídeos de la Mediateca.
Clase 25-04-2024 Tema 8 - Estadística 1ªparte - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Comenzamos con el tema 8, que está dedicado a la estadística y le vamos a dedicar dos sesiones.
00:00:01
La de hoy va a ser un poco más teórica y la de la semana que viene será más práctica y con ejercicios en el papel.
00:00:07
En el aula virtual podéis ver que tenemos un documento de teoría, que es el con el que trabajaremos hoy en pantalla.
00:00:15
Vamos a tener otro documento con ejercicios propuestos, que usaremos más la semana que viene.
00:00:24
Y también están los dos cuestionarios que podéis realizar. En el primero de ellos hay preguntas un poco más teóricas, una tabla de frecuencia que veremos qué es, algunos datos, podemos ver por aquí las primeras preguntas que son más teóricas, son cuestionarios cortitos de cinco preguntas y lo mismo sucede con el cuestionario dos.
00:00:29
Lo único que primero hace falta ver es todos los contenidos del tema.
00:00:59
Nos vamos a centrar con este documento de teoría, que es el que vamos a usar de soporte o de apoyo.
00:01:04
Lo primero, de todas formas, cuando vamos a hablar de estadística, aquí encontramos una pequeña definición.
00:01:12
La estadística se puede considerar una ciencia o una disciplina, en este caso de las matemáticas,
00:01:18
que lo que va a hacer va a ser trabajar con datos, intentar poner orden en los datos,
00:01:23
intentar estructurarlo de una forma que nos permita extraer información
00:01:30
y muchas veces puede sacar conclusiones, tomar decisiones.
00:01:35
Vamos a ver que a veces yo voy a poder trabajar con el 100% de los datos
00:01:40
de un conjunto que yo quiero estudiar, pero otras veces yo no puedo tener acceso
00:01:44
a la respuesta o al conjunto de todos los datos.
00:01:50
Por ejemplo, si hay unas elecciones generales para presidente del Gobierno,
00:01:54
no podemos preguntar previamente a, no sé, si hay 30 millones de personas que votan,
00:02:00
a las 30 millones de personas a quién van a votar.
00:02:07
Habrá que coger una muestra, una parte, ¿vale?
00:02:10
O si queremos preguntar en un municipio, queremos ir a Madrid,
00:02:14
y en Madrid Capital, que somos varios millones de personas, queremos saber cuál es el color
00:02:18
favorito de la gente. Pues no podemos preguntarle a todo el mundo. Habrá que coger una parte.
00:02:22
En cambio, habrá situaciones en las cuales, a lo mejor, en una clase con 25 alumnos, pues
00:02:28
queremos hacer un estudio de si las personas son rubias, morenas o cuál es la altura media.
00:02:33
Pues ahí, como el total de la clase es un número más o menos reducido, 25 personas,
00:02:38
pues posiblemente podamos hacer el estudio con todos los datos. ¿Vale? Entonces, a
00:02:43
Al final, eso es la estadística.
00:02:48
También es importante saber que la estadística no va a ser una ciencia exacta cuando yo trabajo con una muestra.
00:02:51
Yo puedo sacar unas conclusiones, ver hacia dónde van los datos,
00:02:58
pero no quiere decir que con eso yo pueda adivinar cosas que vayan a suceder.
00:03:03
Me podría acercar bastante, pero que sepamos que no es una ciencia exacta
00:03:08
y que muchas veces nos encontramos, sobre todo cuando vemos los medios de comunicación,
00:03:12
que se manipula la estadística.
00:03:17
O se manipulan los gráficos, ¿vale? Vamos a ver que aunque nosotros vamos a trabajar mucho con números y con tablas, pero también hay unas gráficas que van asociadas a los datos. Pues en los medios de comunicación es habitual encontrarse con gráficas que están manipuladas, ¿vale?
00:03:18
O lo vemos cuando hay cualquier debate entre los políticos que sacan gráfica
00:03:35
y al día siguiente salen los medios de comunicación
00:03:39
viendo cuántas mentiras se han contado con los gráficos
00:03:42
porque han manipulado los ejes, han manipulado el tamaño.
00:03:44
Entonces, con eso se juega mucho.
00:03:48
Estalística. Este bloque, ¿vale?
00:03:51
Este documento de contenido.
00:03:53
Lo primero que vamos a ver son algunas definiciones, ¿vale?
00:04:00
Como la definición de población y de muestra.
00:04:04
Y es que cuando vamos a hacer un estudio estadístico, pues yo puedo, no tengo lo que es la población, que la población es todo el conjunto de individuos que tiene una característica común, que es la que yo quiero estudiar, ¿vale? Y que, digamos, son susceptibles de ese estudio.
00:04:07
Pero de toda la población, yo a veces cojo solo una parte, esa parte de la que se llama la muestra, ¿vale? Que es un subconjunto de la población. Y lo que sí debe de elegirse de una manera representativa.
00:04:21
Es decir, si yo quiero saber, hablábamos de las elecciones generales, pues, o intentar predecir cuáles van a ser los resultados, yo no puedo coger solo los datos de la Comunidad de Madrid, tendré que coger los datos de las 17 comunidades autónomas.
00:04:31
Es más, los suyos que lo coja de todas las provincias, que coja un número también proporcional de hombres y de mujeres y los rangos de edades, es decir, que al final la muestra se va a estratificar en muchos subconjuntos, ¿vale? Porque no será lo mismo posiblemente lo que piense la mayoría de la gente de 18 años que con la gente de 65, o la gente del País Vasco y la gente de la Comunidad Valenciana, ¿vale?
00:04:47
Entonces, es importante saber cómo elegir la muestra. Cuando vamos a hacer un estudio, vamos a hablar de que vamos a analizar un atributo, una cualidad, que podrá ser cualitativa o cuantitativa.
00:05:15
Nosotros podemos estudiar si en una clase los alumnos son rubios, morenos, castaños o pelirrojos
00:05:29
Eso es algo cualitativo
00:05:37
O cuál es el color favorito o tu deporte favorito
00:05:38
Porque no es una cantidad
00:05:43
Simplemente son distintas respuestas o alternativas que se pueden mostrar
00:05:44
Y luego están las variables que son cuantitativas
00:05:47
Es decir, aquellas que al final se van a trabajar de una manera numérica
00:05:51
Y dentro de que sean numéricas vamos a poder encontrarnos unos datos que sean o discretos o continuos. Puede que la respuesta sea el número de hijos que tienen las personas de un municipio. Las respuestas que vamos a obtener son 0, 1, 2, 3. Pero yo entre el 0 y el 1 o entre el 1 y el 2 no voy a encontrar una respuesta intermedia.
00:05:55
no tienes un hijo y medio
00:06:19
o tienes uno o tienes dos
00:06:22
en cambio
00:06:23
en las variables continuas
00:06:25
entre dos valores
00:06:28
puedo encontrar un valor intermedio
00:06:29
puedo irme a la altura
00:06:31
una persona mide
00:06:36
1,60 y otro mide 1,61
00:06:38
pero si somos tiquismiquis
00:06:40
con los milímetros
00:06:42
alguien puede medir 1,605
00:06:43
que está entre
00:06:45
1,60 y 1,61
00:06:47
puede alcanzar un valor intermedio.
00:06:49
Otras cosas como yo lo recojo luego en el
00:06:52
estudio, pero al final es lo que se llama
00:06:54
la continuidad, que puede alcanzar
00:06:56
cualquier valor, ¿vale? No solo
00:06:58
números enteros.
00:07:00
Nosotros, en los ejercicios,
00:07:03
vamos a trabajar
00:07:05
con todo un poco, pero
00:07:06
digamos que va a ser casi más
00:07:08
con valores discretos, ¿vale?
00:07:12
O si hablamos de altura, pues yo entiendo que
00:07:14
gustan unos 60 y unos 61, no vamos a dar esos valores intermedios, pero que lo entendamos lo que significa, ¿vale?
00:07:16
Si la mayoría tiene 1,8 hijos, vamos a ver qué cosas podemos calcular con esos datos, por ejemplo, ¿cuál es la media?
00:07:23
La media de hijos de un municipio o de España es 1,8, lógicamente tú no tienes 1,8, pero numéricamente vas a poder
00:07:40
hacer un cálculo, que te dice
00:07:49
la media base, es como los exámenes
00:07:51
a nivel individual, tú sacas
00:07:53
unas notas a lo largo del curso
00:07:55
pero luego al final tu calificación final es la nota media
00:07:57
veremos
00:07:59
cómo se calcula la nota media
00:08:01
¿vale? pero habrá que ver también
00:08:03
cómo se producen diversas dispersiones
00:08:05
como algunos datos sobre esa medida
00:08:07
de centralización
00:08:09
¿vale? hay valores que
00:08:10
destacan por arriba y por abajo
00:08:13
habrá quien tenga 6 hijos
00:08:14
y habrá quien tenga 0 hijos, pues habrá que ver
00:08:17
también esas, no son anomalías, son dispersiones realmente de los datos. Lo primero que vamos
00:08:19
a hacer en cualquier estudio estadístico va a ser hacer un recuento de las respuestas.
00:08:28
Vamos a hacer unas preguntas, es decir, primero habrá que saber qué vamos a preguntar, luego
00:08:32
nos vamos a ir a nuestra muestra, es decir, a esos individuos que son susceptibles de
00:08:39
darnos esa respuesta, bien porque la preguntemos o bien porque sea algo que analicemos. Pensar
00:08:44
en el mundo animal, van a coger una muestra de ovejas de distintos rebaños para analizar
00:08:48
alguna cualidad o una patología. Las ovejas no responden, nosotros buscamos la respuesta.
00:08:55
Por eso se usa la palabra individuos. Y vamos a tener unos datos que mirar. Frecuencia absoluta,
00:09:02
frecuencia relativa y frecuencia acumulada. Mirad la imagen. En este caso tenemos respuestas
00:09:09
de colores, por ejemplo, que nos pregunten cuál es tu color favorito. Y estas son las
00:09:17
respuestas que nos han dado. Pues lo primero, yo tengo que hacer un recuento de una forma
00:09:21
o de otra, según como sean los datos. Aquí está hecho como cuando elegimos delegado
00:09:26
en clase, que vamos haciendo rayitas, pero yo al final tengo que contar cuántos rojos
00:09:31
hay, cuántos verdes, cuántos azules, cuántos amarillos y cuántos turquesas. Y tengo 6,
00:09:37
8, 7, 5 y 4. Esa es lo que se llama la frecuencia absoluta. La frecuencia absoluta es el número
00:09:41
de veces que aparece el rojo, ese valor. ¿Ese valor cuántas veces aparece? El rojo aparece
00:09:50
6 veces, el verde 8 veces. Y la frecuencia absoluta se suele escribir con esta f minúscula
00:09:59
y esto que pone y, f su y
00:10:06
o la x que pone x su y
00:10:08
es porque los datos yo puedo
00:10:10
cuando los vaya a trabajar
00:10:12
¿vale? a veces en vez de rojo
00:10:14
o ver azul, lo voy a llamar el dato
00:10:16
1, 2, 3, el x su 1
00:10:18
x su 2, x su 3
00:10:20
¿vale? pues se pone lo de la y
00:10:22
el f su y pues igual, la frecuencia del 1
00:10:24
del 2, ¿vale?
00:10:26
porque luego habrá unas fórmulas matemáticas
00:10:28
que es como una suma de muchos datos
00:10:30
un sumatorio, y te voy a decir, oye, es un sumatorio
00:10:32
desde el primer dato hasta
00:10:34
el último, que será el quinto
00:10:35
o el octavo, depende de cuantos
00:10:38
tenga, ¿vale? F minúscula
00:10:39
va a ser la frecuencia absoluta y este es
00:10:42
uno de los datos más importantes para poder trabajar
00:10:44
¿vale?
00:10:46
luego voy a tener, me voy a la frecuencia
00:10:47
acumulada
00:10:50
me salto esta columna intermedia
00:10:51
y me voy a la de la derecha, F mayúscula
00:10:54
esta de aquí, ¿no?
00:10:56
¿sí?
00:10:58
que en este caso
00:11:00
ya os digo que este dato aquí está
00:11:01
está mal calculado
00:11:04
¿vale?
00:11:06
pero la acumulada
00:11:07
¿vale?
00:11:09
es la suma
00:11:10
ahora lo veremos con una tabla
00:11:12
pero es que aquí está mal
00:11:13
la suma de las frecuencias
00:11:14
que se van acumulando
00:11:16
si yo comienzo con el rojo
00:11:17
¿vale?
00:11:19
tengo 6 datos
00:11:20
pues acumulados van 6
00:11:21
cuando voy al verde
00:11:23
tengo 6 más 8
00:11:24
14
00:11:25
14 más 7
00:11:26
21
00:11:28
ya llevo 21 datos acumulados
00:11:29
21 más 5
00:11:30
26
00:11:31
26 más 4
00:11:32
30
00:11:33
30 en total, yo puedo acumular hasta el número total de datos. Frecuencia absoluta acumulada, que me va a servir para poder ver cómo se van situando los datos.
00:11:34
Yo cuando llevo el 50% de los datos, por ejemplo. Pero claro, si yo calculo hasta 30, no me viene, digamos, cuando llevo el 50% yo espero ver el 50% de alguna forma.
00:11:46
Para eso voy a usar la frecuencia relativa
00:11:59
La frecuencia relativa va a ser la división
00:12:01
División de la frecuencia absoluta, que es el número de datos que tengo
00:12:03
¿Vale?
00:12:07
Entre el número total
00:12:08
En este caso tengo 30 respuestas de colores
00:12:10
Pues la frecuencia relativa va a ser la frecuencia absoluta
00:12:13
Dividido el número total de datos, en este caso entre 30
00:12:19
Yo diría 60 entre 30, 0,20
00:12:22
80 entre 30, 0,21
00:12:25
7 entre 30, 0.15
00:12:27
5 entre 30, 0.33
00:12:30
4 entre 30, 0.11
00:12:31
Y todos estos, si yo los sumo
00:12:33
¿Qué me va a dar?
00:12:35
1
00:12:38
Claro, si yo esto lo multiplicara
00:12:38
Por 100
00:12:41
¿Qué tendría? Un porcentaje
00:12:43
Diría, oye, que es que el rojo
00:12:45
El rojo le ha contestado el 20% de las personas
00:12:48
El verde ha contestado
00:12:50
El 21% de las personas
00:12:52
Yo no voy a escribir porcentajes
00:12:53
Pero mentalmente pensar que yo esto lo puedo multiplicar por 100
00:12:55
Y luego voy a tener otra columna
00:12:58
Que aquí no nos aparece todavía
00:13:01
Pero ya lo adelanto
00:13:02
Que va a ser la frecuencia relativa acumulada
00:13:03
De tal forma que este porcentaje
00:13:07
Por entenderlo de alguna forma
00:13:10
Los voy a ir sumando
00:13:11
Digo, oye, este va al 20%, ¿no?
00:13:11
Venga, pues el 20
00:13:14
Y este va al 21
00:13:15
20 y 21 ya va al 41%
00:13:16
Y ahora le sumo al 0,15
00:13:18
Pues 41 y 15
00:13:20
0,56
00:13:22
Cuando yo llego a este dato aquí atraveso el 50%
00:13:24
Si yo quiero buscar qué dato está en la mitad, por ejemplo
00:13:27
Si yo los tengo en un orden
00:13:30
¿Vale? Eso lo vamos a usar luego en los ejercicios
00:13:32
Luego yo voy a tener dos frecuencias, ¿vale?
00:13:35
Frecuencia absoluta, que es el número de veces
00:13:38
Que se ha dado, digamos, una respuesta
00:13:41
¿Vale? Y la frecuencia absoluta relativa es
00:13:44
La absoluta entre el número total de datos
00:13:47
Que lo que subyace ahí es la idea de qué porcentaje de individuos han dado por respuesta rojo, verde y azul
00:13:51
Y luego está la acumulada, la acumulada es ir sumando todas las frecuencias que ya han ido apareciendo
00:14:01
Con todo esto vamos a poder dibujar distintos gráficos
00:14:08
Simplemente para saber cuántas respuestas hemos obtenido para cada dato
00:14:14
una de ellas es el diagrama
00:14:19
de sectores, el de los quesitos
00:14:22
pero si yo
00:14:24
quiero dibujarlo de una manera
00:14:26
exacta, no a ojo
00:14:28
aproximada, o sea yo sé que si
00:14:30
yo miro los datos digo oye pues
00:14:32
el que más ha respondido
00:14:34
es el verde que ha dado un 8
00:14:36
pues yo sé que el verde tiene que ser el quesito más grande
00:14:37
y si el turquesa lo han dicho
00:14:39
4 debería de ser la mitad del verde
00:14:42
pues 4 es la mitad de 8
00:14:43
pues por tamaño debe ser la mitad
00:14:46
pero si yo lo ahojo
00:14:47
no me va a quedar ni la mitad
00:14:50
y el último quesito ya no me va a quedar espacio
00:14:51
o me va a quedar muy grande
00:14:54
¿vale? si yo quiero hacerlo bien
00:14:55
¿vale? lo que vamos a trabajar va a ser
00:14:58
con que la circunferencia tiene 360 grados
00:15:00
y yo voy a repartir
00:15:02
esos 360 grados
00:15:04
para que os hagáis la idea
00:15:06
si en total hay 30 respuestas
00:15:07
30 respuestas
00:15:10
se corresponde con 360 grados
00:15:12
a partir de aquí yo hago una regla de 3
00:15:14
Digo, si 30 respuestas es 360 grados
00:15:16
6 respuestas es X
00:15:21
O lo que es lo mismo
00:15:24
Yo voy a multiplicar, va a ser 6 por 360
00:15:25
Va a ser siempre
00:15:28
El dato que tengo frecuencia absoluta
00:15:29
Por 360
00:15:31
Dividido entre el número de datos
00:15:33
Si yo no me quiero aprender eso
00:15:34
Lo puedo calcular con una regla de 3
00:15:37
¿Sí?
00:15:39
El total de datos es 360 grados
00:15:41
Mis datos, X
00:15:44
Fijaros
00:15:45
Pues 4 por 360 es de 30. 48 grados. 5 por 360 es de 30. 7 por 360 es de 30. Siempre es la misma operación, cambia las frecuencias. Si yo sumo todos los grados, me tiene que sumar el qué? 360 grados.
00:15:46
Que lo quiero ver como proporción, pues aquí lo tengo. Frecuencia entre el número total de datos es igual a qué? A los grados que yo quiero calcular, que es X partido 360. Pues es lo mismo, ¿vale? Y de esta forma podemos dibujar correctamente un diagrama de sectores, ¿vale?
00:16:02
el diagrama de barras
00:16:22
pues va a ser cada uno de los dos ejes
00:16:25
eje horizontal, eje
00:16:27
vertical, ¿vale?
00:16:29
y en el eje
00:16:32
de las X voy a poner los datos que tenga
00:16:35
claro, lo ideal muchas veces es
00:16:37
trabajar con números, si yo tengo 0, 1, 2, 3
00:16:39
pues lo voy a poner de manera correlativa
00:16:41
cuando sean variables
00:16:43
cualitativas, bueno, pues aquí debajo en la leyenda
00:16:44
pondré rojo, verde, azul
00:16:47
¿vale? o en este caso es muy claro
00:16:49
porque cada uno lo pintó de su color
00:16:51
Y lo que va a hacer va a ser levantar hacia arriba
00:16:52
¿Vale? ¿El qué?
00:16:55
Pues una línea, un rectángulo
00:16:57
Que corresponda con la frecuencia absoluta
00:16:59
¿El rojo?
00:17:01
6 personas, pues
00:17:02
El verde ha respondido 8
00:17:04
Pues la frecuencia absoluta 8
00:17:06
Y así con cada uno de ellos
00:17:08
¿Vale? Diagrama de barras
00:17:09
Fijaros que
00:17:12
Hay un hueco entre uno y otro, no están pegados
00:17:14
No es como cuando yo trabajo
00:17:16
Con un intervalo numérico
00:17:18
¿Vale? En este caso
00:17:20
están un poquito separados
00:17:21
¿vale?
00:17:24
fijaros, luego vamos a ir al histograma
00:17:28
aquí están pegados, ¿a que sí?
00:17:30
¿sí? pero voy a introducir
00:17:32
ya que tengo esta gráfica aquí, el polígono
00:17:34
de frecuencias
00:17:36
aunque este ejercicio esté hecho
00:17:36
con números, con 0, 1, 2, 3, 4
00:17:40
me da igual, pensad que son los colores
00:17:42
color rojo, verde, azul, amarillo
00:17:44
¿sí? vale, y aquí tengo
00:17:45
su diagrama de barras
00:17:48
el polígono de frecuencias que es
00:17:49
unir el vértice de cada uno
00:17:52
o el extremo superior
00:17:55
de cada uno de estos
00:17:57
¿vale?
00:17:58
de estas barras, las uno
00:18:00
y me muestra como la evolución
00:18:02
¿lo veis?
00:18:05
¿sí?
00:18:07
esto con el diagrama de barras, claro, si tiene
00:18:08
forma de rectángulo
00:18:10
voy a tener que coger el punto medio
00:18:13
no es lo mismo que yo levante una línea
00:18:15
aunque tenga cierto grosor
00:18:18
¿qué punto de aquí arriba uno?
00:18:20
y aquí también voy a poder dibujar
00:18:22
un histograma
00:18:24
un polígono de frecuencia, perdonad
00:18:26
pero con el punto medio
00:18:28
vuelvo para arriba, ¿vale?
00:18:29
estábamos aquí
00:18:33
y vamos a ver
00:18:33
algunos ejercicios así a grosor
00:18:36
¿vale?
00:18:38
un ejercicio puede ser
00:18:41
haz recuento de los siguientes datos
00:18:43
¿qué tenemos que hacer? calcular frecuencias absolutas, nada más
00:18:45
Y contar cuántas veces está el 1, el 2, el 3 y el 4
00:18:48
Colocarlo en la tabla
00:18:51
¿Vale?
00:18:52
Yo con estos datos
00:18:54
Podría calcular el resto de frecuencias
00:18:55
¿Vale?
00:18:59
Voy a copiar esta tabla
00:19:00
Y vamos a ver cómo la haríamos
00:19:02
¿Vale?
00:19:05
Vamos a ver
00:19:05
Los datos que tenemos es
00:19:09
3, 8
00:19:11
4 y 9
00:19:13
Un segundín
00:19:16
Y me voy a la cámara
00:19:23
Aquí
00:19:26
Esto es lo que tenemos
00:19:28
Frecuencia absoluta, ¿no?
00:19:29
Están recogidos todas esas respuestas
00:19:33
Que nos habían dado
00:19:35
¿Cuántas hay? 3 y 8, 11
00:19:35
11 y 4, 15
00:19:38
15 y 9, 24, ¿no?
00:19:41
Pues el número total es
00:19:43
24
00:19:45
Y lo pongo, ¿vale?
00:19:47
Número total de datos
00:19:50
Este es el número total de datos
00:19:51
¿Vale?
00:19:54
24. Tengo la frecuencia absoluta y yo puedo poner también la frecuencia absoluta acumulada, la F mayúscula.
00:19:56
Yo arranco con tres datos. Pues de momento solo acumulo tres.
00:20:06
Tras considerar los que me han respondido 1 y 2, imagina que esto es el número de hijos, 1, 2, 3 o 4, ¿vale?
00:20:13
¿Vale? Pues yo aquí sumo los que tienen un hijo y los que tienen dos hijos, que son 3 más 8, van a 11. En el siguiente sumo 11 más 4, 15. Y al final sumo 15 más 9, 24. Y me tiene que coincidir con el número total de datos. ¿Vale? Esto es como un sumatorio, se llama un sumatorio en matemáticas. ¿Vale?
00:20:19
Ahora van las frecuencias relativas
00:20:42
Las relativas son las que cada dato
00:20:45
Lo divido
00:20:48
¿Entre qué?
00:20:49
Entre 24
00:20:50
¿Vale?
00:20:51
La frecuencia relativa
00:20:53
Se suele poner una H
00:20:54
Pero es lo que veíamos ahí
00:20:56
Que aparecía F sub i
00:21:00
Entre el número de datos
00:21:01
Esa división
00:21:03
3 entre 24
00:21:05
3 entre 24
00:21:07
Y yo puedo hacer la división
00:21:09
Vamos a ver
00:21:11
Vamos a hacer las divisiones
00:21:18
3 entre 24
00:21:19
0,125
00:21:22
Hablamos del 12,5%
00:21:26
El siguiente es
00:21:27
8 entre 24
00:21:30
8 entre 24
00:21:33
Pues 0,333
00:21:35
Como salen infinitas cifras decimales
00:21:40
Si yo luego aquí sumara
00:21:42
Puede que me llegara 1
00:21:44
Me quede 0,999
00:21:45
Normal que se pierda precisión
00:21:47
Lo estoy haciendo con 3 cifras decimales
00:21:49
Lo pude haber hecho con 2 cifras decimales
00:21:51
¿Vale?
00:21:53
El siguiente es 4
00:21:55
Entre
00:21:56
Número total de datos
00:21:59
Pues 4 entre 24
00:22:00
Me da 0,1666
00:22:02
o habrá quien redonde como 1, 6, 7
00:22:07
que diga voy a redondear
00:22:10
¿vale? podría haber redondeado perfectamente
00:22:11
no lo he hecho
00:22:14
he truncado directamente
00:22:15
y el último 9
00:22:17
entre 24
00:22:19
9 entre 24
00:22:21
me da 0,375
00:22:24
¿si?
00:22:27
esta es la frecuencia relativa
00:22:29
y ya tengo la frecuencia relativa
00:22:32
acumulada
00:22:34
acumulada. ¿Y qué es? Estos porcentajes, no es porcentaje, pero me lo voy a entender
00:22:36
mejor así. Estos los voy a sumar. ¿Y al final qué me tiene que dar? Pues 1, me va
00:22:42
a acumular 1, que es el 100%. O bueno, como es corta decimal, me puede quedar 0,99, o
00:22:49
si es redondeado me puede quedar 1,01, ¿vale? Pero porque hemos redondeado, no por otra
00:22:55
cosa vale lo arrancamos con acumulada de primeras 0 con 125 ahora que le sumamos 0,333 y me da 0,45
00:23:00
8
00:23:15
Ahora que le sumamos
00:23:16
0,166
00:23:18
Me da 0,624
00:23:24
Y ahora le sumamos
00:23:28
0,375
00:23:29
Y oh sorpresa
00:23:31
Me da 0,999
00:23:33
Lo que esperábamos, vamos
00:23:35
Yo puedo aquí redondear
00:23:37
Y decir, vale, que esto es un 1
00:23:39
¿Vale?
00:23:40
Bien, diréis, ¿y esto para qué?
00:23:42
Porque nos va a ayudar para la parte
00:23:45
Que ahora vamos a tener
00:23:47
Que yo necesito unos datos que estudiar
00:23:49
Como la media que comentabais
00:23:50
¿Vale? ¿Cómo calcular ese valor de la media?
00:23:52
¿Cómo calcular otro que se llama la mediana?
00:23:55
Y que es la mediana
00:23:57
¿Cómo calcular lo que es la moda?
00:23:58
Bien, pues de aquí lo vamos a poder sacar
00:24:01
¿Vale?
00:24:03
Continúo y luego volvemos a este ejercicio
00:24:05
Para intentar resolverlo
00:24:07
¿Os parece?
00:24:08
Pero lo primero es saber que de manera más o menos mecánica
00:24:10
yo tengo una tabla que es la que me va a ayudar
00:24:13
¿vale?
00:24:15
yo con esta tabla así
00:24:17
voy a poder calcular lo que se llama
00:24:19
la media, la moda, la mediana
00:24:21
incluso los cuartiles
00:24:23
y los percentiles que puede que también os suene
00:24:25
por ejemplo cuando se tiene
00:24:27
un bebé y te dice que está
00:24:29
en el percentil 30 o en el 70
00:24:31
porque el niño va
00:24:34
de peso más bajo
00:24:35
o más alto
00:24:37
¿vale? pues vamos a ver qué significa
00:24:39
qué significa y cómo encontrar ese valor con la ayuda de la tabla.
00:24:42
Luego, para otros valores que usaremos más adelante, para estudiar la dispersión,
00:24:47
usaremos otras columnas auxiliares, que me van a ayudar a hacer las cuentas.
00:24:51
¿Por qué? Porque no es lo mismo si yo tengo 5 respuestas,
00:24:59
se puede hacer todo más o menos rápido y casi sin tabla,
00:25:03
pero si yo tengo 200 respuestas, voy a tener que agrupar la información.
00:25:07
Y para eso me va a ayudar mucho la tabla, ¿vale?
00:25:12
Volvemos a nuestro documento.
00:25:17
Bueno, ahí vienen ejemplos.
00:25:21
Otro caso que tenemos es que muchas veces los datos vamos a tener que agruparlos.
00:25:24
Pensad que yo tengo que o voy a estudiar la altura de las personas.
00:25:30
Pues voy a ir centímetro a centímetro.
00:25:35
¿Cuántos datos voy a tener? Un montón.
00:25:38
Pues yo voy a coger el dato más pequeño
00:25:39
El dato más grande
00:25:41
Y voy a trabajar intervalos
00:25:43
¿Vale?
00:25:44
Imaginar que la altura más pequeña
00:25:45
Es 153
00:25:48
Y la mayor de las alturas
00:25:52
Es 183
00:25:54
Pues a lo mejor digo
00:25:56
Mira, pues mientras hace intervalos
00:25:58
De 5 en 5 centímetros
00:25:59
¿Vale?
00:26:00
Venga, pues comienzo en el 150
00:26:02
Venga, 150 a 155
00:26:03
El siguiente que me va de 155
00:26:05
a 160
00:26:08
de 160 a 165
00:26:10
y así progresivamente
00:26:12
muchas veces también lo que se hace es
00:26:13
comenzar el intervalo primero
00:26:16
que comienza con la primera de las respuestas
00:26:18
también se usa eso
00:26:20
depende como yo vaya a analizar los datos
00:26:21
es como, ¿cómo de grandes son los intervalos?
00:26:24
pues ya
00:26:28
tendremos que tomar decisiones
00:26:28
lógicamente cuanto más pequeños
00:26:30
sean los intervalos
00:26:32
la información va a ser más precisa
00:26:34
cuando pueda calcular
00:26:37
lo que son medidas de centralización
00:26:38
o de dispersión
00:26:41
aquí vienen un montón
00:26:42
de datos, da igual lo que significan
00:26:45
a mí, pero tengo datos como el número
00:26:47
14 y otro
00:26:49
como el 829
00:26:51
están muy separados
00:26:52
pues aquí dice que
00:26:54
imagina que decimos, agrúpalo
00:26:56
en 5 intervalos
00:26:58
pues tú buscas cuál es el más grande
00:27:00
y el más pequeño, el más pequeño es 14
00:27:03
y el más grande
00:27:04
Pues decía, ojo
00:27:05
975
00:27:08
Aquí 945
00:27:11
975, ¿vale?
00:27:13
Digo, venga, pues voy a hacerlo entre 0 y 1000
00:27:15
¿Cómo? Quiero 5 intervalos
00:27:16
De 0 a 1000
00:27:19
Bueno, 1000 menos 0 es 1000
00:27:20
1000 lo divido en 5 partes, entre 5
00:27:22
Pues cada intervalo son 200 unidades
00:27:25
Me dice, el primer intervalo me va de 0 a 200
00:27:27
El siguiente de 200 a 400
00:27:29
400, 600
00:27:32
600, 800 y 800, 1000
00:27:33
Pero, fijaros en los símbolos que hay a izquierda y a derecha, que el otro día cuando las funciones ya vimos que significaba que me aparezca un corchete o un paréntesis en un intervalo. El corchete significa que este punto, este extremo, está incluido, mientras que el paréntesis significa que este punto no está incluido.
00:27:35
Es decir, en el 0 al 200, tengo incluidos todos los puntos que me van del 0 al 200 menos el 200.
00:27:58
El 200 no.
00:28:05
199 sí, pero el 200 cae fuera.
00:28:07
El 200 se iría al siguiente intervalo.
00:28:10
El siguiente intervalo es el 200, 400.
00:28:12
Fijaros, 200 cerrado, 400 abierto.
00:28:15
Y así todos ellos, ¿vale?
00:28:21
Claro, yo recuento y digo, vale, entre el 0 y el 200 tengo 10 datos.
00:28:23
Frecuencia.
00:28:28
De todos estos datos, ¿vale?
00:28:30
Los busco y digo, tengo 10.
00:28:32
Entre el 200 y el 400, ¿cuántos tengo?
00:28:34
13.
00:28:37
Entre el 400 y el 600, 9.
00:28:38
Así todos ellos, ¿vale?
00:28:40
Pero cuidado, hay otra cosa más.
00:28:42
Digo, vale, yo tengo la frecuencia.
00:28:45
Pero una vez que yo cuento que tengo 10 dentro de este intervalo,
00:28:47
yo voy a tener que hacer cuentas
00:28:49
y qué es lo que sumo o qué es lo que resto.
00:28:50
Voy a necesitar una cosa que se llama
00:28:53
la marca de clase. Es decir,
00:28:55
Todos los datos que caen dentro del intervalo 0, 200
00:28:56
Les voy a asignar un mismo valor
00:28:59
Ahora, si da un mismo valor
00:29:01
Ya estoy perdiendo esa actitud
00:29:03
¿Vale?
00:29:06
¿Y qué número le asigno?
00:29:08
El punto medio, el punto medio es el 100
00:29:11
Pues yo automáticamente estoy diciendo
00:29:12
Oye, los 10 datos que están entre 0 y 200
00:29:15
Para mí es como si fueran 10 veces el 100
00:29:17
¿Vale?
00:29:21
Siguiente intervalo entre 200 y 400
00:29:23
¿cuál es el punto medio?
00:29:25
300
00:29:28
si no lo veo a simple vista, sumo los extremos y divido entre 2
00:29:28
300
00:29:32
y tengo 13 datos
00:29:33
pues automáticamente, para los cálculos
00:29:34
que tengo que hacer posteriormente
00:29:37
esos 13 datos son 13 veces 300
00:29:38
y así sucesivamente
00:29:41
con todo, ¿vale?
00:29:43
eso es lo que se llama la marca de clase
00:29:45
otro ejemplo
00:29:47
pues si los mismos datos de antes
00:29:48
yo los quiero hacer en 8 intervalos
00:29:51
pues tengo que dividir 1000
00:29:53
Entre 8 y me da 125
00:29:55
Pues voy de 125 a 125 a la hora de hacer los intervalos
00:29:56
¿Vale?
00:29:59
¿La marca de clase quién es?
00:30:01
Pues el punto medio
00:30:03
Sumo 0 más 125 y divido entre 2
00:30:03
62,5
00:30:07
Esa es la marca de clase
00:30:08
Y en este caso tengo 7 datos que van entre 0 y 125
00:30:10
¿Vale?
00:30:14
Y voy a introducir lo que es el histograma
00:30:18
El histograma es muy parecido a un diagrama de barras
00:30:20
Pero lo vamos a usar cuando vamos a trabajar con intervalos
00:30:24
Es decir, yo aquí abajo
00:30:29
Pues voy a coger y decir, vale, el primer intervalo que es
00:30:30
En el de, voy de 200 en 200
00:30:32
El 0 a 200
00:30:36
Pues yo marco el 0 a 200
00:30:37
Y luego ya lo levanto en altura
00:30:39
Pues mira, 10 veces
00:30:41
Aquí viene el número 10
00:30:43
Es la frecuencia
00:30:46
El intervalo 200-400 está 13 veces
00:30:47
Pues me veo aquí y digo, el siguiente intervalo
00:30:51
Este es del 200 al 400
00:30:53
Y lo levanto en altura 13 veces
00:30:55
Y así conto, cada uno de ellos
00:30:58
Claro, si en vez de 5 intervalos
00:31:00
Yo tuviera 8
00:31:03
Pues tengo que hacerlo así, claro
00:31:04
Queda más estrechito, si lo des cuenta
00:31:07
Porque el intervalo es más estrecho
00:31:09
Puede cambiar ligeramente, fijaos que aquí
00:31:10
A que se ve aquí un bajonazo, aquí en el centro
00:31:12
En el quinto, sin embargo
00:31:15
Cuando yo agrupo de 200 en 200
00:31:16
No llego a verlo
00:31:18
¿Vale?
00:31:20
porque depende como haga los intervalos
00:31:22
pero igual, resulta que
00:31:25
yo he cogido el intervalo 400-600
00:31:27
y a lo mejor están
00:31:29
todos los datos muy cerca del 400
00:31:31
o muy cerca del 600
00:31:32
¿vale? y cuando lo divido en dos intervalos
00:31:34
diferentes, pues si se ve esa separación
00:31:37
¿vale?
00:31:39
entonces siempre cuantos más intervalos haga
00:31:41
o cuantos más pequeños sean los intervalos
00:31:43
¿qué sucede?
00:31:45
que
00:31:48
es todo mucho más
00:31:48
preciso ¿vale?
00:31:50
Algo que no he dicho, y ahora ya veremos, es cómo se llama la diferencia que hay entre
00:31:52
el dato más grande y el dato más pequeño, que es lo que se llama el rango.
00:32:03
El rango es, mis datos van entre el 3 y el 14, pues 14 menos 3, 11.
00:32:07
Hay 11 unidades en las cuales se desarrollan todos los datos.
00:32:14
Que mis datos son
00:32:16
El más pequeño es 7
00:32:18
Y el más grande es 70
00:32:20
¿Cuál es el rango?
00:32:23
70 menos 7
00:32:24
Grande menos pequeño
00:32:25
¿Sí?
00:32:27
Es el rango en el cual yo voy a encontrarme los datos
00:32:29
Entre el mayor y el menor
00:32:31
Lógicamente con variables que son
00:32:33
Cuantitativas, que son numéricas
00:32:35
¿Vale?
00:32:37
Bueno, aquí vienen algunos ejercicios resueltos
00:32:41
¿Vale?
00:32:43
Igual con intervalos
00:32:44
para que veáis la diferencia de si cojo datos numéricos
00:32:45
este dice, agrupa los siguientes datos en 10 grupos
00:32:50
y agrupa los mismos datos ahora en 5 grupos
00:32:53
y que veamos cómo cambian los gráficos
00:32:55
que como son valores que van del 1 al 10
00:33:00
pues si yo lo cojo como valores discretos
00:33:02
del 1 al 10, veo cuántas veces la frecuencia
00:33:05
hay de cada uno de esos datos y hago mi gráfico
00:33:08
si en vez de cogerlo como datos sueltos
00:33:11
hago intervalos, digo, oye, el primer intervalo
00:33:15
la respuesta es como me ha dicho
00:33:17
1, 2, lo que es lo mismo, el intervalo 1, 2
00:33:18
¿vale?
00:33:21
1, 2, pues tengo 16 respuestas
00:33:22
10 más 6, 16
00:33:25
el intervalo 3, 4
00:33:27
pues son los que han respondido, 4 que era el 3
00:33:29
y 9 que era el 4, 4, 9, 13
00:33:31
y este sería el gráfico
00:33:33
cambia el gráfico
00:33:35
¿vale?
00:33:36
bueno, aquí veis
00:33:38
el
00:33:41
lo que decía antes
00:33:42
En este caso, uno desde el punto medio
00:33:44
De aquí arriba, en lo que es cada uno de estos rectángulos del histograma
00:33:49
Desde el punto medio
00:33:55
Hago unos ejercicios resueltos que os pueden servir de ayuda
00:33:56
Con estas cosas básicas
00:34:03
Y me voy a ir a lo que es la parte más numérica y matemática
00:34:05
para la acción
00:34:11
medidas de centralización
00:34:12
vamos a tener medidas de centralización y de dispersión
00:34:15
las medidas de centralización
00:34:17
lo que van a decir es
00:34:19
o nos van a dar información acerca de
00:34:21
cómo los
00:34:23
datos se sitúan
00:34:25
¿vale? con respecto a una
00:34:27
posición y en concreto lo que
00:34:29
más nos interesa es casi siempre
00:34:31
lo más en el centro posible
00:34:33
¿vale?
00:34:35
hay otras posiciones
00:34:38
que nos pueden interesar
00:34:39
Como decía antes, lo de los percentiles
00:34:40
O los cuartiles
00:34:42
Que me van a decir, bueno, donde estoy situado
00:34:44
La media, que todos lo conocéis
00:34:46
Lo que me va a decir es
00:34:49
Bueno, si yo sumo todos los datos
00:34:50
Y lo divido en el número total de datos
00:34:52
Me va a decir
00:34:54
Bueno, pues, cuál es ese valor
00:34:55
Donde unos datos compensan a otros
00:34:58
Un examen
00:35:00
Un 6 y un 8
00:35:02
Y digo, la media es un 7
00:35:03
6 más 8, 14, entre 2, 7
00:35:05
El 8 le da un puntito al 6
00:35:07
Entonces el 8 baja a 7
00:35:10
El 6 sube a 7, compensa
00:35:13
¿Vale? Eso es lo que hace la media
00:35:15
¿Vale? Si unos se tiran a otros
00:35:17
¿Vale? En total
00:35:19
¿Quién nos saldría? Por eso cuando nos dicen
00:35:20
La media de hijos es 1,8
00:35:22
Pues no es que hay
00:35:25
Una madre que salga 0,8 hijos
00:35:26
No
00:35:29
¿Vale? Es la...
00:35:30
Ese cálculo numérico
00:35:32
¿Vale? Que 1,8
00:35:33
¿Qué te va a significar? Pues bueno, pues que sean
00:35:36
casi dos hijos, los que tienes.
00:35:38
¿Vale?
00:35:42
Vamos a hacer XT más X2, que es 1.
00:35:42
Bueno, la media. Sumo todos los datos,
00:35:44
¿vale? Y divido.
00:35:46
Aquí hay una formulita.
00:35:48
¿Veis que pone X1 por F1
00:35:50
más X2 por F2
00:35:52
hasta XN
00:35:53
por FN partido número de datos.
00:35:55
¿Lo veis?
00:35:59
Bien. Me voy a ir al papel.
00:36:00
¿Vale?
00:36:02
¿Es una fórmula o es una...
00:36:04
Es una fórmula.
00:36:06
Por eso os decía aquí lo del Fsui
00:36:06
Que es F1, F2, F3
00:36:09
Mirad, la media
00:36:11
Para entenderlo más o menos
00:36:13
Si yo tuviera poquitos datos
00:36:14
¿Vale?
00:36:17
Yo digo, pues mira
00:36:18
Los datos que tengo es 2
00:36:19
Notas de un examen
00:36:22
2, 7, 8, 4 y 6
00:36:23
Estas son las notas que he sacado en exámenes
00:36:27
¿Cuántas notas son?
00:36:30
En total, tengo 5, ¿no?
00:36:33
Pues yo si he pensado mucho digo, mira, 2 más 7 más 8 más 4 y más 6, sumo todos mis datos y lo divido entre qué, entre 5, ¿no? 2 más 7 es 9, 9 más 8 es 17, 17 más 4 es 21, más 6 es 27, 27 partido 5 y si hago esta división me dice que la media es 5,4, ¿vale?
00:36:35
La media se suele representar con este dato
00:37:02
Con esta forma de escribir
00:37:06
Una X y aquí una rayita
00:37:08
Esa es la forma de escribir la media
00:37:10
¿Vale?
00:37:12
Muchas veces aquí tienes media igual
00:37:15
Ese es el símbolo, ¿vale?
00:37:17
¿Sí?
00:37:21
Claro, esto cuando son poquitos datos
00:37:21
Y yo sumo cada uno de los datos
00:37:23
Que de hecho cada dato en esta ocasión me parece una sola vez
00:37:25
La frecuencia de cada uno de ellos es una sola vez
00:37:29
En el ejercicio que antes hemos planteado
00:37:31
Nos ha dicho que el 1 está 3 veces, ¿no?
00:37:34
¿Sí?
00:37:38
Vale, si yo me fuera un poco a lo bestia
00:37:39
Yo diría, oye, pues el 1 está 3 veces
00:37:44
Pues 1 más 1 más 1, 3 veces
00:37:47
El 2 está 8 veces
00:37:50
Más 2 más 2, 3, 4, 5, 6, 7, 8 veces, ¿no?
00:37:52
El 3 está cuatro veces. Más 1, más 2, más 3, más 4. El 4 está nueve veces. Una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve veces.
00:38:01
Hay cuatro, sí
00:38:19
El cuatro nueve veces
00:38:22
Cuatro nueve veces
00:38:24
Y en total son veinticuatro datos
00:38:29
Que si yo los contara me tendría que dar veinticuatro
00:38:32
Que no me haya olvidado ninguno
00:38:35
Y todo ello lo divido entre veinticuatro
00:38:36
Bien, pues esta va a ser
00:38:38
La media
00:38:40
Pero puedes sumar todos los datos
00:38:41
Esto es un rollo
00:38:44
Tiene que haber una forma mecánica
00:38:45
De calcularlo
00:38:48
Bien. Para eso tenemos la tabla, ¿no? Para calcular aquí los datos de la tabla, mirad, la fórmula que aparecía dice x sub 1 por f sub 1, x sub 2 por f sub 2.
00:38:50
Es decir, me va a multiplicar cada dato por su frecuencia, x sub 1 por f sub 1, x sub 2 por f sub 2. Eso es lo que me dice la fórmula.
00:39:04
la fórmula
00:39:13
en matemática de sumatorio
00:39:14
de los x sub i por f sub i partido de i
00:39:17
¿vale?
00:39:19
sumar
00:39:22
x sub 1, f sub 1, x sub 2, f sub 2
00:39:22
x sub 3, f sub 3, todos estos los multiplico
00:39:25
y luego los sumo
00:39:28
pues yo me voy a crear aquí
00:39:30
otra columna, otra columna que es
00:39:31
x sub i
00:39:34
por f sub i
00:39:34
¿vale?
00:39:37
voy a multiplicar
00:39:40
1 por 3
00:39:41
3
00:39:43
2 por 8
00:39:44
16
00:39:46
3 por 4
00:39:48
12
00:39:49
y 4 por 9
00:39:51
36
00:39:52
y ahora los voy a sumar
00:39:55
3 más 16, 19
00:39:57
19 más 12, 31
00:39:59
y 31 más 36
00:40:02
67
00:40:03
oye, que es que este sumatorio
00:40:05
que es muy feo
00:40:08
y no nos gusta ver estas fórmulas con letras
00:40:10
Bueno, es lo mismo que decir 67
00:40:12
Es
00:40:15
Yo multiplico las X por F
00:40:17
¿Vale?
00:40:20
Lo multiplico y le pongo una nueva columna
00:40:22
Es una columna auxiliar que me va a ayudar
00:40:24
El sumatorio
00:40:26
Pues lo sumo, lo pongo aquí debajo
00:40:28
Lo suma, 67
00:40:29
¿Y entre qué lo voy a dividir?
00:40:31
Entre el número total de datos
00:40:33
¿Cuántos datos tengo?
00:40:34
24
00:40:36
Pues 67 entre 24
00:40:36
Y si hago esa división
00:40:39
me va a decir
00:40:42
quién es la media, ¿vale?
00:40:43
en nuestro caso, 67 entre 24
00:40:46
es 2,79
00:40:48
2,79
00:40:50
pues la media en este caso
00:40:52
de estos datos
00:40:53
es 2,79
00:40:56
si yo hago toda esta cuenta
00:40:57
¿cuánto me va a dar?
00:41:00
pues si no me equivoco en el cálculo
00:41:02
me tiene que dar 2,79
00:41:04
claro, y si en vez de ser
00:41:05
24 datos son 500 datos
00:41:08
me voy a poner a sumar los 500
00:41:10
no puedo
00:41:11
además, podemos usar una hoja de cálculo
00:41:12
y una hoja de cálculo
00:41:15
vosotros pensad que estáis trabajando en cosas de estadística
00:41:16
pues tú vas a sintetizar todos los datos así
00:41:19
y solo con tener esto grabado
00:41:21
todo lo demás son fórmulas
00:41:23
al final, va muy mecanizado
00:41:26
¿vale?
00:41:27
luego la única cosa que hace falta va a ser
00:41:30
al final, tener estos datos
00:41:31
¿sí? entonces mirad
00:41:34
esta columna me ayuda
00:41:35
para calcular la media
00:41:37
Porque la media es multiplicar cada dato por su frecuencia
00:41:40
Por el número de veces
00:41:43
Es lo mismo decir 4 más 4 más 4
00:41:43
9 veces
00:41:47
O por definición, sumar el 4 9 veces
00:41:48
Es multiplicar el 4 por 9
00:41:51
Por definición
00:41:52
Y luego se lo sumo y divido entre el número de datos
00:41:53
Esta es la media
00:41:57
¿Vale?
00:41:59
¿Sí?
00:42:01
¿Sí?
00:42:02
Pues depende de lo que se os pida
00:42:09
En principio todo
00:42:10
¿Vale? Y alguna cosa más que nos falte
00:42:11
Bueno, a ver
00:42:15
Más definiciones
00:42:16
La moda, esta es más sencilla
00:42:19
¿Vale?
00:42:21
La moda es lo que más se repite
00:42:22
Lo que más veces aparece
00:42:25
¿Vale?
00:42:27
Por lo tanto yo voy a buscar
00:42:30
Entre las frecuencias absolutas
00:42:31
Me vengo aquí a mi
00:42:33
A ver, a mi hoja
00:42:35
Y la moda va a ser
00:42:37
La que tenga mayor frecuencia absoluta
00:42:39
¿Cuál tiene mayor frecuencia absoluta?
00:42:41
El 4.
00:42:43
¿El 4 es el que más veces está?
00:42:44
Que aparece 9 veces, ¿no?
00:42:45
Pues la moda va a ser esta de aquí.
00:42:47
Yo aquí me fijo para la moda, me fijo aquí para la moda.
00:42:49
¿Vale?
00:42:54
Y entonces yo digo que la moda es 4.
00:42:55
¿Vale?
00:43:01
Porque está aquí, está 9 veces.
00:43:02
¿Sí?
00:43:05
Pero también a veces la moda puede ser varias cosas.
00:43:08
La moda puede ser llevar vaqueros y la gorra al revés. Si hubiera habido varios datos con el 9, imaginar que este 8 me dio un 8 hubiera sido un 9. Pues yo digo que la moda sería 2 y 4. No hago ningún cálculo intermedio, ni cálculo medias, ni nada. Pues tengo varias modas.
00:43:11
La moda es 4
00:43:30
Se puede poner la M y la O chiquitita
00:43:37
M, O es igual a 4
00:43:39
Pero me lo ponéis con palabra, me vale
00:43:41
Me lo ponéis así, también me vale
00:43:43
¿Sí?
00:43:46
Bien
00:43:49
Hemos visto la media, la moda
00:43:50
Y el que me queda es la mediana
00:43:52
Para entender la mediana
00:43:55
Si yo voy por una autovía
00:43:57
Tengo dos carriles
00:44:00
o tengo dos direcciones del tráfico
00:44:02
y hay una fuerza en la mitad
00:44:04
que separa una dirección de la otra
00:44:05
y le llamamos mediana
00:44:08
porque está en el medio
00:44:10
bien
00:44:12
la mediana, en este caso, que son números
00:44:13
si yo los números los ordenara
00:44:16
de menor a mayor
00:44:18
¿qué dato está justo?
00:44:20
en la mitad
00:44:22
¿qué número me deja?
00:44:23
el 50% de los datos
00:44:25
a la izquierda
00:44:27
y el 50% de los datos
00:44:29
a la derecha.
00:44:31
¿Eso lo entendemos por definición?
00:44:33
Sí. Claro, si yo pudiera mirar
00:44:35
aquí gráficamente,
00:44:37
me dice, mira, es que
00:44:39
son números 0, 1, 2, 3, 4, o colores,
00:44:40
como quiera mover, ¿vale?
00:44:43
Del 0 al
00:44:45
treinta y tantos por ciento, porque la divido
00:44:47
en cien partes. ¿Veis que lo que divide en cien partes?
00:44:49
Si yo divido en cien partes,
00:44:51
¿vale? Digo, esto es hasta el 35%.
00:44:53
Si yo voy acumulando,
00:44:55
porque aquí voy a meter la frecuencia relativa
00:44:57
acumulada, si yo voy
00:44:59
acumulado aquí me paso de 50
00:45:01
¿lo veis?
00:45:02
yo busco que el dato está justo en la mitad
00:45:05
en el 50, pues mira, cuando echa el 50
00:45:06
el color verde, el 1
00:45:09
si yo os preguntara, ¿dónde está el 10%?
00:45:10
¿el 10% dónde está el 10%?
00:45:13
gráficamente lo veo muy bien, aquí
00:45:15
le toca en el 0, ¿a que sí?
00:45:17
oye, ¿y el 90%?
00:45:20
pues aquí, en el azul celeste
00:45:22
pero claro, yo no voy a tener ese gráfico así tan bonito
00:45:23
yo voy a tener números
00:45:26
y voy a tener que buscar el 10%
00:45:28
o 50%, ¿vale?
00:45:30
La mediana, lo que está en el medio, ¿vale?
00:45:34
Pero lo primero, debo de ordenar los números, ¿sí?
00:45:37
Si yo tuviera poquitos datos y los ordeno, ¿vale?
00:45:41
Por ejemplo, ordenado tengo el 2, 3, 5, 6, 6, 6, 8...
00:45:51
¿Quién está en el medio?
00:46:01
se ve a simple vista
00:46:02
que si yo coloco
00:46:05
el 6 que está en el medio, me deja 3 datos
00:46:07
a la izquierda y 3 datos a la derecha
00:46:09
es más, en total
00:46:11
son 7 datos, pues hay un truco
00:46:13
que me dice, vale, el número de datos que es 7
00:46:15
entre 2, me da 3,5
00:46:17
y como la posición
00:46:20
3,5 no existe, cojo la siguiente
00:46:21
que es la cuarta, cuarta posición
00:46:23
pero claro, que sucedería si yo tengo un dato más
00:46:25
Tengo un 1 aquí, el 1, 2, 3
00:46:31
5, 6, 6
00:46:34
6 y 8
00:46:36
Pues que si digo, oye, cojo el 5
00:46:37
El 5 me deja 3 a la izquierda y 4 a la derecha
00:46:40
No me vale
00:46:42
Pues cojo el 6, 4 a la izquierda y 3 a la derecha
00:46:42
No me vale
00:46:46
La mediana estaría justo aquí en medio, ¿no?
00:46:46
Pues yo debo de coger estos dos
00:46:49
Necesito coger estos dos
00:46:50
¿Vale?
00:46:52
Y así dejo 3 a la izquierda y 3 a la derecha
00:46:55
¿Pero quién sería la mediana?
00:46:57
La mediana sería la media
00:46:59
5 más 6 entre 2
00:47:01
Tendría que calcular la mediana
00:47:03
En este caso sería
00:47:05
5 más 6 entre 2, lo que es lo mismo
00:47:08
5 y medio
00:47:11
Para calcular la posición, si yo divido
00:47:12
8 datos entre 2, me da 4
00:47:15
Pues tengo que coger
00:47:17
La cuarta posición
00:47:19
Más la quinta
00:47:20
Posición y dividir entre 2
00:47:22
Esto, con datos pequeñitos
00:47:25
Pues vale
00:47:27
Pero cuando tengo muchos datos
00:47:29
se me va el traste, no me vale
00:47:30
y por lo tanto
00:47:32
volvemos a mi tabla de frecuencias
00:47:33
¿no?
00:47:36
y fijaros, yo aquí
00:47:38
he calculado la frecuencia
00:47:39
relativa
00:47:42
y aquí va la frecuencia relativa
00:47:43
acumulada
00:47:45
¿lo veis? esto es como si
00:47:47
gráficamente yo cogiera
00:47:50
a ver si aquí
00:47:52
y dijera, pues oye, que es que
00:47:53
vamos a hacer una línea aquí
00:47:56
y tengo
00:47:57
del 0%, que se entiende mejor con un porcentaje, al 12,5%, aquí está el 1, del 12,5% al 45,8%, aquí va el 2,
00:48:00
De 0,45 al 0,62
00:48:24
Al 0,62
00:48:27
4
00:48:30
Sí
00:48:31
A ver, 62,4
00:48:36
Lo voy a poner como porcentaje
00:48:38
62,4 sería el 3
00:48:40
Y el 4 me va ya de aquí hasta
00:48:42
Hasta el 100%
00:48:45
Hasta el 100%
00:48:47
Yo os digo
00:48:49
¿Dónde estaría la mediana?
00:48:51
¿Dónde estaría el 50%?
00:48:54
Pues entre 45 y el 62
00:48:57
el 50 cae aquí, el 50% caería aquí
00:48:58
pues la mediana
00:49:01
¿quién es? 3
00:49:03
¿vale?
00:49:05
sin tener que dibujarlo
00:49:07
como antes, yo puedo buscarlo
00:49:09
aquí
00:49:11
yo puedo buscarlo aquí
00:49:12
porque yo digo, con el 1
00:49:14
he llegado hasta el 12
00:49:17
yo busco el 0,50, 0,50 es el 50%
00:49:18
¿no?
00:49:22
¿sí?
00:49:23
en el 2
00:49:25
llego hasta el 45%
00:49:26
por ciento no llega al 50 el siguiente dato ya es un 3 después de 45 por ciento y aquí
00:49:27
llevan 62 por ciento luego en este intervalo en este que en el que pasa del 50 por ciento
00:49:34
el 3 es donde está la mediana la mediana está en el 3 que es el intervalo que va del 0 45 al 0 62
00:49:42
Pensad que el intervalo va de 0 a 125
00:49:48
De 125 a 458
00:49:52
De 458 a 600
00:49:55
¿Lo veis?
00:49:56
Luego yo busco aquí el 50%, ¿vale?
00:49:59
Que es esto multiplicado por 100
00:50:02
Luego, ¿este es el primero que pasa del 0 a 50?
00:50:03
Pues en 3 está la mediana
00:50:07
La mediana es 3
00:50:09
Y vosotros me decís, la mediana
00:50:11
Es 3, ¿vale?
00:50:13
Si queréis me podéis decir
00:50:17
Porque la frecuencia relativa acumulada es 0,624
00:50:19
Pero lo importante es esto, ¿vale?
00:50:26
¿Sí?
00:50:31
Claro, y con esto nos vamos a meter en lo que se llama
00:50:32
Que creo que viene por aquí
00:50:35
Si yo tuviera aquí
00:50:36
Aquí, me pusiera el 50%, ¿vale?
00:50:40
Tendría que hacer la media entre los dos valores
00:50:46
Si justo tuviera 50%, ¿vale?
00:50:48
Claro, porque acumula el 50%, el otro 50% va después
00:50:52
Imagina que en vez de... a ver, vamos a hacer...
00:50:56
Espera, que no estoy viendo la cámara
00:50:58
Que tú dices que acumulamos en la columna de la acumulada
00:51:00
Imagínate que tenemos 0,25
00:51:07
0,50, ¿no?
00:51:09
0,65 y 1, ¿vale?
00:51:13
Y los datos es el 1, 2, 3 y 4. Bien, en este caso, el dato que yo busco está justo aquí. ¿Por qué? Porque por un lado aquí está el 50% de los datos y aquí está el otro 50% de los datos.
00:51:17
Luego, la mediana
00:51:34
Ni es 2 ni es 3
00:51:37
Está justo en la frontera
00:51:38
De los datos
00:51:41
¿Sí?
00:51:43
La media de 2 y 7
00:51:46
Yo me cojo los dos
00:51:47
¿Quién será la mediana?
00:51:48
Pues la mediana
00:51:50
La mediana sería
00:51:51
2 más 3 entre 2
00:51:54
2 y medio
00:51:57
¿Sí?
00:51:58
A ver, en el examen intentaré que os caiga dentro
00:52:02
que no tenéis que ir ahí a la
00:52:04
frontera, por así decir, y ver
00:52:06
pero claro, es un caso que puede darse
00:52:08
perfectamente
00:52:10
¿sí? bien
00:52:11
bueno, aquí vienen algunos ejemplos
00:52:16
de qué pasa si cambia
00:52:20
un número, si cambia otro
00:52:21
aquí tenéis ejercicios resueltos
00:52:23
¿vale? fijaros, una tabla
00:52:25
y a partir de la tabla, pues que calcules
00:52:27
la frecuencia
00:52:30
absoluta
00:52:31
¿vale?
00:52:34
que suma 30 datos, el x super f sui
00:52:35
que esto me vale para la media
00:52:37
la acumulada
00:52:38
¿vale?
00:52:41
y bueno aquí realmente
00:52:44
para la mediana, pues ¿qué necesitaría?
00:52:45
bueno aquí la acumulada
00:52:49
también podría buscar
00:52:50
el título que podría buscar
00:52:51
¿dónde está la mediana? si digo vale
00:52:52
son 30 datos, la mitad es 15 ¿no?
00:52:55
pues cuando pasa
00:52:58
de 15
00:52:59
pero yo creo que es que se ve mejor
00:53:01
con el porcentaje
00:53:03
¿Vale? A mí me gusta más con la relativa
00:53:04
Con esto se podría ver, ¿vale?
00:53:07
Con la f sub i esta se puede ver perfecto
00:53:09
Pero que dice, vale
00:53:10
Estaría ahí en el 15
00:53:11
El 50%, ¿vale?
00:53:14
Pero pasa
00:53:16
Se ve mejor con la
00:53:18
Ya os digo
00:53:20
En este caso, como es un
00:53:22
Un intervalo, trabajamos siempre con las marcas de clase
00:53:23
Como dato
00:53:27
Dentro de la medida de posición, ¿vale?
00:53:27
Si la mediana es el 50%
00:53:34
donde cae el 50% de los datos
00:53:35
o dejas el 50% a la izquierda y a la derecha
00:53:37
yo puedo trocear
00:53:39
como se ve aquí gráficamente
00:53:41
el 10%, el 20%, el 30% de los datos hasta el 100%
00:53:43
¿vale?
00:53:46
pensar que estos números corresponden
00:53:47
pues con el peso de los mismos
00:53:49
¿vale? el que pesa más va a estar más a la derecha
00:53:51
que pesa más y el que pesa menos más a la izquierda
00:53:54
yo cuando te dice está en el percentil 10
00:53:56
está abajo de peso
00:53:57
porque si tú ordenas los datos de menor a mayor
00:53:59
pues
00:54:02
estaría ahí ¿vale?
00:54:03
Cuando me dice percentil 10, ¿qué busco?
00:54:04
El 10%
00:54:07
¿Y dónde lo busco?
00:54:08
En la frecuencia relativa acumulada
00:54:10
En ese porcentaje que veíamos en la tabla
00:54:13
¿Vale?
00:54:14
El percentil 90, mira, aquí se escribe
00:54:16
Una P y un 10
00:54:18
Percentil 10, percentil 80
00:54:20
Pues yo busco el 80%, el 80% está aquí
00:54:22
El 3, ¿vale?
00:54:25
Si yo me voy a mi tabla
00:54:26
Me voy a mi tabla de antes
00:54:28
Está aquí
00:54:29
¿Dónde está el percentil 10?
00:54:31
Yo busco el 10%, pues el 10% en el primero, porque el primero llega hasta el 12%, ¿no? Aquí. El percentil 60. El 2 llega hasta el 45%, ¿no? El 3 llega hasta el 62, pues está en el 3. Entre el 45 y el 62 son 3.
00:54:34
sí
00:54:56
a partir de aquí
00:55:01
empiezo a sumar 3
00:55:04
desde el 0,45 al 0,62
00:55:05
¿vale?
00:55:08
el percentil 90
00:55:09
pues el percentil 90 estaría aquí entre 0,62 y 0,99
00:55:11
luego sería un 4
00:55:15
igual que está el percentil
00:55:16
están los cuartiles
00:55:18
los cuartiles que se representan con una Q
00:55:19
y un 1 y un 3
00:55:21
primer cuartil
00:55:23
o tercer cuartil
00:55:26
25%
00:55:27
es el primer cuartil
00:55:29
el segundo cuartil
00:55:31
que no lo cita
00:55:33
es que es la mitad, ya lo tenemos
00:55:34
es la mediana
00:55:36
tercer cuartil es el 75%
00:55:38
lo que simplemente es decir
00:55:42
te dicen, primer cuartil
00:55:43
que tenemos que saber, que busco donde está el
00:55:45
25%
00:55:47
tercer cuartil, que busco
00:55:48
75%
00:55:51
no hay más
00:55:53
¿vale? y los porcentiles es buscar
00:55:53
Pues la posición, 10%, 80%, 70%
00:55:57
El que me digan
00:56:01
¿Sí?
00:56:03
Vale
00:56:05
El próximo día
00:56:05
¿Vale?
00:56:11
Aquí vienen unos ejercicios un poco resueltos
00:56:12
¿Con gráfica o sin gráfica?
00:56:14
Sin gráfica
00:56:18
No, no, sin gráfica
00:56:18
El próximo día, ¿vale?
00:56:20
Vamos a ir a las medidas de dispersión
00:56:22
¿Vale?
00:56:24
Esta puede ser más compleja al calcularla
00:56:25
y ya os ayudaré un poquito con la fórmula
00:56:27
pero bueno, en la medida de dispersión
00:56:29
pues va a ver como los datos en mayor o menor
00:56:32
grado
00:56:34
se alejan
00:56:36
¿vale? con respecto a las medidas
00:56:38
de centralización, con respecto a la media
00:56:40
como los datos se alejan
00:56:42
¿vale?
00:56:44
y veremos el rango
00:56:47
ya os he dicho, el rango recorrido que es la diferencia entre
00:56:48
el mayor dato y el menor, ese no tiene misterio
00:56:50
pero la desviación típica
00:56:52
y la varianza, ambos tienen una fórmula
00:56:54
muy bonita, que la veis
00:56:56
¿vale? preciosa
00:56:58
y decís, ¿qué significa? lo veremos el próximo día
00:56:59
pero lo vamos a poder hacer
00:57:02
lo vamos a poder hacer
00:57:04
con la tabla
00:57:05
¿vale? porque yo tengo la f y
00:57:07
y tengo la x y
00:57:10
pues si yo pongo una tabla que diga x y al cuadrado
00:57:11
y luego
00:57:14
otra columna, donde lo multiplico por
00:57:16
f su y, y si al sumar
00:57:18
sumo todas las celdas
00:57:20
¿qué es un rollo? sí, es un poco rollo, ¿vale?
00:57:21
lo vemos el próximo día
00:57:25
¿Vale? El próximo día veremos
00:57:26
La varianza de la desviación típica
00:57:28
Y ya, pues nos iremos
00:57:30
A ver si me ha ido esto
00:57:32
Y ya pues nos iremos a hacer por aquí ejercicios
00:57:33
Pero que podéis ver ya ejercicios que están resueltos
00:57:36
¿Vale?
00:57:39
Con vistas al examen
00:57:40
¿Vale?
00:57:43
Pues yo al final os pondré unos datos
00:57:44
¿Vale? O una tabla
00:57:46
Imaginaos, ya os lo doy, pero no, que no tengáis que hacer recuento
00:57:48
Con
00:57:51
Cada dato, cuál es su frecuencia absoluta
00:57:52
O a lo mejor tenéis que recontar si no son muchos.
00:57:55
Y a partir de ahí que calcule la media, la moda, la mediana, un percentil 10, ¿vale?
00:57:57
Que me digáis cuál es a lo mejor la división típica.
00:58:04
Pero todo eso se va a hacer por una tabla.
00:58:06
¿Vale?
00:58:09
Entonces, por resumen,
00:58:10
debéis recordar,
00:58:14
la x y y son los datos con los que voy a trabajar.
00:58:15
¿Vale?
00:58:18
Número adictos, 1, 2, 3, 4.
00:58:19
La F minúscula es la frecuencia absoluta número de veces que aparece cada dato
00:58:20
La F mayúscula es la acumulada
00:58:28
¿Me podría servir para calcular la mediana percentil?
00:58:31
Sí, pero es más difícil porque el percentil es la décima parte de 24
00:58:39
Creo que cuesta más, es mejor verlo como porcentaje
00:58:44
la relativa es dividir
00:58:46
la frecuencia absoluta entre el número total de datos
00:58:49
¿vale? y ya
00:58:51
voy a trabajar con un número que si lo multiplico por 100
00:58:53
es un porcentaje
00:58:56
que eso parece que ya se entiende más fácilmente
00:58:56
¿vale?
00:58:59
y tengo el acumulado, que el acumulado es donde yo
00:59:01
me fijaría para ver
00:59:03
si a mí me piden percentil 30
00:59:05
pues en qué intervalo cae
00:59:07
el 30% o el 0,30
00:59:09
y así
00:59:11
digo cuál es el dato que está ahí
00:59:13
¿Vale? Para calcular la media
00:59:15
me tengo que sumar todos los datos, si son muchos datos
00:59:17
y no sumarlo a lo bestia, ¿qué hago?
00:59:19
Multiplico
00:59:22
el dato por su frecuencia, el 1 3 veces
00:59:23
el 2 8 veces, el 3 4 veces
00:59:25
el 4 9 veces, aquí en esta columna
00:59:27
y lo subo
00:59:30
y tengo este sumatorio de esta fórmula
00:59:31
que a lo mejor
00:59:33
visto así no nos gusta
00:59:35
claro, multiplico este por este
00:59:37
este por este, este por este, este por este
00:59:39
y dejo aquí los resultados
00:59:41
y ahora lo subo, me da 67
00:59:43
calculó la media mediana buscar aquí donde que el 50% vale y la moda me fijo
00:59:45
en donde tengo la mayor frecuencia absoluta
00:59:53
el próximo día lo retomamos añadimos la variaza y la desviación típica
01:00:01
y hacemos un par de ejercicios ya más completos con la tabla
01:00:08
- Subido por:
- Diego R.
- Licencia:
- Reconocimiento - No comercial - Sin obra derivada
- Visualizaciones:
- 24
- Fecha:
- 25 de abril de 2024 - 20:28
- Visibilidad:
- Público
- Centro:
- CEPAPUB SIERRA NORTE
- Duración:
- 1h′ 00′ 15″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1920x1080 píxeles
- Tamaño:
- 1.56