1 00:00:01,070 --> 00:00:06,690 Comenzamos con el tema 8, que está dedicado a la estadística y le vamos a dedicar dos sesiones. 2 00:00:07,530 --> 00:00:14,529 La de hoy va a ser un poco más teórica y la de la semana que viene será más práctica y con ejercicios en el papel. 3 00:00:15,589 --> 00:00:23,030 En el aula virtual podéis ver que tenemos un documento de teoría, que es el con el que trabajaremos hoy en pantalla. 4 00:00:24,350 --> 00:00:29,190 Vamos a tener otro documento con ejercicios propuestos, que usaremos más la semana que viene. 5 00:00:29,190 --> 00:00:58,329 Y también están los dos cuestionarios que podéis realizar. En el primero de ellos hay preguntas un poco más teóricas, una tabla de frecuencia que veremos qué es, algunos datos, podemos ver por aquí las primeras preguntas que son más teóricas, son cuestionarios cortitos de cinco preguntas y lo mismo sucede con el cuestionario dos. 6 00:00:59,189 --> 00:01:03,289 Lo único que primero hace falta ver es todos los contenidos del tema. 7 00:01:04,370 --> 00:01:11,609 Nos vamos a centrar con este documento de teoría, que es el que vamos a usar de soporte o de apoyo. 8 00:01:12,430 --> 00:01:18,049 Lo primero, de todas formas, cuando vamos a hablar de estadística, aquí encontramos una pequeña definición. 9 00:01:18,810 --> 00:01:23,950 La estadística se puede considerar una ciencia o una disciplina, en este caso de las matemáticas, 10 00:01:23,950 --> 00:01:29,489 que lo que va a hacer va a ser trabajar con datos, intentar poner orden en los datos, 11 00:01:30,290 --> 00:01:35,049 intentar estructurarlo de una forma que nos permita extraer información 12 00:01:35,049 --> 00:01:39,269 y muchas veces puede sacar conclusiones, tomar decisiones. 13 00:01:40,269 --> 00:01:44,549 Vamos a ver que a veces yo voy a poder trabajar con el 100% de los datos 14 00:01:44,549 --> 00:01:50,510 de un conjunto que yo quiero estudiar, pero otras veces yo no puedo tener acceso 15 00:01:50,510 --> 00:01:54,810 a la respuesta o al conjunto de todos los datos. 16 00:01:54,810 --> 00:02:00,109 Por ejemplo, si hay unas elecciones generales para presidente del Gobierno, 17 00:02:00,790 --> 00:02:07,950 no podemos preguntar previamente a, no sé, si hay 30 millones de personas que votan, 18 00:02:07,989 --> 00:02:10,330 a las 30 millones de personas a quién van a votar. 19 00:02:10,789 --> 00:02:14,490 Habrá que coger una muestra, una parte, ¿vale? 20 00:02:14,969 --> 00:02:18,870 O si queremos preguntar en un municipio, queremos ir a Madrid, 21 00:02:18,870 --> 00:02:22,750 y en Madrid Capital, que somos varios millones de personas, queremos saber cuál es el color 22 00:02:22,750 --> 00:02:27,490 favorito de la gente. Pues no podemos preguntarle a todo el mundo. Habrá que coger una parte. 23 00:02:28,150 --> 00:02:33,289 En cambio, habrá situaciones en las cuales, a lo mejor, en una clase con 25 alumnos, pues 24 00:02:33,289 --> 00:02:37,469 queremos hacer un estudio de si las personas son rubias, morenas o cuál es la altura media. 25 00:02:38,530 --> 00:02:43,009 Pues ahí, como el total de la clase es un número más o menos reducido, 25 personas, 26 00:02:43,469 --> 00:02:48,849 pues posiblemente podamos hacer el estudio con todos los datos. ¿Vale? Entonces, a 27 00:02:48,849 --> 00:02:51,270 Al final, eso es la estadística. 28 00:02:51,270 --> 00:02:57,289 También es importante saber que la estadística no va a ser una ciencia exacta cuando yo trabajo con una muestra. 29 00:02:58,490 --> 00:03:02,789 Yo puedo sacar unas conclusiones, ver hacia dónde van los datos, 30 00:03:03,409 --> 00:03:07,129 pero no quiere decir que con eso yo pueda adivinar cosas que vayan a suceder. 31 00:03:08,409 --> 00:03:12,289 Me podría acercar bastante, pero que sepamos que no es una ciencia exacta 32 00:03:12,289 --> 00:03:16,289 y que muchas veces nos encontramos, sobre todo cuando vemos los medios de comunicación, 33 00:03:17,110 --> 00:03:18,550 que se manipula la estadística. 34 00:03:18,550 --> 00:03:35,229 O se manipulan los gráficos, ¿vale? Vamos a ver que aunque nosotros vamos a trabajar mucho con números y con tablas, pero también hay unas gráficas que van asociadas a los datos. Pues en los medios de comunicación es habitual encontrarse con gráficas que están manipuladas, ¿vale? 35 00:03:35,229 --> 00:03:39,069 O lo vemos cuando hay cualquier debate entre los políticos que sacan gráfica 36 00:03:39,069 --> 00:03:42,270 y al día siguiente salen los medios de comunicación 37 00:03:42,270 --> 00:03:44,469 viendo cuántas mentiras se han contado con los gráficos 38 00:03:44,469 --> 00:03:47,250 porque han manipulado los ejes, han manipulado el tamaño. 39 00:03:48,030 --> 00:03:51,009 Entonces, con eso se juega mucho. 40 00:03:51,830 --> 00:03:53,530 Estalística. Este bloque, ¿vale? 41 00:03:53,650 --> 00:03:56,750 Este documento de contenido. 42 00:04:00,699 --> 00:04:03,879 Lo primero que vamos a ver son algunas definiciones, ¿vale? 43 00:04:04,840 --> 00:04:07,020 Como la definición de población y de muestra. 44 00:04:07,020 --> 00:04:20,800 Y es que cuando vamos a hacer un estudio estadístico, pues yo puedo, no tengo lo que es la población, que la población es todo el conjunto de individuos que tiene una característica común, que es la que yo quiero estudiar, ¿vale? Y que, digamos, son susceptibles de ese estudio. 45 00:04:21,699 --> 00:04:31,639 Pero de toda la población, yo a veces cojo solo una parte, esa parte de la que se llama la muestra, ¿vale? Que es un subconjunto de la población. Y lo que sí debe de elegirse de una manera representativa. 46 00:04:31,639 --> 00:04:47,579 Es decir, si yo quiero saber, hablábamos de las elecciones generales, pues, o intentar predecir cuáles van a ser los resultados, yo no puedo coger solo los datos de la Comunidad de Madrid, tendré que coger los datos de las 17 comunidades autónomas. 47 00:04:47,579 --> 00:05:15,779 Es más, los suyos que lo coja de todas las provincias, que coja un número también proporcional de hombres y de mujeres y los rangos de edades, es decir, que al final la muestra se va a estratificar en muchos subconjuntos, ¿vale? Porque no será lo mismo posiblemente lo que piense la mayoría de la gente de 18 años que con la gente de 65, o la gente del País Vasco y la gente de la Comunidad Valenciana, ¿vale? 48 00:05:15,779 --> 00:05:29,540 Entonces, es importante saber cómo elegir la muestra. Cuando vamos a hacer un estudio, vamos a hablar de que vamos a analizar un atributo, una cualidad, que podrá ser cualitativa o cuantitativa. 49 00:05:29,540 --> 00:05:37,639 Nosotros podemos estudiar si en una clase los alumnos son rubios, morenos, castaños o pelirrojos 50 00:05:37,639 --> 00:05:38,800 Eso es algo cualitativo 51 00:05:38,800 --> 00:05:43,319 O cuál es el color favorito o tu deporte favorito 52 00:05:43,319 --> 00:05:44,300 Porque no es una cantidad 53 00:05:44,300 --> 00:05:47,639 Simplemente son distintas respuestas o alternativas que se pueden mostrar 54 00:05:47,639 --> 00:05:51,660 Y luego están las variables que son cuantitativas 55 00:05:51,660 --> 00:05:55,899 Es decir, aquellas que al final se van a trabajar de una manera numérica 56 00:05:55,899 --> 00:06:19,660 Y dentro de que sean numéricas vamos a poder encontrarnos unos datos que sean o discretos o continuos. Puede que la respuesta sea el número de hijos que tienen las personas de un municipio. Las respuestas que vamos a obtener son 0, 1, 2, 3. Pero yo entre el 0 y el 1 o entre el 1 y el 2 no voy a encontrar una respuesta intermedia. 57 00:06:19,660 --> 00:06:22,040 no tienes un hijo y medio 58 00:06:22,040 --> 00:06:23,720 o tienes uno o tienes dos 59 00:06:23,720 --> 00:06:25,899 en cambio 60 00:06:25,899 --> 00:06:28,060 en las variables continuas 61 00:06:28,060 --> 00:06:29,500 entre dos valores 62 00:06:29,500 --> 00:06:31,240 puedo encontrar un valor intermedio 63 00:06:31,240 --> 00:06:36,160 puedo irme a la altura 64 00:06:36,160 --> 00:06:38,019 una persona mide 65 00:06:38,019 --> 00:06:40,100 1,60 y otro mide 1,61 66 00:06:40,100 --> 00:06:42,620 pero si somos tiquismiquis 67 00:06:42,620 --> 00:06:43,279 con los milímetros 68 00:06:43,279 --> 00:06:45,879 alguien puede medir 1,605 69 00:06:45,879 --> 00:06:47,740 que está entre 70 00:06:47,740 --> 00:06:49,959 1,60 y 1,61 71 00:06:49,959 --> 00:06:52,279 puede alcanzar un valor intermedio. 72 00:06:52,420 --> 00:06:54,740 Otras cosas como yo lo recojo luego en el 73 00:06:54,740 --> 00:06:56,560 estudio, pero al final es lo que se llama 74 00:06:56,560 --> 00:06:58,620 la continuidad, que puede alcanzar 75 00:06:58,620 --> 00:07:00,379 cualquier valor, ¿vale? No solo 76 00:07:00,379 --> 00:07:02,160 números enteros. 77 00:07:03,139 --> 00:07:05,100 Nosotros, en los ejercicios, 78 00:07:05,279 --> 00:07:06,060 vamos a trabajar 79 00:07:06,060 --> 00:07:08,699 con todo un poco, pero 80 00:07:08,699 --> 00:07:12,779 digamos que va a ser casi más 81 00:07:12,779 --> 00:07:14,540 con valores discretos, ¿vale? 82 00:07:14,779 --> 00:07:16,240 O si hablamos de altura, pues yo entiendo que 83 00:07:16,240 --> 00:07:23,519 gustan unos 60 y unos 61, no vamos a dar esos valores intermedios, pero que lo entendamos lo que significa, ¿vale? 84 00:07:23,879 --> 00:07:38,899 Si la mayoría tiene 1,8 hijos, vamos a ver qué cosas podemos calcular con esos datos, por ejemplo, ¿cuál es la media? 85 00:07:40,319 --> 00:07:49,819 La media de hijos de un municipio o de España es 1,8, lógicamente tú no tienes 1,8, pero numéricamente vas a poder 86 00:07:49,819 --> 00:07:51,980 hacer un cálculo, que te dice 87 00:07:51,980 --> 00:07:53,379 la media base, es como los exámenes 88 00:07:53,379 --> 00:07:55,779 a nivel individual, tú sacas 89 00:07:55,779 --> 00:07:57,000 unas notas a lo largo del curso 90 00:07:57,000 --> 00:07:59,980 pero luego al final tu calificación final es la nota media 91 00:07:59,980 --> 00:08:01,579 veremos 92 00:08:01,579 --> 00:08:03,379 cómo se calcula la nota media 93 00:08:03,379 --> 00:08:05,660 ¿vale? pero habrá que ver también 94 00:08:05,660 --> 00:08:07,660 cómo se producen diversas dispersiones 95 00:08:07,660 --> 00:08:09,740 como algunos datos sobre esa medida 96 00:08:09,740 --> 00:08:10,819 de centralización 97 00:08:10,819 --> 00:08:13,500 ¿vale? hay valores que 98 00:08:13,500 --> 00:08:14,980 destacan por arriba y por abajo 99 00:08:14,980 --> 00:08:17,459 habrá quien tenga 6 hijos 100 00:08:17,459 --> 00:08:19,560 y habrá quien tenga 0 hijos, pues habrá que ver 101 00:08:19,560 --> 00:08:28,199 también esas, no son anomalías, son dispersiones realmente de los datos. Lo primero que vamos 102 00:08:28,199 --> 00:08:31,680 a hacer en cualquier estudio estadístico va a ser hacer un recuento de las respuestas. 103 00:08:32,860 --> 00:08:39,419 Vamos a hacer unas preguntas, es decir, primero habrá que saber qué vamos a preguntar, luego 104 00:08:39,419 --> 00:08:44,259 nos vamos a ir a nuestra muestra, es decir, a esos individuos que son susceptibles de 105 00:08:44,259 --> 00:08:48,659 darnos esa respuesta, bien porque la preguntemos o bien porque sea algo que analicemos. Pensar 106 00:08:48,659 --> 00:08:55,620 en el mundo animal, van a coger una muestra de ovejas de distintos rebaños para analizar 107 00:08:55,620 --> 00:09:01,659 alguna cualidad o una patología. Las ovejas no responden, nosotros buscamos la respuesta. 108 00:09:02,120 --> 00:09:08,919 Por eso se usa la palabra individuos. Y vamos a tener unos datos que mirar. Frecuencia absoluta, 109 00:09:09,220 --> 00:09:17,539 frecuencia relativa y frecuencia acumulada. Mirad la imagen. En este caso tenemos respuestas 110 00:09:17,539 --> 00:09:21,320 de colores, por ejemplo, que nos pregunten cuál es tu color favorito. Y estas son las 111 00:09:21,320 --> 00:09:26,740 respuestas que nos han dado. Pues lo primero, yo tengo que hacer un recuento de una forma 112 00:09:26,740 --> 00:09:31,279 o de otra, según como sean los datos. Aquí está hecho como cuando elegimos delegado 113 00:09:31,279 --> 00:09:37,000 en clase, que vamos haciendo rayitas, pero yo al final tengo que contar cuántos rojos 114 00:09:37,000 --> 00:09:41,580 hay, cuántos verdes, cuántos azules, cuántos amarillos y cuántos turquesas. Y tengo 6, 115 00:09:41,580 --> 00:09:50,059 8, 7, 5 y 4. Esa es lo que se llama la frecuencia absoluta. La frecuencia absoluta es el número 116 00:09:50,059 --> 00:09:59,279 de veces que aparece el rojo, ese valor. ¿Ese valor cuántas veces aparece? El rojo aparece 117 00:09:59,279 --> 00:10:06,879 6 veces, el verde 8 veces. Y la frecuencia absoluta se suele escribir con esta f minúscula 118 00:10:06,879 --> 00:10:08,960 y esto que pone y, f su y 119 00:10:08,960 --> 00:10:10,740 o la x que pone x su y 120 00:10:10,740 --> 00:10:12,679 es porque los datos yo puedo 121 00:10:12,679 --> 00:10:14,740 cuando los vaya a trabajar 122 00:10:14,740 --> 00:10:16,740 ¿vale? a veces en vez de rojo 123 00:10:16,740 --> 00:10:18,840 o ver azul, lo voy a llamar el dato 124 00:10:18,840 --> 00:10:20,840 1, 2, 3, el x su 1 125 00:10:20,840 --> 00:10:22,539 x su 2, x su 3 126 00:10:22,539 --> 00:10:24,059 ¿vale? pues se pone lo de la y 127 00:10:24,059 --> 00:10:26,860 el f su y pues igual, la frecuencia del 1 128 00:10:26,860 --> 00:10:28,559 del 2, ¿vale? 129 00:10:28,580 --> 00:10:30,179 porque luego habrá unas fórmulas matemáticas 130 00:10:30,179 --> 00:10:32,899 que es como una suma de muchos datos 131 00:10:32,899 --> 00:10:34,720 un sumatorio, y te voy a decir, oye, es un sumatorio 132 00:10:34,720 --> 00:10:35,840 desde el primer dato hasta 133 00:10:35,840 --> 00:10:38,100 el último, que será el quinto 134 00:10:38,100 --> 00:10:39,600 o el octavo, depende de cuantos 135 00:10:39,600 --> 00:10:42,120 tenga, ¿vale? F minúscula 136 00:10:42,120 --> 00:10:44,019 va a ser la frecuencia absoluta y este es 137 00:10:44,019 --> 00:10:46,279 uno de los datos más importantes para poder trabajar 138 00:10:46,279 --> 00:10:47,139 ¿vale? 139 00:10:47,879 --> 00:10:50,240 luego voy a tener, me voy a la frecuencia 140 00:10:50,240 --> 00:10:51,940 acumulada 141 00:10:51,940 --> 00:10:54,019 me salto esta columna intermedia 142 00:10:54,019 --> 00:10:56,159 y me voy a la de la derecha, F mayúscula 143 00:10:56,159 --> 00:10:57,440 esta de aquí, ¿no? 144 00:10:58,159 --> 00:10:58,340 ¿sí? 145 00:11:00,440 --> 00:11:01,399 que en este caso 146 00:11:01,399 --> 00:11:04,139 ya os digo que este dato aquí está 147 00:11:04,139 --> 00:11:06,159 está mal calculado 148 00:11:06,159 --> 00:11:06,559 ¿vale? 149 00:11:07,360 --> 00:11:09,000 pero la acumulada 150 00:11:09,000 --> 00:11:09,460 ¿vale? 151 00:11:10,960 --> 00:11:12,059 es la suma 152 00:11:12,059 --> 00:11:13,440 ahora lo veremos con una tabla 153 00:11:13,440 --> 00:11:14,320 pero es que aquí está mal 154 00:11:14,320 --> 00:11:16,679 la suma de las frecuencias 155 00:11:16,679 --> 00:11:17,600 que se van acumulando 156 00:11:17,600 --> 00:11:19,259 si yo comienzo con el rojo 157 00:11:19,259 --> 00:11:19,860 ¿vale? 158 00:11:20,759 --> 00:11:21,820 tengo 6 datos 159 00:11:21,820 --> 00:11:23,340 pues acumulados van 6 160 00:11:23,340 --> 00:11:24,179 cuando voy al verde 161 00:11:24,179 --> 00:11:25,360 tengo 6 más 8 162 00:11:25,360 --> 00:11:26,779 14 163 00:11:26,779 --> 00:11:28,960 14 más 7 164 00:11:28,960 --> 00:11:29,379 21 165 00:11:29,379 --> 00:11:30,779 ya llevo 21 datos acumulados 166 00:11:30,779 --> 00:11:31,940 21 más 5 167 00:11:31,940 --> 00:11:32,740 26 168 00:11:32,740 --> 00:11:33,700 26 más 4 169 00:11:33,700 --> 00:11:34,039 30 170 00:11:34,039 --> 00:11:46,299 30 en total, yo puedo acumular hasta el número total de datos. Frecuencia absoluta acumulada, que me va a servir para poder ver cómo se van situando los datos. 171 00:11:46,299 --> 00:11:59,139 Yo cuando llevo el 50% de los datos, por ejemplo. Pero claro, si yo calculo hasta 30, no me viene, digamos, cuando llevo el 50% yo espero ver el 50% de alguna forma. 172 00:11:59,139 --> 00:12:01,580 Para eso voy a usar la frecuencia relativa 173 00:12:01,580 --> 00:12:03,720 La frecuencia relativa va a ser la división 174 00:12:03,720 --> 00:12:07,200 División de la frecuencia absoluta, que es el número de datos que tengo 175 00:12:07,200 --> 00:12:08,080 ¿Vale? 176 00:12:08,980 --> 00:12:10,360 Entre el número total 177 00:12:10,360 --> 00:12:13,059 En este caso tengo 30 respuestas de colores 178 00:12:13,059 --> 00:12:19,559 Pues la frecuencia relativa va a ser la frecuencia absoluta 179 00:12:19,559 --> 00:12:22,200 Dividido el número total de datos, en este caso entre 30 180 00:12:22,200 --> 00:12:25,419 Yo diría 60 entre 30, 0,20 181 00:12:25,419 --> 00:12:27,960 80 entre 30, 0,21 182 00:12:27,960 --> 00:12:30,080 7 entre 30, 0.15 183 00:12:30,080 --> 00:12:31,879 5 entre 30, 0.33 184 00:12:31,879 --> 00:12:33,720 4 entre 30, 0.11 185 00:12:33,720 --> 00:12:35,840 Y todos estos, si yo los sumo 186 00:12:35,840 --> 00:12:37,220 ¿Qué me va a dar? 187 00:12:38,220 --> 00:12:38,700 1 188 00:12:38,700 --> 00:12:41,679 Claro, si yo esto lo multiplicara 189 00:12:41,679 --> 00:12:43,500 Por 100 190 00:12:43,500 --> 00:12:45,899 ¿Qué tendría? Un porcentaje 191 00:12:45,899 --> 00:12:48,480 Diría, oye, que es que el rojo 192 00:12:48,480 --> 00:12:50,519 El rojo le ha contestado el 20% de las personas 193 00:12:50,519 --> 00:12:52,480 El verde ha contestado 194 00:12:52,480 --> 00:12:53,740 El 21% de las personas 195 00:12:53,740 --> 00:12:55,820 Yo no voy a escribir porcentajes 196 00:12:55,820 --> 00:12:58,940 Pero mentalmente pensar que yo esto lo puedo multiplicar por 100 197 00:12:58,940 --> 00:13:01,100 Y luego voy a tener otra columna 198 00:13:01,100 --> 00:13:02,600 Que aquí no nos aparece todavía 199 00:13:02,600 --> 00:13:03,500 Pero ya lo adelanto 200 00:13:03,500 --> 00:13:07,240 Que va a ser la frecuencia relativa acumulada 201 00:13:07,240 --> 00:13:10,000 De tal forma que este porcentaje 202 00:13:10,000 --> 00:13:11,059 Por entenderlo de alguna forma 203 00:13:11,059 --> 00:13:11,980 Los voy a ir sumando 204 00:13:11,980 --> 00:13:13,519 Digo, oye, este va al 20%, ¿no? 205 00:13:14,460 --> 00:13:15,220 Venga, pues el 20 206 00:13:15,220 --> 00:13:16,000 Y este va al 21 207 00:13:16,000 --> 00:13:18,820 20 y 21 ya va al 41% 208 00:13:18,820 --> 00:13:20,899 Y ahora le sumo al 0,15 209 00:13:20,899 --> 00:13:22,799 Pues 41 y 15 210 00:13:22,799 --> 00:13:24,120 0,56 211 00:13:24,120 --> 00:13:27,440 Cuando yo llego a este dato aquí atraveso el 50% 212 00:13:27,440 --> 00:13:30,340 Si yo quiero buscar qué dato está en la mitad, por ejemplo 213 00:13:30,340 --> 00:13:32,480 Si yo los tengo en un orden 214 00:13:32,480 --> 00:13:35,460 ¿Vale? Eso lo vamos a usar luego en los ejercicios 215 00:13:35,460 --> 00:13:37,919 Luego yo voy a tener dos frecuencias, ¿vale? 216 00:13:38,580 --> 00:13:41,419 Frecuencia absoluta, que es el número de veces 217 00:13:41,419 --> 00:13:44,779 Que se ha dado, digamos, una respuesta 218 00:13:44,779 --> 00:13:47,799 ¿Vale? Y la frecuencia absoluta relativa es 219 00:13:47,799 --> 00:13:51,799 La absoluta entre el número total de datos 220 00:13:51,799 --> 00:14:01,440 Que lo que subyace ahí es la idea de qué porcentaje de individuos han dado por respuesta rojo, verde y azul 221 00:14:01,440 --> 00:14:08,460 Y luego está la acumulada, la acumulada es ir sumando todas las frecuencias que ya han ido apareciendo 222 00:14:08,460 --> 00:14:14,649 Con todo esto vamos a poder dibujar distintos gráficos 223 00:14:14,649 --> 00:14:19,870 Simplemente para saber cuántas respuestas hemos obtenido para cada dato 224 00:14:19,870 --> 00:14:22,090 una de ellas es el diagrama 225 00:14:22,090 --> 00:14:24,269 de sectores, el de los quesitos 226 00:14:24,269 --> 00:14:26,289 pero si yo 227 00:14:26,289 --> 00:14:28,090 quiero dibujarlo de una manera 228 00:14:28,090 --> 00:14:30,509 exacta, no a ojo 229 00:14:30,509 --> 00:14:32,210 aproximada, o sea yo sé que si 230 00:14:32,210 --> 00:14:34,029 yo miro los datos digo oye pues 231 00:14:34,029 --> 00:14:36,009 el que más ha respondido 232 00:14:36,009 --> 00:14:37,149 es el verde que ha dado un 8 233 00:14:37,149 --> 00:14:39,750 pues yo sé que el verde tiene que ser el quesito más grande 234 00:14:39,750 --> 00:14:42,009 y si el turquesa lo han dicho 235 00:14:42,009 --> 00:14:43,970 4 debería de ser la mitad del verde 236 00:14:43,970 --> 00:14:46,190 pues 4 es la mitad de 8 237 00:14:46,190 --> 00:14:47,490 pues por tamaño debe ser la mitad 238 00:14:47,490 --> 00:14:50,049 pero si yo lo ahojo 239 00:14:50,049 --> 00:14:51,389 no me va a quedar ni la mitad 240 00:14:51,389 --> 00:14:54,409 y el último quesito ya no me va a quedar espacio 241 00:14:54,409 --> 00:14:55,370 o me va a quedar muy grande 242 00:14:55,370 --> 00:14:58,070 ¿vale? si yo quiero hacerlo bien 243 00:14:58,070 --> 00:15:00,210 ¿vale? lo que vamos a trabajar va a ser 244 00:15:00,210 --> 00:15:02,830 con que la circunferencia tiene 360 grados 245 00:15:02,830 --> 00:15:04,529 y yo voy a repartir 246 00:15:04,529 --> 00:15:06,049 esos 360 grados 247 00:15:06,049 --> 00:15:07,809 para que os hagáis la idea 248 00:15:07,809 --> 00:15:10,309 si en total hay 30 respuestas 249 00:15:10,309 --> 00:15:12,409 30 respuestas 250 00:15:12,409 --> 00:15:14,649 se corresponde con 360 grados 251 00:15:14,649 --> 00:15:16,309 a partir de aquí yo hago una regla de 3 252 00:15:16,309 --> 00:15:21,830 Digo, si 30 respuestas es 360 grados 253 00:15:21,830 --> 00:15:24,110 6 respuestas es X 254 00:15:24,110 --> 00:15:25,669 O lo que es lo mismo 255 00:15:25,669 --> 00:15:28,029 Yo voy a multiplicar, va a ser 6 por 360 256 00:15:28,029 --> 00:15:29,409 Va a ser siempre 257 00:15:29,409 --> 00:15:31,429 El dato que tengo frecuencia absoluta 258 00:15:31,429 --> 00:15:33,149 Por 360 259 00:15:33,149 --> 00:15:34,669 Dividido entre el número de datos 260 00:15:34,669 --> 00:15:37,129 Si yo no me quiero aprender eso 261 00:15:37,129 --> 00:15:39,809 Lo puedo calcular con una regla de 3 262 00:15:39,809 --> 00:15:41,389 ¿Sí? 263 00:15:41,389 --> 00:15:44,250 El total de datos es 360 grados 264 00:15:44,250 --> 00:15:45,409 Mis datos, X 265 00:15:45,409 --> 00:15:46,149 Fijaros 266 00:15:46,149 --> 00:16:02,769 Pues 4 por 360 es de 30. 48 grados. 5 por 360 es de 30. 7 por 360 es de 30. Siempre es la misma operación, cambia las frecuencias. Si yo sumo todos los grados, me tiene que sumar el qué? 360 grados. 267 00:16:02,769 --> 00:16:22,269 Que lo quiero ver como proporción, pues aquí lo tengo. Frecuencia entre el número total de datos es igual a qué? A los grados que yo quiero calcular, que es X partido 360. Pues es lo mismo, ¿vale? Y de esta forma podemos dibujar correctamente un diagrama de sectores, ¿vale? 268 00:16:22,269 --> 00:16:25,149 el diagrama de barras 269 00:16:25,149 --> 00:16:27,769 pues va a ser cada uno de los dos ejes 270 00:16:27,769 --> 00:16:29,669 eje horizontal, eje 271 00:16:29,669 --> 00:16:31,409 vertical, ¿vale? 272 00:16:32,049 --> 00:16:35,190 y en el eje 273 00:16:35,190 --> 00:16:37,210 de las X voy a poner los datos que tenga 274 00:16:37,210 --> 00:16:39,110 claro, lo ideal muchas veces es 275 00:16:39,110 --> 00:16:41,429 trabajar con números, si yo tengo 0, 1, 2, 3 276 00:16:41,429 --> 00:16:43,009 pues lo voy a poner de manera correlativa 277 00:16:43,009 --> 00:16:44,990 cuando sean variables 278 00:16:44,990 --> 00:16:47,429 cualitativas, bueno, pues aquí debajo en la leyenda 279 00:16:47,429 --> 00:16:49,029 pondré rojo, verde, azul 280 00:16:49,029 --> 00:16:51,289 ¿vale? o en este caso es muy claro 281 00:16:51,289 --> 00:16:52,669 porque cada uno lo pintó de su color 282 00:16:52,669 --> 00:16:55,330 Y lo que va a hacer va a ser levantar hacia arriba 283 00:16:55,330 --> 00:16:56,929 ¿Vale? ¿El qué? 284 00:16:57,269 --> 00:16:59,110 Pues una línea, un rectángulo 285 00:16:59,110 --> 00:17:01,590 Que corresponda con la frecuencia absoluta 286 00:17:01,590 --> 00:17:02,169 ¿El rojo? 287 00:17:02,889 --> 00:17:04,650 6 personas, pues 288 00:17:04,650 --> 00:17:06,690 El verde ha respondido 8 289 00:17:06,690 --> 00:17:08,849 Pues la frecuencia absoluta 8 290 00:17:08,849 --> 00:17:09,990 Y así con cada uno de ellos 291 00:17:09,990 --> 00:17:12,450 ¿Vale? Diagrama de barras 292 00:17:12,450 --> 00:17:14,490 Fijaros que 293 00:17:14,490 --> 00:17:16,950 Hay un hueco entre uno y otro, no están pegados 294 00:17:16,950 --> 00:17:18,730 No es como cuando yo trabajo 295 00:17:18,730 --> 00:17:20,369 Con un intervalo numérico 296 00:17:20,369 --> 00:17:21,849 ¿Vale? En este caso 297 00:17:21,849 --> 00:17:24,410 están un poquito separados 298 00:17:24,410 --> 00:17:24,670 ¿vale? 299 00:17:28,809 --> 00:17:30,569 fijaros, luego vamos a ir al histograma 300 00:17:30,569 --> 00:17:31,670 aquí están pegados, ¿a que sí? 301 00:17:32,630 --> 00:17:34,170 ¿sí? pero voy a introducir 302 00:17:34,170 --> 00:17:36,289 ya que tengo esta gráfica aquí, el polígono 303 00:17:36,289 --> 00:17:36,990 de frecuencias 304 00:17:36,990 --> 00:17:40,190 aunque este ejercicio esté hecho 305 00:17:40,190 --> 00:17:42,190 con números, con 0, 1, 2, 3, 4 306 00:17:42,190 --> 00:17:44,150 me da igual, pensad que son los colores 307 00:17:44,150 --> 00:17:45,910 color rojo, verde, azul, amarillo 308 00:17:45,910 --> 00:17:48,369 ¿sí? vale, y aquí tengo 309 00:17:48,369 --> 00:17:49,930 su diagrama de barras 310 00:17:49,930 --> 00:17:52,529 el polígono de frecuencias que es 311 00:17:52,529 --> 00:17:55,150 unir el vértice de cada uno 312 00:17:55,150 --> 00:17:57,089 o el extremo superior 313 00:17:57,089 --> 00:17:58,210 de cada uno de estos 314 00:17:58,210 --> 00:18:00,549 ¿vale? 315 00:18:00,650 --> 00:18:02,690 de estas barras, las uno 316 00:18:02,690 --> 00:18:05,170 y me muestra como la evolución 317 00:18:05,170 --> 00:18:05,630 ¿lo veis? 318 00:18:07,049 --> 00:18:07,269 ¿sí? 319 00:18:08,369 --> 00:18:10,710 esto con el diagrama de barras, claro, si tiene 320 00:18:10,710 --> 00:18:13,710 forma de rectángulo 321 00:18:13,710 --> 00:18:15,230 voy a tener que coger el punto medio 322 00:18:15,230 --> 00:18:18,250 no es lo mismo que yo levante una línea 323 00:18:18,250 --> 00:18:20,210 aunque tenga cierto grosor 324 00:18:20,210 --> 00:18:21,890 ¿qué punto de aquí arriba uno? 325 00:18:22,910 --> 00:18:24,630 y aquí también voy a poder dibujar 326 00:18:24,630 --> 00:18:26,450 un histograma 327 00:18:26,450 --> 00:18:28,009 un polígono de frecuencia, perdonad 328 00:18:28,009 --> 00:18:29,650 pero con el punto medio 329 00:18:29,650 --> 00:18:32,210 vuelvo para arriba, ¿vale? 330 00:18:33,269 --> 00:18:33,990 estábamos aquí 331 00:18:33,990 --> 00:18:36,589 y vamos a ver 332 00:18:36,589 --> 00:18:38,730 algunos ejercicios así a grosor 333 00:18:38,730 --> 00:18:39,069 ¿vale? 334 00:18:41,859 --> 00:18:43,079 un ejercicio puede ser 335 00:18:43,079 --> 00:18:45,400 haz recuento de los siguientes datos 336 00:18:45,400 --> 00:18:48,119 ¿qué tenemos que hacer? calcular frecuencias absolutas, nada más 337 00:18:48,119 --> 00:18:51,579 Y contar cuántas veces está el 1, el 2, el 3 y el 4 338 00:18:51,579 --> 00:18:52,559 Colocarlo en la tabla 339 00:18:52,559 --> 00:18:53,359 ¿Vale? 340 00:18:54,259 --> 00:18:55,460 Yo con estos datos 341 00:18:55,460 --> 00:18:59,619 Podría calcular el resto de frecuencias 342 00:18:59,619 --> 00:19:00,220 ¿Vale? 343 00:19:00,660 --> 00:19:02,440 Voy a copiar esta tabla 344 00:19:02,440 --> 00:19:05,140 Y vamos a ver cómo la haríamos 345 00:19:05,140 --> 00:19:05,400 ¿Vale? 346 00:19:05,400 --> 00:19:09,259 Vamos a ver 347 00:19:09,259 --> 00:19:11,599 Los datos que tenemos es 348 00:19:11,599 --> 00:19:13,619 3, 8 349 00:19:13,619 --> 00:19:16,279 4 y 9 350 00:19:16,279 --> 00:19:23,730 Un segundín 351 00:19:23,730 --> 00:19:26,109 Y me voy a la cámara 352 00:19:26,109 --> 00:19:28,329 Aquí 353 00:19:28,329 --> 00:19:29,950 Esto es lo que tenemos 354 00:19:29,950 --> 00:19:32,450 Frecuencia absoluta, ¿no? 355 00:19:33,450 --> 00:19:35,250 Están recogidos todas esas respuestas 356 00:19:35,250 --> 00:19:35,869 Que nos habían dado 357 00:19:35,869 --> 00:19:38,089 ¿Cuántas hay? 3 y 8, 11 358 00:19:38,089 --> 00:19:41,069 11 y 4, 15 359 00:19:41,069 --> 00:19:42,970 15 y 9, 24, ¿no? 360 00:19:43,549 --> 00:19:45,069 Pues el número total es 361 00:19:45,069 --> 00:19:47,170 24 362 00:19:47,170 --> 00:19:49,289 Y lo pongo, ¿vale? 363 00:19:50,750 --> 00:19:51,950 Número total de datos 364 00:19:51,950 --> 00:19:54,230 Este es el número total de datos 365 00:19:54,230 --> 00:19:55,549 ¿Vale? 366 00:19:56,109 --> 00:20:05,220 24. Tengo la frecuencia absoluta y yo puedo poner también la frecuencia absoluta acumulada, la F mayúscula. 367 00:20:06,140 --> 00:20:11,099 Yo arranco con tres datos. Pues de momento solo acumulo tres. 368 00:20:13,339 --> 00:20:19,460 Tras considerar los que me han respondido 1 y 2, imagina que esto es el número de hijos, 1, 2, 3 o 4, ¿vale? 369 00:20:19,460 --> 00:20:42,019 ¿Vale? Pues yo aquí sumo los que tienen un hijo y los que tienen dos hijos, que son 3 más 8, van a 11. En el siguiente sumo 11 más 4, 15. Y al final sumo 15 más 9, 24. Y me tiene que coincidir con el número total de datos. ¿Vale? Esto es como un sumatorio, se llama un sumatorio en matemáticas. ¿Vale? 370 00:20:42,019 --> 00:20:45,960 Ahora van las frecuencias relativas 371 00:20:45,960 --> 00:20:48,099 Las relativas son las que cada dato 372 00:20:48,099 --> 00:20:49,660 Lo divido 373 00:20:49,660 --> 00:20:50,420 ¿Entre qué? 374 00:20:50,880 --> 00:20:51,640 Entre 24 375 00:20:51,640 --> 00:20:52,720 ¿Vale? 376 00:20:53,240 --> 00:20:54,480 La frecuencia relativa 377 00:20:54,480 --> 00:20:56,759 Se suele poner una H 378 00:20:56,759 --> 00:21:00,160 Pero es lo que veíamos ahí 379 00:21:00,160 --> 00:21:01,859 Que aparecía F sub i 380 00:21:01,859 --> 00:21:03,779 Entre el número de datos 381 00:21:03,779 --> 00:21:05,380 Esa división 382 00:21:05,380 --> 00:21:07,259 3 entre 24 383 00:21:07,259 --> 00:21:09,940 3 entre 24 384 00:21:09,940 --> 00:21:11,180 Y yo puedo hacer la división 385 00:21:11,180 --> 00:21:18,140 Vamos a ver 386 00:21:18,140 --> 00:21:19,480 Vamos a hacer las divisiones 387 00:21:19,480 --> 00:21:22,500 3 entre 24 388 00:21:22,500 --> 00:21:26,039 0,125 389 00:21:26,039 --> 00:21:27,920 Hablamos del 12,5% 390 00:21:27,920 --> 00:21:30,099 El siguiente es 391 00:21:30,099 --> 00:21:33,259 8 entre 24 392 00:21:33,259 --> 00:21:35,700 8 entre 24 393 00:21:35,700 --> 00:21:40,039 Pues 0,333 394 00:21:40,039 --> 00:21:42,680 Como salen infinitas cifras decimales 395 00:21:42,680 --> 00:21:44,180 Si yo luego aquí sumara 396 00:21:44,180 --> 00:21:45,279 Puede que me llegara 1 397 00:21:45,279 --> 00:21:47,000 Me quede 0,999 398 00:21:47,000 --> 00:21:49,440 Normal que se pierda precisión 399 00:21:49,440 --> 00:21:51,759 Lo estoy haciendo con 3 cifras decimales 400 00:21:51,759 --> 00:21:53,740 Lo pude haber hecho con 2 cifras decimales 401 00:21:53,740 --> 00:21:54,599 ¿Vale? 402 00:21:55,420 --> 00:21:56,839 El siguiente es 4 403 00:21:56,839 --> 00:21:59,400 Entre 404 00:21:59,400 --> 00:22:00,920 Número total de datos 405 00:22:00,920 --> 00:22:02,319 Pues 4 entre 24 406 00:22:02,319 --> 00:22:07,359 Me da 0,1666 407 00:22:07,359 --> 00:22:10,119 o habrá quien redonde como 1, 6, 7 408 00:22:10,119 --> 00:22:11,240 que diga voy a redondear 409 00:22:11,240 --> 00:22:14,400 ¿vale? podría haber redondeado perfectamente 410 00:22:14,400 --> 00:22:15,640 no lo he hecho 411 00:22:15,640 --> 00:22:17,079 he truncado directamente 412 00:22:17,079 --> 00:22:19,319 y el último 9 413 00:22:19,319 --> 00:22:21,920 entre 24 414 00:22:21,920 --> 00:22:24,519 9 entre 24 415 00:22:24,519 --> 00:22:26,519 me da 0,375 416 00:22:27,299 --> 00:22:29,019 ¿si? 417 00:22:29,880 --> 00:22:32,519 esta es la frecuencia relativa 418 00:22:32,519 --> 00:22:34,819 y ya tengo la frecuencia relativa 419 00:22:34,819 --> 00:22:36,519 acumulada 420 00:22:36,519 --> 00:22:42,819 acumulada. ¿Y qué es? Estos porcentajes, no es porcentaje, pero me lo voy a entender 421 00:22:42,819 --> 00:22:49,519 mejor así. Estos los voy a sumar. ¿Y al final qué me tiene que dar? Pues 1, me va 422 00:22:49,519 --> 00:22:55,660 a acumular 1, que es el 100%. O bueno, como es corta decimal, me puede quedar 0,99, o 423 00:22:55,660 --> 00:23:00,640 si es redondeado me puede quedar 1,01, ¿vale? Pero porque hemos redondeado, no por otra 424 00:23:00,640 --> 00:23:15,259 cosa vale lo arrancamos con acumulada de primeras 0 con 125 ahora que le sumamos 0,333 y me da 0,45 425 00:23:15,259 --> 00:23:16,299 8 426 00:23:16,299 --> 00:23:18,519 Ahora que le sumamos 427 00:23:18,519 --> 00:23:24,049 0,166 428 00:23:24,049 --> 00:23:28,009 Me da 0,624 429 00:23:28,009 --> 00:23:29,750 Y ahora le sumamos 430 00:23:29,750 --> 00:23:31,630 0,375 431 00:23:31,630 --> 00:23:33,390 Y oh sorpresa 432 00:23:33,390 --> 00:23:35,170 Me da 0,999 433 00:23:35,170 --> 00:23:37,289 Lo que esperábamos, vamos 434 00:23:37,289 --> 00:23:39,349 Yo puedo aquí redondear 435 00:23:39,349 --> 00:23:40,450 Y decir, vale, que esto es un 1 436 00:23:40,450 --> 00:23:41,410 ¿Vale? 437 00:23:42,609 --> 00:23:45,329 Bien, diréis, ¿y esto para qué? 438 00:23:45,329 --> 00:23:47,569 Porque nos va a ayudar para la parte 439 00:23:47,569 --> 00:23:49,210 Que ahora vamos a tener 440 00:23:49,210 --> 00:23:50,910 Que yo necesito unos datos que estudiar 441 00:23:50,910 --> 00:23:52,269 Como la media que comentabais 442 00:23:52,269 --> 00:23:54,650 ¿Vale? ¿Cómo calcular ese valor de la media? 443 00:23:55,529 --> 00:23:57,170 ¿Cómo calcular otro que se llama la mediana? 444 00:23:57,549 --> 00:23:58,390 Y que es la mediana 445 00:23:58,390 --> 00:24:00,890 ¿Cómo calcular lo que es la moda? 446 00:24:01,589 --> 00:24:03,390 Bien, pues de aquí lo vamos a poder sacar 447 00:24:03,390 --> 00:24:04,670 ¿Vale? 448 00:24:05,849 --> 00:24:07,690 Continúo y luego volvemos a este ejercicio 449 00:24:07,690 --> 00:24:08,990 Para intentar resolverlo 450 00:24:08,990 --> 00:24:09,589 ¿Os parece? 451 00:24:10,150 --> 00:24:13,210 Pero lo primero es saber que de manera más o menos mecánica 452 00:24:13,210 --> 00:24:15,970 yo tengo una tabla que es la que me va a ayudar 453 00:24:15,970 --> 00:24:16,930 ¿vale? 454 00:24:17,670 --> 00:24:19,390 yo con esta tabla así 455 00:24:19,390 --> 00:24:21,869 voy a poder calcular lo que se llama 456 00:24:21,869 --> 00:24:23,410 la media, la moda, la mediana 457 00:24:23,410 --> 00:24:25,609 incluso los cuartiles 458 00:24:25,609 --> 00:24:27,869 y los percentiles que puede que también os suene 459 00:24:27,869 --> 00:24:29,630 por ejemplo cuando se tiene 460 00:24:29,630 --> 00:24:31,809 un bebé y te dice que está 461 00:24:31,809 --> 00:24:34,190 en el percentil 30 o en el 70 462 00:24:34,190 --> 00:24:35,130 porque el niño va 463 00:24:35,130 --> 00:24:37,970 de peso más bajo 464 00:24:37,970 --> 00:24:39,069 o más alto 465 00:24:39,069 --> 00:24:42,109 ¿vale? pues vamos a ver qué significa 466 00:24:42,109 --> 00:24:46,210 qué significa y cómo encontrar ese valor con la ayuda de la tabla. 467 00:24:47,369 --> 00:24:51,230 Luego, para otros valores que usaremos más adelante, para estudiar la dispersión, 468 00:24:51,690 --> 00:24:59,670 usaremos otras columnas auxiliares, que me van a ayudar a hacer las cuentas. 469 00:24:59,750 --> 00:25:02,470 ¿Por qué? Porque no es lo mismo si yo tengo 5 respuestas, 470 00:25:03,750 --> 00:25:06,130 se puede hacer todo más o menos rápido y casi sin tabla, 471 00:25:07,029 --> 00:25:11,170 pero si yo tengo 200 respuestas, voy a tener que agrupar la información. 472 00:25:12,109 --> 00:25:14,950 Y para eso me va a ayudar mucho la tabla, ¿vale? 473 00:25:17,390 --> 00:25:18,970 Volvemos a nuestro documento. 474 00:25:21,220 --> 00:25:22,299 Bueno, ahí vienen ejemplos. 475 00:25:24,299 --> 00:25:29,500 Otro caso que tenemos es que muchas veces los datos vamos a tener que agruparlos. 476 00:25:30,619 --> 00:25:35,079 Pensad que yo tengo que o voy a estudiar la altura de las personas. 477 00:25:35,920 --> 00:25:37,720 Pues voy a ir centímetro a centímetro. 478 00:25:38,339 --> 00:25:39,680 ¿Cuántos datos voy a tener? Un montón. 479 00:25:39,680 --> 00:25:41,980 Pues yo voy a coger el dato más pequeño 480 00:25:41,980 --> 00:25:43,299 El dato más grande 481 00:25:43,299 --> 00:25:44,859 Y voy a trabajar intervalos 482 00:25:44,859 --> 00:25:45,720 ¿Vale? 483 00:25:45,740 --> 00:25:48,059 Imaginar que la altura más pequeña 484 00:25:48,059 --> 00:25:52,380 Es 153 485 00:25:52,380 --> 00:25:54,539 Y la mayor de las alturas 486 00:25:54,539 --> 00:25:56,460 Es 183 487 00:25:56,460 --> 00:25:58,400 Pues a lo mejor digo 488 00:25:58,400 --> 00:25:59,599 Mira, pues mientras hace intervalos 489 00:25:59,599 --> 00:26:00,779 De 5 en 5 centímetros 490 00:26:00,779 --> 00:26:01,599 ¿Vale? 491 00:26:02,200 --> 00:26:03,759 Venga, pues comienzo en el 150 492 00:26:03,759 --> 00:26:05,619 Venga, 150 a 155 493 00:26:05,619 --> 00:26:08,220 El siguiente que me va de 155 494 00:26:08,220 --> 00:26:10,180 a 160 495 00:26:10,180 --> 00:26:12,799 de 160 a 165 496 00:26:12,799 --> 00:26:13,660 y así progresivamente 497 00:26:13,660 --> 00:26:16,440 muchas veces también lo que se hace es 498 00:26:16,440 --> 00:26:18,579 comenzar el intervalo primero 499 00:26:18,579 --> 00:26:20,779 que comienza con la primera de las respuestas 500 00:26:20,779 --> 00:26:21,880 también se usa eso 501 00:26:21,880 --> 00:26:24,640 depende como yo vaya a analizar los datos 502 00:26:24,640 --> 00:26:27,259 es como, ¿cómo de grandes son los intervalos? 503 00:26:28,359 --> 00:26:28,740 pues ya 504 00:26:28,740 --> 00:26:30,460 tendremos que tomar decisiones 505 00:26:30,460 --> 00:26:32,819 lógicamente cuanto más pequeños 506 00:26:32,819 --> 00:26:34,319 sean los intervalos 507 00:26:34,319 --> 00:26:37,220 la información va a ser más precisa 508 00:26:37,220 --> 00:26:38,240 cuando pueda calcular 509 00:26:38,240 --> 00:26:41,039 lo que son medidas de centralización 510 00:26:41,039 --> 00:26:42,180 o de dispersión 511 00:26:42,180 --> 00:26:45,279 aquí vienen un montón 512 00:26:45,279 --> 00:26:47,380 de datos, da igual lo que significan 513 00:26:47,380 --> 00:26:49,279 a mí, pero tengo datos como el número 514 00:26:49,279 --> 00:26:51,279 14 y otro 515 00:26:51,279 --> 00:26:52,579 como el 829 516 00:26:52,579 --> 00:26:54,339 están muy separados 517 00:26:54,339 --> 00:26:56,980 pues aquí dice que 518 00:26:56,980 --> 00:26:58,819 imagina que decimos, agrúpalo 519 00:26:58,819 --> 00:27:00,279 en 5 intervalos 520 00:27:00,279 --> 00:27:03,000 pues tú buscas cuál es el más grande 521 00:27:03,000 --> 00:27:04,799 y el más pequeño, el más pequeño es 14 522 00:27:04,799 --> 00:27:05,960 y el más grande 523 00:27:05,960 --> 00:27:08,599 Pues decía, ojo 524 00:27:08,599 --> 00:27:11,500 975 525 00:27:11,500 --> 00:27:13,480 Aquí 945 526 00:27:13,480 --> 00:27:14,660 975, ¿vale? 527 00:27:15,440 --> 00:27:16,920 Digo, venga, pues voy a hacerlo entre 0 y 1000 528 00:27:16,920 --> 00:27:19,680 ¿Cómo? Quiero 5 intervalos 529 00:27:19,680 --> 00:27:20,980 De 0 a 1000 530 00:27:20,980 --> 00:27:22,440 Bueno, 1000 menos 0 es 1000 531 00:27:22,440 --> 00:27:25,059 1000 lo divido en 5 partes, entre 5 532 00:27:25,059 --> 00:27:27,200 Pues cada intervalo son 200 unidades 533 00:27:27,200 --> 00:27:29,799 Me dice, el primer intervalo me va de 0 a 200 534 00:27:29,799 --> 00:27:32,079 El siguiente de 200 a 400 535 00:27:32,079 --> 00:27:33,440 400, 600 536 00:27:33,440 --> 00:27:35,039 600, 800 y 800, 1000 537 00:27:35,039 --> 00:27:58,880 Pero, fijaros en los símbolos que hay a izquierda y a derecha, que el otro día cuando las funciones ya vimos que significaba que me aparezca un corchete o un paréntesis en un intervalo. El corchete significa que este punto, este extremo, está incluido, mientras que el paréntesis significa que este punto no está incluido. 538 00:27:58,880 --> 00:28:05,660 Es decir, en el 0 al 200, tengo incluidos todos los puntos que me van del 0 al 200 menos el 200. 539 00:28:05,799 --> 00:28:06,579 El 200 no. 540 00:28:07,640 --> 00:28:09,519 199 sí, pero el 200 cae fuera. 541 00:28:10,079 --> 00:28:12,220 El 200 se iría al siguiente intervalo. 542 00:28:12,400 --> 00:28:15,059 El siguiente intervalo es el 200, 400. 543 00:28:15,980 --> 00:28:19,980 Fijaros, 200 cerrado, 400 abierto. 544 00:28:21,839 --> 00:28:22,779 Y así todos ellos, ¿vale? 545 00:28:23,680 --> 00:28:28,140 Claro, yo recuento y digo, vale, entre el 0 y el 200 tengo 10 datos. 546 00:28:28,880 --> 00:28:29,319 Frecuencia. 547 00:28:30,500 --> 00:28:31,680 De todos estos datos, ¿vale? 548 00:28:32,299 --> 00:28:33,319 Los busco y digo, tengo 10. 549 00:28:34,400 --> 00:28:36,259 Entre el 200 y el 400, ¿cuántos tengo? 550 00:28:37,440 --> 00:28:37,880 13. 551 00:28:38,819 --> 00:28:40,940 Entre el 400 y el 600, 9. 552 00:28:40,940 --> 00:28:41,980 Así todos ellos, ¿vale? 553 00:28:42,799 --> 00:28:44,980 Pero cuidado, hay otra cosa más. 554 00:28:45,299 --> 00:28:46,339 Digo, vale, yo tengo la frecuencia. 555 00:28:47,099 --> 00:28:49,079 Pero una vez que yo cuento que tengo 10 dentro de este intervalo, 556 00:28:49,119 --> 00:28:50,240 yo voy a tener que hacer cuentas 557 00:28:50,240 --> 00:28:53,039 y qué es lo que sumo o qué es lo que resto. 558 00:28:53,940 --> 00:28:55,000 Voy a necesitar una cosa que se llama 559 00:28:55,000 --> 00:28:56,539 la marca de clase. Es decir, 560 00:28:56,539 --> 00:28:59,579 Todos los datos que caen dentro del intervalo 0, 200 561 00:28:59,579 --> 00:29:01,799 Les voy a asignar un mismo valor 562 00:29:01,799 --> 00:29:03,660 Ahora, si da un mismo valor 563 00:29:03,660 --> 00:29:06,539 Ya estoy perdiendo esa actitud 564 00:29:06,539 --> 00:29:08,220 ¿Vale? 565 00:29:08,759 --> 00:29:10,880 ¿Y qué número le asigno? 566 00:29:11,099 --> 00:29:12,660 El punto medio, el punto medio es el 100 567 00:29:12,660 --> 00:29:15,440 Pues yo automáticamente estoy diciendo 568 00:29:15,440 --> 00:29:17,960 Oye, los 10 datos que están entre 0 y 200 569 00:29:17,960 --> 00:29:21,039 Para mí es como si fueran 10 veces el 100 570 00:29:21,039 --> 00:29:23,259 ¿Vale? 571 00:29:23,920 --> 00:29:25,740 Siguiente intervalo entre 200 y 400 572 00:29:25,740 --> 00:29:26,700 ¿cuál es el punto medio? 573 00:29:28,240 --> 00:29:28,759 300 574 00:29:28,759 --> 00:29:32,099 si no lo veo a simple vista, sumo los extremos y divido entre 2 575 00:29:32,099 --> 00:29:33,079 300 576 00:29:33,079 --> 00:29:34,319 y tengo 13 datos 577 00:29:34,319 --> 00:29:37,640 pues automáticamente, para los cálculos 578 00:29:37,640 --> 00:29:38,799 que tengo que hacer posteriormente 579 00:29:38,799 --> 00:29:41,400 esos 13 datos son 13 veces 300 580 00:29:41,400 --> 00:29:43,539 y así sucesivamente 581 00:29:43,539 --> 00:29:44,779 con todo, ¿vale? 582 00:29:45,359 --> 00:29:47,000 eso es lo que se llama la marca de clase 583 00:29:47,000 --> 00:29:48,940 otro ejemplo 584 00:29:48,940 --> 00:29:51,640 pues si los mismos datos de antes 585 00:29:51,640 --> 00:29:53,400 yo los quiero hacer en 8 intervalos 586 00:29:53,400 --> 00:29:55,259 pues tengo que dividir 1000 587 00:29:55,259 --> 00:29:56,940 Entre 8 y me da 125 588 00:29:56,940 --> 00:29:59,940 Pues voy de 125 a 125 a la hora de hacer los intervalos 589 00:29:59,940 --> 00:30:01,240 ¿Vale? 590 00:30:01,680 --> 00:30:03,000 ¿La marca de clase quién es? 591 00:30:03,099 --> 00:30:03,880 Pues el punto medio 592 00:30:03,880 --> 00:30:07,779 Sumo 0 más 125 y divido entre 2 593 00:30:07,779 --> 00:30:08,839 62,5 594 00:30:08,839 --> 00:30:10,519 Esa es la marca de clase 595 00:30:10,519 --> 00:30:14,319 Y en este caso tengo 7 datos que van entre 0 y 125 596 00:30:14,319 --> 00:30:16,099 ¿Vale? 597 00:30:18,099 --> 00:30:20,940 Y voy a introducir lo que es el histograma 598 00:30:20,940 --> 00:30:24,440 El histograma es muy parecido a un diagrama de barras 599 00:30:24,440 --> 00:30:29,119 Pero lo vamos a usar cuando vamos a trabajar con intervalos 600 00:30:29,119 --> 00:30:30,099 Es decir, yo aquí abajo 601 00:30:30,099 --> 00:30:32,960 Pues voy a coger y decir, vale, el primer intervalo que es 602 00:30:32,960 --> 00:30:36,359 En el de, voy de 200 en 200 603 00:30:36,359 --> 00:30:37,579 El 0 a 200 604 00:30:37,579 --> 00:30:39,720 Pues yo marco el 0 a 200 605 00:30:39,720 --> 00:30:41,799 Y luego ya lo levanto en altura 606 00:30:41,799 --> 00:30:43,500 Pues mira, 10 veces 607 00:30:43,500 --> 00:30:46,240 Aquí viene el número 10 608 00:30:46,240 --> 00:30:47,759 Es la frecuencia 609 00:30:47,759 --> 00:30:51,279 El intervalo 200-400 está 13 veces 610 00:30:51,279 --> 00:30:53,500 Pues me veo aquí y digo, el siguiente intervalo 611 00:30:53,500 --> 00:30:55,279 Este es del 200 al 400 612 00:30:55,279 --> 00:30:58,099 Y lo levanto en altura 13 veces 613 00:30:58,099 --> 00:31:00,180 Y así conto, cada uno de ellos 614 00:31:00,180 --> 00:31:03,240 Claro, si en vez de 5 intervalos 615 00:31:03,240 --> 00:31:04,440 Yo tuviera 8 616 00:31:04,440 --> 00:31:07,039 Pues tengo que hacerlo así, claro 617 00:31:07,039 --> 00:31:09,059 Queda más estrechito, si lo des cuenta 618 00:31:09,059 --> 00:31:10,279 Porque el intervalo es más estrecho 619 00:31:10,279 --> 00:31:12,960 Puede cambiar ligeramente, fijaos que aquí 620 00:31:12,960 --> 00:31:15,119 A que se ve aquí un bajonazo, aquí en el centro 621 00:31:15,119 --> 00:31:16,839 En el quinto, sin embargo 622 00:31:16,839 --> 00:31:18,700 Cuando yo agrupo de 200 en 200 623 00:31:18,700 --> 00:31:20,019 No llego a verlo 624 00:31:20,019 --> 00:31:22,240 ¿Vale? 625 00:31:22,240 --> 00:31:25,299 porque depende como haga los intervalos 626 00:31:25,299 --> 00:31:27,019 pero igual, resulta que 627 00:31:27,019 --> 00:31:29,579 yo he cogido el intervalo 400-600 628 00:31:29,579 --> 00:31:31,339 y a lo mejor están 629 00:31:31,339 --> 00:31:32,940 todos los datos muy cerca del 400 630 00:31:32,940 --> 00:31:34,240 o muy cerca del 600 631 00:31:34,240 --> 00:31:37,319 ¿vale? y cuando lo divido en dos intervalos 632 00:31:37,319 --> 00:31:39,339 diferentes, pues si se ve esa separación 633 00:31:39,339 --> 00:31:40,700 ¿vale? 634 00:31:41,039 --> 00:31:43,019 entonces siempre cuantos más intervalos haga 635 00:31:43,019 --> 00:31:45,819 o cuantos más pequeños sean los intervalos 636 00:31:45,819 --> 00:31:46,839 ¿qué sucede? 637 00:31:48,380 --> 00:31:48,619 que 638 00:31:48,619 --> 00:31:50,740 es todo mucho más 639 00:31:50,740 --> 00:31:52,079 preciso ¿vale? 640 00:31:52,240 --> 00:32:03,859 Algo que no he dicho, y ahora ya veremos, es cómo se llama la diferencia que hay entre 641 00:32:03,859 --> 00:32:07,279 el dato más grande y el dato más pequeño, que es lo que se llama el rango. 642 00:32:07,279 --> 00:32:14,099 El rango es, mis datos van entre el 3 y el 14, pues 14 menos 3, 11. 643 00:32:14,279 --> 00:32:16,720 Hay 11 unidades en las cuales se desarrollan todos los datos. 644 00:32:16,720 --> 00:32:18,440 Que mis datos son 645 00:32:18,440 --> 00:32:20,460 El más pequeño es 7 646 00:32:20,460 --> 00:32:23,339 Y el más grande es 70 647 00:32:23,339 --> 00:32:24,779 ¿Cuál es el rango? 648 00:32:24,940 --> 00:32:25,859 70 menos 7 649 00:32:25,859 --> 00:32:27,359 Grande menos pequeño 650 00:32:27,359 --> 00:32:28,720 ¿Sí? 651 00:32:29,119 --> 00:32:31,740 Es el rango en el cual yo voy a encontrarme los datos 652 00:32:31,740 --> 00:32:33,460 Entre el mayor y el menor 653 00:32:33,460 --> 00:32:35,259 Lógicamente con variables que son 654 00:32:35,259 --> 00:32:37,500 Cuantitativas, que son numéricas 655 00:32:37,500 --> 00:32:38,140 ¿Vale? 656 00:32:41,799 --> 00:32:43,960 Bueno, aquí vienen algunos ejercicios resueltos 657 00:32:43,960 --> 00:32:44,680 ¿Vale? 658 00:32:44,740 --> 00:32:45,759 Igual con intervalos 659 00:32:45,759 --> 00:32:50,019 para que veáis la diferencia de si cojo datos numéricos 660 00:32:50,019 --> 00:32:53,180 este dice, agrupa los siguientes datos en 10 grupos 661 00:32:53,180 --> 00:32:55,759 y agrupa los mismos datos ahora en 5 grupos 662 00:32:55,759 --> 00:33:00,339 y que veamos cómo cambian los gráficos 663 00:33:00,339 --> 00:33:02,640 que como son valores que van del 1 al 10 664 00:33:02,640 --> 00:33:05,259 pues si yo lo cojo como valores discretos 665 00:33:05,259 --> 00:33:08,220 del 1 al 10, veo cuántas veces la frecuencia 666 00:33:08,220 --> 00:33:11,140 hay de cada uno de esos datos y hago mi gráfico 667 00:33:11,140 --> 00:33:15,039 si en vez de cogerlo como datos sueltos 668 00:33:15,039 --> 00:33:17,440 hago intervalos, digo, oye, el primer intervalo 669 00:33:17,440 --> 00:33:18,900 la respuesta es como me ha dicho 670 00:33:18,900 --> 00:33:21,099 1, 2, lo que es lo mismo, el intervalo 1, 2 671 00:33:21,099 --> 00:33:22,039 ¿vale? 672 00:33:22,960 --> 00:33:25,359 1, 2, pues tengo 16 respuestas 673 00:33:25,359 --> 00:33:27,259 10 más 6, 16 674 00:33:27,259 --> 00:33:29,400 el intervalo 3, 4 675 00:33:29,400 --> 00:33:31,440 pues son los que han respondido, 4 que era el 3 676 00:33:31,440 --> 00:33:33,180 y 9 que era el 4, 4, 9, 13 677 00:33:33,180 --> 00:33:35,380 y este sería el gráfico 678 00:33:35,380 --> 00:33:36,980 cambia el gráfico 679 00:33:36,980 --> 00:33:37,759 ¿vale? 680 00:33:38,940 --> 00:33:41,140 bueno, aquí veis 681 00:33:41,140 --> 00:33:42,079 el 682 00:33:42,079 --> 00:33:44,279 lo que decía antes 683 00:33:44,279 --> 00:33:49,940 En este caso, uno desde el punto medio 684 00:33:49,940 --> 00:33:55,440 De aquí arriba, en lo que es cada uno de estos rectángulos del histograma 685 00:33:55,440 --> 00:33:56,180 Desde el punto medio 686 00:33:56,180 --> 00:34:03,539 Hago unos ejercicios resueltos que os pueden servir de ayuda 687 00:34:03,539 --> 00:34:05,000 Con estas cosas básicas 688 00:34:05,000 --> 00:34:11,039 Y me voy a ir a lo que es la parte más numérica y matemática 689 00:34:11,039 --> 00:34:12,699 para la acción 690 00:34:12,699 --> 00:34:15,139 medidas de centralización 691 00:34:15,139 --> 00:34:17,780 vamos a tener medidas de centralización y de dispersión 692 00:34:17,780 --> 00:34:19,679 las medidas de centralización 693 00:34:19,679 --> 00:34:21,280 lo que van a decir es 694 00:34:21,280 --> 00:34:23,039 o nos van a dar información acerca de 695 00:34:23,039 --> 00:34:25,380 cómo los 696 00:34:25,380 --> 00:34:27,960 datos se sitúan 697 00:34:27,960 --> 00:34:29,239 ¿vale? con respecto a una 698 00:34:29,239 --> 00:34:31,519 posición y en concreto lo que 699 00:34:31,519 --> 00:34:33,360 más nos interesa es casi siempre 700 00:34:33,360 --> 00:34:35,460 lo más en el centro posible 701 00:34:35,460 --> 00:34:36,500 ¿vale? 702 00:34:38,239 --> 00:34:39,679 hay otras posiciones 703 00:34:39,679 --> 00:34:40,820 que nos pueden interesar 704 00:34:40,820 --> 00:34:42,980 Como decía antes, lo de los percentiles 705 00:34:42,980 --> 00:34:44,239 O los cuartiles 706 00:34:44,239 --> 00:34:46,559 Que me van a decir, bueno, donde estoy situado 707 00:34:46,559 --> 00:34:49,059 La media, que todos lo conocéis 708 00:34:49,059 --> 00:34:50,679 Lo que me va a decir es 709 00:34:50,679 --> 00:34:52,539 Bueno, si yo sumo todos los datos 710 00:34:52,539 --> 00:34:54,179 Y lo divido en el número total de datos 711 00:34:54,179 --> 00:34:55,659 Me va a decir 712 00:34:55,659 --> 00:34:58,440 Bueno, pues, cuál es ese valor 713 00:34:58,440 --> 00:35:00,059 Donde unos datos compensan a otros 714 00:35:00,059 --> 00:35:02,039 Un examen 715 00:35:02,039 --> 00:35:03,500 Un 6 y un 8 716 00:35:03,500 --> 00:35:05,820 Y digo, la media es un 7 717 00:35:05,820 --> 00:35:07,820 6 más 8, 14, entre 2, 7 718 00:35:07,820 --> 00:35:10,099 El 8 le da un puntito al 6 719 00:35:10,099 --> 00:35:13,500 Entonces el 8 baja a 7 720 00:35:13,500 --> 00:35:15,280 El 6 sube a 7, compensa 721 00:35:15,280 --> 00:35:17,199 ¿Vale? Eso es lo que hace la media 722 00:35:17,199 --> 00:35:19,800 ¿Vale? Si unos se tiran a otros 723 00:35:19,800 --> 00:35:20,719 ¿Vale? En total 724 00:35:20,719 --> 00:35:22,920 ¿Quién nos saldría? Por eso cuando nos dicen 725 00:35:22,920 --> 00:35:25,360 La media de hijos es 1,8 726 00:35:25,360 --> 00:35:26,699 Pues no es que hay 727 00:35:26,699 --> 00:35:29,800 Una madre que salga 0,8 hijos 728 00:35:29,800 --> 00:35:30,260 No 729 00:35:30,260 --> 00:35:32,659 ¿Vale? Es la... 730 00:35:32,659 --> 00:35:33,840 Ese cálculo numérico 731 00:35:33,840 --> 00:35:36,460 ¿Vale? Que 1,8 732 00:35:36,460 --> 00:35:38,340 ¿Qué te va a significar? Pues bueno, pues que sean 733 00:35:38,340 --> 00:35:40,539 casi dos hijos, los que tienes. 734 00:35:42,239 --> 00:35:42,480 ¿Vale? 735 00:35:42,519 --> 00:35:43,960 Vamos a hacer XT más X2, que es 1. 736 00:35:44,539 --> 00:35:46,340 Bueno, la media. Sumo todos los datos, 737 00:35:46,519 --> 00:35:47,579 ¿vale? Y divido. 738 00:35:48,800 --> 00:35:49,860 Aquí hay una formulita. 739 00:35:50,739 --> 00:35:52,239 ¿Veis que pone X1 por F1 740 00:35:52,239 --> 00:35:53,980 más X2 por F2 741 00:35:53,980 --> 00:35:55,440 hasta XN 742 00:35:55,440 --> 00:35:58,099 por FN partido número de datos. 743 00:35:59,199 --> 00:35:59,539 ¿Lo veis? 744 00:36:00,159 --> 00:36:01,840 Bien. Me voy a ir al papel. 745 00:36:02,719 --> 00:36:02,920 ¿Vale? 746 00:36:04,400 --> 00:36:06,119 ¿Es una fórmula o es una... 747 00:36:06,119 --> 00:36:06,880 Es una fórmula. 748 00:36:06,880 --> 00:36:09,139 Por eso os decía aquí lo del Fsui 749 00:36:09,139 --> 00:36:11,800 Que es F1, F2, F3 750 00:36:11,800 --> 00:36:13,059 Mirad, la media 751 00:36:13,059 --> 00:36:14,179 Para entenderlo más o menos 752 00:36:14,179 --> 00:36:17,400 Si yo tuviera poquitos datos 753 00:36:17,400 --> 00:36:18,139 ¿Vale? 754 00:36:18,599 --> 00:36:19,760 Yo digo, pues mira 755 00:36:19,760 --> 00:36:22,480 Los datos que tengo es 2 756 00:36:22,480 --> 00:36:23,579 Notas de un examen 757 00:36:23,579 --> 00:36:27,820 2, 7, 8, 4 y 6 758 00:36:27,820 --> 00:36:30,380 Estas son las notas que he sacado en exámenes 759 00:36:30,380 --> 00:36:32,059 ¿Cuántas notas son? 760 00:36:33,420 --> 00:36:35,119 En total, tengo 5, ¿no? 761 00:36:35,119 --> 00:37:02,559 Pues yo si he pensado mucho digo, mira, 2 más 7 más 8 más 4 y más 6, sumo todos mis datos y lo divido entre qué, entre 5, ¿no? 2 más 7 es 9, 9 más 8 es 17, 17 más 4 es 21, más 6 es 27, 27 partido 5 y si hago esta división me dice que la media es 5,4, ¿vale? 762 00:37:02,559 --> 00:37:06,380 La media se suele representar con este dato 763 00:37:06,380 --> 00:37:08,199 Con esta forma de escribir 764 00:37:08,199 --> 00:37:10,840 Una X y aquí una rayita 765 00:37:10,840 --> 00:37:12,519 Esa es la forma de escribir la media 766 00:37:12,519 --> 00:37:13,639 ¿Vale? 767 00:37:15,099 --> 00:37:17,599 Muchas veces aquí tienes media igual 768 00:37:17,599 --> 00:37:20,239 Ese es el símbolo, ¿vale? 769 00:37:21,199 --> 00:37:21,420 ¿Sí? 770 00:37:21,900 --> 00:37:23,320 Claro, esto cuando son poquitos datos 771 00:37:23,320 --> 00:37:25,500 Y yo sumo cada uno de los datos 772 00:37:25,500 --> 00:37:29,159 Que de hecho cada dato en esta ocasión me parece una sola vez 773 00:37:29,159 --> 00:37:31,360 La frecuencia de cada uno de ellos es una sola vez 774 00:37:31,360 --> 00:37:34,780 En el ejercicio que antes hemos planteado 775 00:37:34,780 --> 00:37:37,320 Nos ha dicho que el 1 está 3 veces, ¿no? 776 00:37:38,340 --> 00:37:38,519 ¿Sí? 777 00:37:39,219 --> 00:37:44,500 Vale, si yo me fuera un poco a lo bestia 778 00:37:44,500 --> 00:37:47,519 Yo diría, oye, pues el 1 está 3 veces 779 00:37:47,519 --> 00:37:50,340 Pues 1 más 1 más 1, 3 veces 780 00:37:50,340 --> 00:37:52,639 El 2 está 8 veces 781 00:37:52,639 --> 00:38:00,380 Más 2 más 2, 3, 4, 5, 6, 7, 8 veces, ¿no? 782 00:38:01,360 --> 00:38:19,519 El 3 está cuatro veces. Más 1, más 2, más 3, más 4. El 4 está nueve veces. Una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve veces. 783 00:38:19,519 --> 00:38:22,800 Hay cuatro, sí 784 00:38:22,800 --> 00:38:24,500 El cuatro nueve veces 785 00:38:24,500 --> 00:38:29,090 Cuatro nueve veces 786 00:38:29,090 --> 00:38:32,670 Y en total son veinticuatro datos 787 00:38:32,670 --> 00:38:35,150 Que si yo los contara me tendría que dar veinticuatro 788 00:38:35,150 --> 00:38:36,070 Que no me haya olvidado ninguno 789 00:38:36,070 --> 00:38:38,570 Y todo ello lo divido entre veinticuatro 790 00:38:38,570 --> 00:38:40,489 Bien, pues esta va a ser 791 00:38:40,489 --> 00:38:41,809 La media 792 00:38:41,809 --> 00:38:44,389 Pero puedes sumar todos los datos 793 00:38:44,389 --> 00:38:45,949 Esto es un rollo 794 00:38:45,949 --> 00:38:48,429 Tiene que haber una forma mecánica 795 00:38:48,429 --> 00:38:50,469 De calcularlo 796 00:38:50,469 --> 00:39:04,190 Bien. Para eso tenemos la tabla, ¿no? Para calcular aquí los datos de la tabla, mirad, la fórmula que aparecía dice x sub 1 por f sub 1, x sub 2 por f sub 2. 797 00:39:04,190 --> 00:39:13,989 Es decir, me va a multiplicar cada dato por su frecuencia, x sub 1 por f sub 1, x sub 2 por f sub 2. Eso es lo que me dice la fórmula. 798 00:39:13,989 --> 00:39:14,510 la fórmula 799 00:39:14,510 --> 00:39:17,489 en matemática de sumatorio 800 00:39:17,489 --> 00:39:19,989 de los x sub i por f sub i partido de i 801 00:39:19,989 --> 00:39:21,349 ¿vale? 802 00:39:22,130 --> 00:39:22,610 sumar 803 00:39:22,610 --> 00:39:25,750 x sub 1, f sub 1, x sub 2, f sub 2 804 00:39:25,750 --> 00:39:28,170 x sub 3, f sub 3, todos estos los multiplico 805 00:39:28,170 --> 00:39:29,989 y luego los sumo 806 00:39:30,650 --> 00:39:31,809 pues yo me voy a crear aquí 807 00:39:31,809 --> 00:39:34,030 otra columna, otra columna que es 808 00:39:34,030 --> 00:39:34,789 x sub i 809 00:39:34,789 --> 00:39:37,550 por f sub i 810 00:39:37,550 --> 00:39:38,909 ¿vale? 811 00:39:40,530 --> 00:39:41,670 voy a multiplicar 812 00:39:41,670 --> 00:39:43,030 1 por 3 813 00:39:43,030 --> 00:39:44,429 3 814 00:39:44,429 --> 00:39:46,429 2 por 8 815 00:39:46,429 --> 00:39:48,349 16 816 00:39:48,349 --> 00:39:49,710 3 por 4 817 00:39:49,710 --> 00:39:51,349 12 818 00:39:51,349 --> 00:39:52,429 y 4 por 9 819 00:39:52,429 --> 00:39:55,010 36 820 00:39:55,010 --> 00:39:57,989 y ahora los voy a sumar 821 00:39:57,989 --> 00:39:59,929 3 más 16, 19 822 00:39:59,929 --> 00:40:02,429 19 más 12, 31 823 00:40:02,429 --> 00:40:03,969 y 31 más 36 824 00:40:03,969 --> 00:40:05,630 67 825 00:40:05,630 --> 00:40:08,670 oye, que es que este sumatorio 826 00:40:08,670 --> 00:40:10,329 que es muy feo 827 00:40:10,329 --> 00:40:12,690 y no nos gusta ver estas fórmulas con letras 828 00:40:12,690 --> 00:40:15,809 Bueno, es lo mismo que decir 67 829 00:40:15,809 --> 00:40:17,570 Es 830 00:40:17,570 --> 00:40:20,329 Yo multiplico las X por F 831 00:40:20,329 --> 00:40:20,809 ¿Vale? 832 00:40:22,070 --> 00:40:24,190 Lo multiplico y le pongo una nueva columna 833 00:40:24,190 --> 00:40:26,369 Es una columna auxiliar que me va a ayudar 834 00:40:26,369 --> 00:40:28,269 El sumatorio 835 00:40:28,269 --> 00:40:29,409 Pues lo sumo, lo pongo aquí debajo 836 00:40:29,409 --> 00:40:31,889 Lo suma, 67 837 00:40:31,889 --> 00:40:33,030 ¿Y entre qué lo voy a dividir? 838 00:40:33,110 --> 00:40:34,250 Entre el número total de datos 839 00:40:34,250 --> 00:40:35,030 ¿Cuántos datos tengo? 840 00:40:36,190 --> 00:40:36,670 24 841 00:40:36,670 --> 00:40:39,510 Pues 67 entre 24 842 00:40:39,510 --> 00:40:42,130 Y si hago esa división 843 00:40:42,130 --> 00:40:43,110 me va a decir 844 00:40:43,110 --> 00:40:45,429 quién es la media, ¿vale? 845 00:40:46,050 --> 00:40:48,210 en nuestro caso, 67 entre 24 846 00:40:48,210 --> 00:40:50,269 es 2,79 847 00:40:50,269 --> 00:40:52,550 2,79 848 00:40:52,550 --> 00:40:53,869 pues la media en este caso 849 00:40:53,869 --> 00:40:56,269 de estos datos 850 00:40:56,269 --> 00:40:57,130 es 2,79 851 00:40:57,130 --> 00:41:00,090 si yo hago toda esta cuenta 852 00:41:00,090 --> 00:41:01,150 ¿cuánto me va a dar? 853 00:41:02,489 --> 00:41:04,230 pues si no me equivoco en el cálculo 854 00:41:04,230 --> 00:41:05,869 me tiene que dar 2,79 855 00:41:05,869 --> 00:41:08,170 claro, y si en vez de ser 856 00:41:08,170 --> 00:41:10,449 24 datos son 500 datos 857 00:41:10,449 --> 00:41:11,610 me voy a poner a sumar los 500 858 00:41:11,610 --> 00:41:12,909 no puedo 859 00:41:12,909 --> 00:41:15,530 además, podemos usar una hoja de cálculo 860 00:41:15,530 --> 00:41:16,510 y una hoja de cálculo 861 00:41:16,510 --> 00:41:19,250 vosotros pensad que estáis trabajando en cosas de estadística 862 00:41:19,250 --> 00:41:21,630 pues tú vas a sintetizar todos los datos así 863 00:41:21,630 --> 00:41:23,530 y solo con tener esto grabado 864 00:41:23,530 --> 00:41:26,070 todo lo demás son fórmulas 865 00:41:26,070 --> 00:41:27,610 al final, va muy mecanizado 866 00:41:27,610 --> 00:41:29,730 ¿vale? 867 00:41:30,429 --> 00:41:31,989 luego la única cosa que hace falta va a ser 868 00:41:31,989 --> 00:41:34,190 al final, tener estos datos 869 00:41:34,190 --> 00:41:35,789 ¿sí? entonces mirad 870 00:41:35,789 --> 00:41:37,730 esta columna me ayuda 871 00:41:37,730 --> 00:41:40,030 para calcular la media 872 00:41:40,030 --> 00:41:43,110 Porque la media es multiplicar cada dato por su frecuencia 873 00:41:43,110 --> 00:41:43,969 Por el número de veces 874 00:41:43,969 --> 00:41:47,710 Es lo mismo decir 4 más 4 más 4 875 00:41:47,710 --> 00:41:48,349 9 veces 876 00:41:48,349 --> 00:41:51,070 O por definición, sumar el 4 9 veces 877 00:41:51,070 --> 00:41:52,349 Es multiplicar el 4 por 9 878 00:41:52,349 --> 00:41:53,349 Por definición 879 00:41:53,349 --> 00:41:57,530 Y luego se lo sumo y divido entre el número de datos 880 00:41:57,530 --> 00:41:59,070 Esta es la media 881 00:41:59,070 --> 00:42:00,329 ¿Vale? 882 00:42:01,909 --> 00:42:02,150 ¿Sí? 883 00:42:02,150 --> 00:42:02,309 ¿Sí? 884 00:42:09,010 --> 00:42:10,369 Pues depende de lo que se os pida 885 00:42:10,369 --> 00:42:11,309 En principio todo 886 00:42:11,309 --> 00:42:15,110 ¿Vale? Y alguna cosa más que nos falte 887 00:42:15,110 --> 00:42:16,730 Bueno, a ver 888 00:42:16,730 --> 00:42:19,070 Más definiciones 889 00:42:19,070 --> 00:42:21,650 La moda, esta es más sencilla 890 00:42:21,650 --> 00:42:21,869 ¿Vale? 891 00:42:22,489 --> 00:42:25,090 La moda es lo que más se repite 892 00:42:25,090 --> 00:42:27,130 Lo que más veces aparece 893 00:42:27,130 --> 00:42:28,530 ¿Vale? 894 00:42:30,250 --> 00:42:31,610 Por lo tanto yo voy a buscar 895 00:42:31,610 --> 00:42:33,329 Entre las frecuencias absolutas 896 00:42:33,329 --> 00:42:35,789 Me vengo aquí a mi 897 00:42:35,789 --> 00:42:37,429 A ver, a mi hoja 898 00:42:37,429 --> 00:42:39,389 Y la moda va a ser 899 00:42:39,389 --> 00:42:41,230 La que tenga mayor frecuencia absoluta 900 00:42:41,230 --> 00:42:42,730 ¿Cuál tiene mayor frecuencia absoluta? 901 00:42:43,769 --> 00:42:44,389 El 4. 902 00:42:44,389 --> 00:42:45,289 ¿El 4 es el que más veces está? 903 00:42:45,449 --> 00:42:46,570 Que aparece 9 veces, ¿no? 904 00:42:47,349 --> 00:42:48,889 Pues la moda va a ser esta de aquí. 905 00:42:49,949 --> 00:42:52,849 Yo aquí me fijo para la moda, me fijo aquí para la moda. 906 00:42:54,010 --> 00:42:54,409 ¿Vale? 907 00:42:55,250 --> 00:43:01,190 Y entonces yo digo que la moda es 4. 908 00:43:01,590 --> 00:43:01,989 ¿Vale? 909 00:43:02,530 --> 00:43:04,889 Porque está aquí, está 9 veces. 910 00:43:05,809 --> 00:43:06,210 ¿Sí? 911 00:43:08,170 --> 00:43:10,889 Pero también a veces la moda puede ser varias cosas. 912 00:43:11,230 --> 00:43:30,909 La moda puede ser llevar vaqueros y la gorra al revés. Si hubiera habido varios datos con el 9, imaginar que este 8 me dio un 8 hubiera sido un 9. Pues yo digo que la moda sería 2 y 4. No hago ningún cálculo intermedio, ni cálculo medias, ni nada. Pues tengo varias modas. 913 00:43:30,909 --> 00:43:37,380 La moda es 4 914 00:43:37,380 --> 00:43:39,940 Se puede poner la M y la O chiquitita 915 00:43:39,940 --> 00:43:41,559 M, O es igual a 4 916 00:43:41,559 --> 00:43:43,880 Pero me lo ponéis con palabra, me vale 917 00:43:43,880 --> 00:43:46,079 Me lo ponéis así, también me vale 918 00:43:46,079 --> 00:43:47,340 ¿Sí? 919 00:43:49,869 --> 00:43:50,309 Bien 920 00:43:50,309 --> 00:43:52,869 Hemos visto la media, la moda 921 00:43:52,869 --> 00:43:55,929 Y el que me queda es la mediana 922 00:43:55,929 --> 00:43:57,369 Para entender la mediana 923 00:43:57,369 --> 00:44:00,130 Si yo voy por una autovía 924 00:44:00,130 --> 00:44:02,289 Tengo dos carriles 925 00:44:02,289 --> 00:44:04,269 o tengo dos direcciones del tráfico 926 00:44:04,269 --> 00:44:05,869 y hay una fuerza en la mitad 927 00:44:05,869 --> 00:44:08,789 que separa una dirección de la otra 928 00:44:08,789 --> 00:44:10,710 y le llamamos mediana 929 00:44:10,710 --> 00:44:12,190 porque está en el medio 930 00:44:12,190 --> 00:44:13,269 bien 931 00:44:13,269 --> 00:44:16,329 la mediana, en este caso, que son números 932 00:44:16,329 --> 00:44:18,769 si yo los números los ordenara 933 00:44:18,769 --> 00:44:20,510 de menor a mayor 934 00:44:20,510 --> 00:44:22,369 ¿qué dato está justo? 935 00:44:22,510 --> 00:44:23,190 en la mitad 936 00:44:23,190 --> 00:44:25,849 ¿qué número me deja? 937 00:44:25,849 --> 00:44:27,909 el 50% de los datos 938 00:44:27,909 --> 00:44:29,030 a la izquierda 939 00:44:29,030 --> 00:44:31,269 y el 50% de los datos 940 00:44:31,269 --> 00:44:32,530 a la derecha. 941 00:44:33,530 --> 00:44:35,090 ¿Eso lo entendemos por definición? 942 00:44:35,329 --> 00:44:37,449 Sí. Claro, si yo pudiera mirar 943 00:44:37,449 --> 00:44:38,510 aquí gráficamente, 944 00:44:39,250 --> 00:44:40,889 me dice, mira, es que 945 00:44:40,889 --> 00:44:43,489 son números 0, 1, 2, 3, 4, o colores, 946 00:44:43,590 --> 00:44:44,449 como quiera mover, ¿vale? 947 00:44:45,889 --> 00:44:47,150 Del 0 al 948 00:44:47,150 --> 00:44:49,250 treinta y tantos por ciento, porque la divido 949 00:44:49,250 --> 00:44:51,050 en cien partes. ¿Veis que lo que divide en cien partes? 950 00:44:51,769 --> 00:44:53,050 Si yo divido en cien partes, 951 00:44:53,530 --> 00:44:55,250 ¿vale? Digo, esto es hasta el 35%. 952 00:44:55,909 --> 00:44:57,449 Si yo voy acumulando, 953 00:44:57,869 --> 00:44:59,309 porque aquí voy a meter la frecuencia relativa 954 00:44:59,309 --> 00:45:01,210 acumulada, si yo voy 955 00:45:01,210 --> 00:45:02,630 acumulado aquí me paso de 50 956 00:45:02,630 --> 00:45:03,710 ¿lo veis? 957 00:45:05,070 --> 00:45:06,769 yo busco que el dato está justo en la mitad 958 00:45:06,769 --> 00:45:09,190 en el 50, pues mira, cuando echa el 50 959 00:45:09,190 --> 00:45:10,590 el color verde, el 1 960 00:45:10,590 --> 00:45:13,449 si yo os preguntara, ¿dónde está el 10%? 961 00:45:13,650 --> 00:45:15,150 ¿el 10% dónde está el 10%? 962 00:45:15,730 --> 00:45:17,070 gráficamente lo veo muy bien, aquí 963 00:45:17,070 --> 00:45:18,789 le toca en el 0, ¿a que sí? 964 00:45:20,289 --> 00:45:21,630 oye, ¿y el 90%? 965 00:45:22,409 --> 00:45:23,590 pues aquí, en el azul celeste 966 00:45:23,590 --> 00:45:26,969 pero claro, yo no voy a tener ese gráfico así tan bonito 967 00:45:26,969 --> 00:45:28,530 yo voy a tener números 968 00:45:28,530 --> 00:45:30,570 y voy a tener que buscar el 10% 969 00:45:30,570 --> 00:45:32,769 o 50%, ¿vale? 970 00:45:34,170 --> 00:45:36,610 La mediana, lo que está en el medio, ¿vale? 971 00:45:37,369 --> 00:45:41,090 Pero lo primero, debo de ordenar los números, ¿sí? 972 00:45:41,869 --> 00:45:49,989 Si yo tuviera poquitos datos y los ordeno, ¿vale? 973 00:45:51,230 --> 00:46:00,550 Por ejemplo, ordenado tengo el 2, 3, 5, 6, 6, 6, 8... 974 00:46:01,429 --> 00:46:02,349 ¿Quién está en el medio? 975 00:46:02,349 --> 00:46:05,570 se ve a simple vista 976 00:46:05,570 --> 00:46:07,630 que si yo coloco 977 00:46:07,630 --> 00:46:09,690 el 6 que está en el medio, me deja 3 datos 978 00:46:09,690 --> 00:46:11,170 a la izquierda y 3 datos a la derecha 979 00:46:11,170 --> 00:46:13,789 es más, en total 980 00:46:13,789 --> 00:46:15,829 son 7 datos, pues hay un truco 981 00:46:15,829 --> 00:46:17,710 que me dice, vale, el número de datos que es 7 982 00:46:17,710 --> 00:46:20,130 entre 2, me da 3,5 983 00:46:20,130 --> 00:46:21,670 y como la posición 984 00:46:21,670 --> 00:46:23,469 3,5 no existe, cojo la siguiente 985 00:46:23,469 --> 00:46:25,909 que es la cuarta, cuarta posición 986 00:46:25,909 --> 00:46:31,750 pero claro, que sucedería si yo tengo un dato más 987 00:46:31,750 --> 00:46:34,530 Tengo un 1 aquí, el 1, 2, 3 988 00:46:34,530 --> 00:46:36,570 5, 6, 6 989 00:46:36,570 --> 00:46:37,630 6 y 8 990 00:46:37,630 --> 00:46:40,210 Pues que si digo, oye, cojo el 5 991 00:46:40,210 --> 00:46:42,110 El 5 me deja 3 a la izquierda y 4 a la derecha 992 00:46:42,110 --> 00:46:42,550 No me vale 993 00:46:42,550 --> 00:46:46,070 Pues cojo el 6, 4 a la izquierda y 3 a la derecha 994 00:46:46,070 --> 00:46:46,710 No me vale 995 00:46:46,710 --> 00:46:48,590 La mediana estaría justo aquí en medio, ¿no? 996 00:46:49,190 --> 00:46:50,809 Pues yo debo de coger estos dos 997 00:46:50,809 --> 00:46:52,949 Necesito coger estos dos 998 00:46:52,949 --> 00:46:54,730 ¿Vale? 999 00:46:55,170 --> 00:46:57,110 Y así dejo 3 a la izquierda y 3 a la derecha 1000 00:46:57,110 --> 00:46:59,349 ¿Pero quién sería la mediana? 1001 00:46:59,349 --> 00:47:01,889 La mediana sería la media 1002 00:47:01,889 --> 00:47:03,090 5 más 6 entre 2 1003 00:47:03,090 --> 00:47:05,670 Tendría que calcular la mediana 1004 00:47:05,670 --> 00:47:08,789 En este caso sería 1005 00:47:08,789 --> 00:47:11,050 5 más 6 entre 2, lo que es lo mismo 1006 00:47:11,050 --> 00:47:12,230 5 y medio 1007 00:47:12,230 --> 00:47:15,170 Para calcular la posición, si yo divido 1008 00:47:15,170 --> 00:47:17,510 8 datos entre 2, me da 4 1009 00:47:17,510 --> 00:47:19,210 Pues tengo que coger 1010 00:47:19,210 --> 00:47:20,710 La cuarta posición 1011 00:47:20,710 --> 00:47:22,969 Más la quinta 1012 00:47:22,969 --> 00:47:25,329 Posición y dividir entre 2 1013 00:47:25,329 --> 00:47:27,949 Esto, con datos pequeñitos 1014 00:47:27,949 --> 00:47:29,090 Pues vale 1015 00:47:29,090 --> 00:47:30,250 Pero cuando tengo muchos datos 1016 00:47:30,250 --> 00:47:32,309 se me va el traste, no me vale 1017 00:47:32,309 --> 00:47:33,409 y por lo tanto 1018 00:47:33,409 --> 00:47:36,469 volvemos a mi tabla de frecuencias 1019 00:47:36,469 --> 00:47:36,849 ¿no? 1020 00:47:38,130 --> 00:47:39,929 y fijaros, yo aquí 1021 00:47:39,929 --> 00:47:42,530 he calculado la frecuencia 1022 00:47:42,530 --> 00:47:43,269 relativa 1023 00:47:43,269 --> 00:47:45,929 y aquí va la frecuencia relativa 1024 00:47:45,929 --> 00:47:47,030 acumulada 1025 00:47:47,030 --> 00:47:50,269 ¿lo veis? esto es como si 1026 00:47:50,269 --> 00:47:52,630 gráficamente yo cogiera 1027 00:47:52,630 --> 00:47:53,590 a ver si aquí 1028 00:47:53,590 --> 00:47:56,150 y dijera, pues oye, que es que 1029 00:47:56,150 --> 00:47:57,610 vamos a hacer una línea aquí 1030 00:47:57,610 --> 00:48:00,829 y tengo 1031 00:48:00,829 --> 00:48:24,030 del 0%, que se entiende mejor con un porcentaje, al 12,5%, aquí está el 1, del 12,5% al 45,8%, aquí va el 2, 1032 00:48:24,030 --> 00:48:27,610 De 0,45 al 0,62 1033 00:48:27,610 --> 00:48:30,590 Al 0,62 1034 00:48:30,590 --> 00:48:31,510 4 1035 00:48:31,510 --> 00:48:36,289 Sí 1036 00:48:36,289 --> 00:48:38,570 A ver, 62,4 1037 00:48:38,570 --> 00:48:40,250 Lo voy a poner como porcentaje 1038 00:48:40,250 --> 00:48:42,929 62,4 sería el 3 1039 00:48:42,929 --> 00:48:45,010 Y el 4 me va ya de aquí hasta 1040 00:48:45,010 --> 00:48:47,010 Hasta el 100% 1041 00:48:47,010 --> 00:48:49,289 Hasta el 100% 1042 00:48:49,289 --> 00:48:51,940 Yo os digo 1043 00:48:51,940 --> 00:48:54,519 ¿Dónde estaría la mediana? 1044 00:48:54,639 --> 00:48:56,019 ¿Dónde estaría el 50%? 1045 00:48:57,000 --> 00:48:58,639 Pues entre 45 y el 62 1046 00:48:58,639 --> 00:49:01,619 el 50 cae aquí, el 50% caería aquí 1047 00:49:01,619 --> 00:49:03,739 pues la mediana 1048 00:49:03,739 --> 00:49:05,280 ¿quién es? 3 1049 00:49:05,280 --> 00:49:06,699 ¿vale? 1050 00:49:07,559 --> 00:49:09,079 sin tener que dibujarlo 1051 00:49:09,079 --> 00:49:11,739 como antes, yo puedo buscarlo 1052 00:49:11,739 --> 00:49:12,239 aquí 1053 00:49:12,239 --> 00:49:14,500 yo puedo buscarlo aquí 1054 00:49:14,500 --> 00:49:17,519 porque yo digo, con el 1 1055 00:49:17,519 --> 00:49:18,460 he llegado hasta el 12 1056 00:49:18,460 --> 00:49:22,159 yo busco el 0,50, 0,50 es el 50% 1057 00:49:22,159 --> 00:49:22,320 ¿no? 1058 00:49:23,239 --> 00:49:23,440 ¿sí? 1059 00:49:25,280 --> 00:49:26,000 en el 2 1060 00:49:26,000 --> 00:49:27,440 llego hasta el 45% 1061 00:49:27,440 --> 00:49:34,199 por ciento no llega al 50 el siguiente dato ya es un 3 después de 45 por ciento y aquí 1062 00:49:34,199 --> 00:49:42,400 llevan 62 por ciento luego en este intervalo en este que en el que pasa del 50 por ciento 1063 00:49:42,400 --> 00:49:48,539 el 3 es donde está la mediana la mediana está en el 3 que es el intervalo que va del 0 45 al 0 62 1064 00:49:48,539 --> 00:49:52,679 Pensad que el intervalo va de 0 a 125 1065 00:49:52,679 --> 00:49:55,340 De 125 a 458 1066 00:49:55,340 --> 00:49:56,940 De 458 a 600 1067 00:49:56,940 --> 00:49:58,199 ¿Lo veis? 1068 00:49:59,139 --> 00:50:01,940 Luego yo busco aquí el 50%, ¿vale? 1069 00:50:02,340 --> 00:50:03,559 Que es esto multiplicado por 100 1070 00:50:03,559 --> 00:50:06,880 Luego, ¿este es el primero que pasa del 0 a 50? 1071 00:50:07,539 --> 00:50:09,659 Pues en 3 está la mediana 1072 00:50:09,659 --> 00:50:11,239 La mediana es 3 1073 00:50:11,239 --> 00:50:13,320 Y vosotros me decís, la mediana 1074 00:50:13,320 --> 00:50:17,139 Es 3, ¿vale? 1075 00:50:17,139 --> 00:50:19,400 Si queréis me podéis decir 1076 00:50:19,400 --> 00:50:26,519 Porque la frecuencia relativa acumulada es 0,624 1077 00:50:26,519 --> 00:50:29,320 Pero lo importante es esto, ¿vale? 1078 00:50:31,019 --> 00:50:31,239 ¿Sí? 1079 00:50:32,260 --> 00:50:35,639 Claro, y con esto nos vamos a meter en lo que se llama 1080 00:50:35,639 --> 00:50:36,500 Que creo que viene por aquí 1081 00:50:36,500 --> 00:50:40,300 Si yo tuviera aquí 1082 00:50:40,300 --> 00:50:45,579 Aquí, me pusiera el 50%, ¿vale? 1083 00:50:46,679 --> 00:50:48,340 Tendría que hacer la media entre los dos valores 1084 00:50:48,340 --> 00:50:51,840 Si justo tuviera 50%, ¿vale? 1085 00:50:52,780 --> 00:50:56,280 Claro, porque acumula el 50%, el otro 50% va después 1086 00:50:56,280 --> 00:50:58,960 Imagina que en vez de... a ver, vamos a hacer... 1087 00:50:58,960 --> 00:51:00,000 Espera, que no estoy viendo la cámara 1088 00:51:00,000 --> 00:51:07,289 Que tú dices que acumulamos en la columna de la acumulada 1089 00:51:07,289 --> 00:51:09,909 Imagínate que tenemos 0,25 1090 00:51:09,909 --> 00:51:12,349 0,50, ¿no? 1091 00:51:13,090 --> 00:51:17,670 0,65 y 1, ¿vale? 1092 00:51:17,670 --> 00:51:34,750 Y los datos es el 1, 2, 3 y 4. Bien, en este caso, el dato que yo busco está justo aquí. ¿Por qué? Porque por un lado aquí está el 50% de los datos y aquí está el otro 50% de los datos. 1093 00:51:34,750 --> 00:51:37,730 Luego, la mediana 1094 00:51:37,730 --> 00:51:38,929 Ni es 2 ni es 3 1095 00:51:38,929 --> 00:51:41,829 Está justo en la frontera 1096 00:51:41,829 --> 00:51:43,949 De los datos 1097 00:51:43,949 --> 00:51:44,769 ¿Sí? 1098 00:51:46,110 --> 00:51:47,590 La media de 2 y 7 1099 00:51:47,590 --> 00:51:48,610 Yo me cojo los dos 1100 00:51:48,610 --> 00:51:50,570 ¿Quién será la mediana? 1101 00:51:50,789 --> 00:51:51,429 Pues la mediana 1102 00:51:51,429 --> 00:51:54,530 La mediana sería 1103 00:51:54,530 --> 00:51:57,469 2 más 3 entre 2 1104 00:51:57,469 --> 00:51:58,170 2 y medio 1105 00:51:58,170 --> 00:52:01,199 ¿Sí? 1106 00:52:02,199 --> 00:52:04,400 A ver, en el examen intentaré que os caiga dentro 1107 00:52:04,400 --> 00:52:06,559 que no tenéis que ir ahí a la 1108 00:52:06,559 --> 00:52:08,019 frontera, por así decir, y ver 1109 00:52:08,019 --> 00:52:10,500 pero claro, es un caso que puede darse 1110 00:52:10,500 --> 00:52:11,539 perfectamente 1111 00:52:11,539 --> 00:52:16,079 ¿sí? bien 1112 00:52:16,079 --> 00:52:20,380 bueno, aquí vienen algunos ejemplos 1113 00:52:20,380 --> 00:52:21,440 de qué pasa si cambia 1114 00:52:21,440 --> 00:52:23,840 un número, si cambia otro 1115 00:52:23,840 --> 00:52:25,920 aquí tenéis ejercicios resueltos 1116 00:52:25,920 --> 00:52:27,699 ¿vale? fijaros, una tabla 1117 00:52:27,699 --> 00:52:30,500 y a partir de la tabla, pues que calcules 1118 00:52:30,500 --> 00:52:31,920 la frecuencia 1119 00:52:31,920 --> 00:52:34,619 absoluta 1120 00:52:34,619 --> 00:52:35,099 ¿vale? 1121 00:52:35,099 --> 00:52:37,820 que suma 30 datos, el x super f sui 1122 00:52:37,820 --> 00:52:38,780 que esto me vale para la media 1123 00:52:38,780 --> 00:52:41,519 la acumulada 1124 00:52:41,519 --> 00:52:42,619 ¿vale? 1125 00:52:44,199 --> 00:52:45,579 y bueno aquí realmente 1126 00:52:45,579 --> 00:52:48,159 para la mediana, pues ¿qué necesitaría? 1127 00:52:49,360 --> 00:52:50,239 bueno aquí la acumulada 1128 00:52:50,239 --> 00:52:51,199 también podría buscar 1129 00:52:51,199 --> 00:52:52,599 el título que podría buscar 1130 00:52:52,599 --> 00:52:55,400 ¿dónde está la mediana? si digo vale 1131 00:52:55,400 --> 00:52:57,340 son 30 datos, la mitad es 15 ¿no? 1132 00:52:58,539 --> 00:52:59,559 pues cuando pasa 1133 00:52:59,559 --> 00:53:01,000 de 15 1134 00:53:01,000 --> 00:53:03,659 pero yo creo que es que se ve mejor 1135 00:53:03,659 --> 00:53:04,440 con el porcentaje 1136 00:53:04,440 --> 00:53:07,500 ¿Vale? A mí me gusta más con la relativa 1137 00:53:07,500 --> 00:53:08,980 Con esto se podría ver, ¿vale? 1138 00:53:09,000 --> 00:53:10,960 Con la f sub i esta se puede ver perfecto 1139 00:53:10,960 --> 00:53:11,679 Pero que dice, vale 1140 00:53:11,679 --> 00:53:14,179 Estaría ahí en el 15 1141 00:53:14,179 --> 00:53:16,699 El 50%, ¿vale? 1142 00:53:16,820 --> 00:53:18,679 Pero pasa 1143 00:53:18,679 --> 00:53:20,619 Se ve mejor con la 1144 00:53:20,619 --> 00:53:22,219 Ya os digo 1145 00:53:22,219 --> 00:53:23,880 En este caso, como es un 1146 00:53:23,880 --> 00:53:27,239 Un intervalo, trabajamos siempre con las marcas de clase 1147 00:53:27,239 --> 00:53:27,780 Como dato 1148 00:53:27,780 --> 00:53:33,659 Dentro de la medida de posición, ¿vale? 1149 00:53:34,099 --> 00:53:35,920 Si la mediana es el 50% 1150 00:53:35,920 --> 00:53:37,719 donde cae el 50% de los datos 1151 00:53:37,719 --> 00:53:39,900 o dejas el 50% a la izquierda y a la derecha 1152 00:53:39,900 --> 00:53:41,400 yo puedo trocear 1153 00:53:41,400 --> 00:53:43,199 como se ve aquí gráficamente 1154 00:53:43,199 --> 00:53:46,679 el 10%, el 20%, el 30% de los datos hasta el 100% 1155 00:53:46,679 --> 00:53:46,880 ¿vale? 1156 00:53:47,360 --> 00:53:49,900 pensar que estos números corresponden 1157 00:53:49,900 --> 00:53:51,199 pues con el peso de los mismos 1158 00:53:51,199 --> 00:53:54,280 ¿vale? el que pesa más va a estar más a la derecha 1159 00:53:54,280 --> 00:53:56,059 que pesa más y el que pesa menos más a la izquierda 1160 00:53:56,059 --> 00:53:57,800 yo cuando te dice está en el percentil 10 1161 00:53:57,800 --> 00:53:59,239 está abajo de peso 1162 00:53:59,239 --> 00:54:02,300 porque si tú ordenas los datos de menor a mayor 1163 00:54:02,300 --> 00:54:03,239 pues 1164 00:54:03,239 --> 00:54:04,980 estaría ahí ¿vale? 1165 00:54:04,980 --> 00:54:07,440 Cuando me dice percentil 10, ¿qué busco? 1166 00:54:07,579 --> 00:54:08,300 El 10% 1167 00:54:08,300 --> 00:54:10,760 ¿Y dónde lo busco? 1168 00:54:10,940 --> 00:54:13,000 En la frecuencia relativa acumulada 1169 00:54:13,000 --> 00:54:14,699 En ese porcentaje que veíamos en la tabla 1170 00:54:14,699 --> 00:54:15,300 ¿Vale? 1171 00:54:16,599 --> 00:54:18,940 El percentil 90, mira, aquí se escribe 1172 00:54:18,940 --> 00:54:20,199 Una P y un 10 1173 00:54:20,199 --> 00:54:22,840 Percentil 10, percentil 80 1174 00:54:22,840 --> 00:54:25,219 Pues yo busco el 80%, el 80% está aquí 1175 00:54:25,219 --> 00:54:26,179 El 3, ¿vale? 1176 00:54:26,960 --> 00:54:28,199 Si yo me voy a mi tabla 1177 00:54:28,199 --> 00:54:29,980 Me voy a mi tabla de antes 1178 00:54:29,980 --> 00:54:31,480 Está aquí 1179 00:54:31,480 --> 00:54:34,119 ¿Dónde está el percentil 10? 1180 00:54:34,119 --> 00:54:56,880 Yo busco el 10%, pues el 10% en el primero, porque el primero llega hasta el 12%, ¿no? Aquí. El percentil 60. El 2 llega hasta el 45%, ¿no? El 3 llega hasta el 62, pues está en el 3. Entre el 45 y el 62 son 3. 1181 00:54:56,880 --> 00:55:01,969 sí 1182 00:55:01,969 --> 00:55:04,710 a partir de aquí 1183 00:55:04,710 --> 00:55:05,809 empiezo a sumar 3 1184 00:55:05,809 --> 00:55:08,710 desde el 0,45 al 0,62 1185 00:55:08,710 --> 00:55:09,250 ¿vale? 1186 00:55:09,789 --> 00:55:11,429 el percentil 90 1187 00:55:11,429 --> 00:55:15,389 pues el percentil 90 estaría aquí entre 0,62 y 0,99 1188 00:55:15,389 --> 00:55:16,809 luego sería un 4 1189 00:55:16,809 --> 00:55:18,510 igual que está el percentil 1190 00:55:18,510 --> 00:55:19,650 están los cuartiles 1191 00:55:19,650 --> 00:55:21,630 los cuartiles que se representan con una Q 1192 00:55:21,630 --> 00:55:23,469 y un 1 y un 3 1193 00:55:23,469 --> 00:55:26,929 primer cuartil 1194 00:55:26,929 --> 00:55:27,909 o tercer cuartil 1195 00:55:27,909 --> 00:55:29,690 25% 1196 00:55:29,690 --> 00:55:31,630 es el primer cuartil 1197 00:55:31,630 --> 00:55:33,650 el segundo cuartil 1198 00:55:33,650 --> 00:55:34,369 que no lo cita 1199 00:55:34,369 --> 00:55:36,610 es que es la mitad, ya lo tenemos 1200 00:55:36,610 --> 00:55:38,710 es la mediana 1201 00:55:38,710 --> 00:55:42,769 tercer cuartil es el 75% 1202 00:55:42,769 --> 00:55:43,690 lo que simplemente es decir 1203 00:55:43,690 --> 00:55:45,250 te dicen, primer cuartil 1204 00:55:45,250 --> 00:55:47,570 que tenemos que saber, que busco donde está el 1205 00:55:47,570 --> 00:55:48,989 25% 1206 00:55:48,989 --> 00:55:51,650 tercer cuartil, que busco 1207 00:55:51,650 --> 00:55:53,369 75% 1208 00:55:53,369 --> 00:55:53,829 no hay más 1209 00:55:53,829 --> 00:55:57,250 ¿vale? y los porcentiles es buscar 1210 00:55:57,250 --> 00:56:01,449 Pues la posición, 10%, 80%, 70% 1211 00:56:01,449 --> 00:56:03,050 El que me digan 1212 00:56:03,050 --> 00:56:04,250 ¿Sí? 1213 00:56:05,210 --> 00:56:05,690 Vale 1214 00:56:05,690 --> 00:56:11,449 El próximo día 1215 00:56:11,449 --> 00:56:12,170 ¿Vale? 1216 00:56:12,329 --> 00:56:14,369 Aquí vienen unos ejercicios un poco resueltos 1217 00:56:14,369 --> 00:56:16,809 ¿Con gráfica o sin gráfica? 1218 00:56:18,030 --> 00:56:18,889 Sin gráfica 1219 00:56:18,889 --> 00:56:20,630 No, no, sin gráfica 1220 00:56:20,630 --> 00:56:22,309 El próximo día, ¿vale? 1221 00:56:22,869 --> 00:56:24,510 Vamos a ir a las medidas de dispersión 1222 00:56:24,510 --> 00:56:25,150 ¿Vale? 1223 00:56:25,550 --> 00:56:27,389 Esta puede ser más compleja al calcularla 1224 00:56:27,389 --> 00:56:29,889 y ya os ayudaré un poquito con la fórmula 1225 00:56:29,889 --> 00:56:32,710 pero bueno, en la medida de dispersión 1226 00:56:32,710 --> 00:56:34,489 pues va a ver como los datos en mayor o menor 1227 00:56:34,489 --> 00:56:36,690 grado 1228 00:56:36,690 --> 00:56:38,170 se alejan 1229 00:56:38,170 --> 00:56:40,429 ¿vale? con respecto a las medidas 1230 00:56:40,429 --> 00:56:42,449 de centralización, con respecto a la media 1231 00:56:42,449 --> 00:56:44,429 como los datos se alejan 1232 00:56:44,429 --> 00:56:45,969 ¿vale? 1233 00:56:47,030 --> 00:56:48,309 y veremos el rango 1234 00:56:48,309 --> 00:56:50,289 ya os he dicho, el rango recorrido que es la diferencia entre 1235 00:56:50,289 --> 00:56:52,570 el mayor dato y el menor, ese no tiene misterio 1236 00:56:52,570 --> 00:56:54,210 pero la desviación típica 1237 00:56:54,210 --> 00:56:56,550 y la varianza, ambos tienen una fórmula 1238 00:56:56,550 --> 00:56:58,010 muy bonita, que la veis 1239 00:56:58,010 --> 00:56:59,849 ¿vale? preciosa 1240 00:56:59,849 --> 00:57:02,369 y decís, ¿qué significa? lo veremos el próximo día 1241 00:57:02,369 --> 00:57:04,349 pero lo vamos a poder hacer 1242 00:57:04,349 --> 00:57:05,710 lo vamos a poder hacer 1243 00:57:05,710 --> 00:57:07,329 con la tabla 1244 00:57:07,329 --> 00:57:10,309 ¿vale? porque yo tengo la f y 1245 00:57:10,309 --> 00:57:11,710 y tengo la x y 1246 00:57:11,710 --> 00:57:14,849 pues si yo pongo una tabla que diga x y al cuadrado 1247 00:57:14,849 --> 00:57:16,329 y luego 1248 00:57:16,329 --> 00:57:18,530 otra columna, donde lo multiplico por 1249 00:57:18,530 --> 00:57:20,530 f su y, y si al sumar 1250 00:57:20,530 --> 00:57:21,590 sumo todas las celdas 1251 00:57:21,590 --> 00:57:24,389 ¿qué es un rollo? sí, es un poco rollo, ¿vale? 1252 00:57:25,210 --> 00:57:26,190 lo vemos el próximo día 1253 00:57:26,190 --> 00:57:28,510 ¿Vale? El próximo día veremos 1254 00:57:28,510 --> 00:57:30,829 La varianza de la desviación típica 1255 00:57:30,829 --> 00:57:32,909 Y ya, pues nos iremos 1256 00:57:32,909 --> 00:57:33,650 A ver si me ha ido esto 1257 00:57:33,650 --> 00:57:36,889 Y ya pues nos iremos a hacer por aquí ejercicios 1258 00:57:36,889 --> 00:57:39,489 Pero que podéis ver ya ejercicios que están resueltos 1259 00:57:39,489 --> 00:57:39,750 ¿Vale? 1260 00:57:40,429 --> 00:57:43,309 Con vistas al examen 1261 00:57:43,309 --> 00:57:44,349 ¿Vale? 1262 00:57:44,929 --> 00:57:46,489 Pues yo al final os pondré unos datos 1263 00:57:46,489 --> 00:57:48,570 ¿Vale? O una tabla 1264 00:57:48,570 --> 00:57:51,170 Imaginaos, ya os lo doy, pero no, que no tengáis que hacer recuento 1265 00:57:51,170 --> 00:57:52,170 Con 1266 00:57:52,170 --> 00:57:55,650 Cada dato, cuál es su frecuencia absoluta 1267 00:57:55,650 --> 00:57:57,389 O a lo mejor tenéis que recontar si no son muchos. 1268 00:57:57,829 --> 00:58:03,070 Y a partir de ahí que calcule la media, la moda, la mediana, un percentil 10, ¿vale? 1269 00:58:04,170 --> 00:58:06,269 Que me digáis cuál es a lo mejor la división típica. 1270 00:58:06,769 --> 00:58:08,170 Pero todo eso se va a hacer por una tabla. 1271 00:58:09,110 --> 00:58:09,309 ¿Vale? 1272 00:58:10,289 --> 00:58:12,090 Entonces, por resumen, 1273 00:58:14,090 --> 00:58:14,809 debéis recordar, 1274 00:58:15,909 --> 00:58:18,489 la x y y son los datos con los que voy a trabajar. 1275 00:58:18,929 --> 00:58:19,150 ¿Vale? 1276 00:58:19,269 --> 00:58:20,710 Número adictos, 1, 2, 3, 4. 1277 00:58:20,710 --> 00:58:28,230 La F minúscula es la frecuencia absoluta número de veces que aparece cada dato 1278 00:58:28,230 --> 00:58:31,750 La F mayúscula es la acumulada 1279 00:58:31,750 --> 00:58:39,949 ¿Me podría servir para calcular la mediana percentil? 1280 00:58:39,949 --> 00:58:44,010 Sí, pero es más difícil porque el percentil es la décima parte de 24 1281 00:58:44,010 --> 00:58:46,750 Creo que cuesta más, es mejor verlo como porcentaje 1282 00:58:46,750 --> 00:58:49,869 la relativa es dividir 1283 00:58:49,869 --> 00:58:51,989 la frecuencia absoluta entre el número total de datos 1284 00:58:51,989 --> 00:58:53,469 ¿vale? y ya 1285 00:58:53,469 --> 00:58:56,010 voy a trabajar con un número que si lo multiplico por 100 1286 00:58:56,010 --> 00:58:56,769 es un porcentaje 1287 00:58:56,769 --> 00:58:59,730 que eso parece que ya se entiende más fácilmente 1288 00:58:59,730 --> 00:59:00,369 ¿vale? 1289 00:59:01,369 --> 00:59:03,929 y tengo el acumulado, que el acumulado es donde yo 1290 00:59:03,929 --> 00:59:05,130 me fijaría para ver 1291 00:59:05,130 --> 00:59:07,590 si a mí me piden percentil 30 1292 00:59:07,590 --> 00:59:09,530 pues en qué intervalo cae 1293 00:59:09,530 --> 00:59:11,570 el 30% o el 0,30 1294 00:59:11,570 --> 00:59:13,070 y así 1295 00:59:13,070 --> 00:59:15,789 digo cuál es el dato que está ahí 1296 00:59:15,789 --> 00:59:17,630 ¿Vale? Para calcular la media 1297 00:59:17,630 --> 00:59:19,849 me tengo que sumar todos los datos, si son muchos datos 1298 00:59:19,849 --> 00:59:21,369 y no sumarlo a lo bestia, ¿qué hago? 1299 00:59:22,989 --> 00:59:23,349 Multiplico 1300 00:59:23,349 --> 00:59:25,829 el dato por su frecuencia, el 1 3 veces 1301 00:59:25,829 --> 00:59:27,469 el 2 8 veces, el 3 4 veces 1302 00:59:27,469 --> 00:59:30,090 el 4 9 veces, aquí en esta columna 1303 00:59:30,090 --> 00:59:31,769 y lo subo 1304 00:59:31,769 --> 00:59:33,750 y tengo este sumatorio de esta fórmula 1305 00:59:33,750 --> 00:59:35,789 que a lo mejor 1306 00:59:35,789 --> 00:59:37,789 visto así no nos gusta 1307 00:59:37,789 --> 00:59:39,630 claro, multiplico este por este 1308 00:59:39,630 --> 00:59:41,349 este por este, este por este, este por este 1309 00:59:41,349 --> 00:59:43,289 y dejo aquí los resultados 1310 00:59:43,289 --> 00:59:45,489 y ahora lo subo, me da 67 1311 00:59:45,489 --> 00:59:53,030 calculó la media mediana buscar aquí donde que el 50% vale y la moda me fijo 1312 00:59:53,030 --> 01:00:00,389 en donde tengo la mayor frecuencia absoluta 1313 01:00:01,590 --> 01:00:08,469 el próximo día lo retomamos añadimos la variaza y la desviación típica 1314 01:00:08,469 --> 01:00:13,769 y hacemos un par de ejercicios ya más completos con la tabla