1 00:00:02,100 --> 00:00:19,339 Ya está. Vale. Pues digo que ya empezamos. El móvil es un poco lioso. ¿El qué? Es que desde el móvil la mínima que toco el botón se va todo. Vale. Pero sí, sí, sí lo veo, lo veo perfecto. Se ve, ¿no? Bueno, más que lo voy a ampliar. 2 00:00:19,339 --> 00:00:26,820 Y no sé si vosotros en nivel 1 habéis visto estadística y probabilidad 3 00:00:26,820 --> 00:00:29,300 Si lo habéis visto ayudaría bastante 4 00:00:29,300 --> 00:00:32,380 Porque es más de lo mismo, es exactamente lo mismo 5 00:00:32,380 --> 00:00:35,259 Con un poquito más de probabilidad 6 00:00:35,259 --> 00:00:37,420 Pero vamos, es muy muy parecido 7 00:00:37,420 --> 00:00:42,060 Y eso, esta ya es la última lección 8 00:00:42,060 --> 00:00:45,259 Con esta lección ya terminamos 9 00:00:45,259 --> 00:00:48,399 Entonces, pues bueno, pues nada 10 00:00:48,399 --> 00:01:13,140 Bueno, pues comentaros eso, que la estadística se hace con una población y con una muestra, se hace para ver más o menos, es un estudio en el que se ve cuando una muestra suficientemente grande, un conjunto de la población, queremos estudiar alguna particularidad. 11 00:01:13,140 --> 00:01:43,120 Por ejemplo, el número de hijos o cuántas mascotas tenemos o a quién partido botas o lo que sea. Un estudio de estadística son datos en concreto y esos datos estaría muy bien hacerselos a toda la población, pero como no se puede, se coge una representación que se supone que esa muestra es representación de la población de la que se quiera hacer el estudio. 12 00:01:43,140 --> 00:01:52,620 estudio. Por ejemplo, si saco las notas de mis alumnos, pues entonces no lo voy a hacer 13 00:01:52,620 --> 00:01:57,260 de todos, pero más o menos. Pues número de aprobados o de suspensos. Cogerías una 14 00:01:57,260 --> 00:02:03,019 muestra y de esa muestra, pues ve que sea representativa y entonces verías el número 15 00:02:03,019 --> 00:02:09,719 de aprobados o suspensos, por ejemplo. Bueno, pues ya digo, población es el colectivo del 16 00:02:09,719 --> 00:02:16,360 que se quiera hacer el estudio, la muestra es el conjunto más pequeño del que se va 17 00:02:16,360 --> 00:02:25,780 a obtener los datos para hacer dicho estudio. Y cada uno de los elementos de esa muestra 18 00:02:25,780 --> 00:02:31,919 es el individuo. Bueno, por ejemplo, hábitos alimenticios de tercero de la ESO de todo 19 00:02:31,919 --> 00:02:40,039 Madrid? Pues como no vamos a preguntar a todo tercero de la ESO, pues se decide tomar un 20 00:02:40,039 --> 00:02:47,659 IES que sea representativo por distrito y ver de algunos cuantos colegios, si hay más 21 00:02:47,659 --> 00:02:56,639 de 200 colegios, pues coges uno por distrito y de ahí sacas un estudio más o menos fiable. 22 00:02:56,639 --> 00:03:15,599 No puedes hacerlo ni los extremos, o sea, me refiero a sitios más deprimidos o sitios de renta más alta o sitios de población dispersa, o sea, los extremos no es conveniente en ningún estudio estadístico cogerlos. 23 00:03:15,599 --> 00:03:27,500 vale, por ejemplo, esta actividad dice queremos hacer un estudio de la cantidad de monedas que llevan en el bolsillo los estudiantes de tu clase 24 00:03:27,500 --> 00:03:36,659 para no preguntar a todos elegimos 10 compañeros al azar y anotas en tu cuaderno cuantas monedas lleva cada uno 25 00:03:36,659 --> 00:03:39,379 Dice, ¿cuál es la población? 26 00:03:40,039 --> 00:03:48,580 Bueno, pues la población son los estudiantes de la clase 27 00:03:48,580 --> 00:03:54,099 Pero imaginar que una clase tiene 30, por ejemplo, y de esos 30 han cogido solo a 10 28 00:03:54,099 --> 00:03:56,500 Pues la población sería toda la clase 29 00:03:56,500 --> 00:04:02,460 Y la muestra elegida sería solo los 10 a los que le has preguntado 30 00:04:02,460 --> 00:04:27,279 ¿Vale? Antes esto de aquí, lo de el estudio de los hábitos alimenticios de todos los estudiantes de tercero de la ESO de Madrid, ya digo que hay más de 200 centros públicos, entonces pues solo un 10 por distrito a lo mejor aquí la muestra serían 8 institutos o 5 de los 200 que hay. 31 00:04:27,279 --> 00:04:34,120 y especifica 5 individuos que pertenezcan a la población y no a la muestra 32 00:04:34,120 --> 00:04:39,600 pues los que pertenecen a la población son los 20 que no se les ha preguntado 33 00:04:39,600 --> 00:04:48,439 la muestra son esos 10 que sí, pero los que no pertenecen son a los 20 que no se les ha preguntado 34 00:04:48,439 --> 00:04:52,699 bueno, más o menos esto se entiende 35 00:04:52,699 --> 00:05:13,870 Y dice aquí, pues se pueden hacer estadísticas de cosas tan variopintas como las frutas que tomas, o sea, la cantidad de fruta que tomas, o cuánta comes al día, cuántas monedas, la altura, las marcas de chocolate, etc. 36 00:05:13,870 --> 00:05:30,870 Bien, pues según el tipo de estudio que hagamos, podemos ver que la variable es de lo que tú quieres hacer la estadística. Esa es la variable. Pues puede ser o cuantitativa o cualitativa. 37 00:05:30,870 --> 00:05:55,350 Cuantitativa o cualitativa, vale, la cuantitativa se expresa con números y la cualitativa se expresa con cualidades, por ejemplo, la cualitativa sería el color de ojos, vamos a estudiar el color de ojos de un conjunto de individuos 38 00:05:55,350 --> 00:06:00,769 Pues la cualitativa sería negro, marrón, azules, etc. 39 00:06:01,649 --> 00:06:06,269 Y sin embargo la cuantitativa se expresa con números 40 00:06:06,269 --> 00:06:09,790 Entonces es, por ejemplo, número de hijos 41 00:06:09,790 --> 00:06:14,750 Pues número de hijos da su número, o uno, o dos, o tres, los que sean 42 00:06:14,750 --> 00:06:17,589 Eso sería cuantitativa 43 00:06:17,589 --> 00:06:21,110 Y ya digo, cualitativa darías cualidades 44 00:06:21,110 --> 00:06:28,629 Entonces, dentro de las cuantitativas están las discretas y las continuas 45 00:06:28,629 --> 00:06:36,709 Las discretas solo admiten valores aislados, yo diría casi números enteros 46 00:06:36,709 --> 00:06:41,250 Porque lo de los valores aislados es un poco raro 47 00:06:41,250 --> 00:06:46,329 Pero números enteros sí que nos va a decir o 1 o 2 o 3 48 00:06:46,329 --> 00:06:47,870 Por ejemplo, número de hijos 49 00:06:47,870 --> 00:06:52,670 Pues esa sería una variable cuantitativa discreta 50 00:06:52,670 --> 00:06:57,009 Que la podemos definir por un hijo, dos hijos o tres 51 00:06:57,009 --> 00:07:00,670 Bueno, hasta cinco a lo mejor, pero no mucho más 52 00:07:00,670 --> 00:07:09,649 Pero sin embargo, la cuantitativa continua puede darse números decimales también 53 00:07:09,649 --> 00:07:11,689 Por ejemplo, el peso 54 00:07:11,689 --> 00:07:18,069 Pues el peso de 40 personas, no hay dos personas que pesen igual 55 00:07:18,069 --> 00:07:21,769 Una pesa 0,5, aunque sea parecido 56 00:07:21,769 --> 00:07:28,930 38,5 o 38,75 57 00:07:28,930 --> 00:07:32,189 O sea, dentro del mismo peso no hay dos iguales 58 00:07:32,189 --> 00:07:33,970 Vale, pues esa se llama continua 59 00:07:33,970 --> 00:07:41,750 Porque el peso, igual que por ejemplo la temperatura 60 00:07:41,750 --> 00:07:46,029 ¿Qué temperatura hay en la primavera en Madrid? 61 00:07:46,189 --> 00:07:50,569 Bueno, pues las temperaturas en grados centígrados pueden tener también decimales 62 00:07:50,569 --> 00:07:56,230 Y pueden ser infinitos, casi casi infinitos valores 63 00:07:56,230 --> 00:07:58,670 Pero sin embargo las discretas no 64 00:07:58,670 --> 00:08:02,449 Las discretas son unos cuantos valores 65 00:08:02,449 --> 00:08:11,089 y ya digo que corresponden a números enteros, sobre todo positivos, negativo no es raro. 66 00:08:11,970 --> 00:08:22,670 Vamos a hacer en estas actividades, dice, clasifica las variables cualitativa y cuantitativa del primer ejercicio, 67 00:08:23,490 --> 00:08:29,629 por eso no lo he quitado de la pantalla, por ejemplo, frutas que comes a lo largo de una semana, 68 00:08:29,629 --> 00:08:35,470 Sería cuantitativa discreta, pongo solo la C y la D 69 00:08:35,470 --> 00:08:43,409 ¿Cuántas piezas comes al día? Pues también lo mismo, es un número, cuantitativo discreto 70 00:08:43,409 --> 00:08:49,490 ¿Cuántas monedas llevas en el bolsillo? Lo mismo, son cantidades que puedes contar 71 00:08:51,110 --> 00:08:55,870 Unidades aisladas, pero ¿cuál es la altura? o ¿cuál es tu altura? 72 00:08:55,870 --> 00:09:14,990 Eso es lo que hemos puesto como una cuantitativa continua. Esa se mide una cantidad, pero puedes tener decimales y ya digo que a dos personas que le preguntes no vas a encontrar dos cifras exactamente igual. 73 00:09:14,990 --> 00:09:36,309 Dices, ¿y este cómo lo vamos a meter en una estadística? Pues ahora lo veremos. ¿Cuántas marcas de chocolate recuerdas? Marca de chocolate es cualitativa, es una cualidad. Voy a poner CL de cualitativa. ¿Cuáles son las marcas de chocolate que recuerdas? Pues lo mismo. 74 00:09:36,309 --> 00:09:56,409 Si hicieran este estudio estadístico, sería cualitativa. ¿Cuántos hermanos tienes? Cuantitativa, discreta. ¿Cuál es tu color favorito para un coche? También es una cualidad, cualitativa, CL. 75 00:09:56,409 --> 00:10:00,169 Cuánto tiempo pasas al día viendo la televisión 76 00:10:00,169 --> 00:10:04,870 Pues esto es muy variable, esto no se responde con un solo número 77 00:10:04,870 --> 00:10:09,269 Puedes poner 30 minutos, 40 minutos, 65 minutos, etc 78 00:10:09,269 --> 00:10:14,090 Yo esta casi casi que la pondría cuantitativa continua 79 00:10:14,090 --> 00:10:18,049 Y cuántos seguidores tienes en Twitter 80 00:10:18,049 --> 00:10:21,350 Ahí no puede haber decimales 81 00:10:21,350 --> 00:10:24,129 O sea, las personas, o es una, o dos, o tres 82 00:10:24,129 --> 00:10:25,549 Aunque tengas un millón 83 00:10:25,549 --> 00:10:34,509 pero esta depende, si es un número bajo, sí que la podríamos poner como discreta 84 00:10:34,509 --> 00:10:42,629 pero si son números muy muy altos, entonces a varias personas se les pregunta 85 00:10:42,629 --> 00:10:48,789 y puedes tener desde un rango muy bajo hasta un rango muy alto de número de seguidores 86 00:10:48,789 --> 00:10:56,370 entonces ya aquí interesaría operar como si fuera una cuantitativa continua 87 00:10:56,370 --> 00:11:03,149 Si puedes tener desde 2 hasta a lo mejor 100 millones o 10 millones o lo que sea 88 00:11:03,149 --> 00:11:08,029 unos números muy muy altos, entonces aquí el margen es tan grande 89 00:11:08,029 --> 00:11:14,250 aunque no haya decimales, que a la hora de meterlo en una variable 90 00:11:14,250 --> 00:11:18,570 la clasificaríamos como cuantitativa continua 91 00:11:18,570 --> 00:11:26,340 Bien, pues vamos a continuar un poquito más, hasta aquí se entiende 92 00:11:26,340 --> 00:11:46,659 Bueno, cuando ya hemos decidido qué tipo de estudio estadístico queremos hacer 93 00:11:46,659 --> 00:11:51,179 Y queremos, ya tenemos una muestra de individuos 94 00:11:51,179 --> 00:11:57,000 Y queremos ir agrupando nuestros datos 95 00:11:57,000 --> 00:12:01,200 lo vamos a representar por medio de tablas 96 00:12:01,200 --> 00:12:03,720 y en esas tablas 97 00:12:03,720 --> 00:12:05,840 dice si se elige una muestra 98 00:12:05,840 --> 00:12:07,539 los dos aspectos que hay que tener en cuenta 99 00:12:07,539 --> 00:12:09,860 son el tamaño, la representatividad de la muestra 100 00:12:09,860 --> 00:12:11,279 ta ta ta, si es muy pequeña 101 00:12:11,279 --> 00:12:13,320 aunque esté bien elegida 102 00:12:13,320 --> 00:12:15,259 bueno, como no nos van a poner 103 00:12:15,259 --> 00:12:18,000 a nosotros a hacer 104 00:12:18,000 --> 00:12:20,799 estudios estadísticos 105 00:12:20,799 --> 00:12:22,080 no nos van a dar ya 106 00:12:22,080 --> 00:12:23,460 dados y hechos 107 00:12:23,460 --> 00:12:25,679 entonces vamos al grano 108 00:12:25,679 --> 00:12:33,320 y sobre una muestra, ya digo, suficientemente grande, ni muy pequeña ni grandísima 109 00:12:33,320 --> 00:12:37,740 vamos a estudiar tres parámetros 110 00:12:37,740 --> 00:12:45,399 que son la frecuencia absoluta, que es el número de veces que se repite cada dato 111 00:12:45,399 --> 00:12:51,840 la frecuencia relativa, en ella esta frecuencia absoluta 112 00:12:51,840 --> 00:13:02,559 la vamos a dividir entre el número total de observaciones, ahora lo veremos, el número total de observaciones es todos los datos que hemos cogido 113 00:13:02,559 --> 00:13:14,419 y luego la frecuencia acumulada, vamos a ir arrastrando los valores y vamos a ir sumando y al final nos va a dar el mismo número que hemos conseguido 114 00:13:14,419 --> 00:13:21,019 con la frecuencia relativa. Bueno, pues vamos, solo para que sepáis que vamos a ver estos 115 00:13:21,019 --> 00:13:31,809 tres tipos de frecuencias en las tablas. Bien, pues vamos ya a ver cómo operamos con esto. 116 00:13:32,169 --> 00:13:42,009 Ya digo, el que haya hecho el año pasado nivel 1, pues es más de lo mismo. Aquí la 117 00:13:42,009 --> 00:13:49,289 muestra, son 13 niños, se realiza un control del peso de un grupo de niños, se contabilizan 118 00:13:49,289 --> 00:13:54,590 las veces que comen al día chocolatina, 13 niños en un mes. Esto es irrelevante, nos 119 00:13:54,590 --> 00:14:03,429 da igual el tiempo. Y el número de alumnos, estos 13 niños que han ido respondiendo, 120 00:14:03,889 --> 00:14:11,570 pues cada uno de los alumnos ha ido respondiendo las chocolatinas que se ha ido tomando durante 121 00:14:11,570 --> 00:14:20,409 un mes. Vale. Bueno, pues estos datos se agrupan de esta manera. Primero, claro, ellos han 122 00:14:20,409 --> 00:14:25,730 dicho al azar, dos chocolatinas, cinco, tres, ta, ta, ta, ta. Nosotros vamos a agruparlas 123 00:14:25,730 --> 00:14:32,690 en orden creciente, estos valores que tenemos aquí, y vemos que el menor es el cero y el 124 00:14:32,690 --> 00:14:39,409 mayor es el cinco. Digo, perdón, el mayor es el siete. Dice, vale, pues de cero chocolatinas, 125 00:14:39,409 --> 00:14:45,529 Porque a este niño no le gusta el chocolate, al que se ha tomado 7, entonces tenemos muestra. 126 00:14:45,929 --> 00:14:52,110 Entonces, la muestra es las cantidades de veces que se repite cada valor. 127 00:14:52,809 --> 00:15:01,570 Eso sería la frecuencia absoluta. La frecuencia absoluta, ya digo, es cantidades de veces que se repite cada valor. 128 00:15:01,570 --> 00:15:23,929 Por ejemplo, de cero hay dos. Aquí un cero. Voy a borrar esto y esto. De cero chocolatinas hay este y este. Bueno, pues ponemos dos. De una chocolatina tenemos este y este. Otras dos. 129 00:15:23,929 --> 00:15:29,129 De dos chocolatinas tenemos uno, lo voy a poner en otro color 130 00:15:29,129 --> 00:15:34,169 De dos tenemos uno, dos, tres y cuatro 131 00:15:34,169 --> 00:15:38,450 Vale, pues esos cuatro puntitos serían estos cuatro de aquí 132 00:15:38,450 --> 00:15:41,830 De tres tenemos una, la ponemos 133 00:15:41,830 --> 00:15:46,090 De cuatro tenemos dos, este y este 134 00:15:46,090 --> 00:15:48,190 Son estos dos valores 135 00:15:48,190 --> 00:15:50,870 De cinco, uno que está aquí 136 00:15:50,870 --> 00:15:58,269 De 6 no hay nada, pero tenemos que poner, del mínimo al máximo, tenemos que poner todos los valores 137 00:15:58,269 --> 00:15:59,610 Que hay 0, pues 0 138 00:15:59,610 --> 00:16:05,929 Y por último, de 7, que sería esta cantidad, un individuo 139 00:16:05,929 --> 00:16:08,850 Bueno, pues eso es la frecuencia de veces 140 00:16:08,850 --> 00:16:15,990 La frecuencia absoluta es el número de veces que se repite cada dato 141 00:16:15,990 --> 00:16:18,090 El número de veces que le tenemos 142 00:16:18,090 --> 00:16:43,889 En total, esto tiene que sumar 13. La suma de la frecuencia absoluta, esto sería el sumatorio, de todo esto nos tiene que dar 13. 143 00:16:43,889 --> 00:16:57,889 Vale, y luego dices, la frecuencia absoluta acumulada, acumulada es que a la primera le sumas la segunda, entonces, la primera no tiene ninguna anterior... 144 00:16:57,889 --> 00:16:59,210 ¿El qué? 145 00:17:00,330 --> 00:17:02,429 No, no, no, que es este de aquí 146 00:17:02,429 --> 00:17:07,529 Vale, estaba con la frecuencia absoluta acumulada 147 00:17:07,529 --> 00:17:14,130 Y digo que la acumulada vas sumando la anterior 148 00:17:14,130 --> 00:17:17,170 Anterior al 2 no hay nada, pues ponemos un 2 149 00:17:17,170 --> 00:17:18,890 En el segundo... 150 00:17:18,890 --> 00:17:25,289 En el segundo dato tenemos 2 más 2, 4 151 00:17:25,289 --> 00:17:27,710 O sea, este más este, este 152 00:17:27,710 --> 00:17:33,769 En el tercero, 4 más el anterior, 8, este más este, este 153 00:17:33,769 --> 00:17:37,269 Y así, 1 más 8, 9 154 00:17:37,269 --> 00:17:40,789 Así vamos obteniendo la frecuencia acumulada 155 00:17:40,789 --> 00:17:44,069 2 más 9, 11 156 00:17:44,069 --> 00:17:46,569 11 más 1, 12 157 00:17:46,569 --> 00:17:56,490 Y como en esta muestra no ha habido ningún individuo, pues otra vez 12 y 1, 13 158 00:17:56,490 --> 00:18:03,490 vale, pues este 13 es el valor máximo que tenemos 159 00:18:03,490 --> 00:18:08,369 que tiene que coincidir, la frecuencia absoluta acumulada 160 00:18:08,369 --> 00:18:13,369 tiene que coincidir con la suma de frecuencias absolutas 161 00:18:13,369 --> 00:18:16,490 que ya digo que es la muestra 162 00:18:16,490 --> 00:18:19,390 ¿se entiende? 163 00:18:19,390 --> 00:18:46,549 vale, pues vamos a hacer, antes de avanzar nada más, vamos a hacer un ejercicio que 164 00:18:46,549 --> 00:18:55,670 tenemos en la última hoja, aquí bajamos, bajamos y donde dice ejercicios, pues ahí 165 00:18:55,670 --> 00:19:05,210 poquito más para ver si se ha entendido de lo que estamos hablando 166 00:19:05,210 --> 00:19:12,009 dice se han recogido los datos sobre el número de hijos de 20 matrimonios 167 00:19:12,009 --> 00:19:18,250 entonces bueno lo primero como es esta variable pues 168 00:19:18,529 --> 00:19:24,289 podría ser o cuantitativa o cualitativa pues claramente es cuantitativa y podía 169 00:19:24,289 --> 00:19:32,049 ser dijimos o discreta o continua pues claramente es discreta porque hay pocos 170 00:19:32,049 --> 00:19:40,549 datos así es que la variable utilizada cuantitativa discreta dentro de los de 171 00:19:40,549 --> 00:19:46,309 las opciones que teníamos con estos datos escribe una tabla de 172 00:19:46,309 --> 00:19:59,210 frecuencias, y pues vamos a elaborar igual que hemos visto en el ejemplo, tenemos aquí 173 00:19:59,210 --> 00:20:08,990 en esta tabla número de hijos, número de hijos, bueno, no me cabe toda la palabra, 174 00:20:08,990 --> 00:20:20,509 y la frecuencia absoluta estaría en la parte de abajo de la tabla. 175 00:20:21,349 --> 00:20:30,210 Entonces, vamos viendo el rango, nos movemos entre, desde cero hijos hasta tres. 176 00:20:30,849 --> 00:20:39,960 Bueno, pues vamos poniendo una casilla para cada uno de los elementos que nos vamos a encontrar. 177 00:20:39,960 --> 00:20:45,859 Cero hijos, un hijo, dos y tres 178 00:20:45,859 --> 00:20:56,259 En el ejercicio anterior que hemos hecho, bueno, era lo de las chocolatinas, teníamos de cero a siete 179 00:20:56,259 --> 00:21:01,519 Pues aquí, esta es más pequeñita esta tabla, pues tenemos de cero a tres 180 00:21:01,519 --> 00:21:17,819 Si son 20 matrimonios, vamos a ir viendo y vamos a ir agrupando la cantidad de matrimonios que tienen 0 hijos 181 00:21:17,819 --> 00:21:25,859 Pues 0 hijos tenemos aquí, aquí, serían 2, de 0 hijos hay 2 182 00:21:25,859 --> 00:21:32,680 que tengan 1, pues aquí 1, 2, 3, 4, 5, 6, 7 y 8 183 00:21:32,680 --> 00:21:42,279 se cuenta así tal cual y se va poniendo el número de individuos de esa muestra 184 00:21:42,279 --> 00:21:47,759 con 2 tenemos 1, 2, 3, 4, 5 y 6 185 00:21:47,759 --> 00:21:57,200 Pues tenemos 6 y con 3, 1, 2, 3, 4 individuos 186 00:21:57,200 --> 00:22:00,319 Bueno, perdón, 4 matrimonios 187 00:22:00,319 --> 00:22:09,839 4 matrimonios han tenido 3 hijos, 6 han tenido 2 hijos, 8 han tenido 1 hijo y 2 matrimonios no han tenido ninguno 188 00:22:10,579 --> 00:22:17,640 Tenemos que ver que esta suma, esta suma de aquí, nos da 20 189 00:22:17,640 --> 00:22:23,839 Entonces, porque eso sería la cantidad de veces que hemos preguntado todas estas cifras 190 00:22:23,839 --> 00:22:29,640 6 y 4, 10, pues sí, pues esta suma de aquí nos da 20, va bien la cosa 191 00:22:29,640 --> 00:22:41,319 Si nos dieran una muestra mucho más larga, pues habría que ir comprobando que se ajusta con el número total de personas que le han preguntado 192 00:22:41,319 --> 00:22:57,299 Vale, no nos piden la frecuencia acumulada, pero la vamos a hacer 193 00:22:57,299 --> 00:23:03,059 Porque como acabamos de hablar de ello, pues vamos a ver la frecuencia 194 00:23:03,059 --> 00:23:06,859 Esta es la absoluta, la frecuencia acumulada 195 00:23:06,859 --> 00:23:22,900 Entonces, de la primera cifra la volvemos a repetir 196 00:23:22,900 --> 00:23:25,099 De 2, porque no hay ninguna anterior que sumarle 197 00:23:25,099 --> 00:23:26,339 2 198 00:23:26,339 --> 00:23:34,859 De la segunda, de la frecuencia absoluta de 8 más 2, pondríamos 10 199 00:23:34,859 --> 00:23:38,559 Vale 200 00:23:38,559 --> 00:23:44,420 Ahora, de la tercera, 10 más 6, 16 201 00:23:44,420 --> 00:23:50,119 y de la cuarta 16 y 4, 20 202 00:23:50,119 --> 00:23:52,339 pues sí que nos coincide 203 00:23:52,339 --> 00:23:58,200 y la frecuencia acumulada sería 2 de 16 y 20 204 00:23:58,200 --> 00:24:01,599 nunca hay cifras que sean menores 205 00:24:01,599 --> 00:24:04,720 vamos a más hasta llegar a conseguir estos 20 de aquí 206 00:24:04,720 --> 00:24:06,940 no sé si se ha entendido o no 207 00:24:06,940 --> 00:24:11,619 pero hasta ahora lo que han explicado 208 00:24:11,619 --> 00:24:19,339 En la teoría, frecuencia absoluta y frecuencia acumulada, pues sería esto. 209 00:24:28,319 --> 00:24:38,779 Vale, con estos datos vamos a calcular la media, la mediana y la moda. 210 00:24:38,779 --> 00:25:04,759 Ya sé que en los apuntes viene frecuencia relativa, para otro tipo de estudios que son los cuantitativos continuos, son otro tipo de tablas, pero ya que lo tenemos aquí vamos a ver qué es la media, la mediana y la moda. 211 00:25:04,759 --> 00:25:35,460 Me vuelvo a subir para arriba y esto lo tenemos, la media, mediana y moda, es que es muy fácil y, un momentito, aquí, parámetros estadísticos, media, mediana y moda, vale. 212 00:25:35,460 --> 00:26:17,319 Vale, una media, la media aritmética de unos datos serían sumar todos los datos que hay y dividirlos entre el número de individuos que hay, pero cuando estamos en un estudio estadístico, vale, está un pelín más abajo, perdonad, aquí, vale, la media. 213 00:26:17,319 --> 00:26:23,660 La media se calcula, ya digo, por ejemplo si tenemos 6 personas 214 00:26:23,660 --> 00:26:28,420 Si quieres saber la media de edades, pues sumas todas y divides entre 6 215 00:26:28,420 --> 00:26:31,019 Eso sería una media aritmética bondelironda 216 00:26:31,019 --> 00:26:37,059 Pero de un estudio estadístico, la media es esta fórmula 217 00:26:37,059 --> 00:26:38,700 Dices, pero bueno, ¿qué es esto? 218 00:26:38,859 --> 00:26:46,420 Bueno, pues esto es que multiplicas cada dato, le multiplicas por su frecuencia absoluta 219 00:26:46,420 --> 00:26:53,099 Eso sería la media, entonces me bajo otra vez, luego ya lo vais buscando 220 00:26:53,099 --> 00:27:06,039 La media en un estudio sería multiplicar cada dato por la cantidad de veces que se repite 221 00:27:06,039 --> 00:27:10,559 O sea, el número de hijos por la cantidad de veces que se repite 222 00:27:10,559 --> 00:27:15,539 0 por 2, 1 por 8, 2 por 6 y 3 por 4 223 00:27:15,539 --> 00:27:19,799 esa fórmula que hemos visto antes significa eso 224 00:27:19,799 --> 00:27:27,099 entonces lo voy a poner aquí, la media se representa por x con un sombrerito 225 00:27:27,099 --> 00:27:32,559 y con esto voy a calcular esto que nos piden aquí, lo primero la media 226 00:27:32,559 --> 00:27:41,160 y ya digo, aquí la fórmula, el x sub i sería cada dato por su frecuencia absoluta 227 00:27:41,160 --> 00:27:50,940 Las veces que se repite, el sumatorio de los datos, el x y y, por su frecuencia, por la cantidad de veces que se repite. 228 00:27:51,539 --> 00:27:57,539 Y abajo, este sumatorio de aquí, el sumatorio de x y y. 229 00:27:58,339 --> 00:28:02,539 Ya sé que la fórmula dice, pues vaya rollo, pero luego a la hora de hacerlo es muy muy fácil. 230 00:28:03,019 --> 00:28:10,660 Entonces, multiplicamos cada dato por las veces que se repite, 0 por 2. 231 00:28:11,160 --> 00:28:41,809 Y como es un sumatorio, pues se lo sumamos. Cero hijos se repite dos veces, un hijo se repite ocho veces, pues venga, uno por ocho, dos por seis, dos por seis y tres por cuatro. 232 00:28:41,809 --> 00:28:50,259 3 hijos, se repite 4 veces, pues 3 por 4 233 00:28:50,259 --> 00:28:58,410 Vale, y esto se parte por este número que es la suma de todos los X, Y 234 00:28:58,410 --> 00:29:05,789 La suma de toda la muestra que se ha estado obteniendo en el estudio 235 00:29:05,789 --> 00:29:08,150 Que son 20, 20 familias 236 00:29:08,150 --> 00:29:10,890 Vale, pues aquí operamos 237 00:29:10,890 --> 00:29:18,289 No puede darnos, por supuesto, menos de cero hijos ni más de tres hijos, estamos calculando 238 00:29:18,289 --> 00:29:25,089 la media de hijos, lo que estamos calculando es cuántos hijos de estas veinte familias 239 00:29:25,089 --> 00:29:46,490 tienen de media. Bueno, pues aquí en el numerador 8 más 12, más 12, y en el denominador seguimos 240 00:29:46,490 --> 00:29:59,250 teniendo 20, si aquí operamos, esto nos va a dar 1,6. Dice, vale, eso es imposible que 241 00:29:59,250 --> 00:30:07,170 me dé 1,6, pero ya sé que no hay 1,6 hijos, pero es un dato estadístico y la media no 242 00:30:07,170 --> 00:30:13,630 es ni 1 ni 2, la media es 1,6, pues este dato estadístico sí puede dar decimal, de hecho 243 00:30:13,630 --> 00:30:18,990 va a dar siempre decimal, es raro que den un número entero. Entonces, quiere decir 244 00:30:18,990 --> 00:30:27,430 que la mayoría de las familias, la mayoría, la media, tienen más de 1 y menos de 2. 245 00:30:29,250 --> 00:30:38,950 Bueno, pues eso es lo que estudiaría la media, ya digo, de esta tabla de frecuencias. 246 00:30:39,549 --> 00:30:50,029 Ahora vamos a ver la mediana y la moda. ¿Por qué? Pues porque la mediana y la moda se sacan precisamente de aquí, se sacan de los datos del estudio. 247 00:30:50,029 --> 00:30:55,109 entonces lo único que tengo que hacer es ordenarlos 248 00:30:55,109 --> 00:30:57,630 y una vez que estén ordenados 249 00:30:57,630 --> 00:31:00,630 esos dos valores de la mediana y de la moda 250 00:31:00,630 --> 00:31:02,230 se sacan directamente 251 00:31:02,230 --> 00:31:05,269 pues los voy a poner debajo en marrón 252 00:31:05,269 --> 00:31:10,130 y cojo todos estos valores 253 00:31:10,130 --> 00:31:11,730 y los coloco 254 00:31:11,730 --> 00:31:15,470 cero, cero 255 00:31:15,470 --> 00:31:18,609 bueno, no hace falta ir poniendo comas 256 00:31:18,609 --> 00:31:38,180 El 1 se repite 8 veces, pues los coloco 2, 4, 6, 7 y 8 257 00:31:38,180 --> 00:31:47,900 2 veces el 0, 8 veces el 1, que es lo que tenemos aquí 258 00:31:47,900 --> 00:31:52,299 El 2 se repite 6 veces, pues lo ponemos 259 00:31:52,299 --> 00:32:05,049 Y el 3 se repite 4 veces 260 00:32:05,049 --> 00:32:22,539 Pues pongo 3, 3, 3 y 3. Vale, lo estoy haciendo así, ya digo, porque necesito saber de la mediana y de la moda, necesito saber la muestra ordenada. 261 00:32:22,539 --> 00:32:30,980 Bien, pues aquí todo esto me tiene que sumar 20 en total 262 00:32:30,980 --> 00:32:37,279 Y la moda, vamos por ejemplo con la moda 263 00:32:37,279 --> 00:32:40,500 Es como su nombre indica lo que más se lleva 264 00:32:40,500 --> 00:32:43,299 Es el número que más veces se repite 265 00:32:43,299 --> 00:32:49,119 Entonces el número que más se repite 266 00:32:49,119 --> 00:32:57,819 Esa sería la moda 267 00:32:57,819 --> 00:33:02,160 Nos vamos a nuestra muestra 268 00:33:02,160 --> 00:33:03,880 También nos lo dice nuestra tabla 269 00:33:03,880 --> 00:33:06,319 Y el número que más veces se repite es el 1 270 00:33:06,319 --> 00:33:08,079 Porque se repite 8 veces 271 00:33:08,079 --> 00:33:12,779 Entonces, la moda es igual a 1 272 00:33:12,779 --> 00:33:18,940 ¿Qué es lo que más se da entre estos 20 matrimonios? 273 00:33:19,579 --> 00:33:21,160 Pues es tener un hijo 274 00:33:21,160 --> 00:33:24,500 pues tener un hijo, esa es la moda 275 00:33:24,500 --> 00:33:26,480 vale, y ahora 276 00:33:26,480 --> 00:33:29,779 dice, bueno, eso también lo podías haber sacado de aquí 277 00:33:29,779 --> 00:33:32,839 pues es verdad, la moda no necesito ordenarlos 278 00:33:32,839 --> 00:33:35,740 para saber cuál es, la moda ya lo veo, que es este 279 00:33:35,740 --> 00:33:38,700 que es este valor, pero el siguiente sí 280 00:33:38,700 --> 00:33:42,359 la mediana es el valor que está en el centro 281 00:33:42,359 --> 00:33:44,779 también lo podríamos haber ido sacando 282 00:33:44,779 --> 00:33:47,660 por la frecuencia acumulada 283 00:33:47,660 --> 00:33:51,099 pero bueno, eso cuando tengáis más práctica lo hayáis hecho más veces 284 00:33:51,099 --> 00:34:07,960 Si no, nos colocamos aquí todos y como tenemos 20 matrimonios, ¿cuál es el que está en el centro? Pues vamos contando, es que está en el centro ahora el número 10, entonces 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10. 285 00:34:07,960 --> 00:34:11,840 entre el número 10 286 00:34:11,840 --> 00:34:14,960 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, vale 287 00:34:14,960 --> 00:34:19,619 es el 1, entonces la mediana 288 00:34:19,619 --> 00:34:23,940 es el valor que está en el medio, que es el valor 289 00:34:23,940 --> 00:34:26,940 central, lo voy a poner aquí 290 00:34:26,940 --> 00:34:31,860 Sí, perdone profe, si fueran pares, o sea, si fueran pares 291 00:34:31,860 --> 00:34:35,599 y, pues eso, uno un 4 y otro un 8 292 00:34:35,599 --> 00:34:37,900 Haríamos como la marca de clase 293 00:34:37,900 --> 00:34:39,559 Haríamos la media de esos dos números 294 00:34:39,559 --> 00:34:41,820 Exacto, sacaríamos la media 295 00:34:41,820 --> 00:34:43,159 Exacto, sí 296 00:34:43,159 --> 00:34:45,940 No, no, si ahora mismo ya son pares 297 00:34:45,940 --> 00:34:46,719 Ya hay 20 298 00:34:46,719 --> 00:34:49,300 Entonces, pero bueno 299 00:34:49,300 --> 00:34:51,420 El número 10 es este 300 00:34:51,420 --> 00:34:53,599 Pero si, de verdad, si estuviera 301 00:34:53,599 --> 00:34:55,780 Entre 2, pues haríamos el valor 302 00:34:55,780 --> 00:34:58,159 Pero vamos, en este caso 303 00:34:58,159 --> 00:35:00,239 Pues yo cogería de la mediana 304 00:35:00,239 --> 00:35:01,960 Cogería también el 1 305 00:35:01,960 --> 00:35:03,280 Como mediana 306 00:35:03,280 --> 00:35:12,980 Bueno, la verdad es que aquí tenemos 9 y aquí tenemos 10 307 00:35:12,980 --> 00:35:17,059 Sí, pues entonces para ser más exactos sería 1,5 308 00:35:17,059 --> 00:35:18,900 Está entre 1 y 2 309 00:35:18,900 --> 00:35:26,539 Entre 1 y 2, la mediana sería 1,5 310 00:35:26,539 --> 00:35:29,059 Dices, vale, pero no puedes tener 1,5 hijos 311 00:35:29,059 --> 00:35:49,800 Sí, pero como estás dando un valor estadístico, entonces es una medida de centralización, esa medida te da 1,5 hijos. Esa sería la mediana, la moda 1, ya digo, y la media, que la he calculado y la he dejado por aquí, 1,6 hijos. 312 00:35:49,800 --> 00:36:01,400 Entonces, siempre que nos den una distribución estadística, ordenamos los datos, los organizamos 313 00:36:01,400 --> 00:36:08,980 y vamos viendo el menor, el mayor y vamos contando cuántas veces se repite cada uno de ellos 314 00:36:08,980 --> 00:36:12,239 y eso es la frecuencia absoluta, las veces que se repite 315 00:36:12,239 --> 00:36:24,559 Y luego la acumulada, pues sumaríamos al anterior el siguiente, al anterior el siguiente y así hasta conseguir que esta cifra y esta nos coincida. 316 00:36:24,559 --> 00:36:28,820 bueno, no sé, ¿tenéis alguna duda? 317 00:36:30,340 --> 00:36:32,320 ¿se ha entendido lo que hemos visto hasta aquí? 318 00:36:34,360 --> 00:36:37,699 yo sé que he pegado unos cuantos saltos en la teoría 319 00:36:37,699 --> 00:36:40,099 pero luego vosotros buscáis por aquí 320 00:36:40,099 --> 00:36:44,139 mediana, moda y media 321 00:36:44,139 --> 00:36:47,480 y seguro que os lo cuentan 322 00:36:47,480 --> 00:36:54,679 vale, pues con ese valor que hemos visto 323 00:36:54,679 --> 00:37:00,699 de la frecuencia absoluta y el número de individuos 324 00:37:00,699 --> 00:37:07,500 voy a subir un poco más para arriba y podemos hallar una gráfica 325 00:37:07,500 --> 00:37:12,119 una gráfica, esta no es, perdonad 326 00:37:12,119 --> 00:37:17,480 que se llama gráfica, que se llama diagrama de barras 327 00:37:17,480 --> 00:37:21,340 el diagrama de barras, esta es la frecuencia 328 00:37:21,340 --> 00:37:44,039 Y estos de aquí serían, pues aquí por ejemplo es del grupo sanguíneo, ¿vale? Pues entonces el grupo sanguíneo se pondría abajo en ordenadas sin ascisas tendríamos la frecuencia absoluta, la de veces que se repite y entonces pues lo vas poniendo 2, 4, 6, 8, ABCD. 329 00:37:44,039 --> 00:37:58,280 En nuestro caso anterior tendríamos aquí abajo número de hijos y el número de hijos tendríamos en vez de cuatro valores, así también tendríamos cuatro valores, cero, uno, dos y tres. 330 00:37:58,280 --> 00:38:22,639 Y en la frecuencia lo que nos ha dado antes, para 0 tendríamos 2, para 1 tendría, para un hijo tendríamos 8, para 2 tendríamos 6, o sea, tendríamos nuestra primera barra sería hasta aquí, la segunda que es hasta 8 vendría para acá. 331 00:38:22,639 --> 00:38:28,519 estoy haciendo unas barras paralelas para que veáis que el diagrama de barras solo 332 00:38:28,519 --> 00:38:36,960 hacen falta esos dos parámetros. La muestra, o sea, los valores de la muestra y la frecuencia 333 00:38:36,960 --> 00:38:44,320 absoluta. El otro que nos ha dado para dos tendríamos seis, aquí tendríamos dos, pues 334 00:38:44,320 --> 00:38:58,360 Tendríamos 6, otra barra por aquí, y para 3 tendríamos 4, pues entonces para 3, una que llegara hasta aquí. 335 00:38:59,699 --> 00:39:06,400 O sea, si nos pidieran el diagrama de barras de lo que hemos visto antes de los 20 matrimonios, sería, pues ya digo, 336 00:39:06,400 --> 00:39:16,880 Una primera que llega hasta 2, otra segunda que llega hasta 8, otra que llega hasta 6 y otra que llega hasta 4 337 00:39:16,880 --> 00:39:31,619 Este sería el diagrama de la frecuencia y solo es diagrama de barras cuando es una variable cuantitativa discreta 338 00:39:31,619 --> 00:40:00,900 No hemos hablado de nada más, eso ya para el próximo día, pero ya digo, si veis un poquito por aquí los gráficos son muy muy fáciles, siempre en horizontal y vertical, el primer, aquí está puesto así, pero nosotros si lo ponemos, nuestra tabla la tenemos así, pues es lo mismo, este primero, este primer dato lo tendríamos aquí y este segundo dato que es la frecuencia lo tendríamos en las acisas. 339 00:40:01,619 --> 00:40:08,300 Vale, pues si queréis lo dejamos aquí y continuamos el próximo día con la estadística 340 00:40:08,300 --> 00:40:15,420 y la terminamos y vemos las variables cuantitativas continuas y su diagrama correspondiente. 341 00:40:16,360 --> 00:40:22,900 Pero vamos, no es difícil. La estadística, lo que vamos a ver en este curso, no es difícil. 342 00:40:24,719 --> 00:40:25,280 Ok. 343 00:40:25,980 --> 00:40:29,079 Vale, pues nada, la semana que viene continuamos. 344 00:40:29,840 --> 00:40:30,699 Venga, muchas gracias. 345 00:40:30,699 --> 00:40:32,699 Un saludo. Hasta luego.