1 00:00:07,150 --> 00:00:17,629 Comenzamos a estudiar el tema de la estadística, que es la rama de las matemáticas que te permite recopilar, organizar y analizar los datos según una cierta necesidad. 2 00:00:18,350 --> 00:00:26,129 Para hacer un estudio estadístico, primeramente debemos responder a la pregunta sobre quién vamos a realizar el estudio estadístico. 3 00:00:26,670 --> 00:00:36,530 Para ello, definimos la población como el conjunto de todos los individuos sobre los cuales vamos a realizar el estudio estadístico. 4 00:00:36,829 --> 00:00:42,850 Por ejemplo, podríamos considerar la población de San Sebastián de los Reyes. 5 00:00:44,329 --> 00:00:49,390 Uno de los inconvenientes en trabajar con poblaciones es la cantidad de individuos. 6 00:00:50,049 --> 00:00:56,509 Por lo tanto, lo que se suele hacer es coger un subconjunto de toda la población. 7 00:00:57,649 --> 00:01:05,689 Es importante recalcar que para que la muestra sea representativa de toda la población objeto del estudio estadístico, 8 00:01:05,689 --> 00:01:14,530 tiene que ser elegida convenientemente y aunque hay distintas técnicas la más habitual es el 9 00:01:14,530 --> 00:01:34,799 muestreo aleatorio definida la muestra de la población sobre la cual vamos a realizar 10 00:01:34,799 --> 00:01:40,260 nuestro estudio estadístico el paso siguiente es plantearnos que vamos a estudiar sobre esa muestra 11 00:01:40,260 --> 00:01:47,079 para ello definimos la variable estadística que es una de las características que estudiamos de 12 00:01:47,079 --> 00:01:53,200 la población o mejor de la muestra. La variable estadística la solemos representar con la letra 13 00:01:53,200 --> 00:02:05,659 x mayúscula. Se clasifica la variable estadística en cualitativa cuando las respuestas se pueden 14 00:02:05,659 --> 00:02:12,979 expresar mediante palabras, es decir, no se pueden medir de forma numérica. Por ejemplo, si en una 15 00:02:12,979 --> 00:02:24,669 encuesta preguntamos cuál es la provincia natal, la contestación puede ser Madrid, Barcelona. Vemos 16 00:02:24,669 --> 00:02:31,729 que las respuestas no se expresan mediante números, por eso se llaman cualitativas. En cambio, cuando 17 00:02:31,729 --> 00:02:38,969 la variable estadística se puede expresar mediante números, se denominan cuantitativas, las cuales a 18 00:02:38,969 --> 00:02:45,250 su vez se pueden diferenciar en discretas y continuas. Discretas cuando toman valores 19 00:02:45,250 --> 00:02:51,009 aislados. Por ejemplo, si preguntamos el número de coches que pasan por un peaje, las posibles 20 00:02:51,009 --> 00:03:03,050 respuestas pueden ser 1, 2, 3, toman valores aislados. En cambio, una variable estadística 21 00:03:03,050 --> 00:03:10,030 es continua cuando se puede expresar mediante números y entre dos datos podemos encontrar 22 00:03:10,030 --> 00:03:14,889 más datos. Por ejemplo, imaginaros en el caso de las alturas de una población que 23 00:03:14,889 --> 00:03:22,069 una persona mida unos 60 metros y otra persona que hayamos encostado mida unos 70 metros, 24 00:03:22,270 --> 00:03:32,550 pues puede haber personas que midan entre unos 60 y unos 70 metros. Una vez que hemos 25 00:03:32,550 --> 00:03:37,189 planteado el problema inicial, hemos definido en nuestra población, nuestra muestra de 26 00:03:37,189 --> 00:03:43,669 la población y la variable estadística que vamos a estudiar, el siguiente paso consiste en la 27 00:03:43,669 --> 00:03:54,639 recogida de la información. Elaboramos y hacemos encuestas. Es importante que al elaborar la 28 00:03:54,639 --> 00:04:02,020 encuesta las preguntas deben de ser claras y de respuesta cerrada. Realizada la encuesta la 29 00:04:02,020 --> 00:04:10,400 pasamos a los individuos de nuestra muestra de la población y ordenamos cada una de las respuestas. 30 00:04:11,219 --> 00:04:18,319 Normalmente las organizamos en la tabla de frecuencias y posteriormente se representan con los gráficos estadísticos. 31 00:04:29,259 --> 00:04:34,120 Vamos a ver ahora cómo se organizan los datos en la tabla de frecuencias absolutas y relativas. 32 00:04:36,149 --> 00:04:47,550 Supongamos el ejemplo de que tenemos las siguientes notas 3, 5, 8, 10, 8, 6, 8 y 5 que corresponde a una encuesta a 8 personas. 33 00:04:47,550 --> 00:05:02,550 Los datos los vamos a denotar con la letra x minúscula y tiene el subíndice y. Este subíndice es un contador de datos diferentes que hemos registrado. 34 00:05:03,370 --> 00:05:19,319 Es decir, voy a colocar en la columna de datos, en este caso que la variable estadística es cuantitativa discreta, los voy a ordenar de menor a mayor. 35 00:05:19,319 --> 00:05:32,540 El primer dato sería 3, el segundo dato sería 5, después tendríamos el dato 6, el dato 8 y el dato 10. 36 00:05:32,680 --> 00:05:35,480 Fijaros que en total tenemos 5 datos. 37 00:05:36,079 --> 00:05:39,579 ¿Qué es lo que ocurre? Que algunos de estos datos están repetidos. 38 00:05:41,199 --> 00:05:43,699 Eso es lo que llamamos la frecuencia absoluta. 39 00:05:43,699 --> 00:05:48,899 La frecuencia absoluta es el número de veces que aparecen repetidos los datos en la encuesta. 40 00:05:49,319 --> 00:06:03,040 Así, observando, podemos ver que el dato 3 aparece una única vez, mientras que el número 5 lo tenemos dos veces, por eso colocamos aquí un 2. 41 00:06:03,980 --> 00:06:18,899 El número 6 aparece una única vez, el dato 8 lo tenemos uno, dos y tres veces, y el dato 10 una vez. 42 00:06:18,899 --> 00:06:33,879 Si hemos hecho bien el recuento, la suma de todas las frecuencias absolutas que lo vamos a denotar con el símbolo de sumatorio, de n su i, nos tiene que dar el número total de datos, que es 8. 43 00:06:35,060 --> 00:06:47,790 Efectivamente, 3 más 1, 4, más 3, 7, más 1, 8. Es igual al número de datos encuestado. 44 00:06:47,790 --> 00:06:52,230 A continuación vamos a estudiar lo que son las frecuencias relativas. 45 00:06:52,290 --> 00:06:57,990 Las frecuencias relativas consisten en dividir las frecuencias absolutas entre el número total de datos. 46 00:06:58,790 --> 00:07:03,589 Es decir, cogemos el número 1 y lo dividimos entre 8. 47 00:07:04,470 --> 00:07:08,949 Podemos dejar el resultado en forma de fracción, así tendríamos un octavo. 48 00:07:10,410 --> 00:07:15,709 En el segundo caso sería 2 entre 8, es decir, dos octavos. 49 00:07:15,709 --> 00:07:23,170 Y así sucesivamente, un octavo, tres octavos y un octavo. 50 00:07:23,850 --> 00:07:31,370 La suma de todas las frecuencias relativas en forma de fracción nos queda ocho octavos, que es igual a la unidad. 51 00:07:33,889 --> 00:07:42,610 Esto nos puede servir para saber el porcentaje de personas que ha sacado el dato 3, es decir, la nota de 3. 52 00:07:42,610 --> 00:07:47,610 Para calcular el porcentaje lo único que tenemos que hacer es multiplicar. 53 00:08:02,639 --> 00:08:07,759 Multiplicar un octavo lo multiplicamos por 100. 54 00:08:08,779 --> 00:08:16,610 De esta forma obtenemos el 12,5%, obtendrían la nota de 3. 55 00:08:17,689 --> 00:08:35,190 Dos octavos lo multiplicamos por 100 y nos queda un 25%, en este caso un 12,5%. 56 00:08:35,190 --> 00:09:05,960 35%, tres octavos por 100, 37,5% y un octavo por 100 son 12,5%. 57 00:09:05,960 --> 00:09:13,620 La suma de todos los porcentajes nos tiene que dar el 100% de las personas encuestadas. 58 00:09:14,419 --> 00:09:21,279 Por último, vamos a introducir lo que son las frecuencias absolutas acumuladas y las frecuencias relativas acumuladas, 59 00:09:21,279 --> 00:09:25,679 lo cual denotamos en el primer caso con la letra N mayúscula sub i. 60 00:09:26,519 --> 00:09:39,379 Para calcularlas, partimos de la columna de las frecuencias absolutas del primer dato y lo colocamos en el primer dato, es decir, escribimos 1. 61 00:09:40,299 --> 00:09:48,039 A continuación, este 1 lo sumamos con la segunda frecuencia absoluta, que es un 2. 62 00:09:48,039 --> 00:09:50,480 Así nos queda como resultado 3. 63 00:09:51,279 --> 00:10:00,340 Cogemos el 3 y se lo sumamos al siguiente dato de la frecuencia absoluta. 64 00:10:00,340 --> 00:10:18,919 3 más 1, 4. 4 más 3 nos queda 7 y 7 más 1 nos queda 8. 65 00:10:18,919 --> 00:10:28,159 Fijaros que si está bien hecho, este 8 tiene que coincidir con el número total de datos 66 00:10:28,159 --> 00:10:31,379 que tenemos en la encuesta. 67 00:10:31,379 --> 00:10:37,340 Para calcular las frecuencias relativas acumuladas procedemos de la siguiente forma. 68 00:10:37,340 --> 00:10:47,850 El primer dato coincide con el de las frecuencias relativas, es decir, un octavo. 69 00:10:47,850 --> 00:10:55,730 segundo dato podemos sumarlo un octavo más dos octavos nos queda tres octavos 70 00:10:55,730 --> 00:11:01,990 también fijaros que nos va a dar el mismo resultado 71 00:11:01,990 --> 00:11:07,929 si a partir de la columna de las frecuencias absolutas acumuladas vamos 72 00:11:07,929 --> 00:11:13,990 dividiendo entre el número total de datos es decir 4 lo dividimos entre 8 y 73 00:11:13,990 --> 00:11:22,929 Y nos quedaría 4 octavos, 7 octavos y 8 octavos, que es igual a 1. 74 00:11:27,399 --> 00:11:35,529 Este último resultado nos tiene que coincidir con la suma de las frecuencias relativas. 75 00:11:36,090 --> 00:11:46,990 Último, vamos a representar el diagrama de barras con el polígono de frecuencias de esta variable cuantitativa discreta. 76 00:11:46,990 --> 00:11:55,470 representamos dos ejes donde en el eje vertical colocamos las frecuencias absolutas o el número de personas 77 00:11:55,470 --> 00:12:00,450 y en el eje horizontal ponemos nuestros datos que son las notas 78 00:12:00,450 --> 00:12:10,470 a continuación por cada dato vamos a elevar un rectángulo con altura a la frecuencia absoluta 79 00:12:10,470 --> 00:12:18,610 Es decir, la nota 3 la obtiene una persona, por lo tanto elevamos un rectángulo de altura 1. 80 00:12:19,590 --> 00:12:23,889 La nota 5 la obtienen dos personas. 81 00:12:25,049 --> 00:12:27,990 La nota 6, una persona. 82 00:12:29,710 --> 00:12:32,549 La nota 8, tres personas. 83 00:12:33,169 --> 00:12:35,509 Y por último, la nota 10, una persona. 84 00:12:35,509 --> 00:12:44,389 Es importante recalcar que en este tipo de gráfico las barras van separadas, no juntas, 85 00:12:44,389 --> 00:12:50,110 porque la variable estadística es cuantitativa discreta. 86 00:12:50,110 --> 00:12:56,470 Para realizar el polígono de frecuencia, unimos el centro de las bases superiores de 87 00:12:56,470 --> 00:13:01,210 cada rectángulo, obteniendo una línea poligonal.