1 00:00:03,740 --> 00:00:04,660 Buenas a todos. 2 00:00:06,280 --> 00:00:10,380 Nada, quería hablar un poco sobre el tema de estadística y probabilidad. 3 00:00:11,060 --> 00:00:15,199 A mí normalmente no me gusta utilizar los libros de texto, pero bueno, en este caso lo vamos a utilizar. 4 00:00:15,560 --> 00:00:18,600 Lo tenéis, es subido en la página, es este de aquí. 5 00:00:19,600 --> 00:00:21,440 Matemática de segundo era eso. 6 00:00:21,660 --> 00:00:24,300 El tema de estadística es el último, ¿vale? 7 00:00:24,420 --> 00:00:27,620 Lo podéis buscar, si no, aquí en el buscador, control F, ¿vale? 8 00:00:28,719 --> 00:00:31,839 Y empieza a pedir, lo he escrito mal. 9 00:00:33,439 --> 00:00:46,159 estadística de probabilidad de probabilidad ya subí un par de un par de vídeos pero bueno podéis 10 00:00:46,159 --> 00:00:54,179 leeros todo lo que aparece aquí ok y bueno lo que más quiero que profundice jce es en esta parte de 11 00:00:54,179 --> 00:01:00,439 aquí en medidas de centralización y medidas de medidas de dispersión aparte de este vídeo voy 12 00:01:00,439 --> 00:01:04,959 subir uno haciendo un ejercicio, el examen, esta parte va a ser muy muy sencilla porque 13 00:01:04,959 --> 00:01:11,980 el tema de estadística se utilizan gráficos y conjuntos de datos, entonces la verdad es 14 00:01:11,980 --> 00:01:16,280 que es un tema para, la parte de probabilidad no, pero la parte de estadística es más 15 00:01:16,280 --> 00:01:20,959 para hacer con un ordenador, para hacer con el Excel, por ejemplo, o incluso con la inteligencia 16 00:01:20,959 --> 00:01:27,120 artificial, saber hacer gráficos, esta es la parte de probabilidad, y en la parte de 17 00:01:27,120 --> 00:01:34,079 estadística, pues calcular medias, modas, etc., pues tampoco vamos a profundizar demasiado. 18 00:01:34,819 --> 00:01:41,040 Entonces, ¿qué quiero que sepáis? Bueno, vosotros os lo leéis todo, miráis los ejercicios 19 00:01:41,040 --> 00:01:49,519 que hay resueltos, pero en la parte de estadística, los gráficos, lo único que puedo preguntar 20 00:01:49,519 --> 00:01:55,980 es que aparezca un gráfico, por ejemplo, este gráfico de aquí, que refleja a la gente 21 00:01:55,980 --> 00:02:00,480 que coge el transporte público, pues ¿cuál es el medio más utilizado? Andando, porque 22 00:02:00,480 --> 00:02:06,959 es el que tiene el punto aquí arriba. Van a ser preguntas de ese tipo, porque no voy 23 00:02:06,959 --> 00:02:12,199 a haceros que hagáis un gráfico para el examen. Entonces, pues simplemente saber que aquí 24 00:02:12,199 --> 00:02:20,840 pues que las barras, pues aquí reflejan frecuencias y reflejan cantidades. Este tema es que lo 25 00:02:20,840 --> 00:02:24,360 veo que es un tema más para hacerlo con el ordenador. Pero bueno, entonces, ¿qué me 26 00:02:24,360 --> 00:02:31,080 importa que me importa que hagáis esto de aquí medidas de centralización y medidas de dispersión 27 00:02:31,080 --> 00:02:40,120 las medidas de centralización son la media la moda y la mediana eso lo tenéis que saber calcular y 28 00:02:40,120 --> 00:02:46,960 eso va a aparecer en el examen vale como se calcula la media de un conjunto de datos bueno 29 00:02:46,960 --> 00:02:52,979 por ejemplo si aquí tienes las notas de una clase que son un 7 un 3 un 5 un 9 y un 8 se suman todos 30 00:02:52,979 --> 00:02:57,580 quedan 33 y se dividen entre el número de datos que hay, que son 5 31 00:02:57,580 --> 00:03:00,159 1, 2, 3, 4 y 5 32 00:03:00,159 --> 00:03:05,759 entonces 33 entre 5, 6 con 6, ¿vale? aquí lo podéis ver, suma de todos 33 00:03:05,759 --> 00:03:09,840 los datos dividido entre n, n es el número de datos que hay, en este caso hay 5 34 00:03:09,840 --> 00:03:13,639 si hubiera 10, pues se dividiría entre 10, ¿vale? eso hay que saber hacerlo, la media 35 00:03:13,639 --> 00:03:18,000 de toda la vida, ¿vale? esto lo vais leyendo todo y vais intentando 36 00:03:18,000 --> 00:03:20,800 hacer las actividades resueltas, en el siguiente vídeo 37 00:03:20,800 --> 00:03:36,960 En el otro PDF que hay ejercicio resolveré yo el primero para que veáis cómo funciona. Y luego si tenéis alguna duda me contactáis por el chat. ¿Cuál es el siguiente paso? El siguiente paso es la moda. 38 00:03:36,960 --> 00:03:56,340 La moda es el dato que más se repite. ¿Qué significa el dato que más se repite? Por ejemplo, aquí si esto es el lanzamiento de un dado, aquí tienes cuando sale un 1, cuando sale un 2, cuando sale un 3, cuando sale un 4, cuando sale un 5, cuando sale un 6. 39 00:03:56,340 --> 00:04:20,120 Aquí son las frecuencias. La frecuencia es el número de veces que aparece cada dato. 9 veces ha salido un 1, 8 veces ha salido un 2, 7 veces un 3, 8 un 4, 8 un 5 y 10 veces un 6. ¿Cuál es la moda aquí? Pues la moda es que salga 6. ¿Por qué? Porque es el más alto, el que más se repite. Ha salido 10 veces 6. Como ha salido 10 veces, ese es el que más se repite. 40 00:04:20,120 --> 00:04:43,300 Y el último dato de las medidas de centralización es la mediana. La mediana seguramente habéis escuchado muchas veces en vuestra vida hablar de percentiles, ¿vale? Entonces, la mediana es el percentil 50. ¿Qué es un percentil? Pues imaginaos que cogemos un conjunto de datos y lo ordenamos de menor a mayor, ¿vale? 41 00:04:43,300 --> 00:04:59,379 Pues el que está en la mitad, justo en la mitad, ese es el percentil 50 y es la mediana. Si cogemos, por ejemplo, que hay 10 datos y cogemos 9, los 9 menores, eso sería el percentil 90. 42 00:05:00,139 --> 00:05:05,339 Si cogemos solamente, por ejemplo, de 10 datos los dos primeros, sería percentil 20. 43 00:05:06,120 --> 00:05:12,339 Cuartiles es lo mismo, pero el 25%, el 50% y el 75%. 44 00:05:12,339 --> 00:05:16,519 Lo más importante es que sepáis que la mediana está justamente a mitad, ¿vale? 45 00:05:17,180 --> 00:05:19,379 Y es ordenando los datos de menor a mayor el que está en el medio. 46 00:05:19,420 --> 00:05:24,540 Tienes dos casos. Uno cuando el conjunto de datos es impar, que cae justamente el del medio. 47 00:05:25,500 --> 00:05:29,839 Mira, por ejemplo, estas notas están ordenadas. Estas son notas que ha sacado en una clase, ¿vale? 48 00:05:30,639 --> 00:05:34,620 Ordenadas de menor a mayor. 2, 3, 5, 7, 9 y 9 y 10. 49 00:05:35,360 --> 00:05:38,860 ¿Vale? Entonces, ¿cuál es la mediana? 7. ¿Por qué? Porque está en medio. 50 00:05:39,639 --> 00:05:45,100 Es el valor del medio, el percentil 50. ¿Qué significa? ¿Por qué se le llama percentil 50 también a la mediana? 51 00:05:45,439 --> 00:05:50,420 Porque el 50% de los datos están por debajo y el 50% están por arriba, ¿vale? 52 00:05:50,420 --> 00:06:19,120 Luego tienes dos casos, como he dicho, uno cuando los datos son impares, que se coge el del medio, y si son pares, como este caso de aquí, ¿vale? Que tenéis 2, 3, 4, 5, 7, 9, 9, 10, ¿qué estaría en el medio? El 5 y el 7, ¿no? Porque claro, no podías, no tienes dato impar. Entonces, ¿qué haces? Se suman 5 y 7 y se dividen entre 2. 5 y 7, 12, entre 2, 6. Entonces la mediana sería 6, ¿vale? Esto hay que saber resolverlo, ¿ok? 53 00:06:20,420 --> 00:06:39,759 Y luego, respecto a las medidas de dispersión, las medidas de dispersión son para ver si un conjunto de datos, si se puede confiar en la media en un conjunto de datos, para ver desde el conjunto de datos si los números oscilan mucho entre la media. 54 00:06:39,759 --> 00:06:48,939 entonces cómo se calcula cómo se calcula la desviación la desviación típica bueno 55 00:06:48,939 --> 00:06:54,519 aquí podéis ver tenéis una actividad resuelta luego haré una yo porque esto explicarlo de 56 00:06:54,519 --> 00:07:00,779 palabra quizás un poco más un poco más lioso pero vamos para calcular la desviación típica 57 00:07:00,779 --> 00:07:08,100 por ejemplo de estos datos de aquí el conjunto de este de aquí que tenemos que haríamos primero 58 00:07:08,100 --> 00:07:12,259 calcularíamos la media, ¿vale? Los sumaríamos todos y los dividimos 59 00:07:12,259 --> 00:07:16,199 entre el número de datos que haya, 1, 2, 3, 4, 5, 6 60 00:07:16,199 --> 00:07:20,040 y 7, sumamos todos los datos, los dividimos entre 7, ¿vale? 61 00:07:20,839 --> 00:07:24,399 Y calculamos la media. 62 00:07:24,540 --> 00:07:28,360 ¿Qué hacemos luego? De cada dato, de 2, de 3, 63 00:07:28,360 --> 00:07:32,439 de 5, de 7, de 9, de 9 y de 10, 64 00:07:32,519 --> 00:07:35,740 a cada uno le vamos restando la media, 65 00:07:35,740 --> 00:07:40,040 ¿Vale? Le restamos la media. Y una vez le hemos restado la media 66 00:07:40,040 --> 00:07:43,959 la ponemos al cuadrado. Y luego calculamos 67 00:07:43,959 --> 00:07:47,759 la media de ese número. ¿Vale? Y luego al final 68 00:07:47,759 --> 00:07:51,839 calculamos la raíz cuadrada. Es un poco lioso explicarlo. Ahora lo haré 69 00:07:51,839 --> 00:07:55,480 en un ejercicio. Pero bueno, lo que tenéis que entender es que la desviación típica 70 00:07:55,480 --> 00:07:59,959 ¿Vale? Es una medida para saber cómo de dispares 71 00:07:59,959 --> 00:08:03,819 son los datos respecto de la media. Entonces unos datos 72 00:08:03,819 --> 00:08:07,180 como estos, por ejemplo, que solo oscilan entre 10, tendrá una desviación típica 73 00:08:07,180 --> 00:08:12,199 pequeña. Por ejemplo, este conjunto de datos de aquí, que tiene un 1000 y un 2000, pues 74 00:08:12,199 --> 00:08:18,519 la desviación típica será mucho más grande. Y básicamente eso es un poco todo. Aquí 75 00:08:18,519 --> 00:08:22,160 tenéis actividades resueltas para ir haciendo. Me podéis preguntar por el chat lo que no 76 00:08:22,160 --> 00:08:26,519 entendáis. Pero vamos, leeroslo todo, haced estos ejercicios y los que he puesto yo en 77 00:08:26,519 --> 00:08:33,120 el aula virtual. El tema es sencillo de verdad. En el siguiente vídeo voy a calcular todo 78 00:08:33,120 --> 00:08:38,299 lo que os he dicho. Yo mismo, para que lo veáis, con el lápiz en la mano se explica mucho mejor.