1 00:00:00,430 --> 00:00:05,349 Buenas tardes, esta es la clase de matemáticas del día 22 de abril. 2 00:00:06,150 --> 00:00:14,750 Vamos a empezar el tema de estadística, en el que lo que vamos a ver es lo que aparece aquí en nuestros objetivos. 3 00:00:15,769 --> 00:00:21,649 ¿Qué es? Primero, saber distinguir los distintos parámetros estadísticos, 4 00:00:22,289 --> 00:00:26,190 así como las variables estadísticas distintas que nos podemos encontrar. 5 00:00:26,190 --> 00:00:49,329 Por variables continuas, discretas, ¿vale? Saber cómo organizar los datos en tablas para poder estudiarlos mejor, representar esos datos mediante gráficos, sabiendo qué gráficos tenemos que utilizar en cada caso, puesto que cada tipo de variable tendrá su tipo de gráfico asociado. 6 00:00:49,329 --> 00:01:09,689 Y por último lo que haremos es aprender a calcular las medidas de centralización de esa distribución numérica que tengamos, que son la media, la mediana y la moda, y además los cuartiles, que son muy parecidos, veremos que es como repetir dos veces la mediana. 7 00:01:09,689 --> 00:01:47,120 Y, finalmente, los parámetros de dispersión, cómo de alejados están los datos de la media aritmética, ¿vale? Bueno, pues vamos a ir poco a poco con ello y, primeramente, lo que vamos a hacer es ver cómo se conocen estadística a las distintas cosas, cómo se nombra el lenguaje estadístico a cada una de las cosas, ¿vale? 8 00:01:47,120 --> 00:01:57,780 Entonces, como introducción nos dice aquí que la estadística es necesaria porque me ayuda a organizar datos, 9 00:01:57,959 --> 00:02:03,200 a hacer estudios de poblaciones y organizar los datos que yo he recogido en encuestas 10 00:02:03,200 --> 00:02:07,760 para luego poder estudiarlos y sacar unos resultados de ellos. 11 00:02:08,680 --> 00:02:16,360 Entonces, lo primero que tenemos que ver es cómo llamamos a esos datos y a esas personas que se encuestan 12 00:02:16,360 --> 00:02:21,280 para saber y reconocer luego en los ejercicios de qué me está hablando. 13 00:02:21,719 --> 00:02:30,400 Vamos a llamar población o muestra, población al conjunto de individuos sobre el que haremos la encuesta, 14 00:02:30,939 --> 00:02:39,000 que tendrán características comunes, los individuos en definitiva sobre los que vamos a hacer el estudio, 15 00:02:39,000 --> 00:02:54,719 Pero, claro, no podemos hacer una encuesta a toda la población, por ejemplo, de España o a toda la población mundial. ¿Qué es lo que haremos para reducir el trabajo? Digamos, pues coger muestras. ¿Y qué son esas muestras? 16 00:02:54,719 --> 00:03:13,020 Pues son subconjuntos de esa población, ¿vale? Que sean suficientemente representativos de ella para luego poder, digamos, sacar conclusiones de esa muestra que podamos extrapolar a la población completa. 17 00:03:13,020 --> 00:03:24,639 ¿Qué atributos podemos estudiar y cómo llamaremos a las distintas variables según el tipo de estos atributos? 18 00:03:25,659 --> 00:03:34,360 Bueno, pues a las propiedades o características que podemos estudiar, aquí les vamos a llamar variables estadísticas. 19 00:03:34,360 --> 00:03:56,139 Por ejemplo, podríamos estudiar la altura de los alumnos que hay en clase, podríamos estudiar el número de hijos que tienen todos los vecinos de mi bloque, ¿vale? Pues a eso, a esa altura, a ese número de hijos, tal, esa es lo que llamamos variable estadística. 20 00:03:56,139 --> 00:04:02,479 Y las hay de distintos tipos según las propiedades que tengan, por así decirlo. 21 00:04:03,240 --> 00:04:07,159 Tenemos las primeras que son las variables cualitativas. 22 00:04:07,840 --> 00:04:15,639 Las variables cualitativas siempre van a expresar atributos y no las voy a poder representar numéricamente 23 00:04:15,639 --> 00:04:20,680 porque expresarán atributos que no se miden numéricamente. 24 00:04:20,680 --> 00:04:46,519 Por ejemplo, pues colores, por ejemplo, gustos, ¿vale? Entonces, yo no puedo decir que una persona es guapa o fea, por así decirlo, y que mi percepción la entienda todo el mundo, porque digamos que dependería de lo que cada persona considere como guapo o feo. 25 00:04:46,519 --> 00:04:56,420 Entonces, en este caso, no podemos medir numéricamente con una escala que todo el mundo comprenda esa cualidad, esa variable de la belleza, ¿vale? 26 00:04:57,319 --> 00:05:09,220 Entonces, en este caso decimos que estamos ante una variable cualitativa, que expresa una cualidad o un atributo de algo que no puedo medir numéricamente, ¿vale? 27 00:05:09,220 --> 00:05:19,779 Ahora, tengo otras que sí voy a poder medir numéricamente, que sí podré fijar una escala para ellas y que todo el mundo va a entender perfectamente esa escala. 28 00:05:20,240 --> 00:05:30,540 A estas variables se les llama cuantitativas, porque expresan cantidades, se pueden expresar mediante números, ¿vale? 29 00:05:30,540 --> 00:05:54,920 Y las tenemos de dos tipos, discretas cuando los valores numéricos que toman son valores enteros, el 1, el 2, el 3, ¿vale? Por ejemplo, como decíamos antes, el número de hijos que tienen los vecinos de mi bloque, el número de ventanas, como nos dice aquí, que hay en las distintas casas de mi bloque, ¿vale? 30 00:05:54,920 --> 00:06:05,480 y otras que se llaman continuas, que se miden numéricamente, pero ya no son valores enteros, sino que puede haber decimales. 31 00:06:06,560 --> 00:06:14,639 O sea que su valor está representado dentro de un intervalo donde puedo coger todos los números que estén dentro de ese intervalo. 32 00:06:15,379 --> 00:06:19,300 ¿Cuáles podemos tomar como ejemplo? Pues el peso, la altura. 33 00:06:19,300 --> 00:06:40,779 Por ejemplo, el peso. Es muy raro que yo pese, por ejemplo, 80 kilos justos. Puedo pesar 80,5, 80,70, 82,55. Entonces, al haber esa variedad y esa continuidad, le llamamos variables continuas. 34 00:06:40,779 --> 00:06:52,939 Ya no son números puntuales, por así decirlo, sino que son números dentro de un intervalo y aquí pueden aparecer decimales, cosa que en las variables discretas no podía haber decimales. 35 00:06:53,480 --> 00:07:00,250 ¿Cómo vamos? Yolanda, ¿entendida esta primera parte? 36 00:07:01,589 --> 00:07:02,050 Sí. 37 00:07:02,430 --> 00:07:10,050 Sí, ¿vale? Es que das un poco las definiciones, pero ahora cuando vayamos haciendo ejemplos y ejercicios te va a quedar aún más claro, ¿vale? 38 00:07:10,050 --> 00:07:27,829 Bueno, una vez que sabemos qué tipos de variables me puedo encontrar, vamos a ver cómo voy a reflejar los datos del estudio que hago sobre ellas y esto es lo que hacemos mañana entre los recuentos y los gráficos. 39 00:07:27,829 --> 00:07:54,610 En el recuento lo que haré es ir anotando todas las respuestas que me ha dado la gente, si es una encuesta, ir anotando el número de ventanas que hay en cada casa, ir anotando el número de hijos que tiene cada familia y los gráficos serían una representación gráfica mediante un dibujo de esos datos para que así visualmente yo pueda apreciar más rápidamente qué datos dominan sobre otros. 40 00:07:54,610 --> 00:07:59,949 Entonces, lo que vamos a hacer en este proceso de recopilar datos 41 00:07:59,949 --> 00:08:05,310 es ir haciendo recuentos, ir contando cuántas personas 42 00:08:05,310 --> 00:08:08,750 me responden la misma cantidad, ¿vale? 43 00:08:08,750 --> 00:08:13,689 Y eso lo vamos a reflejar en unas tablas 44 00:08:13,689 --> 00:08:19,490 donde tendremos varias columnas y en cada columna 45 00:08:19,490 --> 00:08:22,610 iremos expresando esos datos de una manera 46 00:08:22,610 --> 00:08:52,590 Entonces, si miramos aquí en el ejemplo, pues vemos que estamos hablando de una variable cualitativa, porque estamos hablando de colores y yo no puedo expresar los colores con números, aunque hay una tabla de colores ahí con referencias numéricas que utilizan los pintores, que es la tabla render, nosotros normalmente no estamos pensando cuando hablamos de rojo, si es el 234 o el 364, 47 00:08:52,610 --> 00:08:56,090 como color, y encima si pensamos en cómo funcionamos 48 00:08:56,090 --> 00:08:58,509 por ejemplo, hombres y mujeres 49 00:08:58,509 --> 00:09:02,169 pues el círculo cromático que tenéis las mujeres es mucho más grande 50 00:09:02,169 --> 00:09:04,690 que el de los hombres, habláis de rosa, de rosa palo 51 00:09:04,690 --> 00:09:07,009 de rosa no sé qué, y los hombres es rosa y se acabó 52 00:09:07,009 --> 00:09:10,090 entonces no podríamos entendernos en ese sentido 53 00:09:10,090 --> 00:09:13,789 nunca, porque tenemos un distinto 54 00:09:13,789 --> 00:09:16,750 punto de vista para reconocer esos colores, ¿no Yolanda? 55 00:09:17,710 --> 00:09:18,029 Sí 56 00:09:18,029 --> 00:09:40,509 Sí, bueno, pues entonces en este caso estaríamos hablando de una variable cualitativa. Me expresa una cualidad que no puedo medir numéricamente. Entonces, yo en mi tablita voy a poner que la variable, que la seguimos llamando x como en las ecuaciones, nada más que ahora la ponemos un subíndice, esta y pequeñita, que me va a decir en qué dato estoy. 57 00:09:40,509 --> 00:09:49,509 El x1 sería el rojo, el x2 sería el verde, el x3 sería el azul, el x4 sería el amarillo, el x5 el turquesa. 58 00:09:50,230 --> 00:09:58,570 Solamente el subíndice me vale para saber en qué fila estoy de mi tabla de datos. 59 00:09:59,750 --> 00:10:08,090 Ahora que ya he puesto qué distintas soluciones tenemos a la pregunta esa de los colores que estoy intentando contar, 60 00:10:08,090 --> 00:10:17,269 vamos a ver cómo organizo las respuestas y empiezo con esta primera columna que la llamamos frecuencia absoluta 61 00:10:17,269 --> 00:10:27,509 y se representa con una f minúscula y la i pequeñita que me va a decir otra vez en qué fila estoy de mi tabla. 62 00:10:27,730 --> 00:10:35,129 Entonces tenemos aquí que la frecuencia absoluta sería el número de veces que ha aparecido ese dato, 63 00:10:35,129 --> 00:10:39,350 En este caso, el número de veces que aparece cada color, ¿vale? 64 00:10:39,590 --> 00:10:44,090 Entonces, si nos vamos al ejemplo, digo, ¿cuántas veces ha aparecido el rojo? 65 00:10:44,269 --> 00:10:49,389 Pues vengo a contarnos y digo, 1, 2, 3, 4, 5 y 6. 66 00:10:49,710 --> 00:10:51,789 Pues su frecuencia absoluta es 6. 67 00:10:52,309 --> 00:10:53,850 ¿Cuántas veces ha aparecido el verde? 68 00:10:54,029 --> 00:10:58,389 Pues 1, 2, 3, 4, 5, 6, 7 y 8. 69 00:10:58,610 --> 00:11:02,029 Como ve, su frecuencia absoluta es 8, ¿vale? 70 00:11:02,029 --> 00:11:09,129 Entonces, frecuencia absoluta, número de veces que aparece un dato. 71 00:11:09,730 --> 00:11:16,629 Si yo sumo todas las frecuencias absolutas, me tiene que salir como total el número de datos que tenía. 72 00:11:17,110 --> 00:11:20,970 En este caso, todos los colores que había aquí en las bolitas, que eran 30. 73 00:11:22,690 --> 00:11:23,990 Bueno, siguiente columna. 74 00:11:24,710 --> 00:11:26,230 Frecuencia relativa. 75 00:11:26,230 --> 00:11:33,529 La frecuencia relativa es el cociente entre la frecuencia absoluta y el número total de datos 76 00:11:33,529 --> 00:11:37,090 Hay veces que se deja como fracción y otras veces como decimal 77 00:11:37,090 --> 00:11:39,090 Nosotros vamos a hacer las cuentas como fracciones 78 00:11:39,090 --> 00:11:42,470 Que va a ser más fácil de manejar que con decimales 79 00:11:42,470 --> 00:11:45,389 Pero simplemente sería eso 80 00:11:45,389 --> 00:11:50,909 Dividir la frecuencia absoluta entre el número total de datos 81 00:11:50,909 --> 00:11:55,830 O sea que este 0,20 sale de dividir 6 entre 30 82 00:11:55,830 --> 00:11:59,809 Ese 0.21 dividir 8 entre 30. 83 00:12:00,330 --> 00:12:03,149 El 0.15 dividir 7 entre 30. 84 00:12:04,070 --> 00:12:10,850 Y hay veces que en vez de ponerla así, me la representan con un h minúscula y una i. 85 00:12:11,450 --> 00:12:17,750 O sea, cuando estén hablando de frecuencias relativas, puede que me la pongan con una h en vez de una f. 86 00:12:18,110 --> 00:12:25,509 Otras veces, como aquí, la notación que usan es poner la frecuencia absoluta, su símbolo, y dividido entre el número total de datos. 87 00:12:25,830 --> 00:12:29,929 Nosotros vamos a utilizar la chi, que es más cómoda. 88 00:12:30,250 --> 00:12:34,009 Frecuencia acumulada. ¿Qué es la frecuencia acumulada? 89 00:12:34,669 --> 00:12:46,070 Pues es la suma de todas las frecuencias absolutas de los valores menores a la posición en la que esté, incluidos también luego los de esa posición. 90 00:12:46,610 --> 00:12:50,629 Ejemplo, yo digo quiero ver la frecuencia absoluta del rojo. 91 00:12:50,870 --> 00:12:56,669 Pues la frecuencia absoluta del rojo, a ver, que aquí ha metido la puerta. 92 00:12:56,669 --> 00:13:13,539 La frecuencia absoluta del rojo, como no hay ningún color por debajo de él, sería 6, mientras que la del verde sería 6 más 8, 15. O sea que aquí se han movido una columna en todas las cuentas. 93 00:13:13,539 --> 00:13:34,879 La del azul sería 6 más 8 más 7, pues 15 más 7, 22. La de la amarilla 6 más 8 más 7 más 5, 27. La de turquesa 6 más 8 más 7 más 5 más 4, los 30 bolitas que teníamos en total. 94 00:13:34,879 --> 00:13:49,480 O sea, que siempre tengo que acabar, al final, con el número de datos que he empezado a hacer ese recuento. ¿Se ha entendido esto del diagrama, Yolanda? 95 00:13:49,980 --> 00:13:50,179 Sí. 96 00:13:51,559 --> 00:13:54,899 Bueno, luego haremos un ejercicio y te voy a ir preguntando, ¿vale? 97 00:13:55,879 --> 00:13:56,320 Vale. 98 00:13:56,320 --> 00:14:24,019 ¿De acuerdo? O sea, que tengo que poner primero qué variable estoy estudiando en la primera columna, la frecuencia absoluta en la segunda, la relativa, perdón, la absoluta acumulada en la segunda, la relativa en la tercera y puedo hacer también la relativa acumulada, pues eso vamos a hacerlo con un ejercicio en el que hagamos los dos juntos las cuentas. 99 00:14:24,019 --> 00:14:37,059 ¿Vale? Bueno, ¿cómo podemos representar esta misma tabla en la que tenía valores numéricos en los recuentos de una forma gráfica? 100 00:14:37,620 --> 00:14:41,039 Pues lo puedo hacer de distintas maneras. Lo puedo hacer con diagramas. 101 00:14:41,600 --> 00:14:48,139 ¿Vale? Vamos a ver que cada diagrama de los que yo haga va a corresponder a un tipo de variable. 102 00:14:49,360 --> 00:14:53,379 Entonces, tenemos diagramas de barras y diagramas de sectores. 103 00:14:54,019 --> 00:14:57,080 ¿Cuándo vamos a utilizar estos diagramas de barras y de sectores? 104 00:14:57,740 --> 00:15:05,179 Pues los vamos a utilizar en las variables cualitativas y en las cuantitativas discretas. 105 00:15:07,889 --> 00:15:12,269 El diagrama de sectores, ¿qué es lo que me va a indicar? 106 00:15:12,690 --> 00:15:18,169 Pues me va a indicar mediante el tamaño de cada quesito de esta circunferencia cuántos datos hay. 107 00:15:18,909 --> 00:15:23,149 Para poder hacerlo bien y que ese diagrama represente bien los datos, 108 00:15:23,149 --> 00:15:26,289 tengo que hacer una pequeña cuenta, que es una regla de tres 109 00:15:26,289 --> 00:15:29,009 es decir, bueno, si la circunferencia 110 00:15:29,009 --> 00:15:31,590 entre ellas son 360 grados 111 00:15:31,590 --> 00:15:35,429 esos 360 grados corresponderían 112 00:15:35,429 --> 00:15:37,870 al total de datos que tengo en mi estudio 113 00:15:37,870 --> 00:15:40,529 por ejemplo, el de los colores antes, a los 30 datos 114 00:15:40,529 --> 00:15:43,769 pero yo no estoy cogiendo 115 00:15:43,769 --> 00:15:46,870 todos los datos en el mismo color, entonces tengo que ir repartiendo 116 00:15:46,870 --> 00:15:49,309 los colores, ¿cómo lo hago? pues digo 117 00:15:49,309 --> 00:15:52,289 la frecuencia absoluta que haya tenido 118 00:15:52,289 --> 00:15:55,289 entre el número total de datos 119 00:15:55,289 --> 00:15:58,529 tiene que ser equivalente a la fracción 120 00:15:58,529 --> 00:16:01,929 a los grados que yo quiero coger de esa circunferencia 121 00:16:01,929 --> 00:16:05,370 vamos, de esa circunferencia o de ese círculo 122 00:16:05,370 --> 00:16:08,070 entre 360, o sea que va a ser 123 00:16:08,070 --> 00:16:10,549 una regla de 3 directa 124 00:16:10,549 --> 00:16:13,269 todos los datos, que en el caso de los colores eran 30 125 00:16:13,269 --> 00:16:16,129 correspondería con 360 grados 126 00:16:16,129 --> 00:16:19,970 que sería hacer esta multiplicación en cruz 127 00:16:19,970 --> 00:16:21,590 por otro lado 128 00:16:21,590 --> 00:16:24,509 digo, si yo solo cogí 129 00:16:24,509 --> 00:16:28,629 8 bolitas de color rojo 130 00:16:28,629 --> 00:16:30,350 pues esas 8 bolitas de color rojo 131 00:16:30,350 --> 00:16:33,029 ¿a qué grados correspondería? 132 00:16:33,190 --> 00:16:35,629 pues pondríamos la X y haríamos la regla de 3 133 00:16:35,629 --> 00:16:39,250 como digo, ahora estamos quedándonos con los nombres de las cosas 134 00:16:39,250 --> 00:16:43,090 luego lo haremos todo en un ejercicio con todas las cuentas y sus dibujos 135 00:16:43,090 --> 00:16:46,929 otra forma de representar 136 00:16:46,929 --> 00:16:49,769 los datos que hemos obtenido 137 00:16:49,769 --> 00:16:51,129 sería el diagrama de barras 138 00:16:51,129 --> 00:17:04,650 Y el diagrama de barras se suele utilizar para variables discretas, ¿vale? Porque veo muy bien con la altura de esas barritas cuántos datos han aparecido. 139 00:17:04,650 --> 00:17:15,829 Entonces, si miramos este dibujo, lo que voy a poner en el eje X va a ser el dato que estoy estudiando, por ejemplo, el color rojo, el verde, el azul, el amarillo y tal. 140 00:17:15,829 --> 00:17:22,190 y en el eje Y lo que voy a hacer es contar cuántos datos me han salido. 141 00:17:22,309 --> 00:17:24,390 Eso es, a poner la frecuencia absoluta. 142 00:17:25,029 --> 00:17:28,369 Como habíamos dicho antes que de bolas rojas teníamos 6, 143 00:17:28,549 --> 00:17:30,569 pues hago una barrita de altura 6. 144 00:17:31,529 --> 00:17:36,490 De bolas verdes teníamos 8, pues una barrita de altura 8. 145 00:17:36,490 --> 00:17:43,349 O sea que son barritas cuya altura me representa la frecuencia absoluta, 146 00:17:43,349 --> 00:17:47,069 o sea, el número de veces que ha aparecido cada uno de esos datos. 147 00:17:47,950 --> 00:17:51,690 Ojo con no confundirlas con otro diagrama que veremos más adelante, 148 00:17:52,230 --> 00:17:57,829 que es el histograma, que van a ser barritas que van pegadas unas a otras. 149 00:17:58,450 --> 00:18:00,549 Y ahora vamos a ver la diferencia entre unas y otras. 150 00:18:02,960 --> 00:18:04,259 Y luego ya vemos ejercicios. 151 00:18:05,000 --> 00:18:11,579 Pues la diferencia es que el histograma lo voy a utilizar para variables continuas. 152 00:18:11,579 --> 00:18:33,019 Y como las variables continuas, dijimos, que venían representadas por intervalos, lo que haré son barritas de anchura, lo grande que sea el intervalo, y de alto la frecuencia absoluta de todos los datos que caen dentro de ese intervalo. 153 00:18:33,019 --> 00:18:54,619 ¿Vale? Entonces, por poner un ejemplo, que ya tenemos hechos el recuento, me dan aquí esta tablita que tiene tantos números y no los podríamos poner de uno en uno porque sería infinito la tabla que me sale de datos. 154 00:18:54,619 --> 00:19:00,200 entonces lo que voy a hacer es agrupar los bueno pues en vez de ponerlos todos 155 00:19:00,200 --> 00:19:06,559 voy a hacer cinco intervalos donde el primero vaya de 0 al 200 el segundo del 156 00:19:06,559 --> 00:19:13,619 200 al 400 el 400 al 600 o sea que vaya de 200 en 200 y lo que voy a hacer luego 157 00:19:13,619 --> 00:19:19,680 finalmente es cuántos de estos datos que hay aquí caen dentro de cada intervalo 158 00:19:19,680 --> 00:19:24,400 esto es como si fuesen cajitas y lo que voy a hacer es meter cada dato dentro de 159 00:19:24,400 --> 00:19:34,150 su cajita. Entonces, lo que estaría haciendo aquí es diciendo que quiero ver cuántos 160 00:19:34,150 --> 00:19:43,650 datos hay que estén entre 0 y 200. Pues si empiezo a contar, tengo el 55, el 42, y me 161 00:19:43,650 --> 00:19:48,930 saldrían 10 datos distintos. Mi frecuencia absoluta sería que hay 10 datos dentro de 162 00:19:48,930 --> 00:19:56,029 esa caja. Si cuento cuánto hay entre 200 y 400, me van a salir 13. Es ir metiendo cada 163 00:19:56,029 --> 00:20:02,549 dato en su caja. Claro, si luego tengo que hacer cuentas con esto, pues no puedo volver 164 00:20:02,549 --> 00:20:07,150 otra vez a poner los datos de 1 en 1. Lo que voy a hacer es, como los he metido en cajas, 165 00:20:07,309 --> 00:20:13,009 es buscar un representante de cada una de las cajas. Y ese representante de cada una 166 00:20:13,009 --> 00:20:18,710 de esas cajas, de cada uno de esos intervalos, es lo que llamamos marca de clase. ¿Y quién 167 00:20:18,710 --> 00:20:24,549 va a ser esa marca de clase? Pues la marca de clase va a ser el punto medio de cada intervalo. 168 00:20:24,549 --> 00:20:33,589 Como aquí va del 0 al 200, por la marca de clase digo que es el 100. Como aquí voy del 200 al 400, la marca de clase el 300. Y así sucesivamente. 169 00:20:33,589 --> 00:20:53,589 Y como os decía antes, el diagrama que utilizo para representar estas variables cuantitativas continuas va a ser el histograma, que es como el diagrama de barras, nada más que ahora las barras van pegaditas. 170 00:20:54,549 --> 00:21:07,410 ¿Qué pondré en el eje X? Pues en el eje X pondré los intervalos que he cogido, del 0 al 200, del 200 al 400, del 400 al 600, ¿vale? 171 00:21:07,410 --> 00:21:19,309 O como en este caso, que está haciendo este segundo ejemplo, pues me ha cogido del 0 al 125, del 125 al 250, del 250 al 500, ¿vale? 172 00:21:19,309 --> 00:21:27,210 O sea que en el eje X vuelvo a decir de dónde a dónde se mueven las variables. 173 00:21:27,750 --> 00:21:32,769 Y en el eje Y lo que voy a hacer es poner la frecuencia absoluta. 174 00:21:32,769 --> 00:21:40,349 O sea, voy a poner una barrita de altura el número de veces que se ha repetido ese dato, 175 00:21:40,509 --> 00:21:42,569 esos datos de esa caja. 176 00:21:42,569 --> 00:21:45,710 en el ejemplo que veíamos antes, decíamos 177 00:21:45,710 --> 00:21:49,230 en el intervalo 0 a 200 caían 10 números 178 00:21:49,230 --> 00:21:51,970 de la lista que me habían dado, pues lo que hago es hacer una barra 179 00:21:51,970 --> 00:21:55,470 de ancho 0 a 200 y de alto 180 00:21:55,470 --> 00:21:58,869 10, en el intervalo de 200 a 400 181 00:21:58,869 --> 00:22:01,450 cayeron 13 datos 182 00:22:01,450 --> 00:22:03,910 pues hago una barrita de ancho 183 00:22:03,910 --> 00:22:06,869 200 a 400 y de alto 184 00:22:06,869 --> 00:22:10,250 13, ¿vale? y así sucesivamente 185 00:22:10,250 --> 00:22:11,670 hasta que tenga todos los datos 186 00:22:11,670 --> 00:22:29,670 Y por último, la última representación que podemos utilizar, que me vale tanto para variables cuantitativas discretas como continuas, para las cualitativas no valdría, es lo que llamamos polígono de frecuencias. 187 00:22:29,670 --> 00:22:36,109 frecuencias, que es que en vez de hacer las barras lo que hago es hacer como segmentos 188 00:22:36,109 --> 00:22:42,549 de líneas que lo que van a hacer es unir los extremos de las barras que habíamos hecho 189 00:22:42,549 --> 00:22:48,069 antes, o sea los puntos más altos de cada barrita. Cuando yo tenía este diagrama de 190 00:22:48,069 --> 00:22:52,809 barras y ahora quiero hacer su histograma lo único que tengo que hacer es unir los 191 00:22:52,809 --> 00:22:58,430 puntos más altos de cada una barrita. Si tengo un histograma exactamente lo mismo, 192 00:22:58,430 --> 00:23:00,990 lo que uno es son las marcas de clase 193 00:23:00,990 --> 00:23:02,849 en su parte más alta 194 00:23:02,849 --> 00:23:05,109 de cada una de las barritas del histograma 195 00:23:05,109 --> 00:23:06,390 ¿vale? 196 00:23:08,210 --> 00:23:08,730 ¿Yolanda? 197 00:23:09,569 --> 00:23:09,849 Sí 198 00:23:09,849 --> 00:23:11,789 Se va entendiendo 199 00:23:11,789 --> 00:23:14,329 Vamos a hacer ahora un ejercicio luego juntos, ¿vale? 200 00:23:15,069 --> 00:23:16,490 Uno de cada cosa 201 00:23:16,490 --> 00:23:17,730 ¿Vale? 202 00:23:18,329 --> 00:23:20,730 Vamos a hacer uno de variable 203 00:23:20,730 --> 00:23:22,150 discreta 204 00:23:22,150 --> 00:23:24,849 y luego hacemos uno de variable contigo 205 00:23:24,849 --> 00:23:27,250 Me dice aquí por ejemplo 206 00:23:27,250 --> 00:23:28,109 a ver 207 00:23:28,109 --> 00:23:30,329 que me voy a coger los datos 208 00:23:30,329 --> 00:23:39,789 ¿por qué no me deja ahora 209 00:23:39,789 --> 00:23:41,650 corta? 210 00:23:50,579 --> 00:23:50,819 bueno 211 00:23:50,819 --> 00:23:53,400 ¿qué le pasa al recorte? 212 00:24:10,490 --> 00:24:18,019 pues lo vemos desde aquí, no sé por qué no funciona el recorte 213 00:24:18,019 --> 00:24:18,619 no me va 214 00:24:18,619 --> 00:24:21,119 ni con las teclas abreviadas 215 00:24:21,119 --> 00:24:22,400 ni con... bueno 216 00:24:22,400 --> 00:24:24,599 pues vamos viendo de un lado a otro 217 00:24:24,599 --> 00:24:27,400 entonces, me dice en este ejercicio 218 00:24:27,400 --> 00:24:29,480 que haga un recuento de los siguientes datos 219 00:24:29,480 --> 00:24:30,480 tengo 220 00:24:30,480 --> 00:24:32,640 4, 2, 1 221 00:24:32,640 --> 00:24:36,380 treses, o sea que tengo números del 1 al 4 222 00:24:36,380 --> 00:24:40,440 entonces yo me voy a mi tablita y digo, lo primero 223 00:24:40,440 --> 00:24:45,779 la variable, ¿qué distintos números me pueden salir? 224 00:24:46,420 --> 00:24:48,859 esta sería mi tabla de frecuencias que luego la voy a utilizar 225 00:24:48,859 --> 00:24:52,380 para hacer el diagrama, tabla de frecuencias 226 00:24:52,380 --> 00:25:00,359 pues los distintos valores que me pueden salir 227 00:25:00,359 --> 00:25:03,140 son unos, doses 228 00:25:03,140 --> 00:25:06,880 Treses y cuatros, ¿no? 229 00:25:07,880 --> 00:25:10,619 Y ahora voy a ver cuántas veces aparece cada uno 230 00:25:10,619 --> 00:25:14,599 Que es lo que hemos llamado frecuencia absoluta 231 00:25:18,599 --> 00:25:19,960 Frecuencia absoluta 232 00:25:19,960 --> 00:25:24,349 Número de veces que se repite cada dato 233 00:25:24,349 --> 00:25:25,990 Pues vamos a contar 234 00:25:25,990 --> 00:25:28,049 ¿Cuántas veces aparece el 1? 235 00:25:28,269 --> 00:25:32,599 Una y dos veces, ¿no? 236 00:25:33,039 --> 00:25:34,279 Yolanda, cuéntame conmigo 237 00:25:34,279 --> 00:25:37,539 no nos dejemos alguno atrás 238 00:25:37,539 --> 00:25:41,359 aquí es bueno ir por filas 239 00:25:41,359 --> 00:25:43,180 vosotros en el cuaderno podéis ir tachando 240 00:25:43,180 --> 00:25:45,740 lo que ya hayáis contado 241 00:25:45,740 --> 00:25:46,319 pues 1 242 00:25:46,319 --> 00:25:48,380 y 2 243 00:25:48,380 --> 00:25:51,079 aquí ya lo habían hecho mal 244 00:25:51,079 --> 00:25:53,019 porque han puesto que son 3 245 00:25:53,019 --> 00:25:53,759 y es mentira 246 00:25:53,759 --> 00:25:56,740 entonces tenemos 2 1 247 00:25:56,740 --> 00:25:59,740 vamos a ver cuantos 2 es ahí 248 00:25:59,740 --> 00:26:00,420 1 249 00:26:00,420 --> 00:26:02,180 2 250 00:26:02,180 --> 00:26:22,680 3, 4, 5, 6, 7 y 8. Esto los han contado bien, 8. Vamos a ver cuántos 3 es. Pues 3 es, digo, tengo 1, 2 y 3, ¿no? 251 00:26:22,680 --> 00:26:44,759 ¿No? Otro que han contado mal. 3 y 4 tengo 1, 2, 3, 4, 5, 6, 7, 8, 9. Pues 9. En total, ¿cuántos números me han salido? 252 00:26:44,759 --> 00:26:59,900 Que al total se le llama N mayúscula. Pues digo, 2 y 8, 10. Y 3, 13. Y 9, 22. ¿No? 253 00:27:00,460 --> 00:27:01,059 Sí. 254 00:27:02,099 --> 00:27:09,339 Pues total, 22 datos. Vamos a ver qué es verdad, porque hay veces que he contado mal. 255 00:27:09,339 --> 00:27:17,140 Entonces yo digo, voy a ver si es verdad que tengo 22 datos. Vamos a ver cuántos hay en cada fila y multiplicamos por 2. 256 00:27:17,220 --> 00:27:24,740 En cada fila hay 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 y 11. 257 00:27:25,140 --> 00:27:28,799 O sea, que 11 por 2, los 22 datos que teníamos, que queríamos. 258 00:27:29,700 --> 00:27:32,960 Luego, parece que no me he equivocado en ninguno. 259 00:27:33,559 --> 00:27:35,880 ¿Vale? Ni he contado de más ni he contado de menos. 260 00:27:36,519 --> 00:27:39,680 Si hubiésemos sumado los que aquí ponía, no sale bien. 261 00:27:39,680 --> 00:27:43,380 3 y 8, 11, 9 y 4, 13. 262 00:27:43,500 --> 00:27:46,220 Le salen 24 datos y no hay 24 datos. 263 00:27:46,220 --> 00:28:10,539 Aquí me estaban intentando engañar. Bueno, pues nosotros hemos hecho ya nuestro recuento. Pues ahora ya sigo con lo demás. Esa es la frecuencia absoluta y ahora tengo la frecuencia relativa, que hemos dicho que la puedo llamar HI o FI entre el número total de datos, como quiera. 264 00:28:10,539 --> 00:28:22,740 Yo suelo poner HI para así no escribir tanto. Y lo que decía esta frecuencia es dividir el número de datos que habían aparecido en la frecuencia absoluta entre el total de datos. 265 00:28:22,740 --> 00:28:37,880 O sea, que esta sería 2 partido de 22, esta sería 8 partido de 22, este 3 partido de 22 y 9 partido de 22. 266 00:28:38,579 --> 00:28:46,140 Si hago la suma de estas frecuencias relativas, me tiene que dar 22 entre 22, que es 1. 267 00:28:46,140 --> 00:28:48,619 si en vez de ponerlo como fracción 268 00:28:48,619 --> 00:28:51,079 hago como en el ejemplo ese que proponía el libro 269 00:28:51,079 --> 00:28:55,039 de hacer la cuenta y ponerlo como decimal 270 00:28:55,039 --> 00:28:58,079 pues también la suma de los decimales que me salgan 271 00:28:58,079 --> 00:28:59,000 me tiene que dar 1 272 00:28:59,000 --> 00:29:01,880 ¿por qué a mí no me gusta ponerlo como decimales? 273 00:29:02,420 --> 00:29:04,519 porque luego hacéis la cuenta con la calculadora 274 00:29:04,519 --> 00:29:06,079 la calculadora redondea 275 00:29:06,079 --> 00:29:07,559 no sale 1 276 00:29:07,559 --> 00:29:09,619 y ya os empecéis a poner nerviosos 277 00:29:09,619 --> 00:29:11,200 y pensáis que lo estáis haciendo mal 278 00:29:11,200 --> 00:29:12,579 y os bloqueáis 279 00:29:12,579 --> 00:29:14,700 mientras que si lo pongo como fracción 280 00:29:14,700 --> 00:29:18,559 solo es ir dividiendo el número que me ha salido 281 00:29:18,559 --> 00:29:21,539 en la frecuencia absoluta entre el número total de datos 282 00:29:21,539 --> 00:29:23,660 y dejo la fracción tal cual, ya está, ¿vale? 283 00:29:24,099 --> 00:29:26,000 No hago más con ella, ¿de acuerdo? 284 00:29:27,480 --> 00:29:29,799 Bueno, ahora tenemos las frecuencias 285 00:29:29,799 --> 00:29:32,920 acumuladas, que hemos dicho 286 00:29:32,920 --> 00:29:35,319 que 287 00:29:35,319 --> 00:29:38,680 es ir juntando, oye, aquí no he puesto 288 00:29:38,680 --> 00:29:41,279 cuál era esta, para que no vaya quedando 289 00:29:41,279 --> 00:29:58,019 Claro, este hemos dicho que es la frecuencia relativa que sale de la absoluta dividido entre el número total de datos. 290 00:29:58,240 --> 00:30:04,859 Bueno, vamos a hacer la frecuencia acumulada, absoluta acumulada, que por eso los dos son conectados. 291 00:30:05,099 --> 00:30:08,880 Las acumuladas van a ser letras mayúsculas, las normales letras minúsculas. 292 00:30:08,880 --> 00:30:17,279 Pues esta me decía que tenía que escribir cuántos datos había, pues, iguales o menores que el valor de la x. 293 00:30:17,539 --> 00:30:23,339 Entonces digo, ¿cuántos datos me salieron iguales o menores que 1? Pues solo me salieron 2. 294 00:30:23,980 --> 00:30:31,920 Ahora, ¿cuántos datos me salieron menores o iguales que 2? Pues los 8 del 2 más los 2 del 1, ¿no? 295 00:30:31,920 --> 00:30:54,680 Entonces, tengo que sumarlos. 8 más 2, pues me salieron 10 datos menores o iguales que 2. ¿Cuántos me salieron menores o iguales que el 3? Pues el 2 más el 8 y más el 3 del 3, pues me salieron 13 datos. 296 00:30:54,680 --> 00:31:22,420 ¿Y cuántos me salieron menores o iguales que 4? Pues la suma de todos, 2 más 8 más 3 y más 9, los 22 datos que yo quería. O sea, que siempre en la última fila de la frecuencia absoluta acumulada, tengo que obtener el mismo valor que en el número total de datos. ¿Vale? 297 00:31:22,420 --> 00:31:24,440 muy bien 298 00:31:24,440 --> 00:31:26,400 ya sé que los he contado bien 299 00:31:26,400 --> 00:31:28,539 estos son truquillos para ver si voy bien 300 00:31:28,539 --> 00:31:30,000 y si no voy bien paro 301 00:31:30,000 --> 00:31:32,180 porque si me equivoco en estos recuentos 302 00:31:32,180 --> 00:31:34,319 todas las operaciones que hagamos después 303 00:31:34,319 --> 00:31:35,759 van a estar mal, ¿vale? 304 00:31:36,140 --> 00:31:38,519 y me he cargado el ejercicio solo por haberme dejado 305 00:31:38,519 --> 00:31:39,140 un dato atrás 306 00:31:39,140 --> 00:31:42,440 o la estadística que estoy haciendo ya no es real 307 00:31:42,440 --> 00:31:44,339 porque me estoy dejando gente atrás 308 00:31:44,339 --> 00:31:44,779 ¿vale? 309 00:31:45,960 --> 00:31:48,940 bueno, pues a esto hemos dicho que le llamamos 310 00:31:48,940 --> 00:31:52,309 frecuencia 311 00:31:52,309 --> 00:31:59,839 absoluta acumulada, ¿vale? 312 00:32:00,740 --> 00:32:03,140 Vamos a hacer lo mismo con la frecuencia relativa. 313 00:32:03,920 --> 00:32:07,480 Y voy a hacer otra columna más, ya la última 314 00:32:07,480 --> 00:32:11,339 de momento, en la que hago 315 00:32:11,339 --> 00:32:16,599 el acumulado de las H, por eso lo llamo H mayúscula, ¿vale? 316 00:32:16,599 --> 00:32:19,920 Este va a ser la frecuencia 317 00:32:19,920 --> 00:32:26,170 relativa acumulada 318 00:32:26,170 --> 00:32:32,599 y hago lo mismo que he hecho antes, digo, venga 319 00:32:32,599 --> 00:32:36,880 tengo que contar cuánto hay en esa posición 320 00:32:36,880 --> 00:32:39,619 o por debajo de ella, pero ahora mirando 321 00:32:39,619 --> 00:32:44,140 a la suma de esta columna, ¿vale? Entonces digo 322 00:32:44,140 --> 00:32:48,640 menores o iguales que 1, pues 2 veintidósavos 323 00:32:48,640 --> 00:32:52,460 menores o iguales que el 2, pues 2 324 00:32:52,460 --> 00:32:56,779 veintidósavos más ocho veintidósavos 325 00:32:56,779 --> 00:33:00,299 me quedan diez veintidósavos, ¿no? 326 00:33:00,940 --> 00:33:04,339 ¿De acuerdo? Menores o iguales que el tres 327 00:33:04,339 --> 00:33:08,200 pues dos más ocho más tres, once 328 00:33:08,200 --> 00:33:11,759 veintidósavos. Oh, perdón, trece. Ay, madre. 329 00:33:12,420 --> 00:33:16,079 Trece veintidósavos. Y ahora, menores o iguales que cuatro 330 00:33:16,079 --> 00:33:21,779 pues dos más ocho más tres más nueve, veintidós 331 00:33:21,779 --> 00:33:25,400 veintidósavos, o sea que si lo he hecho bien 332 00:33:25,400 --> 00:33:27,460 el último me tiene que dar un 1 333 00:33:27,460 --> 00:33:30,200 y ahora fíjate, después de haber dicho 334 00:33:30,200 --> 00:33:33,599 cómo se hace con la definición, voy a decirte el truco 335 00:33:33,599 --> 00:33:37,240 y el truco es que, y por eso yo lo he escrito 336 00:33:37,240 --> 00:33:40,420 en este orden, que a lo mejor en mi libro lo veis en distinto orden 337 00:33:40,420 --> 00:33:42,480 en las columnas, el truco es 338 00:33:42,480 --> 00:33:45,839 mirar la frecuencia absoluta acumulada 339 00:33:45,839 --> 00:33:49,039 2 y dividirla entre 22, 10 340 00:33:49,039 --> 00:33:50,640 y entre 22, 13 341 00:33:50,640 --> 00:33:52,980 y entre 22, 22 y entre 22 342 00:33:52,980 --> 00:33:55,019 o sea que no hace falta que vuelva a pensar 343 00:33:55,019 --> 00:33:56,220 en la suma de fracciones 344 00:33:56,220 --> 00:33:58,799 sino que me vuelva a coger como numerador 345 00:33:58,799 --> 00:34:00,819 la frecuencia absoluta acumulada 346 00:34:00,819 --> 00:34:01,380 ¿lo ves? 347 00:34:02,259 --> 00:34:04,220 lo que estoy diciendo, con lo cual 348 00:34:04,220 --> 00:34:06,440 si yo las pongo en este orden 349 00:34:06,440 --> 00:34:09,219 las columnas, que las puedo poner en el orden que me dé la gana 350 00:34:09,219 --> 00:34:13,000 las cuentas de una me valen para la siguiente 351 00:34:13,000 --> 00:34:14,940 y no tengo que estar 352 00:34:14,940 --> 00:34:17,019 pensando dos veces de cero 353 00:34:17,019 --> 00:34:18,599 ¿ves lo que te digo? 354 00:34:19,039 --> 00:34:21,739 Si lo hubiese hecho como en el libro 355 00:34:21,739 --> 00:34:22,960 que la frecuencia 356 00:34:22,960 --> 00:34:25,539 absoluta acumulada la puso aquí al lado 357 00:34:25,539 --> 00:34:27,699 de la FBI y luego las relativas 358 00:34:27,699 --> 00:34:29,820 las puso al final, pues ya al ir moviendo 359 00:34:29,820 --> 00:34:31,400 los ojos de una columna a otra 360 00:34:31,400 --> 00:34:33,579 que están separadas, hace que me 361 00:34:33,579 --> 00:34:35,639 equivoquen las cuentas. Mientras que 362 00:34:35,639 --> 00:34:37,860 si pongo cada columna al lado 363 00:34:37,860 --> 00:34:39,440 de la que me ayuda a hacer la cuenta 364 00:34:39,440 --> 00:34:41,420 pues me voy a despistar menos 365 00:34:41,420 --> 00:34:43,059 y me voy a equivocar menos, ¿vale? 366 00:34:43,639 --> 00:34:45,960 O sea que parece una tontería 367 00:34:45,960 --> 00:34:46,920 pero luego 368 00:34:46,920 --> 00:34:49,980 metéis la pata y claro, pues eso da mucha rabia 369 00:34:49,980 --> 00:34:52,039 a ver, me he equivocado en un recuento tonto de estos 370 00:34:52,039 --> 00:34:55,179 y que me cargue el ejercicio por ello, pues es una faena, ¿vale? 371 00:34:56,059 --> 00:34:58,539 bueno, ya tenemos hecho 372 00:34:58,539 --> 00:35:02,039 el recuento, digo, ahora, ¿qué tipo de variable 373 00:35:02,039 --> 00:35:04,719 sería esta? pues esta variable 374 00:35:04,719 --> 00:35:07,719 hemos visto que toma valores puntuales 375 00:35:07,719 --> 00:35:08,699 luego es una variable 376 00:35:08,699 --> 00:35:12,519 cuantitativa discreta 377 00:35:12,519 --> 00:35:16,460 esta variable 378 00:35:16,460 --> 00:35:22,539 es cuantitativa 379 00:35:22,539 --> 00:35:28,260 discreta 380 00:35:28,260 --> 00:35:32,619 porque toma valores sueltos, no toma valores en intervalos 381 00:35:32,619 --> 00:35:36,940 porque ha tomado valores numéricos, o sea, cuantitativa por tomar 382 00:35:36,940 --> 00:35:41,159 valores numéricos, discreta porque toma números sueltos 383 00:35:41,159 --> 00:35:44,480 ¿vale? y ahora, ¿cuál dijimos que era 384 00:35:44,480 --> 00:35:48,860 el gráfico que representaba a las variables cuantitativas 385 00:35:48,860 --> 00:35:54,059 discretas? Pues dijimos que el gráfico que me representaba esas variables era el diagrama 386 00:35:54,059 --> 00:36:10,300 de barras, ¿no? Sí. Pues representación era o diagrama de barras, pero había otro 387 00:36:10,300 --> 00:36:18,800 más, que era también el polígono de frecuencias, que era unir los extremos de las barritas, 388 00:36:18,800 --> 00:36:20,820 ¿vale? Sí 389 00:36:20,820 --> 00:36:26,480 Bueno, pues voy a hacer eso 390 00:36:26,480 --> 00:36:31,059 ¿Cómo se hacía? Pues dijimos que me cojo el plano 391 00:36:31,059 --> 00:36:35,300 y digo que en el eje 392 00:36:35,300 --> 00:36:39,000 X lo que voy a poner es valor 393 00:36:39,000 --> 00:36:46,840 o valores de la variable, en este caso 394 00:36:46,840 --> 00:36:51,280 voy a tener el 1, el 2 395 00:36:51,280 --> 00:36:56,179 el 3 y el 4, que eran los distintos valores que me podían salir 396 00:36:56,179 --> 00:37:00,079 y en el eje Y lo que poníamos eran las frecuencias 397 00:37:00,079 --> 00:37:03,159 absolutas, en el eje Y pongo 398 00:37:03,159 --> 00:37:06,760 cuántas veces he repetido cada dato 399 00:37:06,760 --> 00:37:11,800 y lo que hago luego es una barrita encima de cada uno de los valores 400 00:37:11,800 --> 00:37:15,480 de la variable que tenga esa altura, entonces vamos a ver y digo 401 00:37:15,480 --> 00:37:19,719 oye, cuántas veces me salió el 1, me vengo 402 00:37:19,719 --> 00:37:28,340 a mi tabla de frecuencias y veo que el 1 me salió 2 veces. Pues yo digo, a ver, 1 y 2, 403 00:37:29,760 --> 00:37:38,119 pues hago una barrita de altura 2 encima del 1, ¿vale? ¿Cuántas veces me salió el 2? 404 00:37:38,119 --> 00:37:54,699 Pues el 2 me salió 8 veces, ¿vale? Pues digo 2, 3, 4, 5, 6, 7 y 8, ahí, pero hago al revés. 405 00:37:55,320 --> 00:38:01,719 Pues hago una barrita de altura 8, encima del 2, barritas separadas, ¿vale? 406 00:38:01,719 --> 00:38:04,380 ¿Cuánto es el diagrama de barras? 407 00:38:04,460 --> 00:38:05,440 Barras separadas 408 00:38:05,440 --> 00:38:06,960 Encima del 3 409 00:38:06,960 --> 00:38:09,679 ¿Cómo tiene que ser de alta la barrita? 410 00:38:12,460 --> 00:38:13,019 3 411 00:38:13,019 --> 00:38:16,119 3, porque vimos que las veces que se repetía el 3 412 00:38:16,119 --> 00:38:17,039 eran 3, ¿no? 413 00:38:17,619 --> 00:38:19,440 Pues como ya tengo puesta aquí la escala 414 00:38:19,440 --> 00:38:21,920 digo, pues a mi barrita de altura 415 00:38:21,920 --> 00:38:23,079 3 416 00:38:23,079 --> 00:38:25,159 Encima del 3 417 00:38:25,159 --> 00:38:27,340 ¿Y de 4 cuántas me salieron? 418 00:38:28,480 --> 00:38:29,000 9 419 00:38:29,000 --> 00:38:31,300 9, pues barrita 420 00:38:31,300 --> 00:38:32,659 de altura 9 421 00:38:32,659 --> 00:38:35,000 encima de ese 4 422 00:38:35,000 --> 00:38:36,699 ¿Vale? 423 00:38:37,579 --> 00:38:38,000 ¿De acuerdo? 424 00:38:38,000 --> 00:38:39,539 Sí, sí 425 00:38:39,539 --> 00:38:42,000 Ahora digo, el polígono de frecuencias 426 00:38:42,539 --> 00:38:43,539 ¿Cómo 427 00:38:43,539 --> 00:38:46,639 dibujaba yo el polígono de frecuencias? 428 00:38:47,199 --> 00:38:47,960 Pues hemos dicho 429 00:38:47,960 --> 00:38:49,599 pues era simplemente 430 00:38:49,599 --> 00:38:51,159 unir 431 00:38:51,159 --> 00:38:53,900 la parte más alta de las barras 432 00:38:53,900 --> 00:38:57,559 ¿Vale? Madre mía 433 00:38:57,559 --> 00:38:59,940 ¿Qué líneas me salen? Tengo el pulso 434 00:38:59,940 --> 00:39:01,239 un poco estropeado 435 00:39:01,239 --> 00:39:02,639 ¿Vale? 436 00:39:02,659 --> 00:39:17,039 Entonces, el polígono de frecuencias es lo que hemos hecho en rojo, el diagrama de barras lo que he hecho en negro, ¿vale? O sea, que es un poco fácil de hacer, ¿no? 437 00:39:17,860 --> 00:39:18,219 Sí. 438 00:39:18,219 --> 00:39:32,159 Sí, de acuerdo. Bueno, vamos a hacer la misma historia para una variable continua, pero haciendo un histograma. A ver si encontramos un ejemplo. 439 00:39:32,159 --> 00:40:38,469 bueno, lo tenemos aquí 440 00:40:38,469 --> 00:40:41,869 me dice, tengo esas variables que son continuas 441 00:40:41,869 --> 00:40:43,730 porque tengo decimales ahora 442 00:40:43,730 --> 00:40:48,590 me pide el ejercicio, dice, agrúpalas en 5 intervalos 443 00:40:48,590 --> 00:40:50,590 que sean igual de anchos 444 00:40:50,590 --> 00:41:04,809 O sea, que tengan la misma amplitud, porque si no hago las cajitas igual de grandes, pues puede que me caigan más en una cajita que en otra, ¿no? Tengo que asegurarme que las cajitas sean igual de grandes. 445 00:41:04,809 --> 00:41:06,210 ¿Cómo hago eso? 446 00:41:06,889 --> 00:41:12,650 Bueno, pues el valor más bajo que me aparece es ese 0,1 447 00:41:12,650 --> 00:41:14,829 y lo voy a coger un poquito más abajo, el 0 448 00:41:14,829 --> 00:41:18,369 y el más alto que me aparece es ese 9,8 449 00:41:18,369 --> 00:41:20,210 y bueno, pues voy a salir hasta el 10 450 00:41:20,210 --> 00:41:21,889 ¿Y ahora qué hago? 451 00:41:21,989 --> 00:41:24,610 Bueno, pues mira que bien, si me tienen que pagar 5 cajas 452 00:41:24,610 --> 00:41:26,829 pues cada caja que tenga tamaño 2 453 00:41:26,829 --> 00:41:28,789 voy del 0 al 2 en la primera 454 00:41:28,789 --> 00:41:30,869 de 2 al 4 en la segunda 455 00:41:30,869 --> 00:41:32,449 de 4 al 6 en la tercera 456 00:41:32,449 --> 00:41:33,469 6 al 8 457 00:41:33,469 --> 00:41:34,570 8 al 10 458 00:41:34,570 --> 00:41:36,489 Y ya tengo mis cinco cajas como quería. 459 00:41:36,989 --> 00:41:39,369 Y todas han quedado igual de grandes. 460 00:41:39,630 --> 00:41:41,190 Todas tienen amplitud 2. 461 00:41:41,889 --> 00:41:45,489 La amplitud es la diferencia entre el extremo y el origen. 462 00:41:45,670 --> 00:41:46,909 2 menos 0 es 2. 463 00:41:47,070 --> 00:41:48,289 4 menos 2 es 2. 464 00:41:48,710 --> 00:41:49,849 6 menos 4 es 2. 465 00:41:49,969 --> 00:41:50,789 6 menos 8 es 2. 466 00:41:50,889 --> 00:41:52,010 O sea que todas igual de grandes. 467 00:41:52,769 --> 00:41:53,670 Y ahora un detallito. 468 00:41:55,170 --> 00:41:58,289 Siempre al número que está a la izquierda le pongo con un corchete. 469 00:41:58,530 --> 00:42:00,469 Y al que está a la derecha con un paréntesis. 470 00:42:01,150 --> 00:42:02,909 ¿Qué diferencia hay? 471 00:42:02,909 --> 00:42:06,829 pues que el corchete me está diciendo que el 0 472 00:42:06,829 --> 00:42:10,429 le tendría que meter a esta cajita, pero el 2 473 00:42:10,429 --> 00:42:15,010 no le meto donde está el paréntesis, le meto donde está el corchete, o sea, el corchete me dice 474 00:42:15,010 --> 00:42:19,070 que ese número está incluido, mientras que el paréntesis es como si me le dejase 475 00:42:19,070 --> 00:42:22,590 escapar, ¿vale? O sea, que si aquí apareciese algún 2 476 00:42:22,590 --> 00:42:26,409 no hay que contarle en esta primera caja, hay que contarle en esta segunda 477 00:42:26,409 --> 00:42:31,150 si aparece algún 4, no hay que contarle en esta segunda caja, hay que contarle 478 00:42:31,150 --> 00:42:34,630 en la tercera, ¿vale? O sea, donde esté el corchete 479 00:42:34,630 --> 00:42:39,590 es donde tengo que montar ese valor que se ha quedado en el extremo, donde esté el paréntesis 480 00:42:39,590 --> 00:42:43,010 no, ¿vale? Bueno, vamos a hacer 481 00:42:43,010 --> 00:42:47,489 mi tabla de frecuencia, ¿cuántos números hay entre 0 482 00:42:47,489 --> 00:42:51,610 y 2? Pues voy a contarlos, aquí no hay ninguno 483 00:42:51,610 --> 00:42:54,630 entre 0 y 2, aquí tengo 1, el 1,4 484 00:42:54,630 --> 00:42:59,789 1, el 1,1, 2, el 0,1 485 00:42:59,789 --> 00:43:02,269 3, el 1,7 486 00:43:02,269 --> 00:43:04,289 4, el 1,9 487 00:43:04,289 --> 00:43:05,809 5, el 1,3 488 00:43:05,809 --> 00:43:06,829 6 datos 489 00:43:06,829 --> 00:43:10,349 6 números que han caído en esa primera cajita 490 00:43:10,349 --> 00:43:11,969 ¿vale? entonces 491 00:43:11,969 --> 00:43:13,909 para que no me equivoque 492 00:43:13,909 --> 00:43:15,309 puedo hacer la que te decía 493 00:43:15,309 --> 00:43:16,929 los voy tachando 494 00:43:16,929 --> 00:43:19,550 digo el 1,4, el 1,7 495 00:43:19,550 --> 00:43:21,829 el 0,1, el 1,9 496 00:43:21,829 --> 00:43:23,769 el 1,3, el 1,1 497 00:43:23,769 --> 00:43:25,909 y ya están 2,4 498 00:43:25,909 --> 00:43:26,809 6 ¿vale? 499 00:43:27,590 --> 00:43:29,469 y ya eso no lo voy a volver a tocar 500 00:43:29,469 --> 00:43:31,269 digo, ¿cuántos caen en la segunda caja? 501 00:43:31,670 --> 00:43:33,349 entre el 2 y el 4 502 00:43:33,349 --> 00:43:35,349 bueno, pues entre el 2 y el 4 503 00:43:35,349 --> 00:43:37,730 me cae este 3 504 00:43:37,730 --> 00:43:39,469 3,1 505 00:43:39,469 --> 00:43:42,150 me cae ese 2,5 506 00:43:42,150 --> 00:43:43,389 2 507 00:43:43,389 --> 00:43:45,469 ¿el 4 le podría contar? 508 00:43:48,500 --> 00:43:49,019 no 509 00:43:49,019 --> 00:43:51,119 no, porque aquí tengo el intervalo 510 00:43:51,119 --> 00:43:52,960 abierto, sí señora, muy bien 511 00:43:52,960 --> 00:43:54,579 ese detalle, la hacía muy bien 512 00:43:54,579 --> 00:43:57,059 entonces, el único que me quedaría para el final es el 513 00:43:57,059 --> 00:43:59,199 3,6, luego ¿cuántos tengo? 514 00:43:59,199 --> 00:44:02,239 pues 1, 2 y 3 515 00:44:02,239 --> 00:44:03,900 lo que me estaban diciendo aquí en la tabla 516 00:44:03,900 --> 00:44:08,719 ¿cuántos hay entre el 4 y el 6? 517 00:44:09,360 --> 00:44:11,099 a ver, entre el 4 y el 6 518 00:44:11,099 --> 00:44:15,380 pues tengo, ¿puedo contar el 6 en este último intervalo? 519 00:44:15,380 --> 00:44:16,940 en este intervalo que estoy mirando 520 00:44:16,940 --> 00:44:20,579 no, porque tiene abierto 521 00:44:20,579 --> 00:44:22,860 entonces el 6 no lo puedo contar 522 00:44:22,860 --> 00:44:26,039 entre 4 y 6 quiero, entre 4 y 6 523 00:44:26,039 --> 00:44:28,019 tengo el 5,7 524 00:44:28,019 --> 00:44:30,659 Tengo el 5,4 525 00:44:30,659 --> 00:44:33,360 Tengo el 4 526 00:44:33,360 --> 00:44:34,639 No se nos olvide 527 00:44:34,639 --> 00:44:36,940 Tengo el 4,8 528 00:44:36,940 --> 00:44:39,360 Tengo el 5,3 529 00:44:39,360 --> 00:44:41,059 Y el 5,2 530 00:44:41,059 --> 00:44:43,019 O sea que 1,2,3,4 531 00:44:43,019 --> 00:44:44,119 6 532 00:44:44,119 --> 00:44:47,320 Y me he comido uno, el 5,7 533 00:44:47,320 --> 00:44:48,199 Que lo acabo de ver ahora 534 00:44:48,199 --> 00:44:51,159 O sea que tengo 7 535 00:44:51,159 --> 00:44:52,119 Datos 536 00:44:52,119 --> 00:44:54,719 Entre el 6 y el 8 537 00:44:54,719 --> 00:44:56,679 Entre el 6 y el 8 538 00:44:56,679 --> 00:45:00,079 vamos a ver cuántos tengo 539 00:45:00,079 --> 00:45:03,079 el 6 540 00:45:03,079 --> 00:45:06,480 tengo el 7,2 541 00:45:06,480 --> 00:45:08,059 el 6,2 542 00:45:08,059 --> 00:45:09,500 el 6,3 543 00:45:09,500 --> 00:45:11,380 el 6,7 544 00:45:11,380 --> 00:45:13,400 y ya están todos 545 00:45:13,400 --> 00:45:16,039 o sea que 1,2 y 3 546 00:45:16,039 --> 00:45:17,340 4 547 00:45:17,340 --> 00:45:19,079 4 548 00:45:19,079 --> 00:45:21,820 perdón, no había contado el 6,3 549 00:45:21,820 --> 00:45:22,300 4 550 00:45:22,300 --> 00:45:26,360 ¿cuántos me quedan ahora entre el 8 y el 10? 551 00:45:26,360 --> 00:45:42,579 Por lo que nos ha tachado 1, 2, 3 y 4. Luego ya tengo repartidos cada numerito en su caja correspondiente, ¿vale? Bueno, pues a partir de aquí, el resto de la tabla, igual que hemos hecho antes. 552 00:45:42,579 --> 00:45:48,760 La frecuencia relativa, que la llamamos HI, dijimos, ¿no? 553 00:45:49,380 --> 00:45:49,780 Sí. 554 00:45:51,780 --> 00:45:59,599 6 partido de cuántos. ¿Cuántos datos tengo aquí en total? 6 y 3, 9, y 7, 16, 20, 24. 555 00:45:59,599 --> 00:46:19,219 Pues 6 partido de 24, aquí tendríamos 3 partido de 24, 7 partido de 24, 8 partido de 24, 4 partido de 24 y otra vez 4 partido de 24, ¿vale? 556 00:46:19,219 --> 00:46:23,840 Frecuencia absoluta acumulada. 557 00:46:24,980 --> 00:46:26,900 Ahí, Dios, ¿por qué no me dejas escribir? 558 00:46:29,019 --> 00:46:31,699 Me ha ido el tacto de la pizarra. 559 00:46:32,840 --> 00:46:34,239 A ver, ¿por qué no veo el puntero? 560 00:46:37,409 --> 00:46:41,050 Pues le llamamos F mayúsculas, que no veo ahora el puntero. 561 00:46:43,469 --> 00:46:48,210 No veo el puntito, ya sé que tú nunca le ves, pero yo tampoco le veo ahora para saber dónde estoy escribiendo. 562 00:46:48,929 --> 00:46:52,730 La flechita está sobre el número 4, ahí, ahí. 563 00:46:52,869 --> 00:47:03,070 Bueno, te lo digo enseguida 564 00:47:03,070 --> 00:47:05,289 Que nos quedan 3 minutos para ver el gráfico 565 00:47:05,289 --> 00:47:07,489 Ya lo vimos antes, la H mayúscula 566 00:47:07,489 --> 00:47:08,329 Sería 567 00:47:08,329 --> 00:47:11,250 Perdón, la H mayúscula 568 00:47:11,250 --> 00:47:12,829 La H mayúscula se va a ir sumando 569 00:47:12,829 --> 00:47:13,969 Esto de aquí, ¿vale? 570 00:47:14,489 --> 00:47:17,489 La primera va a ser 6, la segunda 6 más 3 571 00:47:17,489 --> 00:47:19,190 9, la tercera 9 572 00:47:19,190 --> 00:47:20,190 Más 7, 16 573 00:47:20,190 --> 00:47:22,929 La cuarta 16 más 4, 20 574 00:47:22,929 --> 00:47:25,110 Y la última 24, ¿vale? 575 00:47:26,230 --> 00:47:27,210 ¿Lo escribes bien? 576 00:47:28,210 --> 00:47:29,670 Es que no sé por qué... 577 00:47:29,670 --> 00:47:32,409 Ahora, ahora, ahora, ahora, ahora. 578 00:47:33,429 --> 00:47:39,389 Venga, ya que hemos dicho 6, esta es la F mayúscula, que es la frecuencia absoluta. 579 00:47:39,989 --> 00:47:45,769 6, 9, 16, 20 y 24. 580 00:47:45,949 --> 00:47:49,929 Y por último me quedaría la relativa acumulada que hemos dicho, 581 00:47:50,469 --> 00:47:55,070 que si he hecho bien la absoluta acumulada solo es dividir entre el número total de datos, 582 00:47:55,070 --> 00:48:11,250 Pues 6 partido de 24, 9 partido de 24, 16 partido de 24, 20 partido de 24 y 24 partido de 24, que es 1, que es a donde yo quería llegar, ¿no? 583 00:48:11,730 --> 00:48:19,150 A tener un 1 al final. Lo haga como fracción o lo haga como números decimales. Como fracción se ve mejor, vuelvo a repetir. 584 00:48:19,150 --> 00:48:41,289 Bueno, y ahora, ¿qué dibujo correspondía a las variables cuantitativas continuas? Pues correspondía el histograma, ¿vale? O sea, que ahora las barras estas son un histograma, porque están juntas unas a otras. 585 00:48:41,289 --> 00:48:43,150 si están separadas diagramas de barras 586 00:48:43,150 --> 00:48:44,610 y están juntas histogramas 587 00:48:44,610 --> 00:48:47,190 ¿qué hago? pues en el eje X lo que hago es poner 588 00:48:47,190 --> 00:48:49,329 cada uno de los intervalos 589 00:48:49,329 --> 00:48:51,809 del 0 al 2, del 2 al 4 590 00:48:51,809 --> 00:48:53,110 del 4 al 6 591 00:48:53,110 --> 00:48:54,989 al 8 y al 10 592 00:48:54,989 --> 00:48:56,949 que fue los intervalos que pusimos aquí 593 00:48:56,949 --> 00:48:58,510 en la variable 594 00:48:58,510 --> 00:48:58,929 ¿vale? 595 00:48:59,769 --> 00:49:02,190 ¿qué pongo en las Y? es la altura 596 00:49:02,190 --> 00:49:03,510 las veces que se ha repetido 597 00:49:03,510 --> 00:49:06,489 la altura de cada barra es las veces que se ha repetido cada dato 598 00:49:06,489 --> 00:49:08,190 que es lo mismo que la frecuencia 599 00:49:08,190 --> 00:49:09,369 absoluta acumulada 600 00:49:09,369 --> 00:49:16,329 Altura 6, altura 3, altura 7, altura 4 y altura 4. 601 00:49:17,469 --> 00:49:29,130 Y ahora, por último, dijimos, si uniese todos los puntos más altos, en este caso, por la parte central, que es lo que llamamos antes, 602 00:49:29,130 --> 00:49:32,630 en la marca de clase, el representante 603 00:49:32,630 --> 00:49:36,650 aquí el representante sería el 1, aquí sería el 3 604 00:49:36,650 --> 00:49:40,530 aquí el 5, el 7 y el 9 que son los puntos 605 00:49:40,530 --> 00:49:44,710 intermedios del intervalo, ¿vale? Pues si uno 606 00:49:44,710 --> 00:49:48,289 esos puntos intermedios en el punto más alto 607 00:49:48,289 --> 00:49:52,690 lo que me saldría era lo que llamamos polígono 608 00:49:52,690 --> 00:49:55,809 de frecuencias 609 00:49:55,809 --> 00:50:00,300 porque viendo 610 00:50:00,300 --> 00:50:03,199 dónde acaba cada segmento 611 00:50:03,199 --> 00:50:04,980 de estos, sé a qué altura 612 00:50:04,980 --> 00:50:06,760 estoy, con lo cual sé qué 613 00:50:06,760 --> 00:50:08,840 frecuencia absoluta tuvo ese 614 00:50:08,840 --> 00:50:10,039 dato, ¿vale? 615 00:50:10,860 --> 00:50:13,039 Sí. Entonces esta parte es fácil, ¿no? 616 00:50:14,280 --> 00:50:15,059 Sí, hasta 617 00:50:15,059 --> 00:50:16,900 aquí sí. Es tener cuidadito 618 00:50:16,900 --> 00:50:18,800 al hacer el recuento 619 00:50:18,800 --> 00:50:20,719 porque si me como algún dato 620 00:50:20,719 --> 00:50:22,880 o pongo alguno de más que le he contado dos veces, pues ya 621 00:50:22,880 --> 00:50:24,420 me sale todo lo demás mal, ¿vale? 622 00:50:24,820 --> 00:50:26,320 Sí, sí, sí. Y luego ya, pues 623 00:50:26,320 --> 00:50:29,099 a aprenderme cuál es cada tipo de variable 624 00:50:29,099 --> 00:50:31,000 para saber qué tipo de representación 625 00:50:31,000 --> 00:50:32,239 tengo para cada uno de ellos 626 00:50:32,239 --> 00:50:33,099 ¿vale? 627 00:50:34,539 --> 00:50:35,739 esto facilito 628 00:50:35,739 --> 00:50:39,119 espero que te hagas algún ejercicio 629 00:50:39,119 --> 00:50:40,300 y te salga bien a la primera 630 00:50:40,300 --> 00:50:43,059 para el próximo día lo que vamos a ver 631 00:50:43,059 --> 00:50:45,500 es una vez hechos estos recuentos 632 00:50:45,500 --> 00:50:47,119 o vistos estos gráficos 633 00:50:47,119 --> 00:50:48,639 ¿cómo puedo 634 00:50:48,639 --> 00:50:51,619 calcular esas medidas de centralización 635 00:50:51,619 --> 00:50:53,360 y esas medidas de dispersión 636 00:50:53,360 --> 00:50:54,739 que mediten 637 00:50:54,739 --> 00:50:57,139 en el tema este 638 00:50:57,139 --> 00:50:59,039 en la estadística que quiero calcular 639 00:50:59,039 --> 00:50:59,559 ¿vale? 640 00:51:00,059 --> 00:51:02,400 van a ser pues algunas formulitas 641 00:51:02,400 --> 00:51:03,780 y otras pues de pura lógica 642 00:51:03,780 --> 00:51:05,559 porque la media sabemos lo que es ya 643 00:51:05,559 --> 00:51:07,679 cuando tú quieres calcular tus notas medias 644 00:51:07,679 --> 00:51:10,320 que haces las sumas todas y dividir eso entre los números de naturas 645 00:51:10,320 --> 00:51:10,519 ¿no? 646 00:51:11,739 --> 00:51:13,059 eso es lo que vamos a hacer aquí 647 00:51:13,059 --> 00:51:16,139 lo que pasa es que lo vamos a hacer de una forma que no sea más productiva 648 00:51:16,139 --> 00:51:18,280 que tenga que hacer la menor cantidad de cuentas posible 649 00:51:18,280 --> 00:51:18,639 ¿vale? 650 00:51:20,079 --> 00:51:21,800 eso lo vemos el próximo día 651 00:51:21,800 --> 00:51:24,579 así que que tenga usted buena tarde 652 00:51:24,579 --> 00:51:26,280 Igualmente 653 00:51:26,280 --> 00:51:28,619 Volvemos a ver o escuchar el lunes 654 00:51:28,619 --> 00:51:30,800 Muy bien, muchas gracias