1 00:00:00,000 --> 00:00:06,780 No es que sea difícil, pero que sí que es verdad que hay veces que los términos los tenemos que tener claros y tenemos que estar entendiendo. 2 00:00:06,940 --> 00:00:15,119 Entonces, lo que sí que os pido por favor hoy, vamos, a partir de ahora, sobre todo en esta unidad, es que me interrumpáis cuando no entendáis algo, ¿vale? 3 00:00:15,119 --> 00:00:25,199 Y también, bueno, yo os iré preguntando y plantearemos algún ejercicio para que lo penséis, lo hagáis vosotros mientras tanto y luego lo corrijamos, 4 00:00:25,199 --> 00:00:34,899 porque al final es que es la única manera de llevar esta unidad al día y enterrarnos todos bien. 5 00:00:35,679 --> 00:00:42,340 Entonces, bueno, vamos a ver el mapa conceptual, como hacemos siempre al principio de la lección, ¿vale? 6 00:00:43,060 --> 00:00:48,020 Entonces, bueno, para ver a qué nos vamos a enfrentar en esta unidad de trabajo, ¿vale? 7 00:00:48,020 --> 00:00:55,020 Bueno, lo que nos indica aquí es que nosotros en un laboratorio, al final nuestro trabajo es medir y comparar 8 00:00:55,200 --> 00:01:10,659 Es lo que hacemos básicamente, damos nuestros resultados de nuestros ensayos en función de lo que estemos analizando, lo que se nos haya solicitado y para ello tenemos que asegurar la calidad de nuestras medidas. 9 00:01:10,659 --> 00:01:27,640 ¿Cómo hacemos eso? Cuando medimos obtenemos datos y los datos lo que hacemos es expresarlos con unas unidades y su incertidumbre asociada es el error con el que nosotros estamos midiendo. 10 00:01:27,640 --> 00:01:37,140 ¿Qué quiere decir esto? Que nosotros cuando hacemos una medida, cuando estamos analizando en cualquier tipo de experimento que estemos realizando, 11 00:01:37,540 --> 00:01:43,260 siempre vamos a tener un error asociado porque no podemos decir al 100% que nuestro dato es el dato real. 12 00:01:43,599 --> 00:01:51,540 Entonces, lo que hacemos es expresar un intervalo, expresar un error asociado a ese dato para que nuestra información esté completa. 13 00:01:51,540 --> 00:02:08,520 ¿Vale? Entonces tenemos distintos tipos de errores que iremos viendo, tenemos los sistemáticos y los aleatorios que a su vez se pueden clasificar en distintas categorías y en función del error que tengamos nos va a afectar a algunos de nuestros parámetros. 14 00:02:08,520 --> 00:02:25,300 Nos va a afectar a la exactitud, nos va a afectar a la precisión, que si os acordáis, esto lo repetiremos hasta la saciedad, son términos diferentes. La exactitud lo que nos indica es la diferencia que hay entre nuestro valor real y el valor que hemos medido. 15 00:02:25,300 --> 00:02:38,840 Nos da una idea, la exactitud es cómo de cerca está nuestra medición del valor considerado real. Y en cambio, la precisión lo que nos indica es cómo de cerca están las medidas. 16 00:02:38,840 --> 00:02:41,860 Elena, no estás compartiendo pantalla. 17 00:02:41,860 --> 00:02:44,300 No estoy compartiendo, Jolín. Voy a ello. 18 00:02:48,020 --> 00:02:53,599 Perdonadme. Ahora sí, ¿verdad? 19 00:02:57,219 --> 00:02:58,080 Ahora sí. 20 00:02:58,080 --> 00:03:16,560 Sí, disculpadme. Bueno, estaba con el mapa conceptual que tenemos en el aula virtual. Entonces, lo que os estaba comentando, la exactitud a lo que se refiere es cómo de cerca está nuestro valor del valor real. 21 00:03:16,560 --> 00:03:35,259 Si nosotros tenemos, lo que estuvimos viendo el otro día, nuestros materiales de referencia, nuestros patrones, nosotros sabemos cuál es el valor exacto, si nosotros hacemos una medición y obtenemos un valor diferente, cuanto más cerca esté ese valor del valor real, más exacta va a ser nuestra medida. 22 00:03:35,259 --> 00:03:46,219 En cambio, ¿qué era la precisión? La precisión lo que nos indica es cómo de dispersos están nuestros datos, cómo de cerca están nuestras distintas mediciones entre ellas. 23 00:03:47,580 --> 00:03:59,759 Esto lo más visual es el ejemplo que pusimos al principio de la diana, que es la exactitud, acertar en el centro de la diana, lo que consideramos el valor real al que tenemos que llegar. 24 00:03:59,759 --> 00:04:12,099 ¿Qué es la precisión? Que todos nuestros dardos estén agrupados cerca, alrededor del centro. ¿Qué pasaría si yo tengo todos mis dardos muy juntos entre ellos, pero en una esquina de la diana? 25 00:04:12,379 --> 00:04:27,540 Que mi medida va a ser muy precisa, porque todos mis dardos están agrupados alrededor de un mismo valor, pero no va a ser exacta, porque el valor alrededor del que están agrupados no es el valor real, que sería en este caso que estamos poniendo el centro de la diana. 26 00:04:27,540 --> 00:04:39,319 Entonces, bueno, vamos a ver los tipos de errores que hay, cómo cuantificarlos y a qué magnitudes nos afectan, a cuáles de nuestros parámetros nos afectan. 27 00:04:41,000 --> 00:04:46,899 Luego vamos a utilizar parámetros analíticos, test estadísticos y ensayos de significancia. 28 00:04:46,899 --> 00:04:58,040 Vamos a ver, bueno, la estadística inferencial, que ahora veremos lo que es, realiza unas hipótesis y luego las prueba para ver si se pueden aceptar o no. 29 00:04:58,939 --> 00:05:11,180 Entonces, bueno, vamos a andar en cómo tenemos que hacer, por ejemplo, cuando estamos en el laboratorio y nosotros hemos tomado siete medidas y vemos que seis de ellas son muy parecidas. 30 00:05:11,180 --> 00:05:23,920 Imaginaos que estamos midiendo un pH y tenemos 7,1, 7,0, 7,2, 6,9, 7,2, 7,1 y de repente nos encontramos con una medida que es 5,4. 31 00:05:24,459 --> 00:05:36,000 Pues ahí empezamos a pensar y decimos, a lo mejor he cometido un error, a lo mejor ese resultado lo tengo que eliminar, pero ¿qué criterio utilizo? 32 00:05:36,000 --> 00:05:49,019 Entonces, vamos a estudiar los distintos métodos que hay para ver si ese resultado lo tendríamos que rechazar o no, por ejemplo, ¿vale? Y eso, para hacer todo esto, vamos a hacer uso todo el rato de la estadística, ¿vale? 33 00:05:51,060 --> 00:06:05,100 Vamos a hablar, que eso yo creo que vamos a hacerlo hoy porque es lo más básico, a ver si os acordáis o si lo tenéis claro, de las cifras significativas y el redondeo. ¿Alguno me sabe decir qué son las cifras significativas? 34 00:06:09,579 --> 00:06:11,240 Seguro que sí, pero no quiere hablar. 35 00:06:14,209 --> 00:06:19,569 Bueno, las cifras significativas son las cifras que tienen, como su propio nombre indica, un significado. 36 00:06:19,870 --> 00:06:21,069 ¿Qué quiere decir esto? 37 00:06:21,370 --> 00:06:28,050 Que si yo te digo, por ejemplo, que tengo un valor de 3,7, esas dos cifras me están dando información. 38 00:06:28,370 --> 00:06:31,050 Tengo una cifra que es el 3 y una cifra que es el 7. 39 00:06:31,889 --> 00:06:39,069 En cambio, si yo te digo que tengo un valor de 0,0037, ¿ahí qué datos me están dando valor? 40 00:06:39,069 --> 00:06:46,329 Realmente hay dos cifras que me están dando una indicación del valor real que tengo, que son el 3 y el 7 41 00:06:46,329 --> 00:06:54,110 Porque lo otro es lo mismo que si yo colocase una potencia que pusiese 3,7 por 10 a la menos 2 o a la menos 3 42 00:06:54,110 --> 00:06:55,790 No sé cuántos ceros he dicho, ¿vale? 43 00:06:56,430 --> 00:06:58,310 Entonces, bueno, esto lo vamos a ver con ejemplos 44 00:06:58,310 --> 00:07:04,930 ¿Qué pasa muchas veces? Que tenemos más cifras en nuestros resultados de las que realmente tenemos que poner 45 00:07:04,930 --> 00:07:18,470 En el ejemplo del pH que os he dicho, que nuestros pH eran 7,2, 7,3, 7,5, eran distintas cantidades con un número entero y un número decimal. 46 00:07:19,149 --> 00:07:29,310 Si yo hago la media y me sale que el pH es 7,83, estoy dando un número de cifras mayor de lo que yo sé realmente, 47 00:07:29,310 --> 00:07:39,370 porque yo sé que mi instrumento está midiendo con 2, entonces tendré que redondear ese 7,83 y en vez de dar esas tres cifras significativas, daré 2, diré 7,8. 48 00:07:40,230 --> 00:07:50,829 Entonces, vamos a ver un poco todas estas herramientas que utilizamos para controlar la calidad de nuestro proceso analítico, que al final esto es un curso de calidad 49 00:07:50,829 --> 00:07:58,990 y una de las herramientas más importantes, la que más vamos a utilizar, aparte de nuestra consulta de la normativa, 50 00:07:59,189 --> 00:08:05,029 donde se tienen estipulados ciertos parámetros, etc., va a ser herramientas estadísticas continuamente. 51 00:08:05,629 --> 00:08:12,350 Los que estáis en segundo ya lo sabéis, los que habéis hecho prácticas ya lo sabéis y los que estáis en primero, que es el primer año, 52 00:08:12,889 --> 00:08:19,709 os daréis cuenta que al final esto lo aplicáis a prácticamente todos los módulos porque cada vez que vamos al laboratorio 53 00:08:19,709 --> 00:08:25,069 y hacemos una serie de medidas, luego nosotros expresamos un resultado final 54 00:08:25,069 --> 00:08:31,050 y para expresar ese resultado final, después de todas las mediciones que nosotros hemos hecho, 55 00:08:31,730 --> 00:08:37,169 tenemos que expresarlo de una manera concreta, que es con su número de cifras significativas apropiado, 56 00:08:37,830 --> 00:08:43,049 si hemos hecho varias medidas, hacemos la media de todas ellas, que ahí estamos aplicando la estadística, 57 00:08:43,750 --> 00:08:48,350 tenemos que aplicar los criterios de redondeo, damos un intervalo de confianza 58 00:08:48,350 --> 00:09:02,049 que muchos ya lo sabéis, pero lo veremos detalladamente cómo se calcula, pero un intervalo de confianza que nos dice, es ese intervalo en el que nosotros aseguramos que está nuestro valor, ¿no? 59 00:09:02,049 --> 00:09:20,590 Por ejemplo, si yo os digo que mi resultado final del pH este que os he dicho es 7,8 más menos 0,1, yo estoy garantizando que mi resultado va a estar entre 7,8 menos 1 y 7,8 más 1. 60 00:09:20,590 --> 00:09:40,590 Lo que quiero decir es que yo estoy diciendo que mi resultado está entre 7,7 y 7,9. A eso se le llama intervalo de confianza. Y eso lo veis representado siempre con la medida de vuestra magnitud, un más menos y esa incertidumbre social, ese intervalo de confianza. 61 00:09:40,590 --> 00:10:01,610 ¿Vale? Ese intervalo de confianza y luego, bueno, nuestra unidad, ¿no? Si yo, el pH es adimensional, pero si yo os estoy hablando, por ejemplo, de lo que estoy midiendo en una balanza, yo os daré que mi masa es 3,5 más menos 0,3 gramos, por ejemplo. 62 00:10:01,610 --> 00:10:16,090 ¿Vale? Datos inventados totalmente. Entonces, bueno, este es a lo que nos vamos a enfrentar y como ya os he comentado varias veces, es la unidad más extensa y vamos a estar con ella hasta bien entrado el año 2025. 63 00:10:16,090 --> 00:10:24,090 Ahora en diciembre las tres clases que nos quedan y estaremos todo enero y probablemente parte de febrero. 64 00:10:25,070 --> 00:10:33,889 Y así dejamos marzo para la siguiente unidad, abril para la última que nos quedaría y mayo para hacer repasos, simulacros, ejercicios, etc. 65 00:10:34,350 --> 00:10:36,690 Entonces, bueno, esto es lo que vamos a hacer. 66 00:10:37,289 --> 00:10:41,370 Y ahora vamos a comenzar por el principio, por qué es la estadística. 67 00:10:41,370 --> 00:11:00,850 ¿Vale? Entonces, ¿qué es la estadística? Pues la estadística es una herramienta matemática que utilizamos para ordenar valores, para ordenarlos, para clasificarlos, para hacer representación, utilizamos representando gráficamente para verlo de manera más visual, ¿vale? 68 00:11:00,850 --> 00:11:20,990 Entonces, bueno, como hemos dicho, estamos en un curso de calidad y sabemos que nuestro objetivo es conseguir la calidad total, el total quality management y lo que queremos es integrar la calidad en todos los procesos de nuestra organización, ¿vale? 69 00:11:20,990 --> 00:11:36,110 nosotros como estamos trabajando en un laboratorio de análisis y control de calidad, es nuestro campo específico, pues bueno, vamos a querer llevar este objetivo de la calidad total a todas las fases de nuestro proceso analítico. 70 00:11:36,110 --> 00:11:51,590 ¿Cómo hacemos eso? Pues mediante una serie de herramientas, algunas son unas herramientas de control, de planificación, en la que gestionamos cómo vamos a realizar nuestros procesos y mediante herramientas estadísticas. 71 00:11:51,590 --> 00:12:06,509 ¿Qué es el proceso analítico? El proceso analítico es el conjunto de operaciones analíticas que nosotros realizamos entre que tenemos una muestra y proporcionamos un resultado. 72 00:12:06,509 --> 00:12:24,570 ¿Vale? El proceso analítico es todo ese proceso que está entre medias. ¿Cómo empieza el proceso analítico? ¿Qué es lo que hacemos siempre ante cualquier problema, entre cualquier solución que queramos proponer? 73 00:12:24,570 --> 00:12:47,990 Pues bueno, identificamos el problema, elegimos el método mediante el cual vamos a realizar nuestro análisis, hacemos el muestreo, que es el muestreo, la toma de la muestra, vamos a obtener una muestra representativa para luego poder procesarla y realizar sobre ella los estudios que sean necesarios para determinarla, ¿vale? 74 00:12:47,990 --> 00:13:01,470 Vamos a determinarla con el método que hayamos seleccionado previamente y después vamos a evaluar los resultados haciendo uso de estas herramientas estadísticas y a redactar el informe, ¿vale? 75 00:13:01,470 --> 00:13:25,190 Entonces, el concepto de calidad total lo que nos dice es que vamos a incluir estas herramientas en todas las etapas del proceso, ¿no? Pues bueno, en mayor o menor medida, pero en el muestreo ya comenzamos eligiendo una muestra que sea representativa, eso ya es una característica. 76 00:13:25,190 --> 00:13:35,190 Bueno, hacemos uso de herramientas estadísticas, que eso ya lo veréis mucho más en profundidad en muestreo. 77 00:13:37,070 --> 00:13:49,210 Y bueno, lo que intentamos básicamente cuando empezamos con nuestra etapa analítica, una vez que hemos identificado el problema, es que nuestra muestra sea representativa. 78 00:13:49,210 --> 00:14:17,269 No tiene sentido que si yo, por ejemplo, lo que estoy analizando es el porcentaje, los PPM que hay de la concentración de un metal, de plomo, en un suelo, de donde sea, no tendría sentido que yo no tome una muestra de la zona en la que yo quiero hacer ese análisis o que no abarque toda la extensión, que no sea de toda la profundidad que pueda contener ese plomo. 79 00:14:17,269 --> 00:14:32,950 El muestreo tiene que ser representativo del problema que nosotros tenemos. Entonces, lo que estoy comentándoos ahora es que la estadística influye en muchas de las etapas del proceso analítico. 80 00:14:32,950 --> 00:14:48,789 En el muestreo, que nosotros lo que buscamos es esa representatividad. Luego, cuando hacemos una medida que incluye la comparación de patrones, estamos aplicando las herramientas que tenemos para saber cómo de certera son nuestras medidas. 81 00:14:48,789 --> 00:15:08,490 Y luego, cuando evaluamos los resultados, que nosotros estamos expresando nuestro resultado con su intervalo de confianza, estamos garantizando con un cierto nivel de probabilidad, que ya veremos cómo se evalúa, que nuestro resultado es el que es y está dentro de unos parámetros. 82 00:15:09,429 --> 00:15:17,250 Vamos a hablar también, vamos a evaluar con los resultados, los resultados que sean dudosos, si los rechazamos o no. 83 00:15:17,529 --> 00:15:24,610 El ejemplo que os he puesto al principio de si estamos haciendo medidas de pH y de repente una es muy distinta de las demás, 84 00:15:24,789 --> 00:15:29,690 tendremos que evaluar si realmente esa medida yo la tengo que considerar o no. 85 00:15:31,470 --> 00:15:37,870 Entonces, para todas estas decisiones, para todas estas etapas, vamos a hacer uso de la estadística. 86 00:15:37,870 --> 00:16:02,289 Que no es más que una sección, una parte de las matemáticas que lo que se encarga es eso, de organizar grandes cantidades de datos y hacerlos representar patrones, representar lo más característico, lo más representativo, de una manera más visual y más fácil de interpretar. 87 00:16:02,289 --> 00:16:15,129 Si nosotros tenemos una tabla con 100 datos, no podemos saber exactamente, no podemos hacernos una idea de ante qué nos estamos enfrentando, pero si nos dan la media de esos 100 datos, ya sí. 88 00:16:15,809 --> 00:16:22,370 Entonces, es una herramienta que a priori es compleja, pero lo que hace es simplificar los procesos y los resultados. 89 00:16:24,049 --> 00:16:30,230 Entonces, muy importante dos conceptos, el concepto de muestra y el concepto de población. 90 00:16:31,230 --> 00:16:40,909 Con muestra, tenemos dos acepciones en nuestro mundo, porque nosotros cuando hablamos de muestra, normalmente lo que estamos hablando es de lo que vamos a analizar. 91 00:16:41,289 --> 00:16:54,090 Tenemos un número de muestras que nosotros analizamos en el laboratorio. Tenemos una muestra de suelo, una muestra de cualquier disolución que tiene un analito o lo que sea. 92 00:16:54,090 --> 00:17:06,210 Pero estadísticamente hablando, muestra tiene una acepción diferente. Vamos a hablar ahora mismo de muestra y población referidos puramente a la estadística. 93 00:17:06,470 --> 00:17:15,950 Los conceptos estadísticos de muestra y población. ¿Qué es la población? La población es la totalidad del sistema que es objeto de estudio. 94 00:17:15,950 --> 00:17:29,289 O sea, de lo que nosotros vamos a hacer un análisis, vamos a hacer un estudio, la población es el todo. ¿Y qué es la muestra? En este caso, la muestra es una porción que es representativa de la población. 95 00:17:29,289 --> 00:17:58,089 ¿Vale? Tenéis aquí un dibujo que no sé si se ve bien, pero bueno, tenemos un grupo de personas dibujadas de distintos colores, que están mezcladas a su vez, entonces nosotros tenemos que lo que está dentro de este círculo grande sería nuestra población total, o sea, el sistema completo, y nosotros para analizarlo vamos a coger una muestra de esta población y ¿qué requisitos tiene que cumplir? 96 00:17:58,089 --> 00:18:10,170 Que sea representativa. Si os dais cuenta aquí, en este círculo pequeño, que es la muestra que hemos elegido, tenemos, pues, hombrecitos de estos de distintos colores, ¿vale? 97 00:18:10,950 --> 00:18:20,069 Si yo tengo esta población y como muestra cojo solo todos los muñequitos verdes, no tengo una muestra representativa, ¿no? 98 00:18:20,109 --> 00:18:24,970 No tengo una porción que me esté representando la población total, ¿vale? 99 00:18:24,970 --> 00:18:28,910 me estará representando una cosa diferente, pero la población total desde luego que no. 100 00:18:28,910 --> 00:18:34,890 Si yo cojo solamente los muñequitos verdes y hago mis análisis sobre los muñequitos verdes, 101 00:18:35,210 --> 00:18:38,930 yo luego no sé cómo es esa población, yo sé cómo son los muñequitos verdes, 102 00:18:39,009 --> 00:18:42,829 pero la población no lo sé porque no he elegido una muestra representativa. 103 00:18:43,089 --> 00:18:47,809 Entonces, estadísticamente, muestra es esa porción representativa de la población. 104 00:18:49,670 --> 00:18:54,910 Y esto es un concepto que os tiene que quedar muy claro. 105 00:18:54,970 --> 00:19:05,730 Que bueno, no es difícil, pero bueno, que lo sepáis, una muestra es la porción representativa de la población sobre la que nosotros hacemos nuestros estudios, ¿vale? 106 00:19:07,470 --> 00:19:21,730 Ejemplos, estamos estudiando, por ejemplo, la contaminación de agua en un río. Pues, ¿qué sería mi población en una región? Pues, todos los ríos en una región afectados por la contaminación. 107 00:19:21,730 --> 00:19:41,490 Por ejemplo, yo estoy estudiando la contaminación con mercurio en los ríos de la Comunidad de Madrid, ¿vale? ¿Cuál es la población? Los ríos de la Comunidad de Madrid, ¿vale? ¿Cuál sería mi muestra? Pues sería un grupo de muestras de agua que yo tomo en puntos diferentes de estos ríos, ¿vale? 108 00:19:41,490 --> 00:19:58,069 ¿Vale? ¿Es todo claro? ¿Si nadie dice lo contrario? Vale. Entonces, población y muestra. La población, la totalidad del sistema objeto de estudio y la muestra, la porción representativa de la población. 109 00:19:58,069 --> 00:20:12,849 ¿Vale? Entonces, ya que sabemos lo que es población y lo que es muestra, vamos a definir las dos vertientes que tiene la estadística, ¿vale? Así de manera general. 110 00:20:13,309 --> 00:20:20,349 Entonces, tenemos la estadística descriptiva y la estadística inferencial. Las dos las vamos a utilizarlas, ¿vale? 111 00:20:20,349 --> 00:20:34,109 Entonces, ¿qué es la estadística descriptiva? Pues como su propio nombre indica, es la estadística, es la parte de la estadística, las herramientas estadísticas que utilizamos para describir los datos que tenemos. 112 00:20:34,109 --> 00:21:00,230 Por ejemplo, yo os digo que quiero describir cómo es España, cómo hacen en sociología, quiero decir cómo sería la edad, si tengo que elegir a una persona y dar todas las características, cuántos años tendría, qué estudios tendría, qué género tendría, etc. 113 00:21:00,230 --> 00:21:19,269 Entonces, lo que hago es, con mis valores, los describo. Por ejemplo, si yo quiero ahora con la media de nuestra clase, que no sé cuántos estamos ahora conectados, estamos conectados 10 personas conmigo. 114 00:21:19,269 --> 00:21:37,109 ¿Vale? Pues imaginaos que yo digo, vale, quiero explicar esta clase a una persona externa, pues diría, vale, somos 10, la media de edad la podría expresar y yo describo con los datos que yo tengo una población o una muestra. 115 00:21:37,109 --> 00:21:50,849 Con una población yo hago un muestreo y lo describo. ¿Qué es la estadística inferencial? Es un poco hacer el proceso contrario. A partir de una muestra, inferir cómo sería toda una población. 116 00:21:50,849 --> 00:22:09,109 O sea, yo tengo una población de la que extraigo una muestra y la realizo. Y eso es a lo que se dedica la estadística descriptiva. Yo tengo unos datos que he obtenido y decido extrapolarlos para expresar cómo es toda una población. 117 00:22:09,789 --> 00:22:13,009 Esto es un poco ambiguo, se entiende mucho mejor con ejemplos. 118 00:22:13,009 --> 00:22:26,089 Lo único que sepáis es que tenemos dos vertientes, la estadística descriptiva es la que hemos visto toda la vida, la que hemos estudiado en todos los niveles y además la que se escucha en la calle. 119 00:22:26,089 --> 00:22:40,349 Cuando dan datos del paro, de los salarios, de la edad media de una población, etc., estamos hablando de estadística descriptiva. 120 00:22:40,549 --> 00:22:47,910 Estamos utilizando los datos que tenemos para sacar unas estadísticas y la estadística inferencial es la que os he comentado, 121 00:22:47,910 --> 00:22:56,390 que se basa en hipótesis y que es la que utilizaremos, por ejemplo, para ver si nuestro resultado dudoso lo tenemos que aceptar o no, 122 00:22:57,210 --> 00:23:03,230 para ver si nuestras medidas son iguales o son significativamente diferentes. 123 00:23:05,170 --> 00:23:12,170 Esto es lo que nombro para que sepáis que hay dos vertientes, pero las iremos viendo con detalles que se entienden mucho mejor. 124 00:23:12,170 --> 00:23:29,170 ¿Vale? Entonces, bueno, aquí tenéis una definición que la estadística descriptiva se encarga de analizar, organizar y presentar los datos que ya tenemos, que ya hemos recolectado y lo que hacemos es organizarlos y presentarlos de una manera clara y comprensible. 125 00:23:29,170 --> 00:23:39,990 Entonces, el objetivo de la estadística descriptiva es resumir la información disponible para que podamos identificar patrones y características de los datos. 126 00:23:39,990 --> 00:23:54,089 Lo que os he dicho antes de si tenemos un listado con 100 medidas, hacemos una media de esas 100 medidas y lo que hacemos es resumir esa información y podemos analizarla de una manera más sencilla. 127 00:23:54,089 --> 00:24:11,930 Y la inferencial, lo que os digo, va más allá de describir los datos que tenemos y lo que queremos es hacer predicciones, generalizaciones a través de hipótesis sobre una población más amplia, ¿vale? A partir de una muestra. Y esto lo hacemos, pues eso, estimando parámetros, realizando pruebas, etc. 128 00:24:11,930 --> 00:24:35,650 Cuando utilizamos estadística diferencial, la mayoría de las veces necesitamos hacer uso de tablas que están ya establecidas, ¿vale? Son tablas que, por ejemplo, en el examen o para hacer ejercicios las vais a tener disponibles y vamos a tener que buscar ahí información para poder hacer estos contrastes de hipótesis, ¿vale? 129 00:24:35,650 --> 00:24:59,650 Entonces, ¿qué es lo que hacemos? Nosotros tenemos nuestras herramientas estadísticas y tenemos que definir otro término que son las variables. ¿Qué son las variables? Las variables son cada una de las propiedades o cualidades que poseen los individuos que forman una población y que pueden adoptar diferentes valores, objetos de medida u observación. 130 00:25:00,450 --> 00:25:07,609 ¿Esto qué quiere decir? Que son los distintos parámetros que yo puedo utilizar para realizar mi estadística. 131 00:25:09,109 --> 00:25:15,509 Una variable, hay de dos tipos, que ahora vemos ejemplos, las cualitativas y las cuantitativas. 132 00:25:16,130 --> 00:25:24,430 Pero, por ejemplo, lo que os he dicho antes de la descripción de la población de la Comunidad de Madrid o de España o de lo que sea, 133 00:25:24,849 --> 00:25:29,150 pues una de las variables, ¿cuál sería? Por ejemplo, la edad. 134 00:25:29,650 --> 00:25:48,230 Estoy utilizando la edad para describirlo, es una de mis variables. Otra cual puede ser el género, por ejemplo. Otra cual puede ser el nivel de estudios, el color de ojos, la masa, lo que me dé la gana. 135 00:25:48,230 --> 00:26:02,230 Son las variables sobre las cuales yo puedo realizar mi estadística. Son las propiedades o cualidades que poseen los individuos y cuando pone individuos se refiere a cada una de las partes de la población estadística. 136 00:26:02,230 --> 00:26:16,609 No hay individuos como personas. Por ejemplo, si yo estoy trabajando en el laboratorio, aquí cuando se refiere a individuos es cada una de mis muestras que yo estoy analizando, cada uno de mis ensayos. 137 00:26:18,230 --> 00:26:32,690 Muestras en la acepción química, tengo una muestra y la analizo. Cada una de ellas tiene unas propiedades que son las que yo puedo adoptar distintos valores y son las que yo puedo medir, observar y, por tanto, analizar. 138 00:26:33,710 --> 00:26:41,930 Y las podemos clasificar según el tipo de valores que pueden tener. Pueden ser o cualitativas con L o cuantitativas. 139 00:26:41,930 --> 00:27:01,289 ¿Qué diferencia hay entre unas y otras? Pues cualitativas, como su propio nombre indica, es una cualidad. Son las variables que se basan en una cualidad de nuestra población, de nuestro objeto de estudio. 140 00:27:01,289 --> 00:27:20,809 Y las cuantitativas son, por el contrario, las que se pueden cuantificar, ¿vale? Las que se pueden representar numéricamente, ¿vale? Entonces, darle una pensada ahora, a ver si se os ocurren algunas, pero bueno, veremos ejemplos ahora a continuación, ¿vale? 141 00:27:20,809 --> 00:27:36,670 Entonces, las variables cualitativas, que acordaos de lo de cualidad, ¿vale? Cualidad, no cantidad. Las cualitativas, que también se llaman variables categóricas o atributos, son las variables que no se pueden expresar en forma de números, ¿vale? 142 00:27:36,670 --> 00:27:48,349 Se pueden expresar en forma de categorías. Luego, tenemos dentro de estas variables cualitativas, tenemos dos tipos. 143 00:27:48,690 --> 00:27:55,730 Unas son las que se pueden ordenar, las que dentro de que son una cualidad tienen un cierto orden y otras son las que no, ¿vale? 144 00:27:56,049 --> 00:28:02,509 Entonces, cuando se pueden ordenar las llamamos ordinales y cuando no las llamamos nominales, ¿vale? 145 00:28:02,509 --> 00:28:22,210 Un ejemplo, vamos a decir lo primero, una variable cualitativa. Si os digo una variable cualitativa, por ejemplo, se me ocurre el color de ojos. Yo puedo clasificar a mi población de la Comunidad de Madrid por los que tienen ojos verdes, los que tienen ojos marrones y los que tienen ojos azules. 146 00:28:22,210 --> 00:28:42,049 Yo puedo hacer mi estadística y decir cuántos hay de cada uno, puede ser mi variable que yo utilice, ¿no? ¿Lo puedo expresar como un número? No, ¿no? O sea, yo puedo hacer la media, puedo sumar azul con verde y dividirlo entre dos, no, son variables que son cualitativas, no se pueden cambiar por un número, ¿vale? 147 00:28:42,970 --> 00:28:50,609 Otra variable cualitativa, por ejemplo, si yo estoy dividiendo la población por el nivel más alto de estudios acabados, ¿no? 148 00:28:51,029 --> 00:29:05,990 Imagínate, doctor, licenciado, FP superior, FP grado medio, bachillerato, no sé, me ocurre más eso y primaria. 149 00:29:06,150 --> 00:29:07,930 Imaginaos que yo lo clasifico así. 150 00:29:07,930 --> 00:29:28,490 Eso tiene un orden. Quiero decir, ¿yo puedo ordenar eso de una manera lógica? Sí, ¿no? No puedo ordenar ojos azules, ojos verdes y ojos marrones porque no hay uno que esté por encima del otro, no hay uno que sea mejor, digamos, uno que tú puedas clasificar con un orden lógico. 151 00:29:28,490 --> 00:29:48,809 En cambio, si yo quiero clasificar, quiero comparar la gente que tiene primaria con la gente que tiene una licenciatura o con FP, yo puedo hacer un orden, ¿no? Puedo hacer un orden concreto de esos atributos. Entonces, a ese tipo de variables se las llama cualitativas ordinales, ¿vale? Porque tienen un orden, ¿ok? 152 00:29:48,809 --> 00:30:05,410 Entonces, tenemos para recapitular dos tipos de variables, cualitativa y cuantitativa. Y dentro de la cualitativa, que también se llama categórica o atributo, son sinónimos, dentro de la cualitativa tengo ordinales y nominales. 153 00:30:05,849 --> 00:30:07,650 Ordinales, si tienen un orden lógico. 154 00:30:08,329 --> 00:30:12,269 Calidad del aire, que si te dicen que es buena, mala o regular, 155 00:30:12,549 --> 00:30:13,950 eso no lo puedes cambiar por un número, 156 00:30:14,170 --> 00:30:17,869 pero tú sabes que está primero la buena, luego la regular y luego la mala. 157 00:30:18,069 --> 00:30:19,029 Tiene un orden lógico. 158 00:30:19,190 --> 00:30:22,470 Eso sería una variable cualitativa ordinal. 159 00:30:23,309 --> 00:30:31,089 Si te dicen color de un indicador pH y uno es rojo, 160 00:30:31,170 --> 00:30:32,789 otro es verde, otro azul y otro amarillo, 161 00:30:32,789 --> 00:30:34,269 no tienes un orden lógico. 162 00:30:34,269 --> 00:30:43,750 Son cualidades, tú puedes clasificar por colores, pero no tienes un orden, no puedes poner el verde, luego el azul, luego el amarillo y luego el rojo en un orden lógico. 163 00:30:44,369 --> 00:30:47,190 Es como que ninguno está por encima del otro. 164 00:30:48,049 --> 00:30:51,269 Entonces, eso son cualitativas, ordinales y nominales. 165 00:30:53,930 --> 00:30:54,410 Ejemplos. 166 00:30:55,970 --> 00:30:56,910 Calidad del aire. 167 00:30:56,910 --> 00:31:04,089 Pues es una variable cualitativa, categórica, que es lo mismo, ordinal. 168 00:31:04,269 --> 00:31:30,730 ¿Vale? Calidad del aire, las que ponen en los centros de medición, por ejemplo, de estos que hay uno en la Casa de Campo, hay otro en el centro, hay distintos puntos para medir la calidad del aire y en función de la calidad del aire, bueno, pues se mandan avisos a la población, en la página de la EMED y del Tiempo siempre tienes la calidad del aire de tu localidad. 169 00:31:30,730 --> 00:31:47,269 Cuando la calidad del aire supera un cierto umbral, pues empieza a haber restricciones, etc. ¿Vale? Entonces, calidad del aire, muy mala, mala, regular, buena, muy buena. ¿Cómo es? 170 00:31:47,269 --> 00:31:50,230 Entonces, primero pensamos, ¿cuantitativa o cualitativa? 171 00:31:50,869 --> 00:31:55,589 Cualitativa. Yo no puedo sumar muy mala más mala y dividirlo entre dos. No se puede. 172 00:31:56,109 --> 00:32:00,710 ¿Es cualitativa y es ordinal? Sí, porque realmente hay un orden. 173 00:32:00,829 --> 00:32:04,490 Yo puedo clasificar muy mala, mala, regular, buena, muy buena. Tiene un sentido. 174 00:32:05,069 --> 00:32:13,289 Otro ejemplo, el tipo de ecosistema. Tenemos un desierto, un bosque, la tundra, la selva, ecosistema urbano, todos los que queramos. 175 00:32:13,289 --> 00:32:29,529 Es una variable que podemos utilizar, es algo con lo que podemos hacer una clasificación, pero es cualitativa claramente, no se puede cambiar por un número, pero no es ordinal, es nominal porque no tiene un orden concreto. 176 00:32:29,529 --> 00:32:43,349 ¿Vale? No podemos poner por encima desierto de bosque, por ejemplo, ¿vale? No hay un orden natural, no tiene un sentido ordenarlo, ¿vale? Entonces, esa es la diferencia. 177 00:32:43,349 --> 00:32:59,650 Y luego, aparte de las variables cualitativas, que son las que hemos visto, tenemos las variables cuantitativas, ¿vale? Cuantitativa de cantidad. Acordaos cuando, si alguien se lía, cuali de cualidad, quanti de cantidad. 178 00:33:00,589 --> 00:33:11,509 Entonces, ¿cuáles son las cuantitativas? Las que sí que se les puede asignar un valor en forma numérica, ¿vale? Que puede ser un número dentro de un intervalo. 179 00:33:11,509 --> 00:33:26,509 Estas son las que nos van a interesar a nosotros, porque en un laboratorio de análisis lo que nosotros estamos es cuantificando, estamos dando resultados que la mayoría de las veces son solo variables cuantitativas. 180 00:33:26,509 --> 00:33:46,190 Entonces, en un laboratorio de análisis tienen mayor interés las cuantitativas que las cualitativas. Entonces, igual que las cualitativas las podíamos separar en nominales y ordinales, en ordinales y no ordinales, las cuantitativas las podemos separar en discretas y continuas. 181 00:33:46,190 --> 00:33:58,430 ¿Vale? ¿Qué son cada una de ellas? Las discretas son aquellas que solo pueden tomar un valor, un número, perdón, finito de valores entre dos valores. 182 00:33:58,910 --> 00:34:06,430 Y las continuas, las variables que pueden tomar un número infinito de valores entre dos números. ¿Vale? Más fácil. 183 00:34:06,910 --> 00:34:13,409 Vamos a empezar por las continuas que son las más sencillas de entender. Una variable continua es aquella que puede tener cualquier valor. 184 00:34:13,409 --> 00:34:33,489 Vale. Yo, si me voy a pesar o voy a pesar una muestra, ¿qué masa voy a obtener? ¿Puedo obtener cualquier valor o valores concretos? Puedo obtener cualquiera, ¿no? Yo puedo pesar algo que mida un gramo o un kilo y también puede pesar dos kilos. 185 00:34:33,489 --> 00:34:39,750 Y entre medias puede pesar un kilo y medio, y entre medias de eso un kilo 550, 5, 5, 5. 186 00:34:39,750 --> 00:34:42,610 Os puedo poner todos los decimales que yo quiera en el medio. 187 00:34:43,329 --> 00:34:48,590 Otra cosa es que yo no tenga el instrumento para medir con tanta precisión. 188 00:34:48,949 --> 00:34:54,429 Pero tú realmente, por ejemplo, una masa puede tener cualquier valor, no está limitado, cualquier valor positivo. 189 00:34:55,610 --> 00:34:57,510 Por eso decimos dentro de un intervalo. 190 00:34:57,510 --> 00:35:04,269 Entonces, si yo pregunto cuánto pesas, tú me puedes dar cualquier valor. 191 00:35:04,570 --> 00:35:08,429 No hay ningún valor que esté restringido, ¿vale? Cualquier valor positivo. 192 00:35:08,989 --> 00:35:13,190 En cambio, las discretas solo pueden tomar un número concreto de valores. 193 00:35:13,469 --> 00:35:18,329 ¿Esto qué quiere decir? Que igual que yo te he preguntado cuánto pesas y tú me puedes dar cualquier número, 194 00:35:18,329 --> 00:35:23,570 si yo te digo que cuántos hermanos tienes, no me puedes decir que tienes 1,87. 195 00:35:23,570 --> 00:35:30,409 tendrás uno o tendrás dos pero no puedes tener cualquier número son números que están cerrados 196 00:35:30,409 --> 00:35:36,349 vale entonces si te pregunto que cuántos hermanos tienes me puedes contestar que cero que uno que 197 00:35:36,349 --> 00:35:44,510 dos que tres que cuatro que cinco y si así hasta el número que alguien tenga hermanos vale pero 198 00:35:44,510 --> 00:35:49,429 nunca me vas a decir que me vas a poder decir que tienes uno y medio vale esto queda claro la 199 00:35:49,429 --> 00:35:55,289 diferencia entre discreta y continua? Porque es muy importante también, ¿vale? Luego para 200 00:35:55,289 --> 00:36:01,789 entender los demás conceptos. Entonces, discretas, las que solo pueden tomar un número finito 201 00:36:01,789 --> 00:36:09,449 de valores y las continuas las que pueden tomar cualquiera, ¿vale? Entonces, ejemplos 202 00:36:09,449 --> 00:36:16,550 de variables discretas. Número de partículas contaminantes en una muestra de aire. Si yo 203 00:36:16,550 --> 00:36:21,570 tengo una muestra de aire y estoy analizando el número, no la concentración, el número 204 00:36:21,570 --> 00:36:27,670 de partículas que hay, yo podré tener una partícula, dos, tres, diez mil, cien mil, 205 00:36:27,809 --> 00:36:34,269 un millón, pero no podré tener tres partículas y media, o tengo dos, o sea, o tengo tres 206 00:36:34,269 --> 00:36:40,210 o tengo cuatro, pero es una entidad que no se puede dividir, ¿vale? Entonces, una variable 207 00:36:40,210 --> 00:36:46,010 discreta sería este número de partículas, ¿vale? Tengo que tener números enteros en 208 00:36:46,010 --> 00:36:52,769 este caso. No puedo tener un número decimal, ¿vale? Número de productos químicos que utilizo en una 209 00:36:52,769 --> 00:36:57,789 planta de tratamiento de aguas. Lo mismo, esto no es una variable tan científica, ¿no? Porque no es 210 00:36:57,789 --> 00:37:03,190 algo que cuantifiquemos así de, pues en esta planta utilizo siete productos, pero lo mismo. Tú puedes 211 00:37:03,190 --> 00:37:08,590 utilizar siete productos. No utilizas siete con cinco ni siete con tres. Utilizas siete, utilizas 212 00:37:08,590 --> 00:37:35,949 Pero no puedes utilizar medio producto, medio tipo de producto. Esos serían ejemplos de variables discretas. Con el COVID, por ejemplo, cuando nos daban los datos públicos continuamente en 2020-2021 del número de casos de COVID que se habían diagnosticado en un día o en una semana. 213 00:37:35,949 --> 00:37:51,909 Nunca te decían, se han diagnosticado 7.825,4, porque no es verdad, porque tú o diagnosticas a 7.825 personas o a 7.826, pero nunca vas a poder diagnosticar a 0,4 personas porque no existe, ¿vale? No existe comunidad. 214 00:37:52,949 --> 00:38:01,070 Entonces, el número de casos de enfermedades respiratorias en una población, variable discreta, ¿vale? Estas clarísimas. 215 00:38:01,929 --> 00:38:23,730 Ahora, variables continuas, las que pueden tomar cualquier valor, cualquier valor dentro de un rango, ¿no? Por ejemplo, si yo hablo de temperatura, realmente la temperatura puede tener cualquier valor, ¿no? Yo puedo tener de fiebre 37 o 38 o 37,5 o 37,55 o 37,58, 3, 4, 9 y así hasta el infinito, ¿vale? 216 00:38:23,730 --> 00:38:43,210 Lo que digo, puede haber, pues la limitación es que no voy a tener un termómetro que me dé exactamente esa precisión, pero técnicamente, teóricamente, yo puedo tener cualquier valor de temperatura, no está limitado, ¿vale? Cualquier valor de temperatura mayor del cero absoluto, porque si no, no existe. 217 00:38:43,210 --> 00:38:50,070 Por eso hablamos de un intervalo, ¿no? Yo no puedo tener menos de 0 grados Kelvin de temperatura, por ejemplo. 218 00:38:50,469 --> 00:38:57,110 Pero a partir de ahí, a partir de los 0 Kelvin, cualquier valor, cualquiera, cualquiera, cualquiera es válido, ¿vale? 219 00:38:57,550 --> 00:39:03,449 Entonces, por ejemplo, hemos hablado antes del número de partículas contaminantes, teníamos un número, ¿no? 220 00:39:03,449 --> 00:39:11,469 Teníamos 10 partículas, 11, 12, 250.000 y era un número entero, no podíamos tener 7 partículas y media. 221 00:39:11,469 --> 00:39:29,570 En cambio, si hacemos un análisis también de un contaminante en el aire, pero estamos hablando de su concentración, pues por ejemplo, en miligramos metro cúbico, unidad de masa entre unidad de volumen, eso es una variable continua porque puede adoptar cualquier valor. 222 00:39:29,570 --> 00:39:52,010 O sea, un contaminante puede ser cualquier masa en cualquier volumen, no hay una restricción, ¿vale? De los datos que teóricamente pueden entrar ahí. La masa es una variable continua totalmente, el volumen es una variable continua también, la temperatura continua, ¿vale? 223 00:39:52,010 --> 00:40:04,269 ¿Vale? Esto, decidme que sí, para que me quede tranquila, esto lo estamos entendiendo todos, ¿no? ¿No hay ninguna duda de esto? ¿Estáis ahí? 224 00:40:05,889 --> 00:40:07,250 Por mi parte, bien. 225 00:40:07,250 --> 00:40:25,269 Entonces, concentración de un contaminante, variable continua. Concentración de metales pesados, de cualquier analito que estemos analizando. Una concentración partes por millón, lo mismo, estamos hablando de una masa en una masa o una masa en un volumen, continua. 226 00:40:25,269 --> 00:40:36,889 Puede adoptar cualquier valor. Temperatura, del aire o del agua, cualquier temperatura. Puede adoptar cualquier valor. Lo que os digo, siempre que sea mayor de 0 Kelvin, o sea, cualquier valor en un intervalo. 227 00:40:37,289 --> 00:40:46,030 Nosotros podemos tener cualquier temperatura. No tenemos que tener 7, 8, 9 o 10. Podemos tener 7, lo que sea y con todos los decimales que queramos, ¿vale? 228 00:40:46,030 --> 00:41:05,010 Entonces, estas son las variables estadísticas que vamos a recapitular otra vez. Tenemos dos tipos, las cualitativas que nos expresan una cualidad, un atributo de nuestra población y las cuantitativas que se pueden expresar con forma de un número. 229 00:41:05,889 --> 00:41:14,369 Dentro de las cualitativas con L podemos tener las ordinales, que tengan un sentido lógico o no, que entonces son nominales. 230 00:41:14,369 --> 00:41:26,469 Y dentro de las cuantitativas con N podemos tener las continuas, que pueden adoptar cualquier valor, por ejemplo, la masa, el volumen, la concentración, la temperatura, etc. 231 00:41:27,309 --> 00:41:31,750 Y luego tenemos las discretas, que solo pueden tener valores concretos. 232 00:41:31,750 --> 00:41:43,210 ¿Vale? Por ejemplo, otro ejemplo estúpido que estoy aquí en clase. ¿Cuántas mesas hay en mi clase? Pues habrá las que haya, habrá 20, pero no va a haber 20 y media. 233 00:41:43,429 --> 00:41:52,070 ¿Vale? Eso sería una variable discreta. O ¿cuántos bolis tienes en el estuche? ¿Cuántos perros tienes en casa? ¿Vale? Esas son variables discretas. 234 00:41:52,070 --> 00:41:58,389 Tu respuesta solo puede tener unos valores predeterminados, el 0, el 1, el 2, el 3 y así hasta donde sea, hasta el infinito. 235 00:41:58,829 --> 00:42:04,769 Pero tú no puedes decir un valor que está entre medias del 0 y el 1, porque no existe, no tienes medio perro. 236 00:42:06,969 --> 00:42:13,030 Entonces, dicho esto, tenemos nuestras variables estadísticas. 237 00:42:13,510 --> 00:42:17,389 Lo que queremos hacer con ellas es poder expresarlas de una manera que nos sean útiles. 238 00:42:17,389 --> 00:42:32,829 Lo que hemos dicho al principio, que la estadística, la función que tiene es presentarnos y organizarnos la información de manera que la podamos utilizar de una manera más intuitiva y más sencilla y más útil al fin y al cabo. 239 00:42:33,769 --> 00:42:38,869 Entonces, la estadística descriptiva, acordaos que lo único que hace es describir nuestros datos. 240 00:42:39,170 --> 00:42:49,409 Nosotros tenemos unos datos y mediante la estadística descriptiva vamos a poder hablar, dar valores que nos representen a esos datos. 241 00:42:50,909 --> 00:42:56,690 Entonces, así, grosso modo, tenemos dos tipos de medidas en la estadística descriptiva. 242 00:42:56,690 --> 00:43:01,690 Una son las medidas de centralización y otra son las medidas de dispersión. 243 00:43:02,829 --> 00:43:18,670 ¿Qué son las medidas de centralización? Como su propio nombre indica, nos quieren dar un valor central, un valor representativo. Nos permiten expresar todos los datos correspondientes a una variable mediante un solo número. 244 00:43:18,670 --> 00:43:37,610 Y ese número nos va a servir como representante de los mismos, ¿vale? Antes de seguir con esto, me estoy acordando, os voy a dejar un par de minutos para que le echéis un ojo a esto y me digáis si son discretas o continuas y nominales u ordinales, ¿vale? 245 00:43:37,610 --> 00:43:47,030 Os dejo tres minutillos para que las leáis y ahora lo corregimos en alto, antes de cambiar al siguiente tercio, ¿vale? 246 00:43:53,239 --> 00:44:01,940 Que además está en el cambio de hora y como hay ruido, así en los dos minutillos que se meten en clase lo vais mirando y ahora lo corregimos. 247 00:44:01,940 --> 00:45:37,530 Vale, le hemos hecho un ojo ya 248 00:45:37,530 --> 00:45:43,050 Entonces, clasifica las siguientes variables según su tipo 249 00:45:43,050 --> 00:45:45,929 Cuantitativa, discreto o continuo 250 00:45:45,929 --> 00:45:48,110 Y cualitativa, nominal u ordinal 251 00:45:48,110 --> 00:45:51,530 La primera, masa de un reactivo químico en microgramos 252 00:45:51,530 --> 00:45:53,550 Medida en un laboratorio con su incertidumbre 253 00:45:53,550 --> 00:45:59,289 Esta sería, os digo yo la respuesta, si nadie dice nada 254 00:45:59,289 --> 00:46:02,789 Esta sería cuantitativa, se puede cuantificar 255 00:46:02,789 --> 00:46:03,989 Y sería continua 256 00:46:03,989 --> 00:46:07,809 Estoy midiendo mi reactivo y la masa puede adoptar cualquier valor. 257 00:46:08,530 --> 00:46:14,090 La B, nombre del compuesto presente en una muestra ambiental, por ejemplo, dióxido de carbono, metano, etc. 258 00:46:16,690 --> 00:46:17,329 Cualitativa. 259 00:46:17,570 --> 00:46:19,250 Cualitativa, nominal u ordinal. 260 00:46:20,809 --> 00:46:22,130 Ahí sí, no sé. 261 00:46:22,789 --> 00:46:27,949 ¿Tú crees que hay un orden que puedes ordenar metano mejor que dióxido de carbono, por ejemplo? 262 00:46:30,670 --> 00:46:31,269 No. 263 00:46:31,269 --> 00:46:38,550 No tiene un orden lógico, no es como si fuese bueno o malo. Entonces, en este caso es nominal, ¿vale? No hay un orden. 264 00:46:39,409 --> 00:46:39,650 Vale. 265 00:46:40,269 --> 00:46:48,050 Genial. El siguiente, grado de contaminación de un río clasificado como bajo, moderado, alto y muy alto. Está así, ¿no? 266 00:46:49,630 --> 00:46:55,190 Aquí tenemos que es cualitativa, es una cualidad la que estamos evaluando, pero sí que tiene un orden. 267 00:46:55,190 --> 00:47:14,409 Tú puedes hacer una escala, ¿no? Pues puedes poner en una tabla y sabrías cuál poner debajo de otro, cuál sigue al siguiente, ¿no? Estaría claramente primero el bajo, luego el moderado, luego el alto y luego el muy alto. Entonces, sería cualitativa y ordinar. Sí que tiene un orden, ¿vale? 268 00:47:14,869 --> 00:47:20,969 Esta, ¿número de colonias bacterianas formadas en una placa de Petri después de un ensayo de 24 horas? 269 00:47:20,969 --> 00:47:24,530 Cuanti 270 00:47:24,530 --> 00:47:26,250 Cuantitativa, perdón 271 00:47:26,250 --> 00:47:27,849 Cuanti con N, ¿no? 272 00:47:28,230 --> 00:47:28,510 ¿Vale? 273 00:47:28,730 --> 00:47:28,949 Sí 274 00:47:28,949 --> 00:47:30,769 ¿Y ahora discreto o continua? 275 00:47:34,989 --> 00:47:35,409 Discreta 276 00:47:35,409 --> 00:47:37,650 Discreta, muy bien, justo 277 00:47:37,650 --> 00:47:39,809 Esta a veces hay mucha confusión 278 00:47:39,809 --> 00:47:41,170 Es el número de colonias 279 00:47:41,170 --> 00:47:44,750 Tú puedes tener una colonia, puedes tener dos, puedes tener diez, puedes tener diez mil 280 00:47:44,750 --> 00:47:46,889 Pero no puedes tener 1,5, ¿vale? 281 00:47:47,329 --> 00:47:50,030 Perfecto, entonces esta sería cuantitativa 282 00:47:50,030 --> 00:47:52,269 Porque se puede cuantificar, pero discreta 283 00:47:52,269 --> 00:47:53,570 Solo ciertos valores 284 00:47:53,570 --> 00:48:01,809 Ok. Longitud de onda de absorción máxima de un compuesto medida en espectrofotometría en nanómetros. 285 00:48:05,750 --> 00:48:07,230 Esta sería una cuanticontinua. 286 00:48:08,510 --> 00:48:14,519 Justo, perfecto. Cuantitativa porque se puede cambiar por un número y continua porque puede... 287 00:48:14,519 --> 00:48:18,599 Clasificación de muestras según su fuente, industrial, doméstica o agrícola. 288 00:48:25,360 --> 00:48:31,579 Esta sería cualitativa, ¿no? Está dándonos un atributo que no se puede... 289 00:48:31,579 --> 00:48:32,460 ¿Y discreta? 290 00:48:32,460 --> 00:48:38,440 No, discreta es sólo si es cuantitativa. Si es cuantitativa, que se puede cuantificar. 291 00:48:38,559 --> 00:48:39,619 Nominal, perdón. 292 00:48:39,659 --> 00:48:51,179 Eso sí, nominal. Si es cuantitativa, es discreto o continua. Y si es cualitativa, nominal u ordinal. Y esta nominal, muy bien, porque no tenemos un orden entre industrial, doméstica, agrícola, hospitalaria, ¿vale? 293 00:48:52,179 --> 00:48:58,460 Luego, tiempo que tarda un equipo en completar una medición. En segundos. 294 00:48:59,860 --> 00:49:03,039 ¿Cuantitativa discreta? 295 00:49:04,019 --> 00:49:06,519 ¿El tiempo que tarda un equipo? 296 00:49:06,599 --> 00:49:07,079 Continua. 297 00:49:07,340 --> 00:49:10,400 Continua, porque puede adoptar cualquier valor. 298 00:49:10,539 --> 00:49:15,980 Puede tardar un segundo, pero puede tardar 1,3, 1,35, 1,3, 8, 5, 7, 8, 9, 299 00:49:16,199 --> 00:49:19,300 si tenemos el instrumento lo suficientemente preciso. 300 00:49:20,119 --> 00:49:24,340 Y la última, cantidad de nitrógeno total detectado en una muestra de suelo 301 00:49:24,340 --> 00:49:26,260 expresada en miligramos partido por kilo. 302 00:49:32,420 --> 00:49:37,059 Esta claramente es cuanti, porque lo podemos expresar con un número, 17 miligramos. 303 00:49:37,340 --> 00:49:38,599 ¿Y continua también? 304 00:49:38,599 --> 00:49:52,139 Y continua también, porque la masa es continua. Entonces, tenemos masa arriba y masa abajo, continua y continua, continua. Perfecto. Ahora os planteo una que siempre hay mucha reflexión y mucha polémica. ¿El dinero, que es discreto o continuo? 305 00:49:56,949 --> 00:49:58,030 Continuo también, ¿no? 306 00:50:00,349 --> 00:50:10,190 Continuo. Es que aquí están las dos vertientes y no hay ninguna que sea correcta. Vale, ¿tú puedes decir quién ha dicho que es continuo? 307 00:50:10,190 --> 00:50:12,469 Yo 308 00:50:12,469 --> 00:50:14,329 Vale, pues el continuo 309 00:50:14,329 --> 00:50:16,750 Tú lo que estás diciendo es que tú puedes tener cualquier cantidad de dinero 310 00:50:16,750 --> 00:50:17,670 ¿No? Por ejemplo 311 00:50:17,670 --> 00:50:19,730 Y con los céntimos también 312 00:50:19,730 --> 00:50:21,329 Claro, pero tú puedes tener 313 00:50:21,329 --> 00:50:24,849 17 euros 314 00:50:24,849 --> 00:50:26,789 Con 315 00:50:26,789 --> 00:50:28,510 Espérate, a ver cómo lo digo 316 00:50:28,510 --> 00:50:29,409 Puedes tener un euro 317 00:50:29,409 --> 00:50:34,269 Con 25,3 céntimos 318 00:50:34,269 --> 00:50:37,539 No, no, porque el céntimo 319 00:50:37,539 --> 00:50:39,880 No se puede dividir más, porque no existe la moneda 320 00:50:39,880 --> 00:50:57,960 Pero esto lo hemos discutido muchas veces en clase y técnicamente el dinero es totalmente continuo, porque tú en el banco puedes tener cualquier valor. Otra cosa es que no haya una moneda que represente ese valor, porque si hablamos del dinero que tenemos físico, sí que es una magnitud, una variable que es discreta. 321 00:50:58,780 --> 00:51:16,059 Entonces, por ejemplo, un compañero vuestro de presencial decía que, claro, que en la gasolinera tú cuando vas a echar gasolina no te pone que te cueste un euro, te pone 1,6358 a lo mejor, que no tenemos ni siquiera nosotros esos decimales, ¿vale? 322 00:51:16,599 --> 00:51:24,699 Entonces, por eso ahí estaba siempre, lo he preguntado por curiosidad para ver qué salía y me habéis dicho una discreta y otra continua, así que como siempre. 323 00:51:25,360 --> 00:51:35,639 El dinero técnicamente sería una variable continua, podemos tener cualquier cantidad de dinero en el banco, pero si lo queremos sacar es discreta, 324 00:51:35,739 --> 00:51:41,219 porque nosotros vamos a poder tener de un céntimo en un céntimo, no podemos tener una cantidad más pequeña en mano. 325 00:51:41,860 --> 00:51:51,780 Y también surge un poco esta misma discusión, este mismo pensamiento cuando hablamos de la edad, que la edad es discreta o continua. 326 00:51:51,780 --> 00:52:14,480 La edad es continua, ¿no? Porque nosotros simplificamos y a ti te preguntan ¿cuántos años tienes? Y tú dices pues yo tengo 25 años, simplificas, tienes 25 años, pero tú realmente tendrías que decir tengo 25 años, 7 meses, 5 días, 4 horas, 3 minutos, 8 segundos, no sé cuántos milisegundos y tú ahí hasta el infinito, ¿no? 327 00:52:14,480 --> 00:52:38,800 O sea, realmente es una variable que es continua, pero nosotros lo que hacemos es discretizarla cuando queremos hacer estudios y demás. Si tú te hacen una encuesta por la calle, tú no vas a decir que tienes tantos años, tantos meses, tantos días, ¿no? Dices los años que tienes, pero realmente la edad sería una magnitud, o sea, los años que tenemos, el tiempo que tenemos vivos, al final es tiempo, que es continuo, ¿vale? 328 00:52:38,800 --> 00:52:59,039 Espero no haberos liado más con esto, pero bueno, para que veáis que casi cualquier variable con la que trabajemos o con la que podamos utilizar en el día a día la podemos clasificar como discreta, como continua o si es cualitativa, como nominal o como ordinal, ¿vale? 329 00:52:59,039 --> 00:53:16,659 Pues lo que hemos dicho, pensad siempre en, cuando no tengáis muy claro si es cuantitativa o cualitativa, si la puedes cambiar por un número y para discreta continua, pues eso, número de hermanos, número de gatos que tengo o número de hijos, nunca vas a poder tener medio, ¿vale? 330 00:53:16,659 --> 00:53:38,360 ¿Vale? Entonces, visto lo de las variables, vamos a retomar aquí con lo que os estaba diciendo, que las medidas de centralización lo que nos hacen es representarnos, expresarnos los datos que tenemos mediante un valor que nos sirve de representante de estos datos, ¿vale? 331 00:53:38,699 --> 00:53:44,659 ¿Cuáles son las medidas de centralización? Pues la media, la moda y la mediana, ¿vale? 332 00:53:45,179 --> 00:53:54,159 La que más escuchamos continuamente y la que más utilizamos nosotros como químicos, como técnicos en un laboratorio, es la media, ¿no? 333 00:53:54,159 --> 00:54:01,840 Vosotros hacéis una serie de experimentos, os da unos valores de concentración y luego sumáis todos los valores que os han dado, 334 00:54:01,840 --> 00:54:07,019 lo dividís entre el número total de mediciones y expresáis vuestra media, ¿no? Es lo más habitual. 335 00:54:07,019 --> 00:54:20,659 Pero tenemos distintos tipos de medidas de centralización que cada una tiene unas características, ¿vale? Entonces, ¿qué es la media? Pues lo que hemos dicho al final, no lo tengo aquí explicado, bueno. 336 00:54:20,659 --> 00:54:43,039 La media es la medida que nosotros utilizamos de manera más habitual, es el parámetro más utilizado para estimar el valor medio verdadero y lo que hacemos con la media, que no tenemos aquí la fórmula, es sumar todas nuestras medidas y dividirlas entre el número total de medidas. 337 00:54:43,039 --> 00:55:08,239 La media, normalmente, lo habréis visto muchas veces que se expresa como la X, que es nuestra variable, con una barra encima, con esta barra de aquí. Esa es la media muestral, que nosotros, como trabajadores en un laboratorio con problemas analíticos con los que vamos a trabajar, siempre, la mayoría de las veces, trabajamos con muestras, no trabajamos con poblaciones enteras. 338 00:55:08,239 --> 00:55:17,699 Entonces, la media es esta de aquí, ¿vale? La representación, me refiero a la graficación, es nuestra X con la barrita encima. 339 00:55:18,519 --> 00:55:24,960 Cuando estamos hablando de una media poblacional, de toda la población, la representamos con la letra mu, ¿vale? 340 00:55:25,139 --> 00:55:31,159 Que es lo mismo, es una ponderación, un promedio de todos nuestros valores, ¿vale? 341 00:55:31,320 --> 00:55:35,519 Dividido entre el número total de los datos que tenga nuestra población, ¿vale? 342 00:55:35,519 --> 00:55:46,320 Para que lo sepáis, porque algunas veces veremos la mu, que es la media poblacional, y otras veces veremos la inmensa mayoría, nuestra x con la barra arriba, que es nuestra media muestral. 343 00:55:46,780 --> 00:55:55,300 Entonces, ¿cómo se calcula la media? Como hemos hecho toda la vida. Si tenemos cinco valores, sumamos esos cinco valores y lo dividimos entre cinco. 344 00:55:55,480 --> 00:55:59,840 Si tenemos más, más. Hacemos un promedio de todos nuestros valores. 345 00:55:59,840 --> 00:56:20,380 ¿Vale? Otro parámetro que tenemos, la mediana, también es una medida de centralización, nos está buscando el punto intermedio, un valor central, un valor que represente a todos de la manera más precisa, con la mayor inteligencia posible. 346 00:56:20,380 --> 00:56:36,460 No quiero decir preciso y exacto para no liar. Entonces, ¿qué es la mediana? Es el valor central de un conjunto de valores. Es distinto de la media. Por ejemplo, voy a abrir una hoja de cálculo y os pongo aquí datos. 347 00:56:36,460 --> 00:57:03,099 Si yo tengo estos valores, el 5, el 6, el 7, el 8, el 12, el 14 y el 16, ¿vale? Mi media, ¿qué será? Mi media es este valor, el 5, más el 6, más el 7, ¿no? Sumo todos mis valores y con el resultado que me dé, ¿vale? Lo voy a hacer así, pero el próximo día lo hago con papel para que os resulte más claro. 348 00:57:03,099 --> 00:57:18,179 pero bueno, mi media va a ser la suma de todo esto, que me da 68, y lo voy a dividir entre el número de valores que tengo, que son 1, 2, 3, 4, 5, 6 y 7, ¿vale? 349 00:57:18,980 --> 00:57:30,639 Entonces, mi media va a ser 9,71, aproximadamente, ¿no? Mi media va a estar por aquí. Es la suma de todos estos valores divididos entre el número de valores. 350 00:57:30,639 --> 00:57:45,639 ¿Qué es mi mediana? Mi mediana es el valor que está en el medio, ¿vale? En el medio cuando los ordeno de mayor a menor o de menor a mayor, da exactamente lo mismo. Aquí los tengo ya ordenados directamente, lo he hecho a posta, ¿vale? Entonces, ¿cuál sería mi mediana aquí? 351 00:57:45,639 --> 00:58:10,500 Yo aquí tengo estos tres valores por encima, estos tres valores por debajo, el que está en el medio es este de aquí, mi mediana es 8, ¿vale? Esto es mi media que me ha dado 9,71 o lo que sea, porque he sumado todos estos valores y los he dividido entre 7, pero mi mediana es el valor que está en el medio, ¿vale? 352 00:58:10,500 --> 00:58:36,559 Muy importante para calcular la mediana, mis datos tienen que estar ordenados, ¿no? Si yo tengo aquí el 4, 27, 5, 8, 12, 48, aquí mi mediana no va a ser el valor, 48, 3, no va a ser este valor de aquí que esté en el medio porque no están ordenados. 353 00:58:36,559 --> 00:58:57,320 Primero los tendría que colocar en orden, ¿no? Colocaría primero el 3, luego el 4, luego el 5, luego el 8, va a dar la casualidad de que es el mismo, pero por casualidades de la vida, 3, 4, 5, 8, 12, 27 y 48, ¿no? 354 00:58:57,320 --> 00:59:11,159 Ahora ya sí que los tengo ordenados, ahora tengo 3 por encima, tengo 3 por debajo y mi mediana es este valor de aquí, ¿vale? Aquí ha dado la casualidad de que justo estaban así, ¿vale? 355 00:59:11,159 --> 00:59:17,719 Pero bueno, entendedme que si esto en vez de un 3 es un 50, ya no saldría, ¿vale? 356 00:59:18,059 --> 00:59:24,400 Porque tendría este número aquí abajo y este no lo tendría. 357 00:59:25,219 --> 00:59:29,420 Entonces, ahora mismo mi mediana sería este de aquí, que es el que está entre medios, ¿vale? 358 00:59:31,579 --> 00:59:34,480 Entonces, los tengo ordenados y busco el valor que hay en el medio. 359 00:59:34,980 --> 00:59:40,119 ¿Qué pasaría si yo tengo, en vez de esto, tengo, por ejemplo, esto de aquí? 360 00:59:40,119 --> 00:59:50,739 Y ahora los sigo teniendo ordenados, ¿vale? De menor a mayor, el 3, el 4, el 5, el 8, 12, 27, 48 y 50. 361 00:59:51,139 --> 01:00:00,659 ¿Aquí cuál sería mi mediana? Vale, pues tengo 4 valores por aquí, o sea, 3 valores por aquí, 3 por aquí, pero es que no tengo un valor medio. 362 01:00:00,659 --> 01:00:16,159 Si yo tengo aquí 4, aquí 4. Entonces, ¿qué hago? Cogerme la media de estos dos valores. Haría 12 más 8 y lo dividiría entre 2. O sea, 12 y 8, 20. Mi mediana en este caso sería 10. 363 01:00:16,159 --> 01:00:24,719 Entonces, ¿cómo se calcula la mediana? Pues si mi número de valores es impar, es el que está en el medio 364 01:00:24,719 --> 01:00:33,579 y si mi número de valores es par, como no hay ninguno en medio, sería esto de aquí, lo que hago es la media entre los dos valores centrales 365 01:00:33,579 --> 01:00:40,320 Si selecciono estos dos, veis que tengo tres por arriba, tres por abajo, pues hago la media de estos dos, ¿vale? 366 01:00:40,320 --> 01:00:57,500 Y con eso tengo mi mediana. Entonces, ya he definido lo que es mi media y lo que es mi mediana, ¿vale? Ahora, ¿qué es mi moda? La moda, lo sabéis también, estar a la moda, lo que más se lleva, lo que más se repite, ¿vale? 367 01:00:57,500 --> 01:01:16,699 La moda es el valor que más se repite en una distribución. En este caso, no tengo ninguna moda, tengo todos los valores una vez, ¿vale? Si mis datos fuesen, pues ahora tengo aquí un 12, ahora mismo la moda de mi serie de valores es el 12, porque está dos veces, ¿no? 368 01:01:16,699 --> 01:01:36,000 Lo tengo aquí y lo tengo aquí y el resto de los valores solo los tengo una vez. Entonces, en este caso, mi moda es 12. ¿Qué pasa si tengo estos datos? Que tengo un 3, un 12, un 5, un 8, un 12 otra vez, un 27, un 5 otra vez. 369 01:01:36,000 --> 01:01:52,260 Pues que tengo dos modas, es bimodal. Mi moda es el 12 y mi moda es el 5, porque ambas se repiten dos veces. Aquí tengo 5, 5, 12, 12. 370 01:01:52,260 --> 01:02:07,420 En este caso, mis datos tienen dos modas. Es bimodal. Hemos visto los tres tipos de medidas de centralización que vamos a utilizar. La moda no la vamos a utilizar prácticamente nunca. 371 01:02:07,420 --> 01:02:19,300 La tenemos que conocer, pero a nivel científico, a nivel analítico, a nuestro nivel como químicos, no es algo que nos aporte una información muy valiosa. 372 01:02:19,980 --> 01:02:30,199 Tenemos que saber lo que es, tenemos que saber calcularlo, pero nosotros vamos a utilizar la mayor parte de las veces la moda y la mediana puede tener sentido. 373 01:02:30,199 --> 01:02:39,960 La mediana, esto que os pone aquí es muy importante, es más robusta que la media ya que no se ve afectada por valores extremos anómalos. 374 01:02:40,199 --> 01:02:43,239 ¿Os acordáis de lo que es que algo sea robusto, que un método sea robusto? 375 01:02:44,340 --> 01:02:58,329 Un método robusto, una medida robusta, es aquella que varía poco cuando hay modificaciones, que se aguanta firme ante los cambios. 376 01:02:58,329 --> 01:03:00,289 digamos, pensar en un árbol gordo 377 01:03:00,289 --> 01:03:02,389 es muy robusto, si sopla el viento no se cae 378 01:03:02,389 --> 01:03:04,150 uno fino es poco robusto, se cae 379 01:03:04,150 --> 01:03:06,929 cuando hay una modificación, cuando hay un cambio 380 01:03:06,929 --> 01:03:09,210 un método que es robusto 381 01:03:09,210 --> 01:03:10,710 no se ve tan afectado 382 01:03:10,710 --> 01:03:12,309 como uno que no es tan robusto 383 01:03:12,309 --> 01:03:14,030 entonces, ¿qué quiere decir? 384 01:03:14,190 --> 01:03:16,909 que la mediana es más robusta que la media 385 01:03:16,909 --> 01:03:18,650 ya que no se ve afectada 386 01:03:18,650 --> 01:03:20,710 por valores extremos anómalos 387 01:03:21,250 --> 01:03:24,489 ¿os cuadra esto? 388 01:03:24,630 --> 01:03:25,789 ¿le veis lógica? 389 01:03:25,789 --> 01:03:41,010 Sí, ¿no? Vamos a pensar, creo que tengo aquí el dato. Vale, los salarios de un país, por ejemplo, en España, los ingresos están distribuidos de una manera que no es muy desigual, ¿no? 390 01:03:41,010 --> 01:03:47,050 Hay poca gente que gana mucho, mucho dinero y luego hay mucha gente que gana poco dinero, ¿no? 391 01:03:47,050 --> 01:03:59,670 Está repartido de una manera que no es una distribución equitativa en el sentido de que no es regular, ¿no? 392 01:03:59,670 --> 01:04:10,889 Que no es como un espejo, que no la podemos ver, que hay la misma cantidad de gente que gana mucho dinero que la misma cantidad de gente que gana poco, ¿no? 393 01:04:10,889 --> 01:04:20,949 tampoco está desplazado esta campana hacia que hay mucha más gente que gana menos dinero que la poca gente que gana mucho, ¿vale? 394 01:04:21,250 --> 01:04:28,530 Pues, por ejemplo, hay mucha más gente ganando 1.000 euros que lo que está ganando, yo que sé, un futbolista que gana 15 millones de euros al año, ¿vale? 395 01:04:29,090 --> 01:04:36,489 Es a lo que voy con lo de que no está como distribución, no como algo social, como distribución estadística, no es regular, ¿no? 396 01:04:36,489 --> 01:04:39,349 Está distribuida de una manera homogénea, ¿vale? 397 01:04:39,829 --> 01:04:47,510 Entonces, por ejemplo, en España, estos son datos reales del INE, del Instituto Nacional de Estadística, del año 2021. 398 01:04:47,510 --> 01:05:00,929 Nos dice que la media del salario en España es 28.400 euros y nos dice que la mediana son 20.300. 399 01:05:00,929 --> 01:05:30,429 ¿Cuál es más representativa en este caso? ¿Cuál creéis que tiene más… que lo que buscamos con las medidas de centralización es que nos representen, bueno, pues toda nuestra población, que nos la representen en un número, ¿no? 400 01:05:33,199 --> 01:05:57,059 Bueno, nadie contesta, pero el salario mediano en este caso es mucho más representativo. ¿Alguien iba a decir algo? ¿Qué he escuchado ahí? Bueno, ¿por qué? Porque la media puede ser alta porque los ingresos que son muy, muy, muy altos, imagínate, pues eso, todos los futbolistas que ganan, me invento los datos, que ganan 50 millones de euros al año. 401 01:05:57,920 --> 01:06:03,059 Cuando hacemos la media, esos 50 millones de euros están entrando como un valor del numerador 402 01:06:03,059 --> 01:06:08,539 y entran exactamente igual que el valor de los que ganan normal y los que ganan, pues eso, 403 01:06:08,639 --> 01:06:12,400 1.000 euros, 1.500, 2.000, 800 euros, lo que sea. 404 01:06:13,159 --> 01:06:15,199 Entran en el mismo saco. 405 01:06:15,199 --> 01:06:21,420 Entonces, cuando dividimos, están aportando también toda su contribución, contribuyen de la misma manera. 406 01:06:22,500 --> 01:06:24,400 En cambio, ¿qué pasa con la mediana? 407 01:06:24,400 --> 01:06:33,440 que la mediana lo que nos está dando son los valores centrales. Entonces, los datos que son muy extremos, o sea, el que gana 50 millones de euros por un lado 408 01:06:33,440 --> 01:06:44,219 y el que gana 10 euros por el otro, no están afectando. Aquí te digo al cambiar los 50 millones por 1.000 millones porque ese valor no va a afectar a la mediana. 409 01:06:44,219 --> 01:07:00,099 La mediana va a seguir siendo el valor que está en el medio, ¿vale? Por ejemplo, en el caso que hemos hecho al principio, voy a poner aquí, esto lo voy a borrar para que no sea un lío, voy a quitarle el color, ¿vale? 410 01:07:00,760 --> 01:07:10,039 Imaginad que tenemos estos datos, ¿no? Yo he hecho, bueno, vamos a hablar de edad, la edad media de la gente que estudia este módulo, ¿no? 411 01:07:10,900 --> 01:07:20,019 Este ciclo, perdón, o bueno, este módulo en concreto. Entonces, tenemos a alguien que tiene 17 años, otro que tiene 18, otro también que tiene 17, 412 01:07:20,019 --> 01:07:28,280 otro que tiene 19, otro que tiene 23, otro que tiene 40, otro que tiene 38 y otro que tiene 18 otra vez, ¿vale? 413 01:07:28,900 --> 01:07:32,440 Imaginaos que esta es mi muestra, esto es lo que tengo yo, ¿vale? 414 01:07:32,880 --> 01:07:42,619 ¿Cuánto es mi media de edad? Mi media, la voy a escribir aquí, mi media es la suma de todos estos, 415 01:07:42,619 --> 01:08:10,659 Es 17 más 18 más 17 más 19 más 23 más 40 más 38 más 18 y lo divido entre el número de valores que tenemos, que son 1, 2, 3, 4, 5, 6, 7 y 8. 416 01:08:10,659 --> 01:08:32,119 ¿No? Entre 8. Y tenemos que la edad media de la gente que estudia este ciclo son 23,75 años. ¿Vale? Ahora, voy a calcular la mediana. Pues los ordeno, ¿vale? Voy a ordenar los datos de menor a mayor y me voy a buscar el valor que esté en el medio. 417 01:08:32,119 --> 01:08:52,819 ¿Vale? Este, este, este, este, pues bueno, mi valor en el medio, tengo cuatro por abajo, ¿no? Como son siete, son ocho, tres, cuatro, cinco, seis, siete y ocho, son ocho valores que he puesto, he puesto siete, ah, no, he puesto ocho, perdonadme, ¿vale? 418 01:08:52,819 --> 01:09:14,899 Entonces tengo estos cuatro, estos cuatro, mi mediana va a ser la media de los dos valores centrales, ¿no? Dejo tres por arriba, tres por abajo. Como es número par, entonces mi mediana será la media de estos dos. Mi mediana es 18 más 19 dividido entre 2, ¿no? 419 01:09:14,899 --> 01:09:36,350 Y me da que mi mediana es 18,5. Tengo mis datos de mi media y mis datos de mi mediana. Ahora, imaginaos que se matricula una persona que tiene 103 años. ¿Cómo cambia mi media y cómo cambia mi mediana? 420 01:09:36,350 --> 01:09:58,550 Mi media es lo mismo que tenía antes, la suma de todo esto dividido entre 9, ¿no? Porque ahora tengo una persona más. La suma de todos estos valores dividido entre 9, ¿vale? 421 01:09:58,550 --> 01:10:05,789 y me ha subido la media, ¿no? De 23,75 que tenía me ha subido a 32,55, 422 01:10:05,930 --> 01:10:07,789 pues se ha metido una persona de 103 años. 423 01:10:08,270 --> 01:10:09,649 Ahora, ¿qué pasa con la mediana? 424 01:10:10,970 --> 01:10:16,850 Ahora tengo estos valores por encima, estos valores por debajo, mi mediana son 19 años. 425 01:10:17,970 --> 01:10:20,090 Mi mediana prácticamente no se ha modificado. 426 01:10:20,090 --> 01:10:25,409 Aunque yo haya metido aquí una persona de 103 años, mi mediana está prácticamente igual 427 01:10:25,409 --> 01:10:28,890 porque no le afectan los valores extremos de la misma manera que a la media. 428 01:10:29,470 --> 01:10:38,109 Imagínate que mi persona de 103 años es una persona, es una cosa rarísima de la naturaleza y tiene 180 años. 429 01:10:38,649 --> 01:10:42,750 Mi media son 41,1, pero mi mediana siguen siendo 19, a mí me da igual. 430 01:10:43,149 --> 01:10:50,590 Y si mi persona tiene 1800 años, la media de edad de mi clase son 221, pero mi mediana son 19. 431 01:10:50,590 --> 01:11:07,369 Es que mi mediana no se ve afectada por los valores extremos. Igual que si esta persona tiene cero años, mi media va a cambiar, pero mi mediana se queda invariable. ¿Esto qué quiere decir? Esto es lo que quería deciros con lo de que la mediana es más robusta. 432 01:11:07,369 --> 01:11:16,250 Pero en nuestro caso, para lo que nosotros utilizamos nuestras medidas de descentralización, la media es mucho más representativa. 433 01:11:16,250 --> 01:11:25,609 Es el valor que vamos a utilizar nosotros como medida de descentralización, es la media, claramente. No hay otro que se le compare. 434 01:11:25,609 --> 01:11:38,510 Entonces, ¿qué pasa? Que como en España, en todos los países, en la mayoría de los lugares, la distribución de los ingresos no sigue un patrón regular, 435 01:11:38,510 --> 01:11:47,270 hay gente que gana mucho, otro grupo de gente más abundante que gana normal y otro grupo muy grande de gente que gana poco, etc. 436 01:11:48,010 --> 01:11:54,970 Sería mucho más representativa la mediana que la media, porque los valores extremos estos que tenemos, porque no es algo que sea homogéneo, 437 01:11:54,970 --> 01:12:06,729 van a afectar mucho menos. Esto como ejemplo para que penséis en que media y mediana no tienen por qué ser iguales salvo que tengamos una distribución normal, que ya veremos lo que es. 438 01:12:07,189 --> 01:12:19,630 Y los dos lo que nos dan es una representación cada una con unas fortalezas y unas debilidades de cómo sería nuestro valor central si tenemos un número de valores distintos. 439 01:12:19,630 --> 01:12:45,729 Hemos tomado una muestra de la población y lo hemos analizado. Lo que hacemos es, para calcular la media, sumamos todos los valores y lo dividimos entre el número total de medidas, que lo llamamos n, la letra n, y para hacer la mediana ordenamos de menor a mayor nuestros datos y cogemos el valor central. 440 01:12:45,729 --> 01:13:02,430 Si son números pares, no hay un valor central, ¿no? Tenemos dos valores centrales y nos quedan la misma cantidad de números por arriba que por abajo. Pues hacemos la media de esos dos números, o sea, los sumamos y dividimos entre dos y tenemos la mediana, ¿vale? 441 01:13:02,430 --> 01:13:20,090 ¿Vale? Entonces, lo que os he dicho, la mediana. ¿Qué es lo que nos hace la mediana? Nos divide nuestros datos, los datos que tengamos, en dos mitades. Vamos a tener la mitad por arriba y la mitad por abajo. ¿Vale? 442 01:13:20,090 --> 01:13:34,470 La moda, ¿qué nos va a dar? El dato que más se repita, el dato que más veces tengamos. Y la media nos va a dar un compendio, un promedio de la suma de todas nuestras medidas dividida entre el número total de medidas que llamamos n. 443 01:13:34,470 --> 01:13:37,810 Y estas son las medidas de centralización. 444 01:13:41,510 --> 01:13:52,510 Os he hablado de la mediana, que os he dicho que es tener la mitad de los valores por encima y la mitad de los valores por abajo. 445 01:13:52,970 --> 01:14:00,369 La mediana, si dividimos nuestra muestra completa en dos, sería el punto que está en el medio. 446 01:14:00,369 --> 01:14:06,970 Imaginaos que tenemos esta barra de aquí, roja, que están todos nuestros valores ordenados. 447 01:14:07,350 --> 01:14:09,869 Pues nuestra mediana es la que lo parte en dos, ¿vale? 448 01:14:10,149 --> 01:14:13,229 ¿Qué pasa? Que podemos hacerlo también de distintas maneras. 449 01:14:13,229 --> 01:14:21,970 Igual que nuestra muestra la partimos en dos para calcular la mediana, la podemos partir en cuatro y lo que tenemos son los cuartiles. 450 01:14:22,590 --> 01:14:28,529 El cuartil dos será la mediana, que nos separa la mitad de los datos por debajo, la mitad por arriba. 451 01:14:28,529 --> 01:14:37,189 pero el 1 que nos separa el 25% de los datos están por debajo, el 25% de los datos están por arriba, ¿vale? 452 01:14:37,189 --> 01:14:41,029 Esos serían los cuartiles, en vez de dividir entre 2, dividir entre 4. 453 01:14:43,369 --> 01:14:49,189 Y tenemos también los percentiles, que esto os lo comento, no es algo que vayamos a utilizar nosotros de manera habitual 454 01:14:49,189 --> 01:14:55,829 pero porque seguramente lo hayáis escuchado en un montón de ocasiones en distintos casos, ¿no? 455 01:14:55,829 --> 01:15:03,909 Por ejemplo, cuando los niños, cuando los bebés nacen y demás, se dice, no, está en el percentil 80. 456 01:15:04,729 --> 01:15:06,289 ¿Qué significa el percentil 80? 457 01:15:06,729 --> 01:15:11,050 Significa que hemos dividido toda nuestra muestra, todo el rango que tenemos, 458 01:15:11,170 --> 01:15:16,310 desde el más bajo hasta el más alto, en 100, y partimos en el 80. 459 01:15:16,310 --> 01:15:17,189 ¿Eso qué quiere decir? 460 01:15:17,449 --> 01:15:23,770 Que solamente el 20% de los valores están por encima y el 80% de los valores están por debajo. 461 01:15:24,710 --> 01:15:29,289 Cuando dicen, no, el niño este es muy alto, es altísimo, está en el percentil 96. 462 01:15:29,909 --> 01:15:36,810 ¿Eso qué significa? Que el 96% de los niños son más bajitos que él y el 4% son más altos. 463 01:15:37,010 --> 01:15:41,350 Entonces, si te dicen que estás en el percentil 50, estás en la mediana. 464 01:15:41,789 --> 01:15:45,810 ¿Qué es lo que quiere decir? Que la mitad de los niños son más altos y la mitad de los niños son más bajos. 465 01:15:45,810 --> 01:15:47,210 Este es el significado. 466 01:15:47,210 --> 01:16:13,409 Entonces, igual que tenemos la mediana que nos separa 50-50, podemos tener, porque hemos separado en dos nuestra muestra, podemos tener nuestros cuartiles, que es cuando los separamos en cuatro, el 0, 25, 50, 75, 100, sería hacer esas divisiones, y podemos tener los percentiles, si lo que hacemos es dividirlo en mil. 467 01:16:13,409 --> 01:16:25,529 Aquí, no sé si lo veréis más claro, el rango, que esto es una medida de dispersión, que son las que vamos a ver ya el próximo día, para no daros hoy mucha más información. 468 01:16:26,609 --> 01:16:32,710 Entonces, aquí tenemos, del valor más bajo al valor más alto son todos los valores que tenemos nosotros, ¿no? El rango. 469 01:16:33,510 --> 01:16:41,350 Entonces, tenemos aquí nuestra mediana, que lo que hace es separarnos, la mitad de los datos están por debajo y la mitad están por encima. 470 01:16:41,350 --> 01:16:54,750 Y luego tenemos los cuartiles, que lo que nos dicen es, este de aquí, por ejemplo, nos dice que todos los datos que estén por debajo de aquí van a ser un 25% y todo lo demás va a estar por encima. 471 01:16:54,850 --> 01:17:00,649 Van a ser un 75% los que están por encima. Es exactamente el mismo concepto que con la mediana. 472 01:17:00,649 --> 01:17:12,270 Entonces, reitero que nosotros vamos a utilizar la media en nuestros estudios, en nuestros análisis del laboratorio, etc. 473 01:17:12,550 --> 01:17:21,130 Pero tenemos que saber que también son medidas de centralización la mediana y la moda y que la mediana es más robusta que la media. 474 01:17:21,850 --> 01:17:26,989 ¿Qué pasa? Que nosotros normalmente, por ejemplo, hacemos un análisis y ¿qué resultados nos salen? 475 01:17:26,989 --> 01:17:33,029 nos salen resultados que tienen mucha precisión, ¿no? Son muy parecidos entre ellos porque es lo que nosotros estamos buscando conseguir. 476 01:17:33,569 --> 01:17:39,810 Nuestra medida por excelencia va a ser la media, que lo que nos va a hacer es, vale, yo he conseguido en uno de mis ensayos, 477 01:17:39,930 --> 01:17:50,149 mi resultado es que tengo una concentración de 0,87 molar, en otra tengo de 0,88 y en otra tengo de 0,89. 478 01:17:50,850 --> 01:17:56,850 ¿Qué valor doy yo como valor final? Pues la media de esos tres valores, ¿no? Sumo los tres y los divido entre tres. 479 01:17:56,989 --> 01:18:10,069 Y no se nos ocurre dar la mediana y no se nos ocurre dar la moda tampoco. Entonces, a nivel laboratorio, la media va a ser nuestra medida de centralización por excelencia. 480 01:18:10,689 --> 01:18:17,890 Que lo que digo, que tampoco a los que ya estáis en segundo y habéis hecho prácticas no os cuento nada nuevo y a los demás yo creo que tampoco porque bueno, 481 01:18:17,890 --> 01:18:34,359 estas son las medidas que más utilizamos para todo, ¿no? Sacar la media de los valores que sean para poder analizarlo, para poder hacernos una idea con ese único número de cómo es una población total. 482 01:18:34,359 --> 01:18:49,140 Hemos visto toda la introducción a la estadística, lo que es población y muestra, los tipos de variables que tenemos 483 01:18:49,140 --> 01:18:58,140 y nos vamos a quedar aquí para que no sea mucho más en las medidas que utilizamos en estadística descriptiva de centralización 484 01:18:58,739 --> 01:19:02,000 para dar un solo resultado que nos represente todos los valores 485 01:19:02,000 --> 01:19:31,039 Y el próximo día, que no es festivo ni nada, el 12, el jueves 12, vamos a comenzar con las medidas de dispersión, que son la otra serie de medidas que realizamos en estadística descriptiva para que nuestros datos no solo nos representen qué valor es, sino cómo de preciso es ese valor, cómo de cerca están los datos entre ellos.