Saltar navegación

Videoconferencia CSL 5 de Diciembre de 2024 - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 8 de diciembre de 2024 por Elena A.

43 visualizaciones

-Introducción a la estadística
-Variables (Cuantitativas/cualitativas)
-Estadística descriptiva: medidas de dispersión

Descargar la transcripción

No es que sea difícil, pero que sí que es verdad que hay veces que los términos los tenemos que tener claros y tenemos que estar entendiendo. 00:00:00
Entonces, lo que sí que os pido por favor hoy, vamos, a partir de ahora, sobre todo en esta unidad, es que me interrumpáis cuando no entendáis algo, ¿vale? 00:00:06
Y también, bueno, yo os iré preguntando y plantearemos algún ejercicio para que lo penséis, lo hagáis vosotros mientras tanto y luego lo corrijamos, 00:00:15
porque al final es que es la única manera de llevar esta unidad al día y enterrarnos todos bien. 00:00:25
Entonces, bueno, vamos a ver el mapa conceptual, como hacemos siempre al principio de la lección, ¿vale? 00:00:35
Entonces, bueno, para ver a qué nos vamos a enfrentar en esta unidad de trabajo, ¿vale? 00:00:43
Bueno, lo que nos indica aquí es que nosotros en un laboratorio, al final nuestro trabajo es medir y comparar 00:00:48
Es lo que hacemos básicamente, damos nuestros resultados de nuestros ensayos en función de lo que estemos analizando, lo que se nos haya solicitado y para ello tenemos que asegurar la calidad de nuestras medidas. 00:00:55
¿Cómo hacemos eso? Cuando medimos obtenemos datos y los datos lo que hacemos es expresarlos con unas unidades y su incertidumbre asociada es el error con el que nosotros estamos midiendo. 00:01:10
¿Qué quiere decir esto? Que nosotros cuando hacemos una medida, cuando estamos analizando en cualquier tipo de experimento que estemos realizando, 00:01:27
siempre vamos a tener un error asociado porque no podemos decir al 100% que nuestro dato es el dato real. 00:01:37
Entonces, lo que hacemos es expresar un intervalo, expresar un error asociado a ese dato para que nuestra información esté completa. 00:01:43
¿Vale? Entonces tenemos distintos tipos de errores que iremos viendo, tenemos los sistemáticos y los aleatorios que a su vez se pueden clasificar en distintas categorías y en función del error que tengamos nos va a afectar a algunos de nuestros parámetros. 00:01:51
Nos va a afectar a la exactitud, nos va a afectar a la precisión, que si os acordáis, esto lo repetiremos hasta la saciedad, son términos diferentes. La exactitud lo que nos indica es la diferencia que hay entre nuestro valor real y el valor que hemos medido. 00:02:08
Nos da una idea, la exactitud es cómo de cerca está nuestra medición del valor considerado real. Y en cambio, la precisión lo que nos indica es cómo de cerca están las medidas. 00:02:25
Elena, no estás compartiendo pantalla. 00:02:38
No estoy compartiendo, Jolín. Voy a ello. 00:02:41
Perdonadme. Ahora sí, ¿verdad? 00:02:48
Ahora sí. 00:02:57
Sí, disculpadme. Bueno, estaba con el mapa conceptual que tenemos en el aula virtual. Entonces, lo que os estaba comentando, la exactitud a lo que se refiere es cómo de cerca está nuestro valor del valor real. 00:02:58
Si nosotros tenemos, lo que estuvimos viendo el otro día, nuestros materiales de referencia, nuestros patrones, nosotros sabemos cuál es el valor exacto, si nosotros hacemos una medición y obtenemos un valor diferente, cuanto más cerca esté ese valor del valor real, más exacta va a ser nuestra medida. 00:03:16
En cambio, ¿qué era la precisión? La precisión lo que nos indica es cómo de dispersos están nuestros datos, cómo de cerca están nuestras distintas mediciones entre ellas. 00:03:35
Esto lo más visual es el ejemplo que pusimos al principio de la diana, que es la exactitud, acertar en el centro de la diana, lo que consideramos el valor real al que tenemos que llegar. 00:03:47
¿Qué es la precisión? Que todos nuestros dardos estén agrupados cerca, alrededor del centro. ¿Qué pasaría si yo tengo todos mis dardos muy juntos entre ellos, pero en una esquina de la diana? 00:03:59
Que mi medida va a ser muy precisa, porque todos mis dardos están agrupados alrededor de un mismo valor, pero no va a ser exacta, porque el valor alrededor del que están agrupados no es el valor real, que sería en este caso que estamos poniendo el centro de la diana. 00:04:12
Entonces, bueno, vamos a ver los tipos de errores que hay, cómo cuantificarlos y a qué magnitudes nos afectan, a cuáles de nuestros parámetros nos afectan. 00:04:27
Luego vamos a utilizar parámetros analíticos, test estadísticos y ensayos de significancia. 00:04:41
Vamos a ver, bueno, la estadística inferencial, que ahora veremos lo que es, realiza unas hipótesis y luego las prueba para ver si se pueden aceptar o no. 00:04:46
Entonces, bueno, vamos a andar en cómo tenemos que hacer, por ejemplo, cuando estamos en el laboratorio y nosotros hemos tomado siete medidas y vemos que seis de ellas son muy parecidas. 00:04:58
Imaginaos que estamos midiendo un pH y tenemos 7,1, 7,0, 7,2, 6,9, 7,2, 7,1 y de repente nos encontramos con una medida que es 5,4. 00:05:11
Pues ahí empezamos a pensar y decimos, a lo mejor he cometido un error, a lo mejor ese resultado lo tengo que eliminar, pero ¿qué criterio utilizo? 00:05:24
Entonces, vamos a estudiar los distintos métodos que hay para ver si ese resultado lo tendríamos que rechazar o no, por ejemplo, ¿vale? Y eso, para hacer todo esto, vamos a hacer uso todo el rato de la estadística, ¿vale? 00:05:36
Vamos a hablar, que eso yo creo que vamos a hacerlo hoy porque es lo más básico, a ver si os acordáis o si lo tenéis claro, de las cifras significativas y el redondeo. ¿Alguno me sabe decir qué son las cifras significativas? 00:05:51
Seguro que sí, pero no quiere hablar. 00:06:09
Bueno, las cifras significativas son las cifras que tienen, como su propio nombre indica, un significado. 00:06:14
¿Qué quiere decir esto? 00:06:19
Que si yo te digo, por ejemplo, que tengo un valor de 3,7, esas dos cifras me están dando información. 00:06:21
Tengo una cifra que es el 3 y una cifra que es el 7. 00:06:28
En cambio, si yo te digo que tengo un valor de 0,0037, ¿ahí qué datos me están dando valor? 00:06:31
Realmente hay dos cifras que me están dando una indicación del valor real que tengo, que son el 3 y el 7 00:06:39
Porque lo otro es lo mismo que si yo colocase una potencia que pusiese 3,7 por 10 a la menos 2 o a la menos 3 00:06:46
No sé cuántos ceros he dicho, ¿vale? 00:06:54
Entonces, bueno, esto lo vamos a ver con ejemplos 00:06:56
¿Qué pasa muchas veces? Que tenemos más cifras en nuestros resultados de las que realmente tenemos que poner 00:06:58
En el ejemplo del pH que os he dicho, que nuestros pH eran 7,2, 7,3, 7,5, eran distintas cantidades con un número entero y un número decimal. 00:07:04
Si yo hago la media y me sale que el pH es 7,83, estoy dando un número de cifras mayor de lo que yo sé realmente, 00:07:19
porque yo sé que mi instrumento está midiendo con 2, entonces tendré que redondear ese 7,83 y en vez de dar esas tres cifras significativas, daré 2, diré 7,8. 00:07:29
Entonces, vamos a ver un poco todas estas herramientas que utilizamos para controlar la calidad de nuestro proceso analítico, que al final esto es un curso de calidad 00:07:40
y una de las herramientas más importantes, la que más vamos a utilizar, aparte de nuestra consulta de la normativa, 00:07:50
donde se tienen estipulados ciertos parámetros, etc., va a ser herramientas estadísticas continuamente. 00:07:59
Los que estáis en segundo ya lo sabéis, los que habéis hecho prácticas ya lo sabéis y los que estáis en primero, que es el primer año, 00:08:05
os daréis cuenta que al final esto lo aplicáis a prácticamente todos los módulos porque cada vez que vamos al laboratorio 00:08:12
y hacemos una serie de medidas, luego nosotros expresamos un resultado final 00:08:19
y para expresar ese resultado final, después de todas las mediciones que nosotros hemos hecho, 00:08:25
tenemos que expresarlo de una manera concreta, que es con su número de cifras significativas apropiado, 00:08:31
si hemos hecho varias medidas, hacemos la media de todas ellas, que ahí estamos aplicando la estadística, 00:08:37
tenemos que aplicar los criterios de redondeo, damos un intervalo de confianza 00:08:43
que muchos ya lo sabéis, pero lo veremos detalladamente cómo se calcula, pero un intervalo de confianza que nos dice, es ese intervalo en el que nosotros aseguramos que está nuestro valor, ¿no? 00:08:48
Por ejemplo, si yo os digo que mi resultado final del pH este que os he dicho es 7,8 más menos 0,1, yo estoy garantizando que mi resultado va a estar entre 7,8 menos 1 y 7,8 más 1. 00:09:02
Lo que quiero decir es que yo estoy diciendo que mi resultado está entre 7,7 y 7,9. A eso se le llama intervalo de confianza. Y eso lo veis representado siempre con la medida de vuestra magnitud, un más menos y esa incertidumbre social, ese intervalo de confianza. 00:09:20
¿Vale? Ese intervalo de confianza y luego, bueno, nuestra unidad, ¿no? Si yo, el pH es adimensional, pero si yo os estoy hablando, por ejemplo, de lo que estoy midiendo en una balanza, yo os daré que mi masa es 3,5 más menos 0,3 gramos, por ejemplo. 00:09:40
¿Vale? Datos inventados totalmente. Entonces, bueno, este es a lo que nos vamos a enfrentar y como ya os he comentado varias veces, es la unidad más extensa y vamos a estar con ella hasta bien entrado el año 2025. 00:10:01
Ahora en diciembre las tres clases que nos quedan y estaremos todo enero y probablemente parte de febrero. 00:10:16
Y así dejamos marzo para la siguiente unidad, abril para la última que nos quedaría y mayo para hacer repasos, simulacros, ejercicios, etc. 00:10:25
Entonces, bueno, esto es lo que vamos a hacer. 00:10:34
Y ahora vamos a comenzar por el principio, por qué es la estadística. 00:10:37
¿Vale? Entonces, ¿qué es la estadística? Pues la estadística es una herramienta matemática que utilizamos para ordenar valores, para ordenarlos, para clasificarlos, para hacer representación, utilizamos representando gráficamente para verlo de manera más visual, ¿vale? 00:10:41
Entonces, bueno, como hemos dicho, estamos en un curso de calidad y sabemos que nuestro objetivo es conseguir la calidad total, el total quality management y lo que queremos es integrar la calidad en todos los procesos de nuestra organización, ¿vale? 00:11:00
nosotros como estamos trabajando en un laboratorio de análisis y control de calidad, es nuestro campo específico, pues bueno, vamos a querer llevar este objetivo de la calidad total a todas las fases de nuestro proceso analítico. 00:11:20
¿Cómo hacemos eso? Pues mediante una serie de herramientas, algunas son unas herramientas de control, de planificación, en la que gestionamos cómo vamos a realizar nuestros procesos y mediante herramientas estadísticas. 00:11:36
¿Qué es el proceso analítico? El proceso analítico es el conjunto de operaciones analíticas que nosotros realizamos entre que tenemos una muestra y proporcionamos un resultado. 00:11:51
¿Vale? El proceso analítico es todo ese proceso que está entre medias. ¿Cómo empieza el proceso analítico? ¿Qué es lo que hacemos siempre ante cualquier problema, entre cualquier solución que queramos proponer? 00:12:06
Pues bueno, identificamos el problema, elegimos el método mediante el cual vamos a realizar nuestro análisis, hacemos el muestreo, que es el muestreo, la toma de la muestra, vamos a obtener una muestra representativa para luego poder procesarla y realizar sobre ella los estudios que sean necesarios para determinarla, ¿vale? 00:12:24
Vamos a determinarla con el método que hayamos seleccionado previamente y después vamos a evaluar los resultados haciendo uso de estas herramientas estadísticas y a redactar el informe, ¿vale? 00:12:47
Entonces, el concepto de calidad total lo que nos dice es que vamos a incluir estas herramientas en todas las etapas del proceso, ¿no? Pues bueno, en mayor o menor medida, pero en el muestreo ya comenzamos eligiendo una muestra que sea representativa, eso ya es una característica. 00:13:01
Bueno, hacemos uso de herramientas estadísticas, que eso ya lo veréis mucho más en profundidad en muestreo. 00:13:25
Y bueno, lo que intentamos básicamente cuando empezamos con nuestra etapa analítica, una vez que hemos identificado el problema, es que nuestra muestra sea representativa. 00:13:37
No tiene sentido que si yo, por ejemplo, lo que estoy analizando es el porcentaje, los PPM que hay de la concentración de un metal, de plomo, en un suelo, de donde sea, no tendría sentido que yo no tome una muestra de la zona en la que yo quiero hacer ese análisis o que no abarque toda la extensión, que no sea de toda la profundidad que pueda contener ese plomo. 00:13:49
El muestreo tiene que ser representativo del problema que nosotros tenemos. Entonces, lo que estoy comentándoos ahora es que la estadística influye en muchas de las etapas del proceso analítico. 00:14:17
En el muestreo, que nosotros lo que buscamos es esa representatividad. Luego, cuando hacemos una medida que incluye la comparación de patrones, estamos aplicando las herramientas que tenemos para saber cómo de certera son nuestras medidas. 00:14:32
Y luego, cuando evaluamos los resultados, que nosotros estamos expresando nuestro resultado con su intervalo de confianza, estamos garantizando con un cierto nivel de probabilidad, que ya veremos cómo se evalúa, que nuestro resultado es el que es y está dentro de unos parámetros. 00:14:48
Vamos a hablar también, vamos a evaluar con los resultados, los resultados que sean dudosos, si los rechazamos o no. 00:15:09
El ejemplo que os he puesto al principio de si estamos haciendo medidas de pH y de repente una es muy distinta de las demás, 00:15:17
tendremos que evaluar si realmente esa medida yo la tengo que considerar o no. 00:15:24
Entonces, para todas estas decisiones, para todas estas etapas, vamos a hacer uso de la estadística. 00:15:31
Que no es más que una sección, una parte de las matemáticas que lo que se encarga es eso, de organizar grandes cantidades de datos y hacerlos representar patrones, representar lo más característico, lo más representativo, de una manera más visual y más fácil de interpretar. 00:15:37
Si nosotros tenemos una tabla con 100 datos, no podemos saber exactamente, no podemos hacernos una idea de ante qué nos estamos enfrentando, pero si nos dan la media de esos 100 datos, ya sí. 00:16:02
Entonces, es una herramienta que a priori es compleja, pero lo que hace es simplificar los procesos y los resultados. 00:16:15
Entonces, muy importante dos conceptos, el concepto de muestra y el concepto de población. 00:16:24
Con muestra, tenemos dos acepciones en nuestro mundo, porque nosotros cuando hablamos de muestra, normalmente lo que estamos hablando es de lo que vamos a analizar. 00:16:31
Tenemos un número de muestras que nosotros analizamos en el laboratorio. Tenemos una muestra de suelo, una muestra de cualquier disolución que tiene un analito o lo que sea. 00:16:41
Pero estadísticamente hablando, muestra tiene una acepción diferente. Vamos a hablar ahora mismo de muestra y población referidos puramente a la estadística. 00:16:54
Los conceptos estadísticos de muestra y población. ¿Qué es la población? La población es la totalidad del sistema que es objeto de estudio. 00:17:06
O sea, de lo que nosotros vamos a hacer un análisis, vamos a hacer un estudio, la población es el todo. ¿Y qué es la muestra? En este caso, la muestra es una porción que es representativa de la población. 00:17:15
¿Vale? Tenéis aquí un dibujo que no sé si se ve bien, pero bueno, tenemos un grupo de personas dibujadas de distintos colores, que están mezcladas a su vez, entonces nosotros tenemos que lo que está dentro de este círculo grande sería nuestra población total, o sea, el sistema completo, y nosotros para analizarlo vamos a coger una muestra de esta población y ¿qué requisitos tiene que cumplir? 00:17:29
Que sea representativa. Si os dais cuenta aquí, en este círculo pequeño, que es la muestra que hemos elegido, tenemos, pues, hombrecitos de estos de distintos colores, ¿vale? 00:17:58
Si yo tengo esta población y como muestra cojo solo todos los muñequitos verdes, no tengo una muestra representativa, ¿no? 00:18:10
No tengo una porción que me esté representando la población total, ¿vale? 00:18:20
me estará representando una cosa diferente, pero la población total desde luego que no. 00:18:24
Si yo cojo solamente los muñequitos verdes y hago mis análisis sobre los muñequitos verdes, 00:18:28
yo luego no sé cómo es esa población, yo sé cómo son los muñequitos verdes, 00:18:35
pero la población no lo sé porque no he elegido una muestra representativa. 00:18:39
Entonces, estadísticamente, muestra es esa porción representativa de la población. 00:18:43
Y esto es un concepto que os tiene que quedar muy claro. 00:18:49
Que bueno, no es difícil, pero bueno, que lo sepáis, una muestra es la porción representativa de la población sobre la que nosotros hacemos nuestros estudios, ¿vale? 00:18:54
Ejemplos, estamos estudiando, por ejemplo, la contaminación de agua en un río. Pues, ¿qué sería mi población en una región? Pues, todos los ríos en una región afectados por la contaminación. 00:19:07
Por ejemplo, yo estoy estudiando la contaminación con mercurio en los ríos de la Comunidad de Madrid, ¿vale? ¿Cuál es la población? Los ríos de la Comunidad de Madrid, ¿vale? ¿Cuál sería mi muestra? Pues sería un grupo de muestras de agua que yo tomo en puntos diferentes de estos ríos, ¿vale? 00:19:21
¿Vale? ¿Es todo claro? ¿Si nadie dice lo contrario? Vale. Entonces, población y muestra. La población, la totalidad del sistema objeto de estudio y la muestra, la porción representativa de la población. 00:19:41
¿Vale? Entonces, ya que sabemos lo que es población y lo que es muestra, vamos a definir las dos vertientes que tiene la estadística, ¿vale? Así de manera general. 00:19:58
Entonces, tenemos la estadística descriptiva y la estadística inferencial. Las dos las vamos a utilizarlas, ¿vale? 00:20:13
Entonces, ¿qué es la estadística descriptiva? Pues como su propio nombre indica, es la estadística, es la parte de la estadística, las herramientas estadísticas que utilizamos para describir los datos que tenemos. 00:20:20
Por ejemplo, yo os digo que quiero describir cómo es España, cómo hacen en sociología, quiero decir cómo sería la edad, si tengo que elegir a una persona y dar todas las características, cuántos años tendría, qué estudios tendría, qué género tendría, etc. 00:20:34
Entonces, lo que hago es, con mis valores, los describo. Por ejemplo, si yo quiero ahora con la media de nuestra clase, que no sé cuántos estamos ahora conectados, estamos conectados 10 personas conmigo. 00:21:00
¿Vale? Pues imaginaos que yo digo, vale, quiero explicar esta clase a una persona externa, pues diría, vale, somos 10, la media de edad la podría expresar y yo describo con los datos que yo tengo una población o una muestra. 00:21:19
Con una población yo hago un muestreo y lo describo. ¿Qué es la estadística inferencial? Es un poco hacer el proceso contrario. A partir de una muestra, inferir cómo sería toda una población. 00:21:37
O sea, yo tengo una población de la que extraigo una muestra y la realizo. Y eso es a lo que se dedica la estadística descriptiva. Yo tengo unos datos que he obtenido y decido extrapolarlos para expresar cómo es toda una población. 00:21:50
Esto es un poco ambiguo, se entiende mucho mejor con ejemplos. 00:22:09
Lo único que sepáis es que tenemos dos vertientes, la estadística descriptiva es la que hemos visto toda la vida, la que hemos estudiado en todos los niveles y además la que se escucha en la calle. 00:22:13
Cuando dan datos del paro, de los salarios, de la edad media de una población, etc., estamos hablando de estadística descriptiva. 00:22:26
Estamos utilizando los datos que tenemos para sacar unas estadísticas y la estadística inferencial es la que os he comentado, 00:22:40
que se basa en hipótesis y que es la que utilizaremos, por ejemplo, para ver si nuestro resultado dudoso lo tenemos que aceptar o no, 00:22:47
para ver si nuestras medidas son iguales o son significativamente diferentes. 00:22:57
Esto es lo que nombro para que sepáis que hay dos vertientes, pero las iremos viendo con detalles que se entienden mucho mejor. 00:23:05
¿Vale? Entonces, bueno, aquí tenéis una definición que la estadística descriptiva se encarga de analizar, organizar y presentar los datos que ya tenemos, que ya hemos recolectado y lo que hacemos es organizarlos y presentarlos de una manera clara y comprensible. 00:23:12
Entonces, el objetivo de la estadística descriptiva es resumir la información disponible para que podamos identificar patrones y características de los datos. 00:23:29
Lo que os he dicho antes de si tenemos un listado con 100 medidas, hacemos una media de esas 100 medidas y lo que hacemos es resumir esa información y podemos analizarla de una manera más sencilla. 00:23:39
Y la inferencial, lo que os digo, va más allá de describir los datos que tenemos y lo que queremos es hacer predicciones, generalizaciones a través de hipótesis sobre una población más amplia, ¿vale? A partir de una muestra. Y esto lo hacemos, pues eso, estimando parámetros, realizando pruebas, etc. 00:23:54
Cuando utilizamos estadística diferencial, la mayoría de las veces necesitamos hacer uso de tablas que están ya establecidas, ¿vale? Son tablas que, por ejemplo, en el examen o para hacer ejercicios las vais a tener disponibles y vamos a tener que buscar ahí información para poder hacer estos contrastes de hipótesis, ¿vale? 00:24:11
Entonces, ¿qué es lo que hacemos? Nosotros tenemos nuestras herramientas estadísticas y tenemos que definir otro término que son las variables. ¿Qué son las variables? Las variables son cada una de las propiedades o cualidades que poseen los individuos que forman una población y que pueden adoptar diferentes valores, objetos de medida u observación. 00:24:35
¿Esto qué quiere decir? Que son los distintos parámetros que yo puedo utilizar para realizar mi estadística. 00:25:00
Una variable, hay de dos tipos, que ahora vemos ejemplos, las cualitativas y las cuantitativas. 00:25:09
Pero, por ejemplo, lo que os he dicho antes de la descripción de la población de la Comunidad de Madrid o de España o de lo que sea, 00:25:16
pues una de las variables, ¿cuál sería? Por ejemplo, la edad. 00:25:24
Estoy utilizando la edad para describirlo, es una de mis variables. Otra cual puede ser el género, por ejemplo. Otra cual puede ser el nivel de estudios, el color de ojos, la masa, lo que me dé la gana. 00:25:29
Son las variables sobre las cuales yo puedo realizar mi estadística. Son las propiedades o cualidades que poseen los individuos y cuando pone individuos se refiere a cada una de las partes de la población estadística. 00:25:48
No hay individuos como personas. Por ejemplo, si yo estoy trabajando en el laboratorio, aquí cuando se refiere a individuos es cada una de mis muestras que yo estoy analizando, cada uno de mis ensayos. 00:26:02
Muestras en la acepción química, tengo una muestra y la analizo. Cada una de ellas tiene unas propiedades que son las que yo puedo adoptar distintos valores y son las que yo puedo medir, observar y, por tanto, analizar. 00:26:18
Y las podemos clasificar según el tipo de valores que pueden tener. Pueden ser o cualitativas con L o cuantitativas. 00:26:33
¿Qué diferencia hay entre unas y otras? Pues cualitativas, como su propio nombre indica, es una cualidad. Son las variables que se basan en una cualidad de nuestra población, de nuestro objeto de estudio. 00:26:41
Y las cuantitativas son, por el contrario, las que se pueden cuantificar, ¿vale? Las que se pueden representar numéricamente, ¿vale? Entonces, darle una pensada ahora, a ver si se os ocurren algunas, pero bueno, veremos ejemplos ahora a continuación, ¿vale? 00:27:01
Entonces, las variables cualitativas, que acordaos de lo de cualidad, ¿vale? Cualidad, no cantidad. Las cualitativas, que también se llaman variables categóricas o atributos, son las variables que no se pueden expresar en forma de números, ¿vale? 00:27:20
Se pueden expresar en forma de categorías. Luego, tenemos dentro de estas variables cualitativas, tenemos dos tipos. 00:27:36
Unas son las que se pueden ordenar, las que dentro de que son una cualidad tienen un cierto orden y otras son las que no, ¿vale? 00:27:48
Entonces, cuando se pueden ordenar las llamamos ordinales y cuando no las llamamos nominales, ¿vale? 00:27:56
Un ejemplo, vamos a decir lo primero, una variable cualitativa. Si os digo una variable cualitativa, por ejemplo, se me ocurre el color de ojos. Yo puedo clasificar a mi población de la Comunidad de Madrid por los que tienen ojos verdes, los que tienen ojos marrones y los que tienen ojos azules. 00:28:02
Yo puedo hacer mi estadística y decir cuántos hay de cada uno, puede ser mi variable que yo utilice, ¿no? ¿Lo puedo expresar como un número? No, ¿no? O sea, yo puedo hacer la media, puedo sumar azul con verde y dividirlo entre dos, no, son variables que son cualitativas, no se pueden cambiar por un número, ¿vale? 00:28:22
Otra variable cualitativa, por ejemplo, si yo estoy dividiendo la población por el nivel más alto de estudios acabados, ¿no? 00:28:42
Imagínate, doctor, licenciado, FP superior, FP grado medio, bachillerato, no sé, me ocurre más eso y primaria. 00:28:51
Imaginaos que yo lo clasifico así. 00:29:06
Eso tiene un orden. Quiero decir, ¿yo puedo ordenar eso de una manera lógica? Sí, ¿no? No puedo ordenar ojos azules, ojos verdes y ojos marrones porque no hay uno que esté por encima del otro, no hay uno que sea mejor, digamos, uno que tú puedas clasificar con un orden lógico. 00:29:07
En cambio, si yo quiero clasificar, quiero comparar la gente que tiene primaria con la gente que tiene una licenciatura o con FP, yo puedo hacer un orden, ¿no? Puedo hacer un orden concreto de esos atributos. Entonces, a ese tipo de variables se las llama cualitativas ordinales, ¿vale? Porque tienen un orden, ¿ok? 00:29:28
Entonces, tenemos para recapitular dos tipos de variables, cualitativa y cuantitativa. Y dentro de la cualitativa, que también se llama categórica o atributo, son sinónimos, dentro de la cualitativa tengo ordinales y nominales. 00:29:48
Ordinales, si tienen un orden lógico. 00:30:05
Calidad del aire, que si te dicen que es buena, mala o regular, 00:30:08
eso no lo puedes cambiar por un número, 00:30:12
pero tú sabes que está primero la buena, luego la regular y luego la mala. 00:30:14
Tiene un orden lógico. 00:30:18
Eso sería una variable cualitativa ordinal. 00:30:19
Si te dicen color de un indicador pH y uno es rojo, 00:30:23
otro es verde, otro azul y otro amarillo, 00:30:31
no tienes un orden lógico. 00:30:32
Son cualidades, tú puedes clasificar por colores, pero no tienes un orden, no puedes poner el verde, luego el azul, luego el amarillo y luego el rojo en un orden lógico. 00:30:34
Es como que ninguno está por encima del otro. 00:30:44
Entonces, eso son cualitativas, ordinales y nominales. 00:30:48
Ejemplos. 00:30:53
Calidad del aire. 00:30:55
Pues es una variable cualitativa, categórica, que es lo mismo, ordinal. 00:30:56
¿Vale? Calidad del aire, las que ponen en los centros de medición, por ejemplo, de estos que hay uno en la Casa de Campo, hay otro en el centro, hay distintos puntos para medir la calidad del aire y en función de la calidad del aire, bueno, pues se mandan avisos a la población, en la página de la EMED y del Tiempo siempre tienes la calidad del aire de tu localidad. 00:31:04
Cuando la calidad del aire supera un cierto umbral, pues empieza a haber restricciones, etc. ¿Vale? Entonces, calidad del aire, muy mala, mala, regular, buena, muy buena. ¿Cómo es? 00:31:30
Entonces, primero pensamos, ¿cuantitativa o cualitativa? 00:31:47
Cualitativa. Yo no puedo sumar muy mala más mala y dividirlo entre dos. No se puede. 00:31:50
¿Es cualitativa y es ordinal? Sí, porque realmente hay un orden. 00:31:56
Yo puedo clasificar muy mala, mala, regular, buena, muy buena. Tiene un sentido. 00:32:00
Otro ejemplo, el tipo de ecosistema. Tenemos un desierto, un bosque, la tundra, la selva, ecosistema urbano, todos los que queramos. 00:32:05
Es una variable que podemos utilizar, es algo con lo que podemos hacer una clasificación, pero es cualitativa claramente, no se puede cambiar por un número, pero no es ordinal, es nominal porque no tiene un orden concreto. 00:32:13
¿Vale? No podemos poner por encima desierto de bosque, por ejemplo, ¿vale? No hay un orden natural, no tiene un sentido ordenarlo, ¿vale? Entonces, esa es la diferencia. 00:32:29
Y luego, aparte de las variables cualitativas, que son las que hemos visto, tenemos las variables cuantitativas, ¿vale? Cuantitativa de cantidad. Acordaos cuando, si alguien se lía, cuali de cualidad, quanti de cantidad. 00:32:43
Entonces, ¿cuáles son las cuantitativas? Las que sí que se les puede asignar un valor en forma numérica, ¿vale? Que puede ser un número dentro de un intervalo. 00:33:00
Estas son las que nos van a interesar a nosotros, porque en un laboratorio de análisis lo que nosotros estamos es cuantificando, estamos dando resultados que la mayoría de las veces son solo variables cuantitativas. 00:33:11
Entonces, en un laboratorio de análisis tienen mayor interés las cuantitativas que las cualitativas. Entonces, igual que las cualitativas las podíamos separar en nominales y ordinales, en ordinales y no ordinales, las cuantitativas las podemos separar en discretas y continuas. 00:33:26
¿Vale? ¿Qué son cada una de ellas? Las discretas son aquellas que solo pueden tomar un valor, un número, perdón, finito de valores entre dos valores. 00:33:46
Y las continuas, las variables que pueden tomar un número infinito de valores entre dos números. ¿Vale? Más fácil. 00:33:58
Vamos a empezar por las continuas que son las más sencillas de entender. Una variable continua es aquella que puede tener cualquier valor. 00:34:06
Vale. Yo, si me voy a pesar o voy a pesar una muestra, ¿qué masa voy a obtener? ¿Puedo obtener cualquier valor o valores concretos? Puedo obtener cualquiera, ¿no? Yo puedo pesar algo que mida un gramo o un kilo y también puede pesar dos kilos. 00:34:13
Y entre medias puede pesar un kilo y medio, y entre medias de eso un kilo 550, 5, 5, 5. 00:34:33
Os puedo poner todos los decimales que yo quiera en el medio. 00:34:39
Otra cosa es que yo no tenga el instrumento para medir con tanta precisión. 00:34:43
Pero tú realmente, por ejemplo, una masa puede tener cualquier valor, no está limitado, cualquier valor positivo. 00:34:48
Por eso decimos dentro de un intervalo. 00:34:55
Entonces, si yo pregunto cuánto pesas, tú me puedes dar cualquier valor. 00:34:57
No hay ningún valor que esté restringido, ¿vale? Cualquier valor positivo. 00:35:04
En cambio, las discretas solo pueden tomar un número concreto de valores. 00:35:08
¿Esto qué quiere decir? Que igual que yo te he preguntado cuánto pesas y tú me puedes dar cualquier número, 00:35:13
si yo te digo que cuántos hermanos tienes, no me puedes decir que tienes 1,87. 00:35:18
tendrás uno o tendrás dos pero no puedes tener cualquier número son números que están cerrados 00:35:23
vale entonces si te pregunto que cuántos hermanos tienes me puedes contestar que cero que uno que 00:35:30
dos que tres que cuatro que cinco y si así hasta el número que alguien tenga hermanos vale pero 00:35:36
nunca me vas a decir que me vas a poder decir que tienes uno y medio vale esto queda claro la 00:35:44
diferencia entre discreta y continua? Porque es muy importante también, ¿vale? Luego para 00:35:49
entender los demás conceptos. Entonces, discretas, las que solo pueden tomar un número finito 00:35:55
de valores y las continuas las que pueden tomar cualquiera, ¿vale? Entonces, ejemplos 00:36:01
de variables discretas. Número de partículas contaminantes en una muestra de aire. Si yo 00:36:09
tengo una muestra de aire y estoy analizando el número, no la concentración, el número 00:36:16
de partículas que hay, yo podré tener una partícula, dos, tres, diez mil, cien mil, 00:36:21
un millón, pero no podré tener tres partículas y media, o tengo dos, o sea, o tengo tres 00:36:27
o tengo cuatro, pero es una entidad que no se puede dividir, ¿vale? Entonces, una variable 00:36:34
discreta sería este número de partículas, ¿vale? Tengo que tener números enteros en 00:36:40
este caso. No puedo tener un número decimal, ¿vale? Número de productos químicos que utilizo en una 00:36:46
planta de tratamiento de aguas. Lo mismo, esto no es una variable tan científica, ¿no? Porque no es 00:36:52
algo que cuantifiquemos así de, pues en esta planta utilizo siete productos, pero lo mismo. Tú puedes 00:36:57
utilizar siete productos. No utilizas siete con cinco ni siete con tres. Utilizas siete, utilizas 00:37:03
Pero no puedes utilizar medio producto, medio tipo de producto. Esos serían ejemplos de variables discretas. Con el COVID, por ejemplo, cuando nos daban los datos públicos continuamente en 2020-2021 del número de casos de COVID que se habían diagnosticado en un día o en una semana. 00:37:08
Nunca te decían, se han diagnosticado 7.825,4, porque no es verdad, porque tú o diagnosticas a 7.825 personas o a 7.826, pero nunca vas a poder diagnosticar a 0,4 personas porque no existe, ¿vale? No existe comunidad. 00:37:35
Entonces, el número de casos de enfermedades respiratorias en una población, variable discreta, ¿vale? Estas clarísimas. 00:37:52
Ahora, variables continuas, las que pueden tomar cualquier valor, cualquier valor dentro de un rango, ¿no? Por ejemplo, si yo hablo de temperatura, realmente la temperatura puede tener cualquier valor, ¿no? Yo puedo tener de fiebre 37 o 38 o 37,5 o 37,55 o 37,58, 3, 4, 9 y así hasta el infinito, ¿vale? 00:38:01
Lo que digo, puede haber, pues la limitación es que no voy a tener un termómetro que me dé exactamente esa precisión, pero técnicamente, teóricamente, yo puedo tener cualquier valor de temperatura, no está limitado, ¿vale? Cualquier valor de temperatura mayor del cero absoluto, porque si no, no existe. 00:38:23
Por eso hablamos de un intervalo, ¿no? Yo no puedo tener menos de 0 grados Kelvin de temperatura, por ejemplo. 00:38:43
Pero a partir de ahí, a partir de los 0 Kelvin, cualquier valor, cualquiera, cualquiera, cualquiera es válido, ¿vale? 00:38:50
Entonces, por ejemplo, hemos hablado antes del número de partículas contaminantes, teníamos un número, ¿no? 00:38:57
Teníamos 10 partículas, 11, 12, 250.000 y era un número entero, no podíamos tener 7 partículas y media. 00:39:03
En cambio, si hacemos un análisis también de un contaminante en el aire, pero estamos hablando de su concentración, pues por ejemplo, en miligramos metro cúbico, unidad de masa entre unidad de volumen, eso es una variable continua porque puede adoptar cualquier valor. 00:39:11
O sea, un contaminante puede ser cualquier masa en cualquier volumen, no hay una restricción, ¿vale? De los datos que teóricamente pueden entrar ahí. La masa es una variable continua totalmente, el volumen es una variable continua también, la temperatura continua, ¿vale? 00:39:29
¿Vale? Esto, decidme que sí, para que me quede tranquila, esto lo estamos entendiendo todos, ¿no? ¿No hay ninguna duda de esto? ¿Estáis ahí? 00:39:52
Por mi parte, bien. 00:40:05
Entonces, concentración de un contaminante, variable continua. Concentración de metales pesados, de cualquier analito que estemos analizando. Una concentración partes por millón, lo mismo, estamos hablando de una masa en una masa o una masa en un volumen, continua. 00:40:07
Puede adoptar cualquier valor. Temperatura, del aire o del agua, cualquier temperatura. Puede adoptar cualquier valor. Lo que os digo, siempre que sea mayor de 0 Kelvin, o sea, cualquier valor en un intervalo. 00:40:25
Nosotros podemos tener cualquier temperatura. No tenemos que tener 7, 8, 9 o 10. Podemos tener 7, lo que sea y con todos los decimales que queramos, ¿vale? 00:40:37
Entonces, estas son las variables estadísticas que vamos a recapitular otra vez. Tenemos dos tipos, las cualitativas que nos expresan una cualidad, un atributo de nuestra población y las cuantitativas que se pueden expresar con forma de un número. 00:40:46
Dentro de las cualitativas con L podemos tener las ordinales, que tengan un sentido lógico o no, que entonces son nominales. 00:41:05
Y dentro de las cuantitativas con N podemos tener las continuas, que pueden adoptar cualquier valor, por ejemplo, la masa, el volumen, la concentración, la temperatura, etc. 00:41:14
Y luego tenemos las discretas, que solo pueden tener valores concretos. 00:41:27
¿Vale? Por ejemplo, otro ejemplo estúpido que estoy aquí en clase. ¿Cuántas mesas hay en mi clase? Pues habrá las que haya, habrá 20, pero no va a haber 20 y media. 00:41:31
¿Vale? Eso sería una variable discreta. O ¿cuántos bolis tienes en el estuche? ¿Cuántos perros tienes en casa? ¿Vale? Esas son variables discretas. 00:41:43
Tu respuesta solo puede tener unos valores predeterminados, el 0, el 1, el 2, el 3 y así hasta donde sea, hasta el infinito. 00:41:52
Pero tú no puedes decir un valor que está entre medias del 0 y el 1, porque no existe, no tienes medio perro. 00:41:58
Entonces, dicho esto, tenemos nuestras variables estadísticas. 00:42:06
Lo que queremos hacer con ellas es poder expresarlas de una manera que nos sean útiles. 00:42:13
Lo que hemos dicho al principio, que la estadística, la función que tiene es presentarnos y organizarnos la información de manera que la podamos utilizar de una manera más intuitiva y más sencilla y más útil al fin y al cabo. 00:42:17
Entonces, la estadística descriptiva, acordaos que lo único que hace es describir nuestros datos. 00:42:33
Nosotros tenemos unos datos y mediante la estadística descriptiva vamos a poder hablar, dar valores que nos representen a esos datos. 00:42:39
Entonces, así, grosso modo, tenemos dos tipos de medidas en la estadística descriptiva. 00:42:50
Una son las medidas de centralización y otra son las medidas de dispersión. 00:42:56
¿Qué son las medidas de centralización? Como su propio nombre indica, nos quieren dar un valor central, un valor representativo. Nos permiten expresar todos los datos correspondientes a una variable mediante un solo número. 00:43:02
Y ese número nos va a servir como representante de los mismos, ¿vale? Antes de seguir con esto, me estoy acordando, os voy a dejar un par de minutos para que le echéis un ojo a esto y me digáis si son discretas o continuas y nominales u ordinales, ¿vale? 00:43:18
Os dejo tres minutillos para que las leáis y ahora lo corregimos en alto, antes de cambiar al siguiente tercio, ¿vale? 00:43:37
Que además está en el cambio de hora y como hay ruido, así en los dos minutillos que se meten en clase lo vais mirando y ahora lo corregimos. 00:43:53
Vale, le hemos hecho un ojo ya 00:44:01
Entonces, clasifica las siguientes variables según su tipo 00:45:37
Cuantitativa, discreto o continuo 00:45:43
Y cualitativa, nominal u ordinal 00:45:45
La primera, masa de un reactivo químico en microgramos 00:45:48
Medida en un laboratorio con su incertidumbre 00:45:51
Esta sería, os digo yo la respuesta, si nadie dice nada 00:45:53
Esta sería cuantitativa, se puede cuantificar 00:45:59
Y sería continua 00:46:02
Estoy midiendo mi reactivo y la masa puede adoptar cualquier valor. 00:46:03
La B, nombre del compuesto presente en una muestra ambiental, por ejemplo, dióxido de carbono, metano, etc. 00:46:08
Cualitativa. 00:46:16
Cualitativa, nominal u ordinal. 00:46:17
Ahí sí, no sé. 00:46:20
¿Tú crees que hay un orden que puedes ordenar metano mejor que dióxido de carbono, por ejemplo? 00:46:22
No. 00:46:30
No tiene un orden lógico, no es como si fuese bueno o malo. Entonces, en este caso es nominal, ¿vale? No hay un orden. 00:46:31
Vale. 00:46:39
Genial. El siguiente, grado de contaminación de un río clasificado como bajo, moderado, alto y muy alto. Está así, ¿no? 00:46:40
Aquí tenemos que es cualitativa, es una cualidad la que estamos evaluando, pero sí que tiene un orden. 00:46:49
Tú puedes hacer una escala, ¿no? Pues puedes poner en una tabla y sabrías cuál poner debajo de otro, cuál sigue al siguiente, ¿no? Estaría claramente primero el bajo, luego el moderado, luego el alto y luego el muy alto. Entonces, sería cualitativa y ordinar. Sí que tiene un orden, ¿vale? 00:46:55
Esta, ¿número de colonias bacterianas formadas en una placa de Petri después de un ensayo de 24 horas? 00:47:14
Cuanti 00:47:20
Cuantitativa, perdón 00:47:24
Cuanti con N, ¿no? 00:47:26
¿Vale? 00:47:28
00:47:28
¿Y ahora discreto o continua? 00:47:28
Discreta 00:47:34
Discreta, muy bien, justo 00:47:35
Esta a veces hay mucha confusión 00:47:37
Es el número de colonias 00:47:39
Tú puedes tener una colonia, puedes tener dos, puedes tener diez, puedes tener diez mil 00:47:41
Pero no puedes tener 1,5, ¿vale? 00:47:44
Perfecto, entonces esta sería cuantitativa 00:47:47
Porque se puede cuantificar, pero discreta 00:47:50
Solo ciertos valores 00:47:52
Ok. Longitud de onda de absorción máxima de un compuesto medida en espectrofotometría en nanómetros. 00:47:53
Esta sería una cuanticontinua. 00:48:05
Justo, perfecto. Cuantitativa porque se puede cambiar por un número y continua porque puede... 00:48:08
Clasificación de muestras según su fuente, industrial, doméstica o agrícola. 00:48:14
Esta sería cualitativa, ¿no? Está dándonos un atributo que no se puede... 00:48:25
¿Y discreta? 00:48:31
No, discreta es sólo si es cuantitativa. Si es cuantitativa, que se puede cuantificar. 00:48:32
Nominal, perdón. 00:48:38
Eso sí, nominal. Si es cuantitativa, es discreto o continua. Y si es cualitativa, nominal u ordinal. Y esta nominal, muy bien, porque no tenemos un orden entre industrial, doméstica, agrícola, hospitalaria, ¿vale? 00:48:39
Luego, tiempo que tarda un equipo en completar una medición. En segundos. 00:48:52
¿Cuantitativa discreta? 00:48:59
¿El tiempo que tarda un equipo? 00:49:04
Continua. 00:49:06
Continua, porque puede adoptar cualquier valor. 00:49:07
Puede tardar un segundo, pero puede tardar 1,3, 1,35, 1,3, 8, 5, 7, 8, 9, 00:49:10
si tenemos el instrumento lo suficientemente preciso. 00:49:16
Y la última, cantidad de nitrógeno total detectado en una muestra de suelo 00:49:20
expresada en miligramos partido por kilo. 00:49:24
Esta claramente es cuanti, porque lo podemos expresar con un número, 17 miligramos. 00:49:32
¿Y continua también? 00:49:37
Y continua también, porque la masa es continua. Entonces, tenemos masa arriba y masa abajo, continua y continua, continua. Perfecto. Ahora os planteo una que siempre hay mucha reflexión y mucha polémica. ¿El dinero, que es discreto o continuo? 00:49:38
Continuo también, ¿no? 00:49:56
Continuo. Es que aquí están las dos vertientes y no hay ninguna que sea correcta. Vale, ¿tú puedes decir quién ha dicho que es continuo? 00:50:00
Vale, pues el continuo 00:50:12
Tú lo que estás diciendo es que tú puedes tener cualquier cantidad de dinero 00:50:14
¿No? Por ejemplo 00:50:16
Y con los céntimos también 00:50:17
Claro, pero tú puedes tener 00:50:19
17 euros 00:50:21
Con 00:50:24
Espérate, a ver cómo lo digo 00:50:26
Puedes tener un euro 00:50:28
Con 25,3 céntimos 00:50:29
No, no, porque el céntimo 00:50:34
No se puede dividir más, porque no existe la moneda 00:50:37
Pero esto lo hemos discutido muchas veces en clase y técnicamente el dinero es totalmente continuo, porque tú en el banco puedes tener cualquier valor. Otra cosa es que no haya una moneda que represente ese valor, porque si hablamos del dinero que tenemos físico, sí que es una magnitud, una variable que es discreta. 00:50:39
Entonces, por ejemplo, un compañero vuestro de presencial decía que, claro, que en la gasolinera tú cuando vas a echar gasolina no te pone que te cueste un euro, te pone 1,6358 a lo mejor, que no tenemos ni siquiera nosotros esos decimales, ¿vale? 00:50:58
Entonces, por eso ahí estaba siempre, lo he preguntado por curiosidad para ver qué salía y me habéis dicho una discreta y otra continua, así que como siempre. 00:51:16
El dinero técnicamente sería una variable continua, podemos tener cualquier cantidad de dinero en el banco, pero si lo queremos sacar es discreta, 00:51:25
porque nosotros vamos a poder tener de un céntimo en un céntimo, no podemos tener una cantidad más pequeña en mano. 00:51:35
Y también surge un poco esta misma discusión, este mismo pensamiento cuando hablamos de la edad, que la edad es discreta o continua. 00:51:41
La edad es continua, ¿no? Porque nosotros simplificamos y a ti te preguntan ¿cuántos años tienes? Y tú dices pues yo tengo 25 años, simplificas, tienes 25 años, pero tú realmente tendrías que decir tengo 25 años, 7 meses, 5 días, 4 horas, 3 minutos, 8 segundos, no sé cuántos milisegundos y tú ahí hasta el infinito, ¿no? 00:51:51
O sea, realmente es una variable que es continua, pero nosotros lo que hacemos es discretizarla cuando queremos hacer estudios y demás. Si tú te hacen una encuesta por la calle, tú no vas a decir que tienes tantos años, tantos meses, tantos días, ¿no? Dices los años que tienes, pero realmente la edad sería una magnitud, o sea, los años que tenemos, el tiempo que tenemos vivos, al final es tiempo, que es continuo, ¿vale? 00:52:14
Espero no haberos liado más con esto, pero bueno, para que veáis que casi cualquier variable con la que trabajemos o con la que podamos utilizar en el día a día la podemos clasificar como discreta, como continua o si es cualitativa, como nominal o como ordinal, ¿vale? 00:52:38
Pues lo que hemos dicho, pensad siempre en, cuando no tengáis muy claro si es cuantitativa o cualitativa, si la puedes cambiar por un número y para discreta continua, pues eso, número de hermanos, número de gatos que tengo o número de hijos, nunca vas a poder tener medio, ¿vale? 00:52:59
¿Vale? Entonces, visto lo de las variables, vamos a retomar aquí con lo que os estaba diciendo, que las medidas de centralización lo que nos hacen es representarnos, expresarnos los datos que tenemos mediante un valor que nos sirve de representante de estos datos, ¿vale? 00:53:16
¿Cuáles son las medidas de centralización? Pues la media, la moda y la mediana, ¿vale? 00:53:38
La que más escuchamos continuamente y la que más utilizamos nosotros como químicos, como técnicos en un laboratorio, es la media, ¿no? 00:53:45
Vosotros hacéis una serie de experimentos, os da unos valores de concentración y luego sumáis todos los valores que os han dado, 00:53:54
lo dividís entre el número total de mediciones y expresáis vuestra media, ¿no? Es lo más habitual. 00:54:01
Pero tenemos distintos tipos de medidas de centralización que cada una tiene unas características, ¿vale? Entonces, ¿qué es la media? Pues lo que hemos dicho al final, no lo tengo aquí explicado, bueno. 00:54:07
La media es la medida que nosotros utilizamos de manera más habitual, es el parámetro más utilizado para estimar el valor medio verdadero y lo que hacemos con la media, que no tenemos aquí la fórmula, es sumar todas nuestras medidas y dividirlas entre el número total de medidas. 00:54:20
La media, normalmente, lo habréis visto muchas veces que se expresa como la X, que es nuestra variable, con una barra encima, con esta barra de aquí. Esa es la media muestral, que nosotros, como trabajadores en un laboratorio con problemas analíticos con los que vamos a trabajar, siempre, la mayoría de las veces, trabajamos con muestras, no trabajamos con poblaciones enteras. 00:54:43
Entonces, la media es esta de aquí, ¿vale? La representación, me refiero a la graficación, es nuestra X con la barrita encima. 00:55:08
Cuando estamos hablando de una media poblacional, de toda la población, la representamos con la letra mu, ¿vale? 00:55:18
Que es lo mismo, es una ponderación, un promedio de todos nuestros valores, ¿vale? 00:55:25
Dividido entre el número total de los datos que tenga nuestra población, ¿vale? 00:55:31
Para que lo sepáis, porque algunas veces veremos la mu, que es la media poblacional, y otras veces veremos la inmensa mayoría, nuestra x con la barra arriba, que es nuestra media muestral. 00:55:35
Entonces, ¿cómo se calcula la media? Como hemos hecho toda la vida. Si tenemos cinco valores, sumamos esos cinco valores y lo dividimos entre cinco. 00:55:46
Si tenemos más, más. Hacemos un promedio de todos nuestros valores. 00:55:55
¿Vale? Otro parámetro que tenemos, la mediana, también es una medida de centralización, nos está buscando el punto intermedio, un valor central, un valor que represente a todos de la manera más precisa, con la mayor inteligencia posible. 00:55:59
No quiero decir preciso y exacto para no liar. Entonces, ¿qué es la mediana? Es el valor central de un conjunto de valores. Es distinto de la media. Por ejemplo, voy a abrir una hoja de cálculo y os pongo aquí datos. 00:56:20
Si yo tengo estos valores, el 5, el 6, el 7, el 8, el 12, el 14 y el 16, ¿vale? Mi media, ¿qué será? Mi media es este valor, el 5, más el 6, más el 7, ¿no? Sumo todos mis valores y con el resultado que me dé, ¿vale? Lo voy a hacer así, pero el próximo día lo hago con papel para que os resulte más claro. 00:56:36
pero bueno, mi media va a ser la suma de todo esto, que me da 68, y lo voy a dividir entre el número de valores que tengo, que son 1, 2, 3, 4, 5, 6 y 7, ¿vale? 00:57:03
Entonces, mi media va a ser 9,71, aproximadamente, ¿no? Mi media va a estar por aquí. Es la suma de todos estos valores divididos entre el número de valores. 00:57:18
¿Qué es mi mediana? Mi mediana es el valor que está en el medio, ¿vale? En el medio cuando los ordeno de mayor a menor o de menor a mayor, da exactamente lo mismo. Aquí los tengo ya ordenados directamente, lo he hecho a posta, ¿vale? Entonces, ¿cuál sería mi mediana aquí? 00:57:30
Yo aquí tengo estos tres valores por encima, estos tres valores por debajo, el que está en el medio es este de aquí, mi mediana es 8, ¿vale? Esto es mi media que me ha dado 9,71 o lo que sea, porque he sumado todos estos valores y los he dividido entre 7, pero mi mediana es el valor que está en el medio, ¿vale? 00:57:45
Muy importante para calcular la mediana, mis datos tienen que estar ordenados, ¿no? Si yo tengo aquí el 4, 27, 5, 8, 12, 48, aquí mi mediana no va a ser el valor, 48, 3, no va a ser este valor de aquí que esté en el medio porque no están ordenados. 00:58:10
Primero los tendría que colocar en orden, ¿no? Colocaría primero el 3, luego el 4, luego el 5, luego el 8, va a dar la casualidad de que es el mismo, pero por casualidades de la vida, 3, 4, 5, 8, 12, 27 y 48, ¿no? 00:58:36
Ahora ya sí que los tengo ordenados, ahora tengo 3 por encima, tengo 3 por debajo y mi mediana es este valor de aquí, ¿vale? Aquí ha dado la casualidad de que justo estaban así, ¿vale? 00:58:57
Pero bueno, entendedme que si esto en vez de un 3 es un 50, ya no saldría, ¿vale? 00:59:11
Porque tendría este número aquí abajo y este no lo tendría. 00:59:18
Entonces, ahora mismo mi mediana sería este de aquí, que es el que está entre medios, ¿vale? 00:59:25
Entonces, los tengo ordenados y busco el valor que hay en el medio. 00:59:31
¿Qué pasaría si yo tengo, en vez de esto, tengo, por ejemplo, esto de aquí? 00:59:34
Y ahora los sigo teniendo ordenados, ¿vale? De menor a mayor, el 3, el 4, el 5, el 8, 12, 27, 48 y 50. 00:59:40
¿Aquí cuál sería mi mediana? Vale, pues tengo 4 valores por aquí, o sea, 3 valores por aquí, 3 por aquí, pero es que no tengo un valor medio. 00:59:51
Si yo tengo aquí 4, aquí 4. Entonces, ¿qué hago? Cogerme la media de estos dos valores. Haría 12 más 8 y lo dividiría entre 2. O sea, 12 y 8, 20. Mi mediana en este caso sería 10. 01:00:00
Entonces, ¿cómo se calcula la mediana? Pues si mi número de valores es impar, es el que está en el medio 01:00:16
y si mi número de valores es par, como no hay ninguno en medio, sería esto de aquí, lo que hago es la media entre los dos valores centrales 01:00:24
Si selecciono estos dos, veis que tengo tres por arriba, tres por abajo, pues hago la media de estos dos, ¿vale? 01:00:33
Y con eso tengo mi mediana. Entonces, ya he definido lo que es mi media y lo que es mi mediana, ¿vale? Ahora, ¿qué es mi moda? La moda, lo sabéis también, estar a la moda, lo que más se lleva, lo que más se repite, ¿vale? 01:00:40
La moda es el valor que más se repite en una distribución. En este caso, no tengo ninguna moda, tengo todos los valores una vez, ¿vale? Si mis datos fuesen, pues ahora tengo aquí un 12, ahora mismo la moda de mi serie de valores es el 12, porque está dos veces, ¿no? 01:00:57
Lo tengo aquí y lo tengo aquí y el resto de los valores solo los tengo una vez. Entonces, en este caso, mi moda es 12. ¿Qué pasa si tengo estos datos? Que tengo un 3, un 12, un 5, un 8, un 12 otra vez, un 27, un 5 otra vez. 01:01:16
Pues que tengo dos modas, es bimodal. Mi moda es el 12 y mi moda es el 5, porque ambas se repiten dos veces. Aquí tengo 5, 5, 12, 12. 01:01:36
En este caso, mis datos tienen dos modas. Es bimodal. Hemos visto los tres tipos de medidas de centralización que vamos a utilizar. La moda no la vamos a utilizar prácticamente nunca. 01:01:52
La tenemos que conocer, pero a nivel científico, a nivel analítico, a nuestro nivel como químicos, no es algo que nos aporte una información muy valiosa. 01:02:07
Tenemos que saber lo que es, tenemos que saber calcularlo, pero nosotros vamos a utilizar la mayor parte de las veces la moda y la mediana puede tener sentido. 01:02:19
La mediana, esto que os pone aquí es muy importante, es más robusta que la media ya que no se ve afectada por valores extremos anómalos. 01:02:30
¿Os acordáis de lo que es que algo sea robusto, que un método sea robusto? 01:02:40
Un método robusto, una medida robusta, es aquella que varía poco cuando hay modificaciones, que se aguanta firme ante los cambios. 01:02:44
digamos, pensar en un árbol gordo 01:02:58
es muy robusto, si sopla el viento no se cae 01:03:00
uno fino es poco robusto, se cae 01:03:02
cuando hay una modificación, cuando hay un cambio 01:03:04
un método que es robusto 01:03:06
no se ve tan afectado 01:03:09
como uno que no es tan robusto 01:03:10
entonces, ¿qué quiere decir? 01:03:12
que la mediana es más robusta que la media 01:03:14
ya que no se ve afectada 01:03:16
por valores extremos anómalos 01:03:18
¿os cuadra esto? 01:03:21
¿le veis lógica? 01:03:24
Sí, ¿no? Vamos a pensar, creo que tengo aquí el dato. Vale, los salarios de un país, por ejemplo, en España, los ingresos están distribuidos de una manera que no es muy desigual, ¿no? 01:03:25
Hay poca gente que gana mucho, mucho dinero y luego hay mucha gente que gana poco dinero, ¿no? 01:03:41
Está repartido de una manera que no es una distribución equitativa en el sentido de que no es regular, ¿no? 01:03:47
Que no es como un espejo, que no la podemos ver, que hay la misma cantidad de gente que gana mucho dinero que la misma cantidad de gente que gana poco, ¿no? 01:03:59
tampoco está desplazado esta campana hacia que hay mucha más gente que gana menos dinero que la poca gente que gana mucho, ¿vale? 01:04:10
Pues, por ejemplo, hay mucha más gente ganando 1.000 euros que lo que está ganando, yo que sé, un futbolista que gana 15 millones de euros al año, ¿vale? 01:04:21
Es a lo que voy con lo de que no está como distribución, no como algo social, como distribución estadística, no es regular, ¿no? 01:04:29
Está distribuida de una manera homogénea, ¿vale? 01:04:36
Entonces, por ejemplo, en España, estos son datos reales del INE, del Instituto Nacional de Estadística, del año 2021. 01:04:39
Nos dice que la media del salario en España es 28.400 euros y nos dice que la mediana son 20.300. 01:04:47
¿Cuál es más representativa en este caso? ¿Cuál creéis que tiene más… que lo que buscamos con las medidas de centralización es que nos representen, bueno, pues toda nuestra población, que nos la representen en un número, ¿no? 01:05:00
Bueno, nadie contesta, pero el salario mediano en este caso es mucho más representativo. ¿Alguien iba a decir algo? ¿Qué he escuchado ahí? Bueno, ¿por qué? Porque la media puede ser alta porque los ingresos que son muy, muy, muy altos, imagínate, pues eso, todos los futbolistas que ganan, me invento los datos, que ganan 50 millones de euros al año. 01:05:33
Cuando hacemos la media, esos 50 millones de euros están entrando como un valor del numerador 01:05:57
y entran exactamente igual que el valor de los que ganan normal y los que ganan, pues eso, 01:06:03
1.000 euros, 1.500, 2.000, 800 euros, lo que sea. 01:06:08
Entran en el mismo saco. 01:06:13
Entonces, cuando dividimos, están aportando también toda su contribución, contribuyen de la misma manera. 01:06:15
En cambio, ¿qué pasa con la mediana? 01:06:22
que la mediana lo que nos está dando son los valores centrales. Entonces, los datos que son muy extremos, o sea, el que gana 50 millones de euros por un lado 01:06:24
y el que gana 10 euros por el otro, no están afectando. Aquí te digo al cambiar los 50 millones por 1.000 millones porque ese valor no va a afectar a la mediana. 01:06:33
La mediana va a seguir siendo el valor que está en el medio, ¿vale? Por ejemplo, en el caso que hemos hecho al principio, voy a poner aquí, esto lo voy a borrar para que no sea un lío, voy a quitarle el color, ¿vale? 01:06:44
Imaginad que tenemos estos datos, ¿no? Yo he hecho, bueno, vamos a hablar de edad, la edad media de la gente que estudia este módulo, ¿no? 01:07:00
Este ciclo, perdón, o bueno, este módulo en concreto. Entonces, tenemos a alguien que tiene 17 años, otro que tiene 18, otro también que tiene 17, 01:07:10
otro que tiene 19, otro que tiene 23, otro que tiene 40, otro que tiene 38 y otro que tiene 18 otra vez, ¿vale? 01:07:20
Imaginaos que esta es mi muestra, esto es lo que tengo yo, ¿vale? 01:07:28
¿Cuánto es mi media de edad? Mi media, la voy a escribir aquí, mi media es la suma de todos estos, 01:07:32
Es 17 más 18 más 17 más 19 más 23 más 40 más 38 más 18 y lo divido entre el número de valores que tenemos, que son 1, 2, 3, 4, 5, 6, 7 y 8. 01:07:42
¿No? Entre 8. Y tenemos que la edad media de la gente que estudia este ciclo son 23,75 años. ¿Vale? Ahora, voy a calcular la mediana. Pues los ordeno, ¿vale? Voy a ordenar los datos de menor a mayor y me voy a buscar el valor que esté en el medio. 01:08:10
¿Vale? Este, este, este, este, pues bueno, mi valor en el medio, tengo cuatro por abajo, ¿no? Como son siete, son ocho, tres, cuatro, cinco, seis, siete y ocho, son ocho valores que he puesto, he puesto siete, ah, no, he puesto ocho, perdonadme, ¿vale? 01:08:32
Entonces tengo estos cuatro, estos cuatro, mi mediana va a ser la media de los dos valores centrales, ¿no? Dejo tres por arriba, tres por abajo. Como es número par, entonces mi mediana será la media de estos dos. Mi mediana es 18 más 19 dividido entre 2, ¿no? 01:08:52
Y me da que mi mediana es 18,5. Tengo mis datos de mi media y mis datos de mi mediana. Ahora, imaginaos que se matricula una persona que tiene 103 años. ¿Cómo cambia mi media y cómo cambia mi mediana? 01:09:14
Mi media es lo mismo que tenía antes, la suma de todo esto dividido entre 9, ¿no? Porque ahora tengo una persona más. La suma de todos estos valores dividido entre 9, ¿vale? 01:09:36
y me ha subido la media, ¿no? De 23,75 que tenía me ha subido a 32,55, 01:09:58
pues se ha metido una persona de 103 años. 01:10:05
Ahora, ¿qué pasa con la mediana? 01:10:08
Ahora tengo estos valores por encima, estos valores por debajo, mi mediana son 19 años. 01:10:10
Mi mediana prácticamente no se ha modificado. 01:10:17
Aunque yo haya metido aquí una persona de 103 años, mi mediana está prácticamente igual 01:10:20
porque no le afectan los valores extremos de la misma manera que a la media. 01:10:25
Imagínate que mi persona de 103 años es una persona, es una cosa rarísima de la naturaleza y tiene 180 años. 01:10:29
Mi media son 41,1, pero mi mediana siguen siendo 19, a mí me da igual. 01:10:38
Y si mi persona tiene 1800 años, la media de edad de mi clase son 221, pero mi mediana son 19. 01:10:43
Es que mi mediana no se ve afectada por los valores extremos. Igual que si esta persona tiene cero años, mi media va a cambiar, pero mi mediana se queda invariable. ¿Esto qué quiere decir? Esto es lo que quería deciros con lo de que la mediana es más robusta. 01:10:50
Pero en nuestro caso, para lo que nosotros utilizamos nuestras medidas de descentralización, la media es mucho más representativa. 01:11:07
Es el valor que vamos a utilizar nosotros como medida de descentralización, es la media, claramente. No hay otro que se le compare. 01:11:16
Entonces, ¿qué pasa? Que como en España, en todos los países, en la mayoría de los lugares, la distribución de los ingresos no sigue un patrón regular, 01:11:25
hay gente que gana mucho, otro grupo de gente más abundante que gana normal y otro grupo muy grande de gente que gana poco, etc. 01:11:38
Sería mucho más representativa la mediana que la media, porque los valores extremos estos que tenemos, porque no es algo que sea homogéneo, 01:11:48
van a afectar mucho menos. Esto como ejemplo para que penséis en que media y mediana no tienen por qué ser iguales salvo que tengamos una distribución normal, que ya veremos lo que es. 01:11:54
Y los dos lo que nos dan es una representación cada una con unas fortalezas y unas debilidades de cómo sería nuestro valor central si tenemos un número de valores distintos. 01:12:07
Hemos tomado una muestra de la población y lo hemos analizado. Lo que hacemos es, para calcular la media, sumamos todos los valores y lo dividimos entre el número total de medidas, que lo llamamos n, la letra n, y para hacer la mediana ordenamos de menor a mayor nuestros datos y cogemos el valor central. 01:12:19
Si son números pares, no hay un valor central, ¿no? Tenemos dos valores centrales y nos quedan la misma cantidad de números por arriba que por abajo. Pues hacemos la media de esos dos números, o sea, los sumamos y dividimos entre dos y tenemos la mediana, ¿vale? 01:12:45
¿Vale? Entonces, lo que os he dicho, la mediana. ¿Qué es lo que nos hace la mediana? Nos divide nuestros datos, los datos que tengamos, en dos mitades. Vamos a tener la mitad por arriba y la mitad por abajo. ¿Vale? 01:13:02
La moda, ¿qué nos va a dar? El dato que más se repita, el dato que más veces tengamos. Y la media nos va a dar un compendio, un promedio de la suma de todas nuestras medidas dividida entre el número total de medidas que llamamos n. 01:13:20
Y estas son las medidas de centralización. 01:13:34
Os he hablado de la mediana, que os he dicho que es tener la mitad de los valores por encima y la mitad de los valores por abajo. 01:13:41
La mediana, si dividimos nuestra muestra completa en dos, sería el punto que está en el medio. 01:13:52
Imaginaos que tenemos esta barra de aquí, roja, que están todos nuestros valores ordenados. 01:14:00
Pues nuestra mediana es la que lo parte en dos, ¿vale? 01:14:07
¿Qué pasa? Que podemos hacerlo también de distintas maneras. 01:14:10
Igual que nuestra muestra la partimos en dos para calcular la mediana, la podemos partir en cuatro y lo que tenemos son los cuartiles. 01:14:13
El cuartil dos será la mediana, que nos separa la mitad de los datos por debajo, la mitad por arriba. 01:14:22
pero el 1 que nos separa el 25% de los datos están por debajo, el 25% de los datos están por arriba, ¿vale? 01:14:28
Esos serían los cuartiles, en vez de dividir entre 2, dividir entre 4. 01:14:37
Y tenemos también los percentiles, que esto os lo comento, no es algo que vayamos a utilizar nosotros de manera habitual 01:14:43
pero porque seguramente lo hayáis escuchado en un montón de ocasiones en distintos casos, ¿no? 01:14:49
Por ejemplo, cuando los niños, cuando los bebés nacen y demás, se dice, no, está en el percentil 80. 01:14:55
¿Qué significa el percentil 80? 01:15:04
Significa que hemos dividido toda nuestra muestra, todo el rango que tenemos, 01:15:06
desde el más bajo hasta el más alto, en 100, y partimos en el 80. 01:15:11
¿Eso qué quiere decir? 01:15:16
Que solamente el 20% de los valores están por encima y el 80% de los valores están por debajo. 01:15:17
Cuando dicen, no, el niño este es muy alto, es altísimo, está en el percentil 96. 01:15:24
¿Eso qué significa? Que el 96% de los niños son más bajitos que él y el 4% son más altos. 01:15:29
Entonces, si te dicen que estás en el percentil 50, estás en la mediana. 01:15:37
¿Qué es lo que quiere decir? Que la mitad de los niños son más altos y la mitad de los niños son más bajos. 01:15:41
Este es el significado. 01:15:45
Entonces, igual que tenemos la mediana que nos separa 50-50, podemos tener, porque hemos separado en dos nuestra muestra, podemos tener nuestros cuartiles, que es cuando los separamos en cuatro, el 0, 25, 50, 75, 100, sería hacer esas divisiones, y podemos tener los percentiles, si lo que hacemos es dividirlo en mil. 01:15:47
Aquí, no sé si lo veréis más claro, el rango, que esto es una medida de dispersión, que son las que vamos a ver ya el próximo día, para no daros hoy mucha más información. 01:16:13
Entonces, aquí tenemos, del valor más bajo al valor más alto son todos los valores que tenemos nosotros, ¿no? El rango. 01:16:26
Entonces, tenemos aquí nuestra mediana, que lo que hace es separarnos, la mitad de los datos están por debajo y la mitad están por encima. 01:16:33
Y luego tenemos los cuartiles, que lo que nos dicen es, este de aquí, por ejemplo, nos dice que todos los datos que estén por debajo de aquí van a ser un 25% y todo lo demás va a estar por encima. 01:16:41
Van a ser un 75% los que están por encima. Es exactamente el mismo concepto que con la mediana. 01:16:54
Entonces, reitero que nosotros vamos a utilizar la media en nuestros estudios, en nuestros análisis del laboratorio, etc. 01:17:00
Pero tenemos que saber que también son medidas de centralización la mediana y la moda y que la mediana es más robusta que la media. 01:17:12
¿Qué pasa? Que nosotros normalmente, por ejemplo, hacemos un análisis y ¿qué resultados nos salen? 01:17:21
nos salen resultados que tienen mucha precisión, ¿no? Son muy parecidos entre ellos porque es lo que nosotros estamos buscando conseguir. 01:17:26
Nuestra medida por excelencia va a ser la media, que lo que nos va a hacer es, vale, yo he conseguido en uno de mis ensayos, 01:17:33
mi resultado es que tengo una concentración de 0,87 molar, en otra tengo de 0,88 y en otra tengo de 0,89. 01:17:39
¿Qué valor doy yo como valor final? Pues la media de esos tres valores, ¿no? Sumo los tres y los divido entre tres. 01:17:50
Y no se nos ocurre dar la mediana y no se nos ocurre dar la moda tampoco. Entonces, a nivel laboratorio, la media va a ser nuestra medida de centralización por excelencia. 01:17:56
Que lo que digo, que tampoco a los que ya estáis en segundo y habéis hecho prácticas no os cuento nada nuevo y a los demás yo creo que tampoco porque bueno, 01:18:10
estas son las medidas que más utilizamos para todo, ¿no? Sacar la media de los valores que sean para poder analizarlo, para poder hacernos una idea con ese único número de cómo es una población total. 01:18:17
Hemos visto toda la introducción a la estadística, lo que es población y muestra, los tipos de variables que tenemos 01:18:34
y nos vamos a quedar aquí para que no sea mucho más en las medidas que utilizamos en estadística descriptiva de centralización 01:18:49
para dar un solo resultado que nos represente todos los valores 01:18:58
Y el próximo día, que no es festivo ni nada, el 12, el jueves 12, vamos a comenzar con las medidas de dispersión, que son la otra serie de medidas que realizamos en estadística descriptiva para que nuestros datos no solo nos representen qué valor es, sino cómo de preciso es ese valor, cómo de cerca están los datos entre ellos. 01:19:02
Materias:
Química
Niveles educativos:
▼ Mostrar / ocultar niveles
  • Formación Profesional
    • Ciclo formativo de grado superior
      • Primer Curso
      • Segundo Curso
Subido por:
Elena A.
Licencia:
Todos los derechos reservados
Visualizaciones:
43
Fecha:
8 de diciembre de 2024 - 9:59
Visibilidad:
Clave
Centro:
IES LOPE DE VEGA
Duración:
1h′ 19′ 31″
Relación de aspecto:
1.78:1
Resolución:
1280x720 píxeles
Tamaño:
219.30 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid