1 00:00:00,180 --> 00:00:07,799 Pues nada, la semana pasada habíamos empezado con el tema de expresión de los resultados analíticos, 2 00:00:07,919 --> 00:00:16,879 que ya os había comentado que es el tema más largo que tenemos, el tema 5 es igual de largo que todos los demás puntos 3 00:00:16,879 --> 00:00:20,839 y el que tiene más material. 4 00:00:21,739 --> 00:00:26,820 Entonces, habíamos empezado relacionándolo con el control de calidad 5 00:00:26,820 --> 00:00:35,079 y habíamos visto que la estadística al final está presente en prácticamente todas las etapas del proceso analítico. 6 00:00:36,000 --> 00:00:42,820 Habíamos definido muestra y población y habíamos hecho también una primera diferenciación 7 00:00:43,359 --> 00:00:46,840 entre estadística descriptiva y estadística inferencial. 8 00:00:47,380 --> 00:00:52,359 La descriptiva la que llevamos usando toda la vida, las medias, las modas, las medianas, 9 00:00:52,359 --> 00:00:56,100 que nos ayudan a ordenar los datos que tenemos y estructurarlos 10 00:00:56,100 --> 00:01:09,299 Y la inferencial que hace uso de hipótesis para calcular unas probabilidades que podrían ocurrir. Lo que intentamos es buscar una generalidad a partir de unos datos que tengamos. 11 00:01:09,299 --> 00:01:18,939 Habíamos visto también que para poder analizar los datos necesitamos tener las variables, que son esas propiedades que podemos medir de alguna manera 12 00:01:18,939 --> 00:01:30,640 y habíamos visto que teníamos de dos tipos, cualitativas y cuantitativas. Las cualitativas son las que expresan una cualidad, las que no son sustituibles por un número 13 00:01:30,640 --> 00:01:43,500 y las cuantitativas, las que se pueden cuantificar, las que pueden ser sustituidas por números, así como he dicho, un poco de andar por casa pero que se entiende mejor. 14 00:01:44,480 --> 00:01:54,299 Dentro de las cualitativas, podían tener un orden lógico o no. Habíamos hablado, por ejemplo, de ecosistemas, creo, o de, yo qué sé, si hablamos de minerales, 15 00:01:54,299 --> 00:02:04,000 que sean rocas metamórficas, que sean ígneas. Es una manera de clasificar, podemos hacer estadística con eso, pero no hay un orden lógico entre las distintas clases. 16 00:02:04,000 --> 00:02:21,740 En cambio, si clasificamos, pusimos el ejemplo de nivel de estudios, podemos ordenar quien tiene un doctorado, una carrera universitaria, un ciclo de grado superior, un ciclo de grado medio, el bachillerato. 17 00:02:21,740 --> 00:02:41,960 Podemos hacer un orden que puede tener un sentido. Se puede decir cuál está más arriba o más abajo. No digo mejor o peor, sino que se puede ordenar. Lo mismo que con la calidad del aire, que se establece como muy buena, buena, regular, mala, muy mala, por ejemplo. 18 00:02:41,960 --> 00:02:59,960 Entonces, tenemos eso, tenemos las ordinales, que son estas que sí que se pueden ordenar, y las que no son expresables en forma de categorías, las nominales. 19 00:02:59,960 --> 00:03:13,780 Luego habíamos distinguido al principio cualitativa-cuantitativa y la cuantitativa es la que más nos va a interesar a nosotros en un laboratorio analítico, la que podemos expresar con números. 20 00:03:14,659 --> 00:03:22,819 Teníamos también dos tipos, discreta y continua. Discreta que solo puede tomar unos valores concretos y continua que puede tomar cualquier valor. 21 00:03:22,819 --> 00:03:34,680 Habíamos puesto en discreta, por ejemplo, el número de protones que tiene un átomo, o una más de estar por casa, el número de hermanos que tengo. 22 00:03:34,680 --> 00:03:50,139 Puedo tener cero, puedo tener uno, pero no puedo tener medio. Continuas, cualquier valor puede tomar. ¿A cuántos grados estamos? ¿A 37 o a 37,5 o a 37,4, 37,45, 37,4, 5, 8, 3, 2? 23 00:03:50,139 --> 00:04:05,180 Entonces, técnicamente la temperatura puede ser cualquiera, puede tener infinitos decimales, la cosa es que no tenemos la capacidad de medir a tanto decimal, de llegar tan al detalle, pero por poder puede tomar cualquier valor. 24 00:04:05,180 --> 00:04:31,899 ¿Vale? Y habíamos visto que con nuestros datos lo que podemos hacer es ordenarlos de distintas maneras, ¿no? Y tenemos las medidas de centralización, que lo que nos permiten es expresar todos los datos que tenemos de una serie de valores mediante un solo número y ese número representa a los demás. 25 00:04:31,899 --> 00:04:54,779 Entonces, habíamos visto la media, la moda y la mediana. Si os acordáis, la moda es el valor que más se repite, es la que menos interés analítico tiene. Es muy fácil de calcular porque no tenemos más que ver nuestros datos, ver si hay alguno que se repite más que otro y esa va a ser la moda. 26 00:04:54,779 --> 00:05:17,019 Si tenemos dos que se repiten en igual medida más que los demás, tenemos dos modas. Y con la moda no se hace la media. Quiero decir, si yo tengo una serie de valores y se repiten el mismo número de veces, el 36 y el 34, la moda es 36 y 34, no es 35. 27 00:05:18,019 --> 00:05:30,199 Luego tenemos la media, que es la que hemos utilizado más habitualmente en nuestra vida cotidiana y que es la que más vamos a utilizar o utilizamos en un laboratorio. 28 00:05:30,839 --> 00:05:37,819 La media se calcula sumando todos los valores que tenemos y dividiéndolo entre el número total de valores. 29 00:05:39,060 --> 00:05:44,759 Y luego, por último, tenemos la mediana. ¿Qué es la mediana? La mediana es el valor que está justo en el medio. 30 00:05:44,759 --> 00:06:01,899 ¿Esto qué significa? Que tenemos la mitad de nuestros datos por encima, la mitad de nuestros datos por debajo, ¿vale? Y como la calculábamos, bueno, la media lo que hemos dicho, sumamos todos y dividimos entre el número, ¿vale? 31 00:06:01,899 --> 00:06:17,040 Bien, por si no tenéis clara esta nomenclatura, esto de aquí es el sumatorio, que significa sumar los valores que sean desde x sub i, o sea, de cada uno de los valores. 32 00:06:17,720 --> 00:06:28,259 Empezando, está ahí, la primera es un 1, ¿vale? El primer valor que tenemos y la última es n, el último valor que tenemos y dividimos entre n, ¿vale? 33 00:06:28,259 --> 00:06:41,660 Lo digo por si no sabéis la nomenclatura, que no os preocupéis. Esto es lo mismo que escribir x1 más x2 más x3 más x4 más x5 dividido entre 5, ¿vale? Es exactamente lo mismo. 34 00:06:43,899 --> 00:06:54,000 Entonces, la mediana, que es lo que estábamos diciendo, para calcularla lo que tengo que hacer es ordenar todos mis datos y a continuación ver cuál está entre medias, ¿vale? 35 00:06:54,000 --> 00:07:09,420 Entonces, por ejemplo, una serie de datos que yo pueda tener. 36 00:07:09,420 --> 00:07:30,600 Pues si tengo el 72, 71, 70, 71 y 73, ¿cuál sería aquí mi mediana? ¿Cómo lo haríamos? Esto no sé si lo llegamos a hacer el último día, creo que sí. 37 00:07:31,379 --> 00:07:32,240 Sí, sí lo hicimos. 38 00:07:32,240 --> 00:07:56,129 Si lo hicimos, ¿no? Vale, que serían 70, 71, 72 y 73 y este es el que está entre medias, ¿vale? Y esto no sé si lo habíamos llegado a ver, que, corregidme si no, la mediana es mucho más robusta que la media, ¿no? 39 00:07:56,689 --> 00:07:57,709 Sí, también lo vimos. 40 00:07:57,709 --> 00:08:11,649 Esto vale, porque si aquí hacemos la media, pues esto nos da de media 70 con algo. Si metemos un valor extremo, la media va a cambiar mucho, pero la mediana va a quedar muy parecida a la que estaba. 41 00:08:12,389 --> 00:08:27,779 Y a colación de esto, usted me ha puesto, por ejemplo, los datos de ingresos en España en 2001, que es lo que aparece en el NIE, que las medias son 28.400, porque es mayor que la mediana. 42 00:08:27,779 --> 00:08:48,159 Alguien tiene un micrófono abierto, creo. Que la media es mucho mayor, vamos, mucho, es significativamente mayor que la mediana porque como hay datos que son muy anómalos, no es habitual ganar 5 millones de euros al año, pero hay gente que lo gana. 43 00:08:48,159 --> 00:09:04,720 ¿Vale? Entonces, como son datos que son muy extremos, están muy fuera de la tendencia, en la media sí que se nota mucho el valor, pero en la mediana, como los valores extremos se anulan, digamos, no repercute tanto. 44 00:09:04,720 --> 00:09:12,879 Entonces, cuando los datos son muy desiguales, la mediana nos puede dar un valor mucho más real, mucho más representativo que lo que nos da la media. 45 00:09:15,539 --> 00:09:23,980 Entonces, por ejemplo, para la determinación del pH de una muestra de agua, se realizó una serie de mediciones obteniendo los siguientes valores. 46 00:09:24,659 --> 00:09:32,240 Y bueno, pues tenemos los valores que tenemos aquí. Calculamos la media, la mediana y la moda. 47 00:09:32,240 --> 00:09:45,759 Lo primero que haríamos para la media, simplemente sumar 7 con 2, más 6 con 8, más 7 con 5, más 7 con 0, más 7 con 1, más 7 con 3, más 7 con 5, más 6 con 9, más 7 con 3. 48 00:09:45,759 --> 00:09:52,820 Y dividir entre el número de valores, que son 1, 2, 3, 4, 5, 6, 7, 8 y 9. 49 00:09:54,320 --> 00:09:55,700 El resultado que me dé. 50 00:09:55,700 --> 00:10:07,620 Esto habitualmente no lo hacemos así, quiero decir, no nos ponemos con un papel y empezamos a sumar y dividimos entre lo que sea, aunque lo hagamos con la calculadora, lo hacemos con las funciones estadísticas de la calculadora, ¿vale? 51 00:10:07,620 --> 00:10:33,279 Entonces, para el próximo día, haceros con una calculadora científica, la más típica son las de marca Casio, no sé si tenéis, supongo que tendréis alguna por casa, si no, si os tenéis que hacer con alguna, aseguraos, si os vais a comprar de cero, que pueda hacer regresiones, porque lo vais a necesitar para hacer los ajustes. 52 00:10:33,279 --> 00:10:36,179 os digo que son muy baratas 53 00:10:36,179 --> 00:10:38,740 y yo creo que ahora prácticamente todas lo traen 54 00:10:38,740 --> 00:10:40,419 yo tengo una antigua que no las hace 55 00:10:40,419 --> 00:10:43,840 antigua, yo que sé, de hace igual 25 años 56 00:10:43,840 --> 00:10:46,980 y tengo una que me compré hace poco 57 00:10:46,980 --> 00:10:49,139 que me costó menos de 20 euros 58 00:10:49,139 --> 00:10:51,899 que ya tiene todas las funciones necesarias 59 00:10:51,899 --> 00:10:53,120 puede ser básica 60 00:10:53,120 --> 00:10:55,899 pero aseguraos que puede hacer regresiones lineales 61 00:10:55,899 --> 00:11:00,480 lo preguntáis si no en la tienda donde lo compréis 62 00:11:00,480 --> 00:11:16,639 Entonces, el próximo día sí que me interesa que la tengáis porque sí que es verdad que para el examen, bueno, en general la vais a tener que saber utilizar porque la vais a usar mucho y para el examen la tenéis que traer, va a haber un apartado grande de ejercicios donde la vais a tener que utilizar. 63 00:11:17,639 --> 00:11:31,000 Entonces, me gustaría que os familiarizaseis porque, aunque todas son muy, muy parecidas, sí que es verdad que en algunas la varianza, por ejemplo, muestra de poblacional, pues viene escrito diferente. 64 00:11:31,879 --> 00:11:39,580 Entonces, bueno, para que lo vayáis haciendo a la vez que yo y si alguien tiene dudas porque no le da lo mismo, igual es que está metiendo la función que no es. 65 00:11:39,580 --> 00:11:57,820 ¿Vale? Entonces, bueno, lo que os digo, lo haríamos con la función media de la calculadora que en la escasio, que seguro que es la que tenéis casi todos, bueno, pues es poner la función estadística y la media, lo que os comenté, es una X con la raya arriba. ¿Vale? 66 00:11:58,600 --> 00:12:06,039 La mediana y la moda no te la hacen, por lo menos las calculadoras muy básicas, como la que utilizo yo normalmente, no te la hacen, ¿vale? 67 00:12:06,059 --> 00:12:15,059 La moda, lo que hay que hacer es fijarse. En la moda lo único que nos podemos equivocar es porque se nos traspapela un poco al mirar. 68 00:12:15,059 --> 00:12:24,539 Pero aquí si lo vemos, tenemos el 7,3 que se repite dos veces y el 7,5 que se repite dos veces. 69 00:12:24,539 --> 00:12:30,860 Entonces, la moda de esta serie de valores es 7,3 y 7,5, bimodal, dos modas. 70 00:12:31,759 --> 00:12:35,580 Y luego, la mediana, tendríamos que hacer lo que acabamos de hacer en la hoja anterior, ¿no? 71 00:12:36,179 --> 00:12:43,200 Ordenarlos de menor a mayor o de mayor a menor, que es lo mismo, y ver cuál es el que está entre 10, ¿vale? 72 00:12:43,460 --> 00:12:52,700 Entonces, bueno, si hacéis eso, la media aritmética nos da 7,2, la mediana nos da 7,2 y la moda nos da 7,3 y 7,5. 73 00:12:52,700 --> 00:13:05,580 ¿Qué nos indica que la media y la mediana sean iguales? Pues que probablemente, no tiene por qué, pero es habitual que esto pase cuando los datos son bastante homogéneos, que no hay ningún valor que se dispare. 74 00:13:05,580 --> 00:13:30,879 O sea, si entre estos pH de repente tuviésemos uno que fuese 3,4, cambiaría mucho la media respecto a la mediana. También os digo que si tuviésemos ese pH de un 3,4, lo primero que haríamos sería mosquearnos y decir, vale, a ver si ese valor tiene que estar ahí o no, a ver si es que me he equivocado midiendo o realmente sí que es un dato que tengo que considerar. 75 00:13:30,879 --> 00:13:43,620 Y eso lo veremos con la parte de estadística inferencial, el rechazo de resultados durosos. Entonces, hemos visto las medidas de centralización y ahora vamos a las de dispersión. 76 00:13:44,559 --> 00:13:58,419 Igual que las de centralización, a ver, un segundín, voy a ver si ya os habéis conectado más o seguimos, seguimos muy pocos, pero bueno, y esto está grabando, ok, vale. 77 00:14:00,879 --> 00:14:17,379 Lo que os decía, que igual que las medidas de centralización nos indican cuál es la centralidad, cuál es el valor central, el más representativo, las de dispersión nos dicen cómo de cerca están esos valores entre sí, cómo de dispersos están, cómo de homogéneos son. 78 00:14:17,379 --> 00:14:36,700 Entonces, tenemos distintos parámetros para medirlo. Tenemos el rango, que es el más sencillo, la varianza y la desviación. Vamos con el primero, con el rango. ¿Qué es el rango? El rango, que se llama también amplitud o recorrido, son sinónimos. 79 00:14:36,700 --> 00:14:51,539 Yo lo suelo llamar rango, pero si os dicen recorrido es exactamente lo mismo, es el valor mayor menos el valor menor. Si queremos ver, por ejemplo, el rango de pH de estos valores, ¿cuál sería? 80 00:14:55,509 --> 00:14:58,070 Has dicho el valor mayor menos el menor. 81 00:14:58,470 --> 00:14:58,750 Sí. 82 00:14:59,690 --> 00:15:02,269 Pues 7,5 menos 6,8. 83 00:15:02,870 --> 00:15:09,350 Menos 6 con 8, efectivamente. Entonces, lo que nos dice es en qué rango se extiende eso, en qué intervalo. 84 00:15:09,450 --> 00:15:14,710 Por ejemplo, si os digo qué rango de edad, siempre pongo el ejemplo de la edad porque lo veo muy visual. 85 00:15:15,129 --> 00:15:23,090 ¿Qué rango de edad tenemos en esta clase? Pues probablemente haya alguien que tenga, yo que sé, 55 y haya alguien que tenga 18. 86 00:15:23,090 --> 00:15:38,629 Pues nuestro rango, o sea, el intervalo en el que nos movemos es entre 18 y 55. Se coge el valor mayor y se le resta el menor. No tiene mucho valor analítico, pero nos puede dar una primera aproximación. 87 00:15:38,629 --> 00:15:54,809 Si nosotros nos dan un rango, ya sabemos en qué nos estamos moviendo. Lo que no sabemos es cuánta gente hay de 50, cuánta gente hay de 60, cuánta gente hay de 30. Nos está dando solo la información de en qué intervalo nos estamos moviendo. 88 00:15:54,809 --> 00:16:11,649 Luego tenemos la varianza, ¿vale? Que la varianza se representa con S al cuadrado, ¿vale? No S, sino S al cuadrado es la varianza, cuando estamos hablando de la varianza de la muestra. 89 00:16:12,110 --> 00:16:31,250 Acordaos que tenemos muestra y población. Ya veréis más adelante cuándo tenéis que aplicar cada una y si no, se os va a indicar. Pero bueno, vamos a quedarnos primero con que la varianza es S al cuadrado y la varianza de la población es sigma al cuadrado. 90 00:16:31,250 --> 00:16:39,330 Siempre cuando tenemos letra latina es de la muestra y cuando tenemos la letra griega es de la población, ¿vale? 91 00:16:39,470 --> 00:16:51,029 Acordaos que con la media teníamos X era la media y mu, que lo tenéis aquí escrito, ¿vale? 92 00:16:51,129 --> 00:16:57,049 Está aquí la letra mu es la de la población, ¿vale? 93 00:16:57,049 --> 00:17:15,329 Pues ahora que estamos con la varianza, tenemos ese cuadrado la de la muestra, sigma cuadrado la de la población. ¿Y qué nos indica la varianza? Nos indica el promedio, o sea, la media del cuadrado de las desviaciones de cada uno de los datos a la media. 94 00:17:15,329 --> 00:17:29,269 ¿Esto qué quiere decir? Que yo tengo una serie de valores, ¿vale? De esa serie de valores yo hago la media y a continuación a cada uno de esos valores le voy a restar el valor de la media, ¿vale? 95 00:17:29,829 --> 00:17:43,890 ¿Qué pasa? Que si yo, por ejemplo, y luego voy a sumar todo eso, ¿qué pasa? Que si yo tengo que un valor menos el valor de la media me da menos 0,1 y el siguiente me da 0,3. 96 00:17:44,089 --> 00:17:55,509 Si yo sumo eso, menos 0,1 más 0,3 me da 0,2. Al final se me está anulando una con la otra y yo lo que quiero cuantificar es lo que se están separando de la media, 97 00:17:55,509 --> 00:18:01,470 me da igual que sea en positivo o en negativo. Entonces, por eso se eleva al cuadrado, porque 98 00:18:01,470 --> 00:18:07,170 sabéis que cualquier número elevado al cuadrado siempre va a ser positivo, ¿vale? Esto para 99 00:18:07,170 --> 00:18:12,630 que sepamos de dónde viene la fórmula y cómo se calcula. Esto es lo mismo, se hace 100 00:18:12,630 --> 00:18:20,069 con la calculadora, que en vuestra calculadora la varianza probablemente no os venga directamente, 101 00:18:20,069 --> 00:18:31,390 Os venga la S, ¿vale? Que es lo que tenemos que ver un poco caso por caso. Entonces, ¿a qué se refiere esto exactamente? Pues imaginaos, esto de aquí es la media, ¿vale? 102 00:18:31,789 --> 00:18:45,230 Yo tengo un montón de valores y esto de aquí es la media. Pues la varianza me mide cada uno de los puntitos cuánto se está separando de la media. 103 00:18:45,230 --> 00:18:58,630 O sea, de aquí a aquí, de aquí a aquí, de aquí a aquí, me los está sumando todos y me está haciendo una media de esos valores. Entonces, ¿qué indicativo es? ¿Qué información me da? 104 00:18:58,630 --> 00:19:10,710 Pues cuanto mayor sea la varianza, significa que mis datos están más dispersos, ¿vale? O sea, que tengo mi valor medio, pero tengo datos que están muy alejados de ese valor medio, la varianza es muy alta. 105 00:19:11,230 --> 00:19:23,309 Cuanto más pequeñita sea la varianza, significa que mis valores están más cerca de la media, o sea, que se separan menos, porque esa diferencia, esa resta que estamos haciendo es más pequeñita, ¿vale? 106 00:19:23,309 --> 00:19:40,630 Entonces, en este caso de aquí, en este gráfico, tendríamos, por ejemplo, dos series de datos que tienen la misma media, que son estas rayas de aquí punteadas, pero los datos en rojo tienen una varianza que es mucho más pequeña que los datos en azul. 107 00:19:40,630 --> 00:20:00,769 ¿Esto qué me quiere decir? Pues que en el ejemplo que hemos puesto de nuestra clase, imaginaos que la media de edad son 25 y que la mayoría de vosotros tenéis 26, 24, 27, 25, 25, 24, 23, ahí la varianza va a ser pequeñita. 108 00:20:00,769 --> 00:20:19,430 Pero imaginaos que la media es 25 y tenemos 3 personas de 20, 3 personas de 50, luego 5 de 18, que está como muy separado, tenemos muchos valores que están lejos de la media. 109 00:20:19,430 --> 00:20:31,250 Ahí la varianza va a ser mucho más grande, o sea, mi curva va a ser más aplastada, más ancha. Cuanto más pequeñita es la varianza, es más fina porque está más cerca de la media. 110 00:20:31,250 --> 00:20:50,950 ¿Vale? Entonces, la varianza importante que sepamos que es ese cuadrado y esto no os confundáis, ¿vale? Que no es ese sino ese cuadrado y que tenemos la poblacional que se calcula con esta fórmula y la muestral que se calcula con esta fórmula. 111 00:20:50,950 --> 00:21:01,109 aunque la mayoría de las veces lo que vamos a hacer es calcularlo con la calculadora o con hojas de cálculo, que es la siguiente cosa que os voy a contar. 112 00:21:01,369 --> 00:21:15,569 Para calcular con Excel o con el libre Office Calc, que es el que utilizo yo, el que es gratuito, enseñaros cómo calcular todos los parámetros estadísticos. 113 00:21:15,569 --> 00:21:26,490 ¿Por qué? Porque es mucho más difícil equivocarse cuando hacemos las cosas un poco automatizadas que si nos ponemos a hacer esto a mano, ¿vale? 114 00:21:26,490 --> 00:21:31,589 Porque yo por poder lo puedo hacer. Ahora si queréis hacemos una tabla y vemos cómo. 115 00:21:32,609 --> 00:21:41,589 Entonces, si veis aquí la única diferencia que hay es que en la poblacional dividimos entre n, que n es el número de valores, ¿vale? 116 00:21:41,589 --> 00:21:56,289 Y en la muestral dividimos entre n-1. ¿Por qué es esto? Pues daos cuenta que una población significa tener muchos, muchos valores y que una muestra es un trozo de la población. 117 00:21:56,289 --> 00:22:09,450 Este n va a ser mucho más pequeño. Consideramos población cuando tenemos, por ejemplo, de 30 valores en adelante y en la muestra cuando tenemos a lo mejor menos de 30, pero podemos tener 6, 7 valores. 118 00:22:09,450 --> 00:22:23,529 Entonces, imaginaos la diferencia. Si mi muestra es n igual a 7, por ejemplo, hay mucha diferencia en que yo aquí divida entre 6 o divida entre 7, ¿no? 119 00:22:23,529 --> 00:22:41,829 Porque como es un número relativamente pequeño, sí que va a haber variación en mi resultado. Si pongo aquí un 6 o pongo un 7. En cambio aquí, si tengo 50 valores, ya el resultado que me va a dar da un poco igual dividir entre 50 que entre 49. 120 00:22:41,829 --> 00:23:03,769 Es un número tan alto que no se va a notar en los decimales, ¿vale? Entonces, si tenéis en algún momento duda, podéis pensar en eso. Si os entra la duda de dividir entre n, n-1, cuál era población, cuál era muestra, pensar que la muestra es cuando tenemos un número muy elevado de valores, tiende la población, ¿vale? 121 00:23:03,769 --> 00:23:13,170 Y por eso, bueno, la fórmula es esta, ¿vale? Sin más, tampoco hay que le deis muchas más vueltas, pero para que lo sepáis, ¿vale? 122 00:23:14,049 --> 00:23:22,029 Ahora, ¿qué nos pasa con la varianza? Que si os dais cuenta, todo esto está al cuadrado, ¿no? 123 00:23:22,269 --> 00:23:32,549 Tenemos mi valor medio, perdón, mi valor, mi valor medio, esto elevado al cuadrado, entonces el resultado que me dé, me da un resultado al cuadrado, ¿vale? 124 00:23:32,549 --> 00:23:44,029 Entonces, si yo hago la raíz cuadrada de todo eso, obtengo un resultado que no está al cuadrado, ¿vale? Y la desviación es la raíz cuadrada de la varianza, ¿vale? 125 00:23:45,109 --> 00:23:53,150 La desviación estándar se puede llamar desviación estándar o desviación típica. Es exactamente lo mismo, son sinónimos. 126 00:23:53,150 --> 00:24:19,890 Igual que hemos dicho que rango y recorrido son sinónimos, desviación estándar y desviación típica son sinónimos también. Y tenemos lo mismo, teníamos nuestra varianza, la de la población sigma al cuadrado era la suma de cada uno de nuestros valores menos la media al cuadrado dividido entre n. 127 00:24:19,890 --> 00:24:25,529 Pues hacemos la raíz cuadrada de eso, ¿vale? Y nos queda sigma, desviación estándar. 128 00:24:26,190 --> 00:24:34,650 Ahora, la de la muestra, lo mismo, teníamos que ese cuadrado era el sumatorio de xy menos x media al cuadrado dividido entre n menos 1. 129 00:24:35,509 --> 00:24:44,549 Hacemos la raíz cuadrada aquí, hemos hecho la raíz cuadrada aquí y la raíz cuadrada de s al cuadrado nos queda s, ¿vale? 130 00:24:44,549 --> 00:24:57,349 Entonces, para pasar de varianza a desviación típica tenemos que hacer la raíz cuadrada y para pasar de desviación típica a varianza tenemos que elevar al cuadrado. 131 00:24:57,529 --> 00:25:10,849 Os lo digo porque en la calculadora lo que os he dicho muchas veces no os va a decir el valor de la varianza, os va a decir el valor de la desviación típica y vosotros tenéis que elevarlo al cuadrado. 132 00:25:10,849 --> 00:25:30,190 ¿Vale? Simplemente. Entonces, ¿qué sentido tiene o por qué nos es útil esta desviación típica? Pues porque al final, como hacemos la raíz cuadrada de esto que está al cuadrado, al final nuestro resultado lo tenemos en las mismas unidades que teníamos el valor original. 133 00:25:30,190 --> 00:25:47,190 Por ejemplo, si estamos hablando de una concentración que es en moles, perdón, en molaridad, si yo hago la varianza, al final lo que estoy haciendo es la molaridad de cada valor menos la molaridad media. 134 00:25:48,349 --> 00:25:53,950 Estoy sumando todas, o sea, elevado al cuadrado, estoy sumando todas y lo estoy dividiendo entre n. 135 00:25:54,690 --> 00:25:57,990 El resultado este que me está dando es molaridad al cuadrado. 136 00:25:58,289 --> 00:26:04,549 Es un poco difícil comparar molaridad, que es mi parámetro, lo que yo estoy midiendo, con molaridad al cuadrado. 137 00:26:05,190 --> 00:26:08,950 En cambio, cuando llegamos a la desviación, como hemos hecho la raíz, 138 00:26:09,190 --> 00:26:13,930 este resultado me da en las mismas unidades que la medida que yo estoy haciendo. 139 00:26:13,930 --> 00:26:21,250 Si tengo kilos, esto ya no son kilos al cuadrado, mi desviación típica o desviación estándar me está dando en kilos. 140 00:26:21,250 --> 00:26:47,450 ¿Vale? Entonces, ofrece más información práctica que la varianza. La varianza se utiliza muchísimo porque es aditiva, pero bueno, esta nos da una información más visual porque está expresada en las mismas unidades que los datos originales y eso nos facilita la interpretación. 141 00:26:47,450 --> 00:27:01,460 ¿Vale? Lo que acabamos de decir. Entonces, última medida de dispersión que vamos a ver. La desviación estándar relativa, ¿ok? Acordaos, la desviación estándar es S, ¿vale? 142 00:27:01,460 --> 00:27:24,960 Varianza S cuadrado, desviación estándar S. Entonces, la desviación estándar relativa es SR o también se puede llamar DER de desviación estándar relativa o en inglés Relative Standard, creo que me he colado y esto es una D, ¿vale? RED, pero os lo compruebo en inglés, ¿vale? 143 00:27:25,940 --> 00:27:28,579 Normalmente se suele poner así o así. 144 00:27:29,519 --> 00:27:36,500 Entonces, es un parámetro que nos mide la dispersión de los datos en relación con la magnitud medida. 145 00:27:38,640 --> 00:27:43,440 ¿Cómo hacemos eso? Cogemos nuestra desviación y la dividimos entre la media. 146 00:27:43,900 --> 00:27:47,599 ¿Y esto por qué es muy útil o por qué es muy visual o por qué es importante? 147 00:27:47,599 --> 00:27:59,380 Porque si yo te digo a ti que la desviación de una serie de valores es 5 y no te digo nada más, tú no sabes si esa desviación es muy grande o muy pequeña. 148 00:27:59,819 --> 00:28:11,500 Si te digo que mi media de los valores es 50, pues una desviación de 5 es una desviación muy grande. 5 sobre 50 es una desviación considerable. 149 00:28:11,500 --> 00:28:19,859 En cambio, si te digo que mi media son 20.000, pues, hombre, 5 unidades sobre 20.000, tampoco es una desviación pequeña. 150 00:28:20,819 --> 00:28:27,559 Entonces, si divido mi desviación entre la media, tengo un dato mucho más significativo. 151 00:28:27,559 --> 00:28:33,099 Y lo que se expresa, como se expresa muy habitualmente, es el porcentaje de esto, ¿vale? 152 00:28:33,119 --> 00:28:41,420 O sea, mi porcentaje de desviación estándar relativa es mi desviación estándar dividido entre mi media y multiplicado por 100. 153 00:28:41,500 --> 00:28:47,119 Y esto me da en porcentaje. Y a esto se le llama coeficiente de variación, que se utiliza bastante. 154 00:28:48,680 --> 00:28:55,599 Entonces, lo que quiero que os quede claro es que al final todo es complementario. 155 00:28:55,599 --> 00:29:06,039 Nosotros, la media sí que nos da información, porque cuando tenemos una media sabemos más o menos cuál es el centro de todos los valores, pero es cojo. 156 00:29:06,039 --> 00:29:24,880 O sea, a mí si me dices eso, pues que hay un sitio en el que va a haber una media de edad de 20 años. No es lo mismo que haya mucha gente de entre 18 y 21 a que haya mucha gente de 40 con sus bebés recién nacidos. 157 00:29:24,880 --> 00:29:40,119 O sea, cambia totalmente. Entonces, ¿eso qué me lo va a decir? La dispersión. Yo tengo la media que es la misma. Si hay mucha gente de 18, 19, 20, 21, 20, 20, 19, 18, así hay mucho bebé de 3 años y mucha persona de 40. 158 00:29:40,119 --> 00:29:51,740 La media va a ser exactamente la misma. En cambio, si me dan la media y la desviación, yo ahí ya tengo una idea más visual de qué me voy a encontrar. 159 00:29:51,880 --> 00:30:05,160 Si me dan la media y el rango, puedo decir, vale, ok, sí que va a haber gente de 0 años y gente de 40, pero no sé cuántos, porque a lo mejor la mayoría son de 20 años y hay una persona de 40 y una persona de 0 años. 160 00:30:05,160 --> 00:30:20,500 Por eso digo que al final son complementarias y que el rango o recorrido es un poco de las dispersivas la que menos información nos da y la desviación estándar relativa, si os dais cuenta, es muy útil y muy visual. 161 00:30:20,500 --> 00:30:44,400 Porque lo que os he dicho de este ejemplo de la media edad de 20 años, aquí sí que lo voy a ver muy bien con el coeficiente de variación. Veo cuánto es la desviación, que la tengo que calcular por la fórmula que hemos visto, lo divido entre la media, lo multiplico por 100 y yo sé qué porcentaje se está desviando de la media. 162 00:30:44,400 --> 00:30:49,720 Hasta aquí todo claro 163 00:30:49,720 --> 00:30:50,839 Voy al chat 164 00:30:50,839 --> 00:30:54,299 A ver si hay dudas de algo 165 00:30:54,299 --> 00:30:55,900 Que parece que no 166 00:30:55,900 --> 00:30:58,900 Vale, pues continuamos 167 00:30:58,900 --> 00:31:01,559 Si en cualquier momento me paráis 168 00:31:01,559 --> 00:31:05,460 Que como estoy con la pantalla proyectada 169 00:31:05,460 --> 00:31:08,279 Pues si decís algo no lo veo 170 00:31:08,279 --> 00:31:12,400 Entonces me interrumpís hablando y ya está 171 00:31:12,400 --> 00:31:39,720 Entonces, aquí, aplicando un poco lo que hemos contado, de estos tres de aquí, que no hagáis caso de lo que son, simplemente era para que vieseis la gráfica, los tres tienen la misma media, el mismo valor entre, vamos a imaginarnos, que esto significa que es la media y esto la desviación. 172 00:31:39,720 --> 00:31:43,599 Entonces, ¿cuál tiene una desviación mayor? ¿El azul, el gris o el verde? 173 00:31:52,240 --> 00:31:54,119 El azul, creo, ¿no? 174 00:31:54,359 --> 00:31:59,700 El azul tiene la menor desviación, porque si te das cuenta, está como más en pico. 175 00:32:00,160 --> 00:32:03,460 O sea, todos los valores están más cerquita del centro, ¿vale? 176 00:32:03,799 --> 00:32:05,880 Es verdad, es verdad, el verde. 177 00:32:07,940 --> 00:32:10,380 Ya, ya, ya me he acordado, lo siento. 178 00:32:10,380 --> 00:32:32,140 Sí, justo al revés. Aquí el azul, tú piensas que el punto más alejado está este punto, este punto, este punto. En cambio, en el verde todos están muy alejados de la media. Tenemos estos puntos por aquí. Cuanto más chato es, más se está alejando de la media y la desviación es más grande. Por lo tanto, los datos están más dispersos. 179 00:32:32,140 --> 00:32:46,420 Entonces, en este caso de aquí, la mayor desviación la tendría el verde, luego el gris y luego el azul. Y si hablamos de varianza, ¿el orden sería el mismo o cambiaría? 180 00:32:46,420 --> 00:33:08,710 Sería el mismo, ¿vale? Porque al final como una cosa es el cuadrado de la otra, si yo tengo una serie de valores que la varianza es de 1, 7 y del otro 3, si hago la raíz cuadrada va a seguir siendo más grande la de 7 y más pequeña la de 3, ¿no? Es la raíz cuadrada la una de la otra. 181 00:33:09,549 --> 00:33:19,009 Entonces, el ejemplo que hemos puesto antes de el mismo, en el que hemos hecho la media, la moderna-mediana, ¿vale? 182 00:33:19,009 --> 00:33:31,829 Pues ahora vamos a calcular el rango, que ya lo hemos calculado antes, que me lo habéis dicho, la varianza, la desviación estándar y la desviación estándar relativa. 183 00:33:31,829 --> 00:33:46,829 ¿Vale? Os dejo cinco minutillos para que lo miréis vosotros y lo voy a hacer yo porque creo que no lo tengo aquí. Así que eso, os dejo cinco minutillos y lo resolvemos, ¿vale? 184 00:33:46,829 --> 00:34:05,950 Si queréis, lo podéis hacer a mano o lo podéis intentar hacer casi mejor con la calculadora, ¿vale? El rango no, el rango lo podemos hacer directamente porque ya lo hemos dicho antes, ¿no? Que es 7,5 menos 6,8, o sea que nuestro rango es 0,7, ¿no? Ese lo tenemos claro. 185 00:34:05,950 --> 00:34:12,510 Ahora, tenemos que hacer varianza, desviación estándar y desviación estándar relativa. 186 00:34:13,090 --> 00:34:21,909 Acordaos que varianza es S al cuadrado, desviación estándar es S y desviación estándar relativa S dividido entre la media. 187 00:34:21,909 --> 00:34:28,909 O sea, que lo primero tenemos que hacer la media, que ya la hemos hecho antes, pero bueno, podéis hacerla otra vez. 188 00:34:28,909 --> 00:34:35,010 Nada, eso, os dejo los cinco minutillos 189 00:34:35,010 --> 00:34:36,809 Y lo vemos 190 00:34:36,809 --> 00:35:15,739 Quiero hacerle a la calculadora 191 00:35:15,739 --> 00:35:17,980 Pero no sé cómo, tengo que verme un vídeo, ¿no? 192 00:35:18,219 --> 00:35:20,539 Vale, no, os lo explico yo aquí 193 00:35:20,539 --> 00:35:23,300 A ver, porque 194 00:35:23,300 --> 00:35:27,519 ¿Tienes tu modelo de calculadora? 195 00:35:27,820 --> 00:35:28,980 ¿Me lo puedes decir cuál es? 196 00:35:32,340 --> 00:35:33,619 Es que la verdad 197 00:35:33,619 --> 00:35:35,579 Amanita lo probó 198 00:35:35,579 --> 00:35:36,960 Vale, mi amor, silencio 199 00:35:36,960 --> 00:35:39,599 ¿Te pones un segundito en la cámara y me la enseñas así a la cámara? 200 00:35:40,239 --> 00:35:40,840 Vale, espera. 201 00:35:43,159 --> 00:35:48,360 Es que no es Casio, es una que me compré realmente en donde estoy. 202 00:35:50,579 --> 00:35:54,920 Vamos a ver si tenemos aquí calculadora, Casio. 203 00:35:55,059 --> 00:35:57,320 Me la compré, ¿sabéis dónde? En el Alcampo. 204 00:35:57,840 --> 00:35:59,579 Bueno, sí, al fin, son todas iguales. 205 00:35:59,699 --> 00:36:00,820 Os digo lo de Casio porque es una... 206 00:36:00,820 --> 00:36:01,659 Te la estoy enseñando. 207 00:36:02,340 --> 00:36:03,460 Pero son todas muy... 208 00:36:03,460 --> 00:36:06,159 Mira, la que yo tengo creo que es esta de aquí. 209 00:36:06,960 --> 00:36:20,960 12 euros. O sea, que veáis que digo Casio porque funcionan muy bien, pero que al final casi, casi, casi todas tienen yo creo que el mismo sistema operativo y te cambia un poco la carcasa y la marca. 210 00:36:20,960 --> 00:36:24,159 si no tenéis calculadora 211 00:36:24,159 --> 00:36:26,139 la verdad es que yo estas me parece 212 00:36:26,139 --> 00:36:28,539 muy fácil de manejar 213 00:36:28,539 --> 00:36:30,420 le dura la batería eternamente 214 00:36:30,420 --> 00:36:32,579 y es muy barata, 12 euros 215 00:36:32,579 --> 00:36:34,119 y dura vamos 216 00:36:34,119 --> 00:36:36,320 años y años y años, estas cosas 217 00:36:36,320 --> 00:36:37,420 no se rompen 218 00:36:37,420 --> 00:36:40,280 entonces, en todas 219 00:36:40,280 --> 00:36:42,059 las calculadoras, no sé si, estáis viendo 220 00:36:42,059 --> 00:36:43,039 mi pantalla, ¿verdad? 221 00:36:44,900 --> 00:36:45,460 ¿Ahora mismo? 222 00:36:46,039 --> 00:36:48,659 Sí. Vale, en todas las calculadoras 223 00:36:48,659 --> 00:36:50,480 tenemos distintas funciones 224 00:36:50,480 --> 00:37:10,480 Tenemos una por defecto que es comp o deg y luego tenemos una función estadística. Normalmente hay una tecla que se llama shift que la pulsamos y luego tenemos que pulsar el botón para cambiar esa función estadística. 225 00:37:10,480 --> 00:37:14,980 estadística en las que son más antiguas nos viene arriba una leyenda y tenemos 226 00:37:14,980 --> 00:37:18,639 que pulsar por ejemplo shift y un punto en el caso de la que tengo yo ahora 227 00:37:18,639 --> 00:37:24,280 mismo delante en esta de aquí que tenemos de casio pulsaríamos shift y nos 228 00:37:24,280 --> 00:37:33,679 abriría otra pantallita y ahí si perdón modo y aquí en el modo 229 00:37:33,679 --> 00:37:40,320 buscamos estadística vale es que no sé si tenéis la misma sino eso el próximo 230 00:37:40,320 --> 00:37:45,059 día me la voy a bajar, que no me la he bajado hoy, perdonadme, porque estamos en plantas 231 00:37:45,059 --> 00:37:51,159 distintas cuando edamos virtual, que es donde está el departamento, el próximo día me 232 00:37:51,159 --> 00:37:56,619 la bajo y la conecto con la cámara para verla. Pero bueno, en general eso, tenéis aquí 233 00:37:56,619 --> 00:38:01,960 el modo y ponéis el modo estadística, ¿vale? Luego una vez que tenemos metido el modo estadística 234 00:38:01,960 --> 00:38:06,699 tenemos que meter los datos, entonces lo que hacemos es meter los valores y separarlos 235 00:38:06,699 --> 00:38:14,559 por m más. Os digo en este modelo, pero la mayoría funcionan igual, entonces metemos 236 00:38:14,559 --> 00:38:26,699 6,8 m más, 7,0 m más y nos va saliendo aquí n igual a 1, n igual a 2, el número de datos 237 00:38:26,699 --> 00:38:35,699 que vayamos metiendo. Y una vez que estén metidos, le damos a shift y aquí tenemos, 238 00:38:35,699 --> 00:38:41,900 Tenemos, aquí no se ve muy bien, pero pone S-varianza y S-varianza, creo. 239 00:38:42,920 --> 00:38:48,739 Entonces, pulsamos ahí y nos va a dar distintas opciones para ver qué queremos calcular. 240 00:38:48,960 --> 00:38:54,380 Si queremos calcular la media, si queremos calcular la desviación típica, etc. 241 00:38:54,380 --> 00:39:08,320 Pero sí que es verdad que si no sabéis hacer uso de la calculadora, sí que es importante que lo hagamos con una calculadora delante. 242 00:39:08,320 --> 00:39:18,019 El año pasado estuve buscando un simulador y no encontré, a ver si lo encuentro este año de Casio y si no, nada, con la cámara, pues os lo voy enseñando yo. 243 00:39:18,019 --> 00:39:34,880 Una cosa importante que os he dicho, que si no tenéis calculadora os hagáis con una, que no sea programable, porque es que acabo de ver justo esta por aquí, que pone que es financiera, no lo sé. 244 00:39:34,880 --> 00:39:47,760 Hay las que son programables o gráficas o algo así, que son más caras, esas no sirven para el examen. El examen, el requisito en todos los módulos, no solamente en calidad, es que sea calculadora no programable. 245 00:39:48,019 --> 00:40:09,559 Entonces eso, si tenéis vuestra calculadora de siempre, genial, que seguro que os sirve. Si os tenéis que comprar una, que sea muy sencillita, que sea de este estilo que os he enseñado yo o si queréis una un poco más moderna de este estilo, siempre que no sea programable. 246 00:40:09,559 --> 00:40:24,900 ¿Vale? Sí, básicamente son o como esta que os he dicho o de este estilo, pero esta, más de 570 funciones, habría que verlo, ¿vale? 247 00:40:25,800 --> 00:40:33,460 O sea, os tenéis que asegurar eso, de que haga regresiones y de que no sea programable. 248 00:40:33,460 --> 00:40:47,500 Nada, lo voy a cerrar porque no… Y reitero que no que quiera hacer yo propaganda de Casio ni mucho menos, pero que de verdad son las más típicas. 249 00:40:47,500 --> 00:41:08,619 Entonces, bueno, no sé si alguien más lo ha intentado o lo ha conseguido. El rango 0,7, ¿no? 7,5 menos 6,8 y ahora vamos a ello con varianza, desviación estándar y desviación estándar relativa. 250 00:41:08,619 --> 00:41:29,159 Entonces, la otra manera de calcular estos parámetros estadísticos es lo que os he comentado en una hoja de Excel, ¿vale? Al final, yo es lo que más utilizo sin duda alguna y, bueno, es muy, muy, muy práctico, ¿vale? 251 00:41:29,159 --> 00:41:47,079 Entonces, vamos a comprobar por si lo habéis hecho, a ver si os da lo mismo. Metemos los valores, 7,2, 6,8, 7,5, 7,0. Al final Excel es como una calculadora pero mucho más avanzada. 252 00:41:47,079 --> 00:42:05,960 7,3, 7,5, 6,9 y 7,3, ¿vale? Entonces, el rango es el mayor menos el menor, que es 0,7, aquí lo ponemos el rango. 253 00:42:05,960 --> 00:42:12,960 Después tenemos la varianza 254 00:42:12,960 --> 00:42:23,099 Que es 0,0698 255 00:42:23,099 --> 00:42:25,699 Me da a mí, ¿la habéis hecho a alguien? 256 00:42:29,699 --> 00:42:31,380 Me he comido un valor, ¿verdad? 257 00:42:31,699 --> 00:42:32,980 No he puesto el 7,1 258 00:42:32,980 --> 00:42:36,039 Lo voy a poner aquí arriba 259 00:42:36,039 --> 00:42:43,420 7.1 260 00:42:43,420 --> 00:42:52,840 La varianza da 0,0619 261 00:42:52,840 --> 00:42:58,639 La varianza, acordaos, que es S al cuadrado 262 00:42:58,639 --> 00:43:01,280 No S, S elevado al cuadrado 263 00:43:01,280 --> 00:43:03,219 S al cuadrado 264 00:43:03,219 --> 00:43:05,480 La desviación estándar 265 00:43:05,480 --> 00:43:07,579 Una vez que tenemos la varianza, ¿cómo la hacemos? 266 00:43:11,889 --> 00:43:13,409 La varianza al cuadrado, ¿no? 267 00:43:14,010 --> 00:43:30,289 Y al revés, la raíz cuadrada de la varianza nos da la desviación típica, o sea, pensar que cualquier cosa que tengamos al cuadrado, si le hacemos la raíz cuadrada, lo que estamos haciendo es quitarle el cuadrado. 268 00:43:30,289 --> 00:43:55,539 Entonces, quitándole el cuadrado a la varianza tenemos la desviación típica y que es una S, que es la raíz cuadrada de esto de aquí, que nos da 0,2489. 269 00:43:55,539 --> 00:44:01,760 9, ¿no? Si os lo he puesto aquí para quitar los decimales en algún punto, la desviación típica. 270 00:44:01,760 --> 00:44:08,099 Y ahora, ¿cómo haríamos la media? Que la teníamos antes, era 7.2, si os acordáis. 271 00:44:10,460 --> 00:44:13,900 Entonces, ¿cómo hacemos ahora la desviación estándar relativa? 272 00:44:21,469 --> 00:44:26,610 Lo que hacemos es nuestra desviación típica dividida entre nuestra media. 273 00:44:26,610 --> 00:44:52,849 O sea, dividimos 0,2489 entre 7,2. Esto entre 7,2 y nos da 0,03456. Y acordaos que tenemos también el coeficiente de variación, que era sacar el porcentaje de la desviación estándar relativa. 274 00:44:52,849 --> 00:45:11,349 Entonces, simplemente tenemos que multiplicar lo que nos ha dado por 100. Esto lo multiplicamos por 100 y nos da 3,45. Y esto, ¿cómo lo tenemos que representar? Como porcentaje. 275 00:45:11,349 --> 00:45:28,150 Entonces, el coeficiente de variación es 3,45%. ¿Eso qué significa? Que los valores se están desviando de la media en una medida aproximada de un 3,5%, ¿vale? 276 00:45:28,949 --> 00:45:36,449 Que no, bueno, depende de para qué propósito analítico, puede ser alto, puede ser bajo, ¿vale? Pero bueno, lo tenemos ya todo calculado. 277 00:45:36,449 --> 00:45:55,469 Lo hemos hecho, que es lo lógico, es hacerlo con calculadora y con hojas de cálculo, pero si queremos lo podemos hacer a mano, ¿vale? Entonces, ¿cómo haríamos, por ejemplo, cómo calcularíamos la varianza de estos valores de aquí? 278 00:45:55,469 --> 00:46:22,110 Voy a abrir la pizarra, que la tengo aquí. No sé qué es eso que ha salido. Entonces, tengo que mi media, que ya lo he calculado, mi media son 7,2. 279 00:46:22,110 --> 00:46:28,690 Sí, perdonadme porque es que lucho contra la tableta esta de escribir, que no la controlo mucho todavía. 280 00:46:29,969 --> 00:46:31,250 La media es 7,2. 281 00:46:31,349 --> 00:46:40,429 Entonces, yo me podría hacer una tabla en la que yo tenga cada uno de mis valores menos la media. 282 00:46:41,650 --> 00:46:42,170 ¿Vale? 283 00:46:42,329 --> 00:46:44,210 La media que me he comido poner esto. 284 00:46:44,309 --> 00:46:45,949 Entonces, cogería y empezaría, ¿vale? 285 00:46:45,949 --> 00:47:09,130 7,2 menos 7,2, el siguiente 6,8 menos 7,2, el siguiente que es ese de ahí, 7,5 menos 7,2, ¿vale? 286 00:47:09,130 --> 00:47:23,230 Y todo esto lo voy haciendo con todos los que me quedan, con el 7, el 7,1. Ahora, el resultado que me da aquí lo elevo al cuadrado, ¿vale? Y así ya tengo cada valor menos la media elevado al cuadrado. 287 00:47:23,230 --> 00:47:36,050 Entonces tengo 7 con 2 menos 7 con 2, 0 al cuadrado, 0. 6 con 8 menos 7 con 2, pues me da menos 0,4. Lo elevo al cuadrado y me da 0,16. 288 00:47:36,050 --> 00:47:41,809 7,5 menos 7,2 me da 0,3 289 00:47:41,809 --> 00:47:44,570 lo elevo al cuadrado y me da 0,9 290 00:47:44,570 --> 00:47:48,090 y así con todos los que tengo por debajo 291 00:47:48,090 --> 00:47:54,050 7 menos 7,2 elevado al cuadrado es 0,2 292 00:47:54,050 --> 00:47:58,610 menos 0,2 elevado al cuadrado que es 0,4 293 00:47:58,610 --> 00:48:00,030 lo voy haciendo con todos 294 00:48:00,030 --> 00:48:02,369 una vez que los tengo todos hechos 295 00:48:02,369 --> 00:48:23,750 Lo sumo. 0, más 0, 16, más 0, 9, más, más, más, todos los que me vengan. Y una vez que tengo la suma de todos, lo divido entre el número de datos totales, que todos los que tengo aquí, que son 1, 2, 3, 4, 5, 6, 7, 8 y 9. 296 00:48:23,750 --> 00:48:26,889 entonces hago la suma y lo divido entre 9 297 00:48:26,889 --> 00:48:28,150 ¿vale? 298 00:48:28,369 --> 00:48:29,630 y lo divido entre 9 299 00:48:29,630 --> 00:48:31,030 y 300 00:48:31,030 --> 00:48:35,929 ¿qué estaría haciendo aquí mal? 301 00:48:36,150 --> 00:48:37,510 que lo estoy diciendo muy rápido 302 00:48:37,510 --> 00:48:40,050 si lo divido entre 9 sería porque 303 00:48:40,050 --> 00:48:42,590 estoy hablando de una población 304 00:48:42,590 --> 00:48:44,409 ¿no? pero en realidad estoy hablando de una muestra 305 00:48:44,409 --> 00:48:46,829 porque tengo muy pocos valores, sería entre 9 menos 1 306 00:48:46,829 --> 00:48:48,929 tendría que dividir aquí entre 8 307 00:48:48,929 --> 00:48:49,730 ¿vale? 308 00:48:49,969 --> 00:48:51,409 entonces si yo hago esto 309 00:48:51,409 --> 00:49:00,429 luego tendría exactamente el mismo valor que el que he hecho calculándolo con la calculadora 310 00:49:00,429 --> 00:49:05,869 solo que como veis es muy muy farragoso y es muy fácil equivocarse 311 00:49:05,869 --> 00:49:11,969 porque al final, como mira, me había equivocado poniendo aquí en vez de n menos 1, n 312 00:49:11,969 --> 00:49:17,869 para empezar, pero luego para seguir en el momento en el que yo me equivoque en hacer una de estas restas 313 00:49:17,869 --> 00:49:22,010 sin elevarlo al cuadrado ya tengo todo mal, pero que sepáis que cómo se hace es este 314 00:49:22,010 --> 00:49:29,989 proceso, ¿vale? Así que os diría que lo hagáis una vez, o sea, ya que tenéis, cuando 315 00:49:29,989 --> 00:49:35,010 tengáis los datos delante con la calculadora, que os pongáis las fórmulas, que hagáis 316 00:49:35,010 --> 00:49:41,469 esta tabla, ¿vale? Y que veáis que os da el mismo valor. Esto, como veis, se tarda 317 00:49:41,469 --> 00:49:46,590 bastante en hacer, es más pesado, tenemos que ir eso, pues lo primero hacer la media 318 00:49:46,590 --> 00:50:06,170 A cada valor restarle la media, elevar al cuadrado lo que me dé, sumar todo lo que me ha dado de esto elevado al cuadrado, dividirlo entre n-1 y eso sería, ¿qué sería? Ese cuadrado, ¿vale? Lo que habría calculado yo es ese cuadrado, que ese cuadrado es varianza, ¿vale? 319 00:50:06,170 --> 00:50:12,809 Acordaos esto, grábaoslo bien bien, S desviación típica, S cuadrado, varianza. 320 00:50:13,710 --> 00:50:20,809 Entonces, la varianza ya la habría calculado y ahora, ¿cómo calculo la desviación típica o desviación estándar? 321 00:50:21,210 --> 00:50:24,590 Haciendo la raíz cuadrada del resultado que me haya dado. 322 00:50:24,590 --> 00:50:30,230 Hago la raíz cuadrada y ya tengo mi S, ¿vale? 323 00:50:30,230 --> 00:50:38,389 La raíz cuadrada de S al cuadrado es quitar los cuadrados, ¿vale? Quito esto, quito esto y se me queda S. 324 00:50:39,610 --> 00:50:47,829 Y por último, mi desviación estándar relativa ya sí que es lo más fácil. Una vez que he calculado mi S, la divido entre mi media. 325 00:50:47,829 --> 00:51:03,510 Os haría para calcularlo, para calcular la relativa, diferenciación estándar relativa sería la S que he calculado dividido entre la media. 326 00:51:04,510 --> 00:51:13,210 Y si quiero el coeficiente de variación, esto lo multiplico por 100 y así me da un porcentaje, lo tengo en porcentaje. 327 00:51:13,210 --> 00:51:27,090 ¿Vale? Perdonad por esta pizarra tan horriblemente escrita, pero es que las tabletas estas son un poco complicadas de usar. Iré afinando, ¿vale? Para que quede más claro. 328 00:51:27,090 --> 00:51:43,570 De todas formas, yo utilizo muchísimo el Excel en clase. Ahora lo he hecho todo muy rápido, por si lo habíais hecho, para comprobar los resultados, pero todo esto que he hecho yo de poner las fórmulas lo vamos a hacer en clase tranquilamente para que lo sepáis hacer vosotros. 329 00:51:43,570 --> 00:52:00,989 Que luego, por ejemplo, cuando tengáis que presentar informes de cualquier módulo o, bueno, no sé, en vuestros trabajos si lo aplicáis o si estáis trabajando en algún campo parecido o lo que sea, bueno, vais a utilizarlo muchísimo y es muy, muy, muy útil. 330 00:52:00,989 --> 00:52:25,309 Porque en Excel, yo ahora mismo he metido aquí los datos y os dais cuenta que he dicho, uy, me he dejado un 7,1 sin meter. Lo pongo y me recalcula todo. No tengo que estar otra vez sumando, metiendo en la calculadora, dividiendo. Y si yo ahora digo, uy, me he equivocado. Si esto no era un 7,5, era un 6,5. Imagínate. Le doy al Enter y veis que me ha cambiado todo. Ya me lo ha hecho y no tengo que estar yo peleándome. 331 00:52:25,309 --> 00:52:33,789 Entonces, bueno, el Excel sí que lo vamos a dar alguna sesión entera para que veáis cómo se usa. 332 00:52:33,789 --> 00:52:57,829 ¿Vale? ¿Dudas hasta aquí? Es mucha información pero una vez que lo asimiléis veréis que no es difícil. Lo que sí que os diría es que practiquéis con la calculadora, con el Excel, si sabéis manejarlo genial, si no, pues igual esperad a que demos la clase porque sí que es más complejillo, pero con la calculadora sí que intentadlo. 333 00:52:57,829 --> 00:53:19,269 Luego, lo de hacer las fórmulas a mano también para practicar un poco, pues calculaos de una serie de datos que pueden ser estos mismos, la media, la moda, la mediana, la varianza, la desviación típica, la desviación estándar, el coeficiente de variación o desviación estándar relativa, etcétera, etcétera. 334 00:53:19,269 --> 00:53:40,789 ¿Vale? Entonces, habíamos visto hasta aquí. Vale. Pues venga, vamos a, como nos queda un poquillo, nos queda 15 minutillos o así que podamos aprovechar, vamos a ver las cifras significativas. 335 00:53:41,789 --> 00:54:08,460 ¿Qué son las cifras significativas? Son las cifras que nos aportan alguna información, que tienen un significado real. Si os dais cuenta, antes cuando yo he hecho lo de la desviación, la media, que la he hecho con el Excel, que lo tenemos aquí abierto, los valores que me da son con muchos decimales. 336 00:54:08,460 --> 00:54:25,320 O sea, la desviación típica de esto es 0,3, 0,4, 1,3, 8, 1,2, 7 y eso es muy, muy habitual, que nos dé un montón de decimales, pero que algunos no tengan un significado real, que sean decimales de relleno, que nos estamos inventando, entre comillas, ¿vale? 337 00:54:25,320 --> 00:54:35,400 Ya veremos cómo se aplica eso. Entonces, bueno, vamos a hablar de las cifras significativas como las cifras de un número que tienen un significado, ¿vale? 338 00:54:36,400 --> 00:54:47,780 Entonces, por ejemplo, si yo tengo esto de aquí, que tengo una pesada de 12,0100 gramos, tengo seis cifras significativas, ¿vale? 339 00:54:47,900 --> 00:54:53,300 Tengo una, tengo dos, tengo tres, tengo cuatro, tengo cinco y tengo seis. 340 00:54:53,739 --> 00:55:01,739 En este caso, si yo estoy pesando en una balanza, yo sé que estas cinco primeras son reales, son de verdad, de verdad, tienen un significado real. 341 00:55:01,739 --> 00:55:29,059 Y esta última es una aproximación, está sometida a error, puede ser cero, puede ser uno, puede ser dos, puede tener algún tipo de fluctuación, ¿vale? La última cifra. Entonces, ¿cómo leemos las cifras significativas? ¿Cuántas cifras significativas tiene un número? Esto lo vamos a ver muy deprisa, ¿vale? Tampoco nos vamos a preocupar muchísimo por esto. Yo creo que muchos ya lo sabréis, pero bueno, vamos a ver las normas. 342 00:55:29,059 --> 00:55:41,489 Vale, ¿cómo vemos cuántas cifras significativas tenemos? Pues lo primero, leemos el número de izquierda a derecha, o sea, como lo leemos siempre, ¿vale? 343 00:55:41,489 --> 00:56:02,030 No es malo. Entonces, comenzando a contar los dígitos con aquel que es el primero que no es un cero, ¿vale? O sea, si yo tengo 0,0073, el primero que voy a contar es el 7, ¿no? Porque es el primero que no es un cero, empezando por la izquierda. 344 00:56:02,030 --> 00:56:23,090 Bueno, luego la posición del punto decimal la ignoramos porque está determinada por las unidades que se utilicen y no por la exactitud del instrumento. ¿Esto qué quiere decir? Que si yo os digo que algo me pesa 7 gramos, si yo lo quiero expresar en kilogramos, me pesará 7 entre 1000, 0,007. 345 00:56:23,090 --> 00:56:40,110 Eso no significa que mi instrumento sea más o menos exacto. Lo que significa es que yo estoy utilizando una unidad mayor o una unidad menor. Estoy poniendo ceros por delante y eso no se considera como cifra significativa. 346 00:56:40,110 --> 00:56:57,869 Uy, perdonad. Luego, cualquier dígito que no sea cero sí que es cifra significativa. Eso es lo primero que vemos. Lo que os digo, si yo tengo un dato que es 7,4835, todo son dígitos que no son cero. Ahí todos son significativos. 347 00:56:57,869 --> 00:57:12,929 ¿Vale? Luego, si tengo ceros entre medias de otras cifras que no son cero, también son significativos. Por ejemplo, si tengo 7,803, ese cero de 803 sí es significativo. 348 00:57:12,929 --> 00:57:31,769 ¿Vale? Luego, los ceros a la derecha, a partir de la primera cifra significativa distinta de cero al final del número, sí que son cifras significativas, ¿vale? Esto es lo que más puede dar lugar a errores. Ahora lo vemos. 349 00:57:32,710 --> 00:57:41,030 Luego, los ceros a la izquierda, lo que hemos dicho, no son cifras significativas porque los ceros a la izquierda es lo mismo que mover el punto decimal, ¿vale? 350 00:57:41,030 --> 00:57:43,570 Estos dos puntos son básicamente lo mismo. 351 00:57:44,570 --> 00:57:53,730 Y ahora, en el caso de los dígitos que no tienen coma decimal, o sea, cuando no tenemos un coma algo, hay que expresar el número en notación científica. 352 00:57:53,730 --> 00:57:57,110 Y no son cifras significativas las potencias de 10. 353 00:57:57,110 --> 00:58:15,980 Notación científica la tenemos todos más o menos clara. Notación científica es expresar en potencias de 10. No decimos 0,07 sino decimos 7 por 10 elevado a menos 2. 354 00:58:15,980 --> 00:58:32,099 ¿Vale? Entonces, vamos con ejemplos. ¿Cuántas cifras significativas tienen los siguientes números? Uy, pensé que esto no se veía en la parte de abajo. Bueno, practicamos así, ¿no? 355 00:58:32,099 --> 00:58:47,059 Bueno, 504, este no hay duda alguna, ¿no? El cero este está entre medias de dos, así que son tres cifras. Aquí lo mismo, el cero está entre dos cifras que no son cero, tres cifras significativas. 356 00:58:47,059 --> 00:59:05,480 Aquí lo mismo, todas las cifras que vemos son cifras significativas, ¿por qué? Porque lo único con lo que podemos dudar que son los ceros, aquí están entre medias de otros valores, entonces tenemos 1, 2, 3, 4, 5, 6, 7 y 8. 357 00:59:05,480 --> 00:59:08,500 Aquí ya empezamos con las dudas 358 00:59:08,500 --> 00:59:10,239 ¿Dónde tenemos que empezar a contar? 359 00:59:11,860 --> 00:59:15,280 Después de la coma, donde empieza el primer número 360 00:59:15,280 --> 00:59:16,940 Que no es un cero 361 00:59:16,940 --> 00:59:21,039 Entonces, esta no, esta no, esta no 362 00:59:21,039 --> 00:59:22,159 Empezamos a contar aquí 363 00:59:22,159 --> 00:59:25,380 Sí, sí, está entre dos cifras 364 00:59:25,380 --> 00:59:26,280 Sí y sí 365 00:59:26,280 --> 00:59:29,719 Aquí tenemos cuatro cifras significativas 366 00:59:29,719 --> 00:59:31,840 Ahora, el siguiente 367 00:59:31,840 --> 00:59:35,320 Lo mismo 368 00:59:35,320 --> 00:59:45,780 ¿El cero coma lo contamos? No, porque lo que hemos dicho, que yo realmente si pongo una potencia de 10, esta coma la puedo mover un poco donde me dé la gana, no le da un significado. 369 00:59:46,280 --> 00:59:53,500 Entonces tenemos el 5 y acordaos que después del punto los ceros que van al final sí se consideran siempre significativas. 370 00:59:53,500 --> 01:00:15,940 Entonces, este tendría una y dos. Este de aquí es el mismo caso que este. Tenemos una, dos y tres. El cero del final sí que se cuenta. Este de aquí, lo mismo. Los ceros que se ponen expresamente detrás del punto sí que se cuentan. Los que no se cuentan son los de antes. 371 01:00:15,940 --> 01:00:40,780 ¿Vale? Entonces, 1, 2, 3 y 4. Aquí tenemos cuatro ceros, pero no hay un decimal entre medias. ¿Vale? Entonces, esto, el poner 50.000 es lo mismo que si ponemos 50 por 10 a la 3, que si ponemos 500 por 10 a la 2, ¿vale? Podemos utilizar esta potencia. 372 01:00:40,780 --> 01:01:03,920 Entonces, al final, la única cifra significativa que hay es esta de aquí, es la primera. ¿Vale? Y os iba a decir, en el caso de que tuviésemos un decimal, que es este caso, ¿vale? Esto de aquí sí que se considera cifra significativa porque nosotros lo podemos poner también como una potencia 5,0 por 10 a la 4. 373 01:01:03,920 --> 01:01:17,079 50,0 por 10 a la 3, ¿vale? Nuestra única cifra que nos está aportando valor es esta de aquí y esta que hemos puesto expresamente detrás del punto, ¿vale? 374 01:01:17,079 --> 01:01:35,099 Entonces, una vez que sabemos que es una cifra significativa, que la mayoría de las veces no nos tenemos ni que parar a pensarlo, nos va a salir automático, pero bueno, ahora que lo sabemos, tenemos que ver dos cosas. 375 01:01:35,099 --> 01:01:50,960 ¿Qué hacemos cuando tenemos operaciones matemáticas? Por ejemplo, que yo esté sumando dos números, ¿cuántas cifras le pongo? Para que tenga sentido, o que los esté restando, o que los esté multiplicando, o que los esté dividiendo. Eso tiene unas normas, que ahora las vemos. 376 01:01:50,960 --> 01:01:57,920 Si veo que es mucha tralla, vemos el redondeo y eso lo dejamos para el próximo día, ¿vale? 377 01:01:57,940 --> 01:01:59,719 Que igual ha sido mucha información ahí. 378 01:02:00,440 --> 01:02:08,000 Entonces, bueno, hemos visto las cifras significativas y ahora vamos a ver los criterios de redondeo, que eso sí que es muy fácil. 379 01:02:08,139 --> 01:02:17,480 ¿Qué pasa? Pues que si yo tengo esto de aquí, por ejemplo, 0,540 y te digo, vale, pero es que yo quiero que me redondees a dos cifras significativas. 380 01:02:17,480 --> 01:02:36,300 ¿Qué tienes que hacer? Acordarme el número. Es como cuando decimos ¿cuánto mides? Pues más o menos 1,7 y tú realmente mides 1,69 pero redondeas a 1,7. Estás quitando una cifra significativa, en vez de 3 estás dando 2. 381 01:02:36,300 --> 01:02:47,639 Y lo que estás haciendo es aproximar ese número nuevo que das para que sea lo más parecido posible, que tenga toda la información posible respecto al número real. 382 01:02:47,639 --> 01:03:10,800 Entonces, ¿cómo redondeamos? Pues tenemos, a ver, perdonadme, que os quiero primero explicar antes de los intervalos de confianza los criterios de redondeo, lo que os estaba diciendo. 383 01:03:10,800 --> 01:03:37,360 Entonces, el redondeo es el proceso de eliminar cifras que no son significativas de un número, que puede ser por distintos motivos. Por lo que os he dicho al principio, que nosotros metemos para hacer una media en la calculadora y nosotros estábamos trabajando con un pH que tenía un decimal, 7,1, 6,8, 7,3 y de repente nos da una media de 7,12348 con un montón de decimales. 384 01:03:37,360 --> 01:03:57,960 Esos decimales nos los quitamos de encima. Lo vamos a dejar en los dos dígitos, dos cifras significativas que teníamos originalmente. Por eso hemos redondeado de 7,1, 7,7, no sé qué, a 7,2, me parece que era. 385 01:03:57,960 --> 01:04:18,260 ¿Vale? Entonces, ¿cómo hacemos el redondeo? Muy fácil. Cuando tenemos nuestro primer dígito no significativo, o sea, el que queremos eliminar, está comprendido entre 0 y 4, lo que hacemos es dejar el anterior como está y lo eliminamos. 386 01:04:18,260 --> 01:04:43,030 Por ejemplo, si tengo 4,3 y quiero redondear a una sola cifra significativa, o sea, un número entero, ¿a qué redondearía el 4,3? A 4, ¿no? Si quiero que solo tenga una cifra significativa y es 4,3, lo redondeo a 4. 387 01:04:43,030 --> 01:05:01,550 En cambio, si tengo 4,7, ¿a qué lo redondeo? A 5. Si el dígito que yo quiero quitar está entre 0 y 4, se quita directamente. Si está entre 6 y 9, se le añade una unidad al dígito anterior. Esto pasa mucho con las notas. 388 01:05:01,550 --> 01:05:12,070 Si tú tienes un 7,2 en el examen, tu nota de evaluación va a ser un 7. En cambio, si tienes un 7,8, tu nota de evaluación será un 8. Es la manera de redondear. 389 01:05:12,070 --> 01:05:32,090 Entonces, cuando tenemos que nuestro último dígito es de 0 a 4 o de 6 a 9, lo tenemos claro, ¿no? Redondeamos para arriba cuando es desde 6 hasta el 9, 5,8 se redondea a 6, 5,9 se redondea a 6, 5,2 se redondea a 5, etc. 390 01:05:32,090 --> 01:05:51,110 Ahora, nuestra única duda va a ser cuando tengamos un 5. Si tengo un 5.5, ¿a qué redondeo? ¿A 6 o a 5? Pues ahí utilizamos un criterio que es un criterio arbitrario, no es que tenga un sentido físico. 391 01:05:51,110 --> 01:06:09,789 Lo que sí que pasa es que si utilizamos un criterio uniforme, estamos consiguiendo minimizar el error. Porque imaginaos que yo siempre que sea 5.5 redondeo a 6. Estoy metiendo un montón de error por exceso, porque estoy dándole 0.5, 0.5, 0.5 de más cada vez que tengo que redondear. 392 01:06:09,789 --> 01:06:23,309 En cambio, si utilizo este criterio que os voy a contar ahora, va a haber veces que ese 5,5 va a redondearse al siguiente y va a haber otras veces que se va a redondear a la anterior. 393 01:06:24,090 --> 01:06:34,389 ¿Y cómo lo hacemos? Pues mira, si el número que le precede es par, no se cambia y se incrementa en 1 si es impar. 394 01:06:34,389 --> 01:06:46,690 ¿Vale? ¿Esto qué quiere decir? Pues que si el número que tengo yo antes, tengo 5,16 y lo quiero dejar en dos cifras significativas, ¿vale? ¿Qué hago? 395 01:06:46,690 --> 01:06:50,309 5,15 396 01:06:50,309 --> 01:06:52,849 5,16 está claro 397 01:06:52,849 --> 01:06:55,690 que si lo quiero redondear es 5,2 398 01:06:55,690 --> 01:06:59,510 porque esto está más cerca del 2 que del 1 399 01:06:59,510 --> 01:07:02,429 si fuese 5,12 400 01:07:02,429 --> 01:07:05,710 redondearía a 5,1 401 01:07:05,710 --> 01:07:07,130 entonces aquí 402 01:07:07,130 --> 01:07:09,449 es cuando tengo el 5,15 403 01:07:09,449 --> 01:07:13,570 y puedo redondear o a 5,2 o a 5,1 404 01:07:13,570 --> 01:07:15,710 entonces miro el criterio 405 01:07:15,710 --> 01:07:34,610 Pero si este número, el que precede al que yo voy a quitar, es par, se deja como está. Si es impar, le sumo 1. El 1 que es par, impar, impar, le sumo 1. Entonces el 5,15 se me queda en 5,2. 406 01:07:35,610 --> 01:07:50,010 Ahora, este de aquí, 5,25. Este es el que voy a quitar, el 5. Y tengo que saber si redondeo a 5,3 o a 5,2. Como es par, lo dejo en el que está, 5,2. 407 01:07:50,010 --> 01:08:09,369 ¿Vale? Si por ejemplo tuviese, yo qué sé, 4,375 y lo quiero redondear, en vez de las cuatro cifras que tiene a 3, ¿qué número se me quedaría? 408 01:08:09,369 --> 01:08:31,510 4,375. Podría ser o 4,38 o 4,37. Si lo quiero dejar en tres cifras en vez de cuatro, 4,38 o 4,37. 409 01:08:31,510 --> 01:08:43,310 Como el 7 es impar, lo voy a redondear a 4,38, ¿vale? 410 01:08:43,789 --> 01:08:56,590 En cambio, si fuese 4,365, como es par, lo redondearía a 4,36, ¿vale? 411 01:08:56,590 --> 01:09:03,409 No sé si os ha quedado claro esto o tenéis dudas. 412 01:09:03,409 --> 01:09:15,579 A ver, no aparecen. Vale, voy a cortar ya la grabación.