Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

Conceptos básicos estadísticos - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 18 de febrero de 2025 por Jose Antonio G.

65 visualizaciones

Conceptos básicos de estadística

Descargar la transcripción

Primero de todo, agradeceros que estéis aquí, que hayáis venido hoy, que estéis presentes. Esta videoconferencia va dirigida a tratar de esclarecer un poco los conceptos estadísticos. 00:00:07
Yo no sé qué nivel tenéis cada uno. Yo con Moisés hablé contigo. Bueno, pues más o menos, el resto no lo sé. Pero bueno, ¿tenéis más o menos conceptos estadísticos? 00:00:29
Yo hace años, años, que no... Pues hasta que acabé el bachillerato, ¿sabes? Que era de ciencias. 00:00:41
Sí, pues precisamente por eso. Es importante que analicemos esos conceptos. Voy a hacer dos. Hoy no voy a dar la parte de análisis probabilístico y no voy a dar la diferencia estadística. 00:00:48
vamos a empezar una introducción 00:01:05
ahora lo vemos 00:01:06
se prepara una presentación 00:01:09
y con esa presentación a ver si hay algún ejemplo 00:01:10
a ver si podemos esclarecer un poco 00:01:13
la parte de 00:01:15
luego tenéis también 00:01:17
dime 00:01:18
esto grabarlo es imposible 00:01:20
porque yo en algún momento tendré que salir 00:01:23
lo estoy grabando ahora mismo 00:01:25
genial 00:01:27
has hecho una prueba antes 00:01:28
genial, genial, vale, pues muchas gracias 00:01:30
vale, entonces lo que decía 00:01:32
me voy a centrar sobre todo en univariable 00:01:34
es decir, una única variable 00:01:37
aunque el temario hace mención 00:01:39
también de multivariable 00:01:41
y hace mención de los métodos, etcétera 00:01:42
pues ahí tampoco se centra mucho 00:01:45
como no 00:01:47
simplemente lo menciona 00:01:49
pues tampoco nos vamos a meter, además es mucho más 00:01:51
complejo, entonces con la parte 00:01:53
de una variable yo creo que está 00:01:55
pues si acaso 00:01:57
yo tuviera que poner, como tengo que poner 00:01:59
práctica, si tuviera que poner algún tipo de ejercicio 00:02:01
o algo pues va a ser de una variable 00:02:03
entonces 00:02:05
vamos a 00:02:06
un momento por favor 00:02:09
venga, gracias 00:02:12
me informan que tenías problemas 00:02:16
para conectarte 00:02:19
vale, vale, ya está 00:02:21
bueno pues sigo 00:02:22
lo vamos a centrar 00:02:25
sobre todo en univariable 00:02:27
de acuerdo 00:02:29
y bueno vamos a ver un poquito 00:02:29
las nociones básicas 00:02:32
y espero que esto os sirva 00:02:36
para cuando empecéis 00:02:37
la próxima unidad del módulo 00:02:39
que es la 5 00:02:42
pues no sea tan complicado 00:02:42
os iba a decir que tenéis también 00:02:44
series temporales 00:02:48
pero también 00:02:48
lo menciona más o menos 00:02:51
y tampoco voy a profundizar mucho 00:02:54
series temporales es más complicado 00:02:56
¿de acuerdo? 00:02:57
voy a compartir 00:02:59
voy a compartir lo que es 00:03:00
la presentación 00:03:03
y lo vamos viendo 00:03:05
es esta la presentación 00:03:05
¿lo veis bien? 00:03:11
bueno, pues está la información 00:03:12
de mercado, concepto básico, etc. 00:03:15
entonces, y así puedo ir 00:03:17
pasando las 00:03:26
slides 00:03:27
vale, está aquí 00:03:29
¿lo veis bien? 00:03:38
¿perfecto? 00:03:41
si, si, seguimos viendo la misma 00:03:42
lo he puesto en powerpoint 00:03:44
antes estaba en el pdf 00:03:48
entonces ahora yo le voy pinchando 00:03:49
a medida que voy y así es más 00:03:52
queda más chulo 00:03:53
bueno empezamos 00:03:55
presentación, bueno el propósito de la presentación 00:03:58
bueno pues lo que os he dicho 00:04:00
vamos a tratar de indagar un poquito 00:04:01
en los conceptos de estadística 00:04:04
y ver un poquito 00:04:05
porque el estado de módulo es importante 00:04:06
aunque se centre al final 00:04:08
yo creo que debería 00:04:11
a efectos de las unidades 00:04:13
debería introducirse un poquito antes 00:04:17
bueno, ya en la 4 ha hablado un poquito de muestra 00:04:18
etcétera, pero debería introducirse un poquito antes 00:04:21
porque luego todo viene de golpe 00:04:23
en la unidad 5 00:04:24
y lo que decís que se hace bola 00:04:26
claro, se va a hacer bola 00:04:29
pero vamos, de acuerdo 00:04:30
hay dos apartados 00:04:32
o lo que es la 00:04:33
el temario o la unidad 00:04:35
pues hace referencia a análisis de datos 00:04:40
y análisis probabilístico 00:04:42
Como os he comentado, vamos a centrarnos hoy en análisis de datos, que es más o menos lo que veremos que son los análisis de datos. 00:04:43
Y luego el análisis probabilístico va centrado más en la diferencia estadística, que es un poquito más complejo, que es el intervalo de confianza, etc. 00:04:51
Y eso lo vamos a ver en otra videoconferencia, que lo voy a dividir en dos partes para que no sea tan largo. 00:05:02
Bueno, entonces, cuando decimos análisis de datos, en realidad lo que queremos hacer es analizar la información. 00:05:07
Es decir, nosotros podemos tener una gran cantidad de información, información sobre un hecho, un suceso o un determinado aspecto que queremos estudiar o que queremos analizar. 00:05:17
y lo analizamos. Entonces, para ello tenemos una serie de herramientas, que son herramientas estadísticas, 00:05:29
que son las que nos van a permitir hacer un análisis y comprobar o llegar a obtener una serie de conclusiones 00:05:35
que nos van a permitir tomar decisiones o lo que fuera. Entonces, esto es lo que realmente nos vamos a centrar. 00:05:46
Nos vamos a centrar en qué medidas o qué herramientas contamos para poder analizar o determinar cómo está la información que en este caso queremos estudiar. 00:05:53
Entonces, estas herramientas, las herramientas estadísticas, nos vamos a centrar en cuatro partes. 00:06:09
Análisis de la varianza, las medidas de, bueno, análisis de la varianza es comparar cuando tenemos varias muestras, en lugar de tener una sola muestra. 00:06:15
Vemos cómo varían o si tenemos varias muestras tenemos varias medias. 00:06:23
Entonces en expulsión de esas medias vamos a ver cómo varían o cómo se alejan nuestras observaciones con respecto a esas medias. 00:06:29
Luego análisis univariable, ahí nos centraremos en medidas de posición y dispersión. 00:06:37
Y me hace entrar única y exclusivamente en univariable, una única variable. 00:06:42
Es decir, variable, miraos lo que viene en la unidad, en el temario del módulo y más o menos se hace mención de una serie de procedimientos para usar con la análisis de más de una variable. 00:06:45
En realidad, nuestro mundo es un mundo complejo. En nuestra realidad, o lo que realmente nosotros vemos, o lo que deberíamos estudiar no es una única variable, sino son muchas. 00:07:05
Perdona, José, seguimos viendo el PDF. No sé si lo vemos. 00:07:18
Ah, ¿seguimos viendo el PDF? 00:07:23
Sí. 00:07:24
No vemos, sí. 00:07:25
Si lo estás hablando, no sale de lo que estamos viendo. 00:07:26
Espera un momento, a ver, espera un momento, entonces voy a ir a, claro, porque a lo mejor he compartido el, pero por siempre es el, perdón, perdón, perdón. 00:07:29
No, no pasa nada. 00:07:39
Pues el, pues no me dejo, me va a hacer el PowerPoint, ¿por qué no me deja? Si está aquí. Bueno, venga, lo hago con el PDF y lo voy moviendo el PDF, porque no sé por qué no me deja la ventana, bueno, al final es lo mismo, sí. 00:07:43
entonces me he centrado 00:08:05
bueno, ahora veis el 00:08:08
cero presentación, perdonad 00:08:10
el propósito 00:08:11
como os he dicho es obtener los conceptos 00:08:13
básicos, teníamos análisis de datos 00:08:16
y análisis probabilístico 00:08:18
esta es la 00:08:19
slide en donde estábamos 00:08:22
y decidí dónde viene 00:08:23
todo esto 00:08:26
pues como veis 00:08:27
son cuatro puntos 00:08:30
tenemos unas herramientas 00:08:31
lo que os he dicho, a nivel real 00:08:33
pues tendríamos que analizar más de una variable 00:08:36
porque lo que nos rodea es más de una variable 00:08:38
pero bueno, pero como lo que 00:08:40
buscamos es 00:08:42
adquirir una serie de conocimientos o refrescar 00:08:42
los conocimientos básicos 00:08:46
o de estadística, pues vamos a 00:08:48
centraros en una única variable 00:08:50
y así conocer todos los 00:08:52
estadísticos o todas las herramientas 00:08:54
estadísticas que 00:08:56
hay para analizar los datos 00:08:56
¿de acuerdo? Entonces tenemos medida de 00:09:00
Exposición y dispersión, que estas van a ser las típicas, la media, la varianza, todo eso sonará. 00:09:01
Luego análisis de la varianza, que como os he dicho ya no es una muestra, sino lo que permite es analizar o comparar varias muestras, luego lo veremos. 00:09:09
Y luego medidas de forma de la distribución, es decir, sabiendo cómo es, todos conocéis lo que es una distribución normal. 00:09:19
La distribución normal es la clásica campana de Gauss, que hace como una forma de campana, donde la parte de arriba es lo más probable o las observaciones que más probable se den, y luego a medida que te vas yendo hacia los lados, pues va bajando. 00:09:28
¿Por qué? Porque la probabilidad de que esa variable se dé o se obtenga es menor 00:09:44
Y entonces va disminuyendo y disminuyendo a medida que nos vamos alejando de lo que es el eje X 00:09:53
Partimos del centro, el centro sería la media 00:09:59
Y esto es lo que vamos a medir a través de estas medidas de forma de la distribución 00:10:02
Es decir, lo que vamos a ver es primero si realmente estamos en una distribución normal, simétrica 00:10:07
o si se tiende hacia la derecha, hacia la izquierda, o si es más achatada o más pronunciada. 00:10:14
Eso es lo que va a permitir medir la forma de la distribución, que es interesante y es importante. 00:10:19
Estas son herramientas que tenemos para analizar los datos o la información que tengamos. 00:10:28
¿Para qué? Pues lo que hemos hecho, para llegar a una serie de conclusiones 00:10:32
o verificar realmente lo que realmente estemos buscando. 00:10:36
Dimos el número de datos, tenemos unas herramientas y a partir de esas herramientas, pues analizamos. Entonces, seguimos. Empezamos con análisis univariable de datos. Bueno, pues como hemos dicho, análisis univariable significa que vamos a utilizar una única variable, es decir, vamos a centrar en el comportamiento de las variables, pero de forma individual, es decir, no van a estar afectadas por otro tipo de variables, en este caso solo una. 00:10:40
Y aquí nos centramos en, vamos a repasar lo que es distribución de frecuencias, la medida de tendencia central, que esto si lo recordaréis o sabéis que es la media, también hay otras, pero la media aritmética o media ponderada es la más utilizada. 00:11:05
medidas de dispersión, pues aquí tenemos la varianza 00:11:23
o la desviación típica 00:11:25
que no lo veremos, y luego la inferencia estadística 00:11:27
que hago una mención pero lo dejo para 00:11:29
el siguiente videoconferencia 00:11:31
esto es más complicado 00:11:32
hay que introducir 00:11:35
un ejemplo y darle más tiempo 00:11:37
entonces 00:11:39
distribución de frecuencia, distribución de frecuencia simplemente es 00:11:40
pues si tenemos 00:11:43
una determinada 00:11:45
variable que estamos estudiando 00:11:47
y tenemos un montón de observaciones 00:11:49
sobre esa variable 00:11:51
Pues ver cuántas veces se repite. Es decir, la frecuencia lo que nos indica es, como si veis aquí, os pongo número de litros de leche consumidos en el hogar a la semana. 00:11:52
Pues nuestra variable, lo que estamos estudiando es el número de litros que se consumen por semana. 00:12:03
Por tanto, ¿qué nos determina la frecuencia o por qué es importante la frecuencia? 00:12:11
Porque nos va a permitir saber si se repite más un determinado valor que otro. 00:12:14
Si os fijáis, tenemos aquí en esto que veis en gris, tenemos en la frecuencia, toda la parte, la cabecera en rojo y luego todo lo que viene en naranja, bueno, en naranja aquí también tenía que haber puesto en naranja, pero bueno. 00:12:20
Entonces, esto son la frecuencia. ¿Qué indica la frecuencia? Que, por ejemplo, el valor 3, es decir, 3 litros por semana que ha consumido un, pues, simplemente imaginaos que habéis hecho una encuesta, habéis cogido un montón de individuos y un individuo o 118 individuos nos han dicho que consumen 3 litros por semana. 00:12:38
Por lo tanto, esa es la frecuencia. Es importante porque nos permite saber cuál de esos valores que toma nuestra variable se repite más. 00:12:57
En este caso, además, estos 118 coinciden con la mayor frecuencia o el mayor número de todos los encuestados, que son 836. 00:13:11
indicamos que la mayor frecuencia se encuentra en 118 00:13:23
que son los 3 litros por semana 00:13:29
esto es lo que estamos midiendo con la frecuencia 00:13:31
determinar realmente 00:13:34
lo repetitivo que se da a un determinado valor 00:13:36
de nuestras observaciones 00:13:41
y lo debemos acompañar 00:13:43
debe estar reflejado de manera porcentual 00:13:46
la manera porcentual es importante 00:13:51
y aquí lo veis, sobre todo la acumulada, aquí nos indica qué porcentaje, por ejemplo, la primera es un 1,9 porcentaje, o sea, es un 1,8 con respecto al total. 00:13:53
Con respecto al total, es decir, casi el 2% se da que toman un litro por semana determinadas personas. 00:14:06
Pues esto es importante ¿para qué? Pues para reflejar en el acumulado cuál es el porcentaje o cómo, o incluso para dividir lo que es la distribución con todas las observaciones y saber realmente dónde está el mayor peso o el menor peso. 00:14:18
No sé si lo veis. Esto es sencillo. En realidad simplemente estamos midiendo por porcentajes cuánto se repiten un determinado valor del conjunto de observaciones. 00:14:36
si yo entiendo las dos primeras columnas vale al final es asignar la frecuencia vale y luego darle 00:14:46
el porcentaje porque eso lo hago yo en mis ventas para saber qué porcentaje de ventas se tiene con 00:14:53
cada cliente del 100% vale pero luego la del un percent que creo que hay un missing es abajo si 00:14:57
me sientes a lo mejor que es algún valor que a lo mejor se marcaba pero luego a nivel de valor 00:15:06
no daba y es como ha metido como un error que suele ocurrir cuando tomas información o haces 00:15:12
una encuesta o lo que sea pues puede ocurrir errores entonces a efectos del porcentaje está 00:15:20
incluido en 836 es un 4,1 por ciento pero como es missing y no tenemos un valor pues entonces 00:15:25
como si lo calcula otra vez el porcentaje es decir en realidad está serían 836 menos 34 00:15:32
sería 802 no 802 sería el total de observaciones válidas y se hace sobre eso efectivamente sobre 00:15:41
esa calcula y por eso nada más que se ha añadido un missing para que veáis que también vale y la 00:15:51
cuarta es perfecto todos y la cuarta entonces y la cuarta la acumulada acumulada sabán el primero 00:15:58
1,9 más 12,5 son los 14,3. ¿Por qué necesitamos la acumulada? Porque nos va a determinar o nos va a permitir saber si es el 100%, ¿no? 00:16:05
O dividir toda la distribución en, por ejemplo, la mitad de la distribución estaría en, llegaría a 55. 00:16:20
Ahí más o menos estaría la, y como veremos luego, permite obtener la mediana. 00:16:30
Yo, perdona, pero la acumulada no sé de dónde sale. 00:16:36
La acumulada es donde pone valid percent, aquí, en la columna, espera, señalo, ¿se ve el ratón? 00:16:40
Sí. 00:16:48
pues aquí va sumando 00:16:48
va acumulando por 9 00:16:50
luego suma estas dos 00:16:52
luego estas tres y así 00:16:54
hasta claro, la suma de todas nos tiene que dar 00:16:55
aquí el 100 00:16:58
que ha sumado todo 00:16:59
¿de acuerdo? 00:17:01
es importante ese acumulado, ¿por qué? 00:17:04
porque nos va a permitir luego ver dónde está la mediana 00:17:06
que es la que divide la distribución 00:17:08
en dos partes iguales 00:17:12
¿ha estado claro todo más o menos? 00:17:15
esto es simplemente eso 00:17:18
Fijarse en qué observaciones se repiten para un determinado valor y conocer así. 00:17:19
En función de eso, es un método, es una forma de analizar los datos y determinar cuál se repite más o cuál se va a... 00:17:26
Es importante. Son herramientas, nada más. 00:17:34
Basamos a las medidas de tendencia central. 00:17:40
Las medidas de tendencia central supongo que son las típicas, las de siempre. 00:17:41
La media aritmética, que es una media aritmética, pero no simple, es una media aritmética ponderada. ¿Qué significa ponderada? Que como tenemos, como si todos los valores de litros de la semana únicamente se lo hubiéramos encuestado a una persona, o sea, si por cada valor de litros por semana consumidos únicamente correspondiese a una persona, a un encuestado, pues sí, tendríamos una media aritmética. 00:17:45
La media aritmética es simple, pero como se repiten, es decir, hay determinados valores, como hemos dicho, el 3 litros por semana se repite hasta 118 veces. De los 800 y pico encuestados, 118 consumen 3. Por tanto, tendrá más peso a efectos de determinar la media aritmética ese que el resto, ¿o no? 00:18:15
Por tanto, hay que ponderarlo. Es como si cuando le multiplicas cada valor, el 3 por 118, lo que estás determinando es darle un peso. 00:18:39
Si os fijáis, aquí la media dice un sumatorio de la frecuencia, que es como si dijéramos el peso, y del valor. 00:18:49
Todo ello dividido entre n. 00:18:57
Vemos aquí, y efectivamente son, van multiplicando cada valor por su peso. 00:18:59
Y así hasta dividirlos, ¿ves aquí lo que os decía? Son 802 observaciones en realidad. ¿Por qué? 34 eran missing, o sea, no eran válidas. Entonces, ¿qué va multiplicando? Vamos multiplicando cada valor, en este caso el 1, valor 1 por su frecuencia 15, más 2 por 100, más 3 por 118. ¿Por qué? Porque no puede ser simple, tiene que ser ponderada porque el 2 tiene mayor importancia que el 1. 00:19:06
¿por qué? porque se repite 100 veces 00:19:33
frente al otro que son 15 00:19:36
por lo tanto la forma de darle un peso 00:19:38
y darle una mayor importancia en una media aritmética 00:19:39
es multiplicándole 00:19:42
por su frecuencia 00:19:44
se multiplican cada una de ellas, se suman todas 00:19:45
y una vez sumadas se dividen 00:19:48
por el número de observaciones que había 00:19:50
que son 802 00:19:51
y eso tiene 6,68 00:19:53
porque si no hiciéramos el peso 00:19:55
si no fijáramos ese peso 00:19:57
pues realmente 00:19:59
estaría distorsionada la media 00:20:01
No sería real. ¿De acuerdo? Casi son, no sé, son aproximadamente 24, si lo divides, no saldría a orden. 00:20:03
Entonces es necesario hacer esa ponderación. Eso en cuanto a la media. 00:20:15
¿Y qué nos determina esa media aritmética? Simplemente que el conjunto de todas las observaciones, ¿cuál es el que se da como media? 00:20:19
Es decir, de todos ellos, 6,68 más o menos, es los litros que de media, cogiendo esas 802 observaciones, te da, es el valor que realmente da como media del conjunto de todas las observaciones. 00:20:25
es una medida central 00:20:46
es decir, de nuestra distribución 00:20:51
si nuestra distribución es normal 00:20:52
y hace forma de una campana 00:20:55
pues la media estaría justo en el medio 00:20:56
que es el valor 00:21:00
y esa media son los 6,7 00:21:02
simplemente es otra herramienta 00:21:04
para analizar los datos 00:21:10
es decir, para decirnos 00:21:11
que de todo ese conjunto de datos 00:21:12
lo normal es que si coges una observación 00:21:14
lo más normal es que te vaya 00:21:17
a estar cercano a los 6 00:21:18
porque es la media 00:21:20
vale 00:21:23
en cuanto a la mediana, la mediana es la que divide 00:21:25
la divide 00:21:28
la distribución, cuando hablamos de distribución 00:21:29
es el conjunto de todas las observaciones 00:21:32
como hemos dicho anteriormente 00:21:34
nuestra distribución 00:21:35
y le hemos hecho un acumulado 00:21:37
se ha ido sumando, sumando 00:21:39
de tal manera que 00:21:41
cuando tenemos más o menos la mitad 00:21:42
cuando está dividido entre dos 00:21:46
pues justo cuando 00:21:47
cuando nuestro porcentaje sea 00:21:49
cercano al 50% 00:21:51
y si os fijáis, más o menos 00:21:53
coincide con el 6, estaría entre el 5 y el 6 00:21:55
¿no? 00:21:58
5 y pico, más o menos 00:21:59
determinamos que la mediana 00:22:00
en este caso, sería el 6 litros 00:22:03
¿vale? es otra herramienta 00:22:06
para determinar o para analizar los tornados 00:22:08
¿y qué nos quedaría? pues la moda 00:22:10
la moda es el 00:22:11
el que tiene un mayor 00:22:13
todos los valores 00:22:16
que tenemos, el que más 00:22:18
se revisa, el que tiene 00:22:20
una mayor frecuencia. 00:22:22
¿Y cuál habíamos determinado que era el que tiene 00:22:24
mayor frecuencia? 00:22:26
El que tenía un total 00:22:27
de 118 encuestados 00:22:29
habían determinado que consumían 00:22:32
3 litros por semana. 00:22:34
Este es el valor. 00:22:35
Ya tenemos 3 00:22:38
métodos o 3 herramientas 00:22:40
que ya nos... 00:22:42
De un conjunto de 802 00:22:44
observaciones, 00:22:46
Te las vemos, tú puedes ver los números y dices, bueno, veo los números y muy bien. 00:22:48
Pero ya con estas tres medidas o estas tres herramientas ya tienes una idea, 00:22:51
ya empiezas a tener una idea un poquito más clara de toda esa masa de números que tienes que no te dicen nada. 00:22:57
Pues para eso, ese es el objetivo de estas medidas o de estos, pues determinar algo, 00:23:03
que podamos llegar a unas conclusiones o podamos ver los números, que no son solo números, 00:23:09
sino que realmente interpretarlos 00:23:15
y llegar a 00:23:17
pues algo, algo que nos diga 00:23:18
pues oye, esto es así 00:23:20
por eso es tan útil 00:23:22
la estadística en general 00:23:24
es muy muy útil 00:23:27
prácticamente nos permite casi 00:23:28
ver el futuro 00:23:30
y yo creo que de hecho la utilizamos a diario 00:23:31
lo que pasa que a lo mejor no sabemos cuál de ellas 00:23:35
no somos conscientes 00:23:37
pero es muy muy útil 00:23:40
y bueno y ahora ya 00:23:42
bueno antes 00:23:43
Entonces, bueno, lo que es el tratamiento de datos y todo esto ya se daba antes. La diferencia entre antes y ahora es que parece que ahora hay un boom con el tratamiento de datos. Antes se ha hecho tratamiento de datos desde los 60, 70, años 70. 00:23:44
Es decir, la diferencia es que ahora tenemos la información, tenemos un mayor volumen de información, tenemos una mayor velocidad a través de ordenadores, a través de base de datos, etc. 00:24:00
Y entonces nos permite hacer cosas que a lo mejor no se podían hacer antes. 00:24:13
Pero antes se utilizaban prácticamente las mismas herramientas de estadísticas o la misma modelización estadística para poder llegar a determinar el futuro. 00:24:17
pero es eso 00:24:27
es el boom, lo conocéis 00:24:31
el boom del Big Data 00:24:32
y del 00:24:33
Machine Learning, etc. 00:24:36
bueno 00:24:39
más, otra medida de tendencia central 00:24:39
son los presentiles, cuartiles 00:24:42
esto simplemente lo que hace 00:24:44
realmente es dividir, como hemos hecho con la mediana 00:24:46
lo que hace es dividir nuestra distribución 00:24:48
en partes 00:24:51
que también es interesante 00:24:51
son cuartiles, en realidad lo que está dividiendo 00:24:53
es en tres partes 00:24:56
Si cogemos un intervalo, en realidad, desde 0 hasta Q1, desde Q1 hasta Q2, desde Q2 hasta Q3 y hasta el final. 00:24:57
Por lo tanto, estamos dividiendo en tres partes, sabiendo que el Q2 es, en realidad, el que me va a dividir la distribución, el conjunto de observaciones, en dos. 00:25:08
O sea, en realidad debe coincidir con la mediana. 00:25:18
En realidad esto es lo único que hace 00:25:21
Bueno, tiene aquí una formulita 00:25:24
Que aquí, por ejemplo, para conseguir el Q2 00:25:25
Pues sería 2 por el número de observaciones partido de 4 00:25:27
En este caso, a ver que más lo he hecho 00:25:30
Es decir, si tú coges ahora mismo los cuartiles 00:25:33
Y coges las 800 00:25:36
800 00:25:38
Son 802, ¿no? 00:25:39
802 observaciones 00:25:42
Que es n 00:25:43
Y lo multiplicas por m 00:25:44
Por 2 00:25:46
Y luego lo divides entre 4 00:25:50
porque estamos viviendo en cuatro partes 00:25:51
sabemos que es igual 00:25:53
si podríamos 00:25:55
ver esto con algún ejemplo 00:25:57
porque por cuartiles y todo esto 00:25:59
pues no 00:26:01
en realidad el ejemplo lo hemos visto antes 00:26:02
¿por qué? porque en realidad hemos dividido 00:26:05
en realidad hemos dividido 00:26:07
si os fijáis en el 55 00:26:08
aquí, donde está el 55 00:26:10
el porcentaje 55 00:26:13
que es prácticamente el 50 00:26:14
en realidad es la mediana 00:26:17
determinada la mediana 00:26:18
ahí sería el Q2 00:26:20
¿por qué? porque está dividiendo 00:26:21
el Q2 divide, si dividimos en cuatro partes 00:26:23
nuestra distribución, es decir, todo esto 00:26:25
en realidad el Q2 es como 00:26:27
dividirlo entre dos partes 00:26:30
pues ese es el ejemplo 00:26:31
lo único que puedes dividirlo entre 00:26:33
deciles, pues diez partes 00:26:35
centiles, en cien partes 00:26:37
lo que necesites 00:26:38
la analisis, etcétera, pero en realidad es lo mismo 00:26:40
por eso nos decía que la mediana 00:26:43
debe coincidir con ese Q2 00:26:46
que es el Q2 que divide en cuatro partes 00:26:47
¿Me estoy explicando? 00:26:49
En realidad es simplemente 00:26:53
Es decir, esas medidas de tendencia central 00:26:54
Lo que hacen es dividir nuestra distribución en partes 00:26:56
Pues para analizar 00:26:58
Pues imagínate que una parte 00:27:00
Una parte está más concentrada 00:27:01
Otra menos, pues simplemente para eso 00:27:03
Es otra herramienta 00:27:05
Otra herramienta de análisis, nada más 00:27:07
Y utiliza esta fórmula 00:27:09
La fórmula que 00:27:15
Simplemente n es el número de soluciones 00:27:16
Que en nuestro caso son 802 00:27:19
m es 00:27:20
el cuartil, si estamos en cuartiles 00:27:22
el cuartil que necesites determinar 00:27:24
si queremos determinar el cuartil 2 00:27:26
pues se multiplicaría por 2 00:27:28
y k sería el número de partes 00:27:30
en las que se divide nuestro 00:27:32
en este caso 00:27:33
un ejemplo, si queremos hacer un cuartil 00:27:35
sería 4 por n partido de 00:27:38
que sería 00:27:41
los 802 00:27:43
por 2 00:27:44
y entre 4 00:27:48
sale los 401, pues ya sabemos que 00:27:50
hay 00:27:53
401, claro, es lógico 00:27:55
si tenemos 802, la mitad tiene que ser 401 00:27:58
observaciones, es decir, las primeras 401 00:28:01
observaciones, que es ahí donde se determina o se obtiene 00:28:04
la mediana, es donde se 00:28:07
divide nuestra, que queremos saber, claro, aquí sabíamos que 00:28:11
era por la mitad y ya está, pero es simplemente para saber 00:28:13
cómo dividir la distribución 00:28:16
y saber el número de observaciones que hay en cada una de las partes. 00:28:19
Vale, pero ¿por qué has utilizado lo del cuartil 2? 00:28:26
Que yo no llego a entender bien. 00:28:29
Como veo el cuartil 1, cuartil 2, cuartil 3, ¿por qué es el 2? 00:28:31
Porque el 2, en realidad, si tú coges un intervalo de... 00:28:35
Si tú coges un intervalo... 00:28:41
A ver, espera, voy a abrir este. 00:28:43
Claro, no, tengo que compartirlo. 00:28:48
Es que no tengo ninguna para dibujar. 00:28:59
Vale, la fórmula la entiendo. 00:29:01
que lo entiendo bien porque coges el cuartil 2 00:29:03
vale, espera 00:29:05
os lo dibujo 00:29:16
en un papel, así lo veis 00:29:18
vale 00:29:20
porque es que en este tampoco 00:29:21
voy a compartir 00:29:23
estamos aquí 00:29:37
dejo de compartir 00:29:38
¿me veis ahora a mí? 00:29:41
ah vale, ¿y ahora? 00:29:43
ahora sí, ¿no? 00:29:56
ahora sí 00:29:58
pues esto es 00:29:59
¿veis este interno? 00:30:01
¿Lo veis? 00:30:03
00:30:04
¿Veis cómo se coloca el Q1, Q2 y Q3? 00:30:04
00:30:08
¿El Q2 dónde está? 00:30:08
En el medio 00:30:10
Por tanto, tiene que ser la mediana 00:30:11
Vale, vale 00:30:13
El problema no lo veis porque 00:30:15
¿Cómo se coloca? 00:30:17
Claro, es que no entendía 00:30:18
Siempre va a ser impar 00:30:19
Si el número es par de partes en que se divide 00:30:22
Los que van a dividirla tienen que ser impar 00:30:25
Vale, vale 00:30:28
Por eso 00:30:29
En realidad lo que estamos haciendo es eso 00:30:30
Eso es lo que estamos haciendo a la hora de dividir lo que es la... 00:30:32
Vale, vale. 00:30:36
Vale. 00:30:37
En este momento voy a compartir otra vez. 00:30:38
Y nada más, no tiene más, de verdad. 00:30:42
Simplemente eso. 00:30:44
Salen las fórmulas, a ver qué es lo que hace, es dividir la distribución y ya está. 00:30:44
Medidas de dispersión. 00:30:51
Las medidas de dispersión, pues son lo que realmente vamos a medir aquí, 00:30:52
es cómo varían las distintas observaciones, cómo varían con respecto a nuestra media. 00:30:57
Si nosotros hemos calculado una media que son de 6,68 y cogemos una de las, yo que sé, la de 24 litros por semana, pues tenemos una, ahí la varianza, o en este caso la división estándar, 00:31:03
lo que nos está midiendo realmente es cómo se aleja esa observación de 24 sobre la media. Eso es lo que nos va a medir. 00:31:23
Es decir, nos va a medir la variabilidad. En este caso sea grande, claro, porque hemos cogido el valor de la observación más alto, ¿vale? Cuando realmente son 6,68. Pues esto es lo que nos sirve las medidas de dispersión, es decir, cómo se dispersa el conjunto de valores de nuestras observaciones y en función de ello, pues determinar, pues analizar cómo son nuestros datos, nuestra información. 00:31:30
¿Por qué se utiliza 00:31:57
varianza y desviación estándar? 00:31:59
Si tenemos la varianza, ¿por qué tenemos que utilizar 00:32:02
otra unidad 00:32:04
si nos dice lo mismo? 00:32:05
Y la única diferencia es que tiene 00:32:07
una raíz cuadrada 00:32:09
Bueno, primero 00:32:11
perdón, primero defino la varianza 00:32:13
simplemente es, como veis, vas cogiendo 00:32:15
cada uno de los valores 00:32:17
le resta la media 00:32:19
¿vale? Eso nos dice 00:32:20
cómo 00:32:23
a qué distancia está de la media 00:32:23
ese valor en concreto, lo eleva al cuadrado, ¿eleva al cuadrado para qué? Pues para evitar números negativos, ¿vale? 00:32:27
Dejarlo en un valor absoluto y le multiplica por la frecuencia para darle el peso, como hacíamos antes. 00:32:35
Todo ello dividido entre n menos 1, que es el número de observaciones, ¿vale? 00:32:41
Esto nos indica la varianza, nos va a indicar la varianza. ¿Por qué utilizamos la derivación estándar? 00:32:45
porque nuestros valores, por ejemplo el 3, 3 litros por semana, 14 litros por semana, 00:32:51
están fijados en determinadas unidades. 00:33:01
Si tú lo elevas al cuadrado, ya la unidad que nos va a dar va a diferir de las unidades que tenemos en los valores de las observaciones. 00:33:03
por eso lo que hacemos es 00:33:16
aplicar la raíz cuadrada 00:33:19
para que esas unidades sean comparables 00:33:21
¿me he explicado? 00:33:23
si no lo vemos 00:33:27
esto si no lo vemos con algo 00:33:27
se nos va a hacer porque 00:33:29
hay una fórmula 00:33:31
te iba a preguntar, perdona, esto en teoría 00:33:32
es para que veamos mejor 00:33:35
lo que es el temario que vamos a ver y tal 00:33:37
pero lo tenemos que saber más 00:33:39
a nivel teórico o lo vamos a tener que 00:33:41
poner en práctica 00:33:43
vais a tener que poner en práctica 00:33:45
porque os voy a poner práctica de esto 00:33:46
vale, por eso, que es práctica también 00:33:49
no os voy a poner ni cosas extraordinarias 00:33:50
voy a poner cosas que estén 00:33:53
sí, pero me refiero, como dice César 00:33:55
que al viéndolo así es como que te quedas un poco 00:33:57
y luego será 00:33:59
fácil seguramente, pero 00:34:01
como yo voy a tener que 00:34:03
perdona César, perdona 00:34:04
dime, dime 00:34:06
como yo voy a tener que abandonar en breve 00:34:07
y esto queda grabado 00:34:10
te pediría si pudieras mandar 00:34:13
mandarnos en base a esto 00:34:14
algún ejercicio 00:34:17
práctico que creas 00:34:19
que no vaya a ser útil 00:34:21
para el examen. 00:34:22
Porque es como que yo estoy perdido porque luego 00:34:25
todo esto no sé cómo digerirlo o no sé cómo 00:34:26
llevarlo a un ejercicio o me preocupa 00:34:29
que no vaya a entender con esta teoría luego 00:34:30
el ejercicio. 00:34:32
En realidad de las partes 00:34:34
tenemos los ejercicios. 00:34:36
Aquí tenemos cómo se calcula 00:34:39
y luego 00:34:41
también tenéis aquí un análisis de la varianza 00:34:42
también tenéis un ejercicio entero 00:34:45
con todos los pasos, es decir 00:34:46
os estoy incorporando 00:34:48
es decir, como se calculaba la media 00:34:52
la mediana, aquí tenéis ya el ejercicio 00:34:55
es decir, esto lo tenéis 00:34:56
como la dispersión, pues ahora os digo 00:34:57
como se calcula 00:35:00
y luego el análisis de la varianza también 00:35:02
y luego lo que daría, lo que es la inferencia 00:35:04
estadística con lo de 00:35:06
los intervalos de confianza, etcétera, que también incorporaría 00:35:07
Y luego, aparte, tendréis los que ya vienen en el temario. Estos son concretamente de aquí, de lo que veis aquí, que lo he puesto como recurso. Pues lo he sacado ahí. Pero en realidad lo tenéis, usados métodos de ejercicio. 00:35:10
De acuerdo. 00:35:25
Y os subo, si queréis, os subo el PDF y ya está. 00:35:26
Luego, ¿esta grabación, para verla, va a aparecer directamente en la unidad? 00:35:31
¿Esta grabación va a aparecer en la unidad? Pues sí. 00:35:35
la incorporaré en la segunda 00:35:38
o sea en la unidad 5 00:35:42
perdón 00:35:44
estamos hablando de la unidad 5 en realidad 00:35:45
lo único que me he anticipado 00:35:48
para que cuando llegue diga 00:35:50
madre mía esto que es 00:35:51
claro, estoy viéndolo así, la verdad que se ve 00:35:52
como un poco fuerte 00:35:55
lo de la bola, pues la bola tiene que ser 00:35:56
vamos, se te hace bola, no 00:35:59
bolón, sabes 00:36:00
sobre todo yo, a mí me pasa 00:36:02
por ejemplo, no sé si a los demás, pero claro 00:36:05
como, si es verdad que tú dices, tienes ejercicio 00:36:06
pero claro, ves una tabla, ves muchos datos 00:36:08
ves mucho, y como que a mí eso 00:36:10
me lía un poco, pero 00:36:12
en realidad, porque esto es 00:36:14
siempre lo mismo, esto bueno, si queréis os subo 00:36:16
os pondré algún ejercicio de cómo 00:36:18
se calcula la varianza y la duración 00:36:20
pero esto es simplemente 00:36:22
aplicar la fórmula, claro, tú coges 00:36:23
los valores en una columna 00:36:26
en Excel, pones los valores en una columna 00:36:28
todos los valores, luego, la siguiente 00:36:30
todas las frecuencias, como estaba aquí 00:36:32
Aquí mira, ya tienes todos los valores 00:36:33
Y todas las frecuencias, pero ahora lo único que hay que hacer 00:36:36
Es la siguiente columna ya no es porcentaje 00:36:38
La siguiente columna será el x sub i 00:36:39
Que es este, que es el valor 00:36:42
Menos la media que hayas conseguido 00:36:43
Y vas a poner todos los valores de aquí 00:36:46
De x sub i menos la media 00:36:47
Luego, la siguiente columna que será 00:36:49
x sub i menos la media elevado al cuadrado 00:36:51
Pues pones todos los valores de aquí 00:36:53
Y ya cuando tengas aquí abajo la suma 00:36:55
De x sub i menos la media 00:36:57
Elevado al cuadrado, luego le multiplicas la frecuencia 00:37:00
has hecho la última columna 00:37:02
que es x sub i menos la media 00:37:07
y elevado al cuadrado por la frecuencia 00:37:09
la sumas y ya la divides entre el menos uno 00:37:12
y ahora ya tiene la variación 00:37:14
y luego ya sin aplicar la raíz cuadrada 00:37:15
ya tiene la división típica 00:37:18
es repetitivo 00:37:19
en realidad es largo 00:37:22
a mi ahora mismo me parece difícil pero porque lo tengo 00:37:23
que ver bien, tranquila 00:37:26
y tal, pero que es verdad que bueno 00:37:28
será practicarlo me imagino 00:37:29
un ejercicio de javier yo creo es muy bueno pero es esto yo creo más complicado efectos 00:37:31
de comprensión porque esto es al fin y al cabo es mecánico lo haces y más o menos lo estás 00:37:46
interpretando en realidad es bueno pues es una fórmula matemática lo estás le estás sacando lo 00:37:51
que es la variación que corresponde a cada con respecto a la medida de cada una de las 00:37:56
observaciones, lo levas al cuadrado 00:38:00
para hacerlo absoluto 00:38:02
y luego le pones el peso que es la frecuencia 00:38:04
y lo divides entre el de menos uno y te tiene que dar la varianza 00:38:06
es decir, como media, cuál es 00:38:08
la variación que hay, eso es lo que te está dando 00:38:10
¿vale? Antes dábamos 00:38:12
cuál es la media y ahora vemos cuál es 00:38:14
como si dijéramos una media de lo que realmente 00:38:16
varía, ¿vale? 00:38:18
Yo creo que es más complicado luego lo que veremos 00:38:20
luego en la análisis de la varianza y sobre todo 00:38:22
lo que es los titulares de confianza 00:38:24
y el contraste de hipótesis 00:38:29
eso es un poquito más complicado 00:38:31
porque ahí ya dices, bueno, no lo veo claro 00:38:32
no es 00:38:35
esto es más mecánico 00:38:36
pero vamos, si queréis ejercicios 00:38:39
yo creo que en el cálculo de la varianza 00:38:41
el cálculo de la media, todo lo tenéis en la unidad 00:38:43
todavía no lo he visto 00:38:46
pero me adelanto 00:38:47
ahí hay ejercicios 00:38:49
entonces vamos 00:38:50
estábamos aquí, bueno, pues lo que os he dicho 00:38:53
aquí lo que he hecho es simplemente los valores 00:38:55
si os fijáis, bueno, he puesto frecuencia 00:38:57
vale, bueno, y ya aquí 00:38:59
automáticamente lo ha calculado y ya está 00:39:00
se calcularía como os he dicho 00:39:02
de todas formas lo tenéis 00:39:04
un ejemplo igual de esto lo tenéis 00:39:06
en la unidad 00:39:08
entonces, saca una varianza 00:39:10
lo que os decía, si os fijáis 00:39:12
la varianza sale de 18 00:39:15
pero es 00:39:16
consecuencia de haber 00:39:18
todas esas diferencias 00:39:20
las hemos elevado al cuadrado 00:39:22
por tanto, nuestro valor estará 00:39:23
no está expresado en las unidades 00:39:26
de nuestros valores de observaciones 00:39:29
aquí tienes 1, 2, 3, 4, 5 00:39:31
así hasta el 24 00:39:34
que creo que era 00:39:34
pues es necesario 00:39:36
utilizar esa raíz cuadrada 00:39:39
para volver a transformar 00:39:42
esta varianza en un valor que realmente 00:39:43
se corresponda con las unidades 00:39:45
aquí decimos que son 4 00:39:47
con 24 en realidad 00:39:50
si son 4,24 00:39:51
litros por semana 00:39:53
que varía de la media 00:39:55
¿Me explico? Sin embargo, el 18 no. El 18 no son 18. Serían litros, pero como lo hemos elevado al cuadrado, ya distorsionan las unidades. Por eso tienes que transformarlo en una derivación típica. Es decir, aplicando la raíz cuadrada. 00:39:56
¿Me estoy explicando lo que estoy diciendo? Por eso se utiliza la definición estándar o científica, lo que queráis. Por eso hay que utilizar la raíz cuadrada o aplicarla sobre la varianza. 00:40:15
para que tengas una forma 00:40:30
de que a nivel de unidades 00:40:33
sea comparable 00:40:34
y entonces te sirva 00:40:36
porque al fin y al cabo lo que estamos utilizando esto son herramientas 00:40:37
que estamos utilizando 00:40:40
y te sirva para ver que dices como media 00:40:41
en nuestro 00:40:44
caso de los litros por semana 00:40:46
que consumían, pues más o menos nuestra distribución 00:40:48
se mueve entre 00:40:51
o más 4,24 o menos 4,24 00:40:52
¿me estoy explicando? 00:40:55
Eso que has dicho ahora de más 4 y menos 4 00:40:58
¿Por qué? 00:41:02
Porque está en valor absoluto 00:41:03
Es decir, en realidad puede variar 00:41:04
Si la media eran 6 con 68 00:41:06
Pues a lo mejor una observación puede estar más o menos 00:41:09
En 10 con 68 00:41:12
Consistente 00:41:14
Pero otra puede estar en 2 con 68 00:41:16
Vale, vale 00:41:18
¿Me explico? 00:41:19
00:41:20
Esto es lo que te está marcando la varianza o la definición típica 00:41:20
Vale 00:41:24
¿Cómo se están variando nuestras observaciones? 00:41:25
con respecto al valor que sería 00:41:27
nada más que eso 00:41:29
chicos yo os tengo que dejar 00:41:32
muchas gracias 00:41:34
hasta luego 00:41:35
pues eso es lo que me diría 00:41:38
bueno aquí 00:41:40
os he puesto también son medidas de dispersión 00:41:42
pero bueno como lo veremos luego después 00:41:46
con las formas de distribución 00:41:47
coeficiente de simetría y coeficiente de apuntamiento 00:41:49
luego lo veremos 00:41:51
la simetría 00:41:53
Si es una campana 00:41:55
La clásica campana de Gauss 00:41:58
Que es esta 00:42:00
Pues la simetría nos indica cómo está 00:42:00
Si es hacia un lado o hacia el otro 00:42:03
Y el apuntamiento nos indica si es aplanada 00:42:05
O achatada 00:42:08
O pronunciada 00:42:09
Nos está midiendo la forma 00:42:11
Que luego lo vemos 00:42:14
Inferencia estadística 00:42:15
Una vez analizado los datos 00:42:17
Hay que verificarlos 00:42:21
verificarlo, es decir 00:42:22
en realidad lo que estamos haciendo con ese análisis de datos 00:42:25
únicamente estamos cogiendo toda esa masa de datos 00:42:27
o esa información que tenemos o que hemos hecho a través 00:42:29
de encuestas o de lo que sea 00:42:31
y analizando cómo están 00:42:33
los datos, como pues tener una idea 00:42:35
de cómo, por dónde van 00:42:38
o por dónde no vienen, o sea 00:42:39
por dónde, sí, analizando 00:42:41
que realmente pues 00:42:43
cuál es el valor 00:42:44
central, cuál es el valor 00:42:47
qué variaciones que puede haber entre, con respecto 00:42:49
al central, cómo es la distribución, etc. 00:42:51
Pero claro, una vez que tenemos ese análisis 00:42:55
hay que comprobar y verificar para llegar 00:42:57
a una serie de conclusiones. Y para eso se utiliza la inferencia 00:43:00
estadística. Aquí pone que 00:43:04
en investigación, siempre en base a unos valores 00:43:06
conocidos a priori o teóricos. Hay veces que ni siquiera hay valores 00:43:09
a priori. Pero bueno, esto lo veremos 00:43:12
en la próxima videoconferencia. 00:43:14
supongo que os acordáis 00:43:18
del contraste de hipótesis 00:43:20
la hipótesis nula, la alternativa 00:43:22
Bueno, a mí 00:43:25
de sonarme os me suena poco 00:43:26
pero yo lo recuerdo todo, la verdad 00:43:28
marcas un porcentaje de probabilidad 00:43:30
que es el nivel de significación 00:43:33
es decir, lo que estás 00:43:35
determinando es 00:43:36
lo que tratas de hacer es 00:43:38
rechazar o no una hipótesis 00:43:39
que has marcado desde el principio 00:43:42
¿Cómo? En función de un estadístico 00:43:44
y en función de un nivel de probabilidad. 00:43:46
Entonces, no es lo mismo decir que yo que sé, 00:43:51
no es lo mismo decir, bueno, pues en general la gente consume 00:43:56
tres litros o seis litros de leche por semana, 00:44:02
que decir, pues tengo una probabilidad del 95% 00:44:08
de que se consumen 6 litros, 6 litros, o mejor aún, no 6 litros, se consumen entre 6 y 7 litros de leche por semana. 00:44:12
Estás acotando, estás acotando. Dentro de nuestra distribución estás acotando cuáles, porque no somos Dios 00:44:27
Y no podemos saber exactamente todo. En el sentido de que no podemos llegar a saber con exactitud cuántos son los litros por semana de media que se consumen. ¿Por qué? Porque nosotros hemos cogido una muestra, no hemos cogido toda la población. 00:44:34
Y si dijéramos mejor entre 5 y 7 litros, aún así haríamos más... 00:44:50
si dijéramos 00:44:55
si cogieramos un intervalo entre 5 y 7 litros 00:44:57
y tienes un 95% 00:44:59
bueno, pues sería brutal 00:45:01
fíjate, ya tienes algo que no tenías 00:45:02
estás con un 95% 00:45:06
de probabilidad, cuando realmente 00:45:08
nuestra población, hemos hecho una muestra de 800 personas 00:45:09
y la población 00:45:12
son 40 millones 00:45:14
y estás 00:45:15
determinando que entre 5 y 7 00:45:17
litros, con un 95% 00:45:20
de probabilidad, yo creo que está bien, ¿no? 00:45:21
Cuánto más se amplíe 00:45:25
el rango 00:45:29
más probabilidad 00:45:30
Cuánto más 00:45:32
observaciones tengas 00:45:34
más acotas el campo 00:45:36
y cuanto más amplías 00:45:38
por supuesto, cuanto más amplías 00:45:40
te vas alejando 00:45:42
si tenemos esta 00:45:43
si es una 00:45:45
distribución normal 00:45:47
si cogemos entre estos dos 00:45:49
a medida que te vas alejando 00:45:51
te vas echando a la izquierda y a la derecha 00:45:53
esto que baja es que realmente 00:45:56
cada vez es menos probable que se dé 00:45:58
aquí es muy probable 00:46:00
que se dé, que es la media 00:46:02
y luego a medida que lo que calculábamos 00:46:04
la división típica 00:46:08
los movimientos hacia la derecha y los movimientos hacia la izquierda 00:46:09
es en realidad la desviación típica 00:46:12
nos vamos moviendo por desviaciones típicas 00:46:14
nuestra desviación típica eran, ¿cuánto? 00:46:16
cuatro, ¿no? 00:46:18
pues movernos hacia la derecha 00:46:20
una división típica sería 4 00:46:22
4 litros 00:46:24
¿me explico? y así 00:46:25
en adelante, o dos deviaciones típicas 00:46:27
o tres deviaciones típicas, hasta que llegamos 00:46:30
a estas zonas 00:46:32
que son las zonas en las que casi es muy 00:46:32
poco probable que realmente se dé 00:46:35
el valor que estamos buscando 00:46:38
claro, si yo digo un 95% 00:46:39
habría que ver qué intervalo es 00:46:41
aunque muchas veces el 95% 00:46:44
es de aquí hasta aquí 00:46:45
todo esto, ¿sabes? 00:46:47
sí, es decir, entre 1 00:46:49
uno y el máximo 00:46:51
claro, pero tenemos una herramienta 00:46:53
para por lo menos decir algo 00:46:55
sí, decir que la mayor parte 00:46:57
para evitar tener que 00:47:00
para evitar tener que hacer una 00:47:01
una encuesta de 00:47:03
40 millones de personas 00:47:05
imagínate 00:47:06
el gasto vamos, el gasto 00:47:09
es con una 00:47:11
pequeña muestra 00:47:13
pequeña muestra no, cuando son muy pequeñas las muestras 00:47:14
tampoco son, cuando es muy 00:47:17
pequeña, luego a nivel 00:47:19
para determinar los valores es muy 00:47:21
poco significativa, hay muestras que son muy poco significativas 00:47:24
por eso es importante el tamaño de la muestra 00:47:26
cuanto mayor es la muestra 00:47:28
más te acercas a los valores que buscas 00:47:29
es obvio 00:47:32
pero claro, hay que buscar ese equilibrio 00:47:32
entre no utilizar 40 millones de personas 00:47:35
o utilizar una muestra 00:47:37
con la suficiente como para 00:47:40
llegar a conclusiones y a tomar decisiones 00:47:41
de manera adecuada 00:47:44
eso es lo que buscan 00:47:44
se busca nada más 00:47:47
entonces, hemos dicho 00:47:48
estamos aquí 00:47:50
lo que es la diferencia 00:47:55
esto ya lo veremos 00:47:58
y hablaremos 00:47:59
de los intervalos de confinamiento 00:48:00
cómo determinarlos 00:48:02
y cómo 00:48:04
hacer contraste de hipótesis 00:48:05
rechazando o aceptando 00:48:09
las hipótesis 00:48:11
para llegar a verificar 00:48:13
los resultados 00:48:15
de esa información que tenemos 00:48:16
análisis de la varianza 00:48:18
El análisis de la varianza aquí ya no solo contamos con una muestra, sino que contamos con muchas muestras, o varias muestras. 00:48:20
Entonces lo que vamos a tratar de determinar es, a través de lo que se llama NOVA, o análisis de la varianza, 00:48:27
es comparar esas muestras y llegar a una conclusión. 00:48:32
¿Cómo hacemos? Bueno, aquí os he puesto un... 00:48:36
Como esto es un poquito más complejo y ya utiliza un estadístico, 00:48:40
y el estadístico prácticamente te lo tienes que saber de memoria, es decir, es una fórmula y tampoco nos vamos a ir más allá. 00:48:44
es decir 00:48:49
tú cuando conduces el coche 00:48:50
no es necesario 00:48:53
vosotros sabéis todo 00:48:54
lo que conforma un coche 00:48:56
para poder conducir 00:49:00
no, os abstraes 00:49:01
te abstraes, sabes conducir 00:49:02
coges el coche, pero no 00:49:05
en ningún momento estás pensando 00:49:06
que están los pistones 00:49:07
ni cómo va a nivel eléctrico 00:49:09
simplemente cosas 00:49:13
pero eso es lo que vamos a tratar de hacer 00:49:14
hay determinadas cosas que es mejor abstraernos 00:49:16
y darlas como que realmente son así 00:49:19
porque si no es imposible 00:49:21
por ejemplo 00:49:23
los estadísticos o muchas fórmulas 00:49:26
o las tablas que están generadas 00:49:27
son generadas por gente 00:49:29
matemáticos 00:49:30
entonces ya tenemos que 00:49:32
solo tenemos que como asumir 00:49:35
o darlo por hecho, es decir, en este caso 00:49:37
aquí utilizaremos un estadístico y el estadístico es esta fórmula 00:49:39
¿lo veis aquí? 00:49:42
00:49:43
yo más o menos os explico 00:49:44
cómo va el ejercicio 00:49:47
Pero tampoco tenéis que, porque es que es imposible. Tampoco es ese el objetivo. El objetivo es que a través de estos procedimientos, de estos ocho pasos, podáis determinar que si tenemos tres fertilizantes, el A, el B y el C, y cada uno, con tres observaciones cada uno, nos indica que ha crecido la planta tantos centímetros, saber si uno de los tres es mejor o si los tres fertilizantes no hay ninguna variación. 00:49:48
sino que realmente los tres dan lo mismo. 00:50:18
O sea, producen lo mismo. 00:50:21
Pues eso es lo que son tres observaciones. 00:50:22
Una observación con un fertilizante A, 00:50:25
una observación con un fertilizante B 00:50:27
y otra con un fertilizante C. 00:50:29
Y cada una y las muestras de cada observación son tres. 00:50:32
¿Vale? 00:50:35
Diez, doce, nueve, catorce, quince, catorce, dieciséis 00:50:35
y ocho, siete, nueve. 00:50:39
Entonces, ahora mismo, si lo vemos así, 00:50:40
lo único que vemos son tres letras y nueve números. 00:50:43
Yo te diría que es en la A. 00:50:45
Es en la A, vale. 00:50:47
pues tú dirías que es el A 00:50:48
y a lo mejor 00:50:49
otro diría 00:50:51
o otra diría que es el B 00:50:53
pero yo te diría 00:50:55
es el A, ¿por qué? 00:50:57
Claro, pues tendrías que hacerlo para saber cuál es, ¿no? 00:50:59
Efectivamente, pero... 00:51:01
Porque la planta 00:51:03
que creció en 9 respecto a la 12 00:51:06
yo diría 00:51:08
que es por el S, pero bueno, yo diría que es esa 00:51:09
Hombre, yo por números 00:51:12
yo diría que es el A-B 00:51:14
porque ha crecido más 00:51:15
centímetros la que más diferencia tiene es la ya que tiene un crecimiento desde la última hasta 00:51:17
la del medio de cuatro centímetros hay más hay más la varianza sería mayor está diciendo la 00:51:24
dirección típica y lo haría más yo creo que esto así a ojo no se puede seríamos seríamos adivinos 00:51:31
No, a lo mejor tenéis una mente privilegiada, pero yo no. Yo tengo que hacer números, ¿vale? Entonces, en realidad, si os fijáis, lo que ha dicho podría tener algún sentido en el sentido de que en el A hay una mayor variación. 00:51:40
Es decir, la división, si os fijáis 00:51:56
Entre 9 y 10 hay 00:51:59
Bueno, entre 9 y 10 hay 1 00:52:01
Pero entre 9 y 12 hay 3 00:52:02
Sin embargo, en las otras 00:52:04
Más o menos es una variación de 1 00:52:07
O de 2 00:52:09
Pero bueno, ahora sí es difícil 00:52:10
Sí, hay que hacerlo para verlo 00:52:12
Vamos a ir poco a poco los pasos 00:52:14
Primero se plantea la hipótesis 00:52:17
¿Qué es una hipótesis? Lo que decía 00:52:19
Cuando planteas una hipótesis siempre hay una 00:52:20
Lo que se llama una hipótesis nula 00:52:22
que se suele denominar 00:52:24
o se suele reflejar como H0 00:52:27
y luego una hipótesis alternativa 00:52:29
que es la H1. ¿Por qué establecemos 00:52:31
dos hipótesis? Porque a efectos de un estadístico 00:52:33
y en función de si es estadístico 00:52:35
y es mayor o menor 00:52:37
vamos a aceptar o rechazar 00:52:39
estas hipótesis. Siempre la hipótesis nula 00:52:41
va a ser la negativa. 00:52:43
En este caso nos indica 00:52:45
no hay diferencia entre los fertilizantes. 00:52:47
Es decir, que nos va a dar igual coger el A, el B o el C. 00:52:49
¿Vale? Porque al fin y al cabo 00:52:52
eso es lo que estamos buscando 00:52:53
nosotros estamos buscando si realmente hay una 00:52:54
hay una diferencia entre unos y otros 00:52:57
¿vale? pues por tanto 00:52:59
lo que nos importa es si hay 00:53:01
diferencia entre unos y otros 00:53:03
nuestra hipótesis nula 00:53:04
tiene que ser que no hay ninguna diferencia 00:53:07
y la hipótesis alternativa es que algún 00:53:09
fertilizante es diferente a los demás 00:53:11
¿vale? 00:53:13
con todo este proceso 00:53:15
lo que haremos es o rechazar 00:53:16
o aceptar la hipótesis nula 00:53:19
¿vale? 00:53:20
Que en realidad es lo mismo que aceptar o rechazar la alternativa, pero bueno, se dice así. Ese es nuestro objetivo, llegar a una conclusión. Antes estábamos analizando datos, nada más. Aquí no, aquí vamos a llegar a una conclusión. 00:53:22
Vamos a tratar de, con las herramientas estadísticas, tratar de llegar a la conclusión o tomar la decisión. 00:53:37
Porque la decisión sería, pues voy a comprar el A, el B o el C. 00:53:46
¿No? Hay una decisión. 00:53:50
Nos interesa llegar a esa conclusión. 00:53:52
Entonces, lo primero que hace es calcular la media de cada grupo. 00:53:56
La media de cada grupo es, en la media de A son 10,33 centímetros, 00:54:00
la media de B son 15 centímetros 00:54:04
y la media de C 00:54:07
que en realidad es una media 00:54:07
simple, si os fijáis aquí 00:54:10
no hay frecuencia, aquí no hay ponderación 00:54:12
lo divide entre 3 00:54:14
porque son 3 tipos 00:54:16
3 medidas 00:54:18
3, 3, 3 00:54:20
ya tenemos 00:54:21
un dato, el dato es la media 00:54:23
de cada uno de los fertilizantes 00:54:26
y son 33, 15 y 8 00:54:28
ahora calculamos 00:54:30
la media general. La media general es coger 00:54:32
todos y lo dividimos 00:54:34
entre el número que hay. 00:54:36
Igual, hacemos una media aritmética 00:54:38
simple. Si no, cuando no hay 00:54:40
frecuencias, pues simple. 00:54:42
Es como si cada uno se multiplicara por uno. 00:54:44
Esa sería su frecuencia. 00:54:47
Su frecuencia es uno. Y son 11 con 11. 00:54:48
Entonces, el siguiente paso es calcular 00:54:51
la variedad total. 00:54:52
La variedad total, 00:54:55
ahora ya no estamos calculando medias. 00:54:57
En realidad, 00:54:58
en el análisis de la varianza, en realidad 00:54:59
estás calculando varianzas. 00:55:02
Pero no lo 00:55:05
hace, o sea, no lo divide 00:55:06
por el número de observaciones, sino que 00:55:07
lo que hace es, hace la suma de cuadrados 00:55:10
totales. Lo que se llama SST 00:55:12
o suma de cuadrados totales, ¿vale? 00:55:14
Vale. Que bueno que viene en inglés, 00:55:16
pero bueno, suma de cuadrados totales. Y lo que hace 00:55:18
realmente es comparar 00:55:19
cada uno de los valores 00:55:22
de los que teníamos, de todos estos, 00:55:24
compararlo con la media general 00:55:26
y calcular un valor. 00:55:27
Vale. 00:55:30
47,56 00:55:30
eso es lo que en realidad varía 00:55:32
el conjunto de todas las observaciones 00:55:35
de las tres fertilizantes 00:55:37
comparándolo con 00:55:38
la media general 00:55:41
y elevándolo al cuadrado 00:55:42
¿para qué? pues para obtener 00:55:45
esas variaciones en valor absoluto 00:55:47
para que no haya negativos 00:55:49
principalmente para eso 00:55:51
la siguiente 00:55:53
otra variabilidad 00:55:55
hemos hecho la variabilidad total 00:55:56
Ahora va a hacer la variabilidad entre los grupos 00:55:59
¿Qué es entre los grupos? Pues comparar 00:56:01
La medida de cada uno de ellos 00:56:03
¿Vale? Sobre el general 00:56:04
Antes lo hemos hecho todo sobre el general 00:56:06
Y ahora, de cada grupo, sobre el general 00:56:08
¿Vale? 00:56:11
Pero claro, hay un problema 00:56:12
Si nosotros queremos comparar esta variabilidad 00:56:14
Con esta variabilidad 00:56:16
Esta la ha hecho sobre nueve valores 00:56:17
Y aquí lo vamos a hacer sobre tres 00:56:20
Por eso multiplica por tres 00:56:22
Porque es como si hubiese tres veces 00:56:24
¿Vale? 00:56:26
Y así lo hace comparable 00:56:27
¿De acuerdo? 00:56:29
Entonces tenemos 47 con 56, 44 con 22 00:56:31
Calcula la variabilidad 00:56:34
De los grupos, que es la diferencia entre los dos 00:56:36
Ajá 00:56:38
Y finalmente es cuando 00:56:39
Bueno, pues aquí es cuando hay que abstraerse 00:56:41
Ay, vale 00:56:44
Cuando ya llegas a ese punto 00:56:45
Y lo pones mal y ya no te... 00:56:48
Pero hay que abstraerse mucho, ¿vale? 00:56:49
Entonces 00:56:50
Hay un estadístico que se llama el F-Statistic 00:56:51
O estadístico F 00:56:54
que lo inventó o lo creó un determinado señor 00:56:55
en el que nos indica que para determinar 00:57:00
o para comparar o hacer la comparación 00:57:03
hay que utilizar esta fórmula. 00:57:05
Se utiliza el SSB, que hemos dicho que el SSB 00:57:09
era la mayoría de grupos 00:57:12
partido de la variabilidad dentro de los grupos. 00:57:16
Pero en realidad lo que está haciendo 00:57:24
es, anteriormente solo hemos calculado 00:57:25
esto ya no es abstracción, esto lo podemos 00:57:27
deducir, en realidad está comparando 00:57:29
en el denominador 00:57:31
y en el numerador 00:57:33
entre el numerador y el denominador está comparando dos varianzas 00:57:34
una es la varianza 00:57:37
de grupos 00:57:39
de varianza 00:57:43
de, ¿dónde está? 00:57:45
aquí, una variabilidad 00:57:47
entre los grupos 00:57:49
con respecto a la variabilidad dentro de los grupos 00:57:50
son dos varianzas, ¿por qué? porque lo está dividiendo 00:57:54
entre k menos uno, que ahora os lo diré que es 00:57:57
y n menos k 00:57:58
que es lo que llaman grados de libertad 00:57:59
¿qué son los grados de libertad? 00:58:02
pues los grados de libertad 00:58:04
lo voy a explicar con un ejemplo así sencillo 00:58:06
y si os fijáis que siempre 00:58:09
resta por menos uno o menos k 00:58:10
¿por qué resta por menos uno? 00:58:12
porque en realidad 00:58:15
es como si tres de vosotros 00:58:16
vais a un restaurante y tenéis que elegir 00:58:18
una pizza cada uno 00:58:21
pero solo hay tres pizzas 00:58:22
entonces, uno de vosotros 00:58:24
coge la primera pizza 00:58:27
elige 00:58:30
la que quiera, tiene un grado de libertad 00:58:31
claro 00:58:34
el segundo de vosotros coge 00:58:34
la segunda pizza, tiene grado de libertad 00:58:36
porque puede elegir entre dos, el primero puede elegir 00:58:39
entre tres, y el último tiene grado de libertad 00:58:41
es lo que 00:58:44
lo que le han dejado 00:58:46
las sobras 00:58:48
por eso se divide entre menos uno 00:58:49
Esos son los grados de libertad. Utilizamos esta fórmula y en función de esta fórmula, que es el F estadístico, nos da un valor. Este valor es el que debemos comparar con una tabla. La tabla, en función de esos grados de libertad, nos dará otro determinado valor. 00:58:52
Si es mayor, pues entonces rechazamos la hipótesis en la que no, aceptamos la hipótesis alternativa. Es así. Yo pienso que en cuanto a los conceptos y en cuanto a lo que debe venir en vuestro módulo, yo creo que ir más allá no es necesario. 00:59:10
¿Nosotros llegaremos a analizar la tabla? 00:59:34
Sí, claro, tienen que editar la tabla. Si no tienen la tabla, no tienes el king. 00:59:38
Pero la tabla no la proporciona... 00:59:41
Claro, si yo os puse en un ejercicio o algo, 00:59:43
ponemos el valor crítico, 5K14. 00:59:45
Si no, ¿cómo lo comparáis? 00:59:48
Entonces, efectivamente, 00:59:50
si es más grande, significa que los fertilizantes 00:59:51
no son iguales. 00:59:53
Entonces, la opción que deberíamos coger 00:59:55
es la más alta. 00:59:57
Pues eso. Este es un procedimiento simplemente 00:59:59
para comparar muestras. 01:00:01
Bueno, tenemos varias muestras. 01:00:03
Es muy útil. Parece que no, 01:00:06
pero es muy útil. 01:00:07
incluso para cosas de logística 01:00:08
o de lo que estéis dando 01:00:11
es decir, es muy útil 01:00:13
a todo tipo de... o incluso 01:00:14
una inversión, si tenéis tres inversiones 01:00:16
imaginaos que tenéis tres inversiones 01:00:18
tres inversiones de tres fondos de inversión 01:00:20
y no sabes 01:00:23
cuál meter vuestro dinero 01:00:24
pues igual, sería exactamente lo mismo 01:00:26
Ya, pero ahí lo haríamos con el BAN 01:00:28
y nos haría más rentable 01:00:31
hacer el cálculo 01:00:32
Pues yo creo que no 01:00:34
no lo sé, con el BAN no sé si lo podrías hacer 01:00:36
o BAN o el TIR 01:00:39
me acuerdo si es el BAN o el TIR 01:00:40
pero seguramente veríamos cuál es el 01:00:42
más provechoso 01:00:45
tú imagínate 01:00:46
que te digo que 01:00:49
yo que sé 01:00:50
que Apple, vas a invertir 01:00:53
Apple te da un 10% 01:00:55
anual 01:00:57
y Amazon te da 01:01:00
un 11% 01:01:02
anual 01:01:04
y yo que sé, otra tercera 01:01:06
el BBVA te da 01:01:08
un 6% 01:01:13
¿cuál elegirías? 01:01:14
o sea, si la CNL 01:01:18
bueno, si la 01:01:20
10, 11 y 6, ¿cuál cogerías? 01:01:22
hombre, pues 01:01:25
haría el cálculo de los intereses 01:01:26
que voy a recibir 01:01:29
o sea, de lo que voy a ganar y seguramente 01:01:30
sería con 01:01:32
el de Amazon 01:01:33
que sea un 11% 01:01:36
Ahora te digo, Apple es un 10%, ¿vale? Pero tiene una varianza o una diversificación típica de 10. Amazon tiene una desviación típica de 9. Y BBVA, que era el más bajo, que era el 6%, tiene una desviación típica de 1. ¿Cuál cogerías? ¿Cuál cogerías el último? 01:01:37
porque el riesgo, es decir 01:02:00
el primero, el de los 10 01:02:02
tiene una diversión típica de 10 01:02:04
es decir, te puedes quedar a 0 01:02:06
y el otro tiene una diversión típica 01:02:07
del 9, es decir, ves como no es 01:02:10
entonces 01:02:12
el análisis de las varianzas es muy muy muy importante 01:02:13
al final BBVA 01:02:16
como muchos se te puede bajar a 5 01:02:18
ese es el 01:02:19
ese es el kit 01:02:24
entonces esto es muy útil 01:02:25
yo pienso que es muy útil 01:02:28
porque no solo tenemos que fijarnos en la media 01:02:29
tenemos que fijarnos también en la varianza 01:02:32
cómo se dispersan los datos 01:02:34
o los valores de las observaciones 01:02:36
y en función de esas 01:02:39
variaciones 01:02:40
pues determinar 01:02:42
si realmente 01:02:45
es más aconsejable una opción u otra 01:02:45
y eso es lo que se está buscando 01:02:49
con esto 01:02:51
y bueno, el procedimiento yo sé que hay cosas que aquí 01:02:51
cuando llegas aquí pues 01:02:54
sí, y lo de los grados de libertad 01:02:56
pero es la forma o es el procedimiento 01:02:59
para determinar 01:03:01
igual no va a pasar en el contraste de hipótesis 01:03:01
en el contraste de hipótesis también 01:03:04
utilizaremos un estadístico y en función de este estadístico 01:03:05
si es mayor o menor 01:03:08
es prácticamente lo mismo 01:03:09
si es mayor o menor que 01:03:13
el valor crítico 01:03:14
pues ahí determinaremos si cogemos 01:03:16
la hipótesis en un lado o no 01:03:18
y eso ya lo vemos 01:03:19
y bueno y ya me 01:03:22
para no alargarlo 01:03:24
vamos aquí 01:03:26
voy a hablar un poquito 01:03:27
de las medidas de asimetría 01:03:30
Bueno, a medida que se me tira lo que decía, es decir, cómo una distribución, es decir, si la distribución más o menos tiene la forma de normal, la distribución normal, la distribución normal es aquella que empieza aquí con mayor probabilidad y luego se va alejando hacia los lados pero de manera simétrica, ¿vale? 01:03:31
De la manera que las colas, o las zonas de los lados, son las que tienen menor. 01:03:46
¿Qué ocurre cuando no es simétrica, como este caso? 01:03:52
Es decir, que está más abombada, o más hacia la derecha, o más hacia la izquierda. 01:03:57
Pues eso es lo que nos va a medir el coeficiente de asimetría, que es este, el g1. 01:04:01
Y simplemente es m3, que es igual. 01:04:08
En lugar de restar x sub i menos la media, al cuadrado lo pone al cubo. 01:04:11
Partido de n. Bueno, pues simplemente sabiendo esta fórmula y determinando si g sub 1 es igual a 0, 01:04:16
estaremos ante una distribución simétrica de esta forma. 01:04:27
Y si es mayor que 0 o menor que 0, ya nos determina que es asimétrica positiva o negativa. 01:04:33
Simplemente es una forma de medir cómo son nuestras distribuciones. 01:04:41
Y si realmente estamos ante una distribución normal, que es lo que realmente buscamos siempre, que es más fácil a nivel de cálculo. 01:04:45
Y en cuanto al apuntamiento curtosis, pues en lugar de determinar la simetría, lo que determina ese apuntamiento es que si se achata, o sea, bomba, o tiende hacia arriba. 01:04:54
Es decir, lo está determinando la forma de la distribución. 01:05:07
Claro, la distribución, todo esto son, en realidad, todo esto son montones, montones de observaciones, valores, ¿vale? 01:05:12
Que se van recogiendo, formando una curva, que en realidad son montones, ¿vale? 01:05:17
Y bueno, ¿y cómo se mide? Pues igual, se mide con otro que se llama G4 y bueno, es lo mismo. 01:05:23
No sabemos la fórmula, que no tiene más y sabemos cómo... 01:05:28
La fórmula es la misma que la de la otra, pero con el 4, ¿no? 01:05:31
Exacto, es el número 4 01:05:35
A ver, si no, lo único que tiene aquí es un menos 3 01:05:37
También, si te fijas 01:05:39
Aquí un menos 3 y aquí lo que no tenía 01:05:40
Pues simplemente 01:05:42
Desarrollas esto 01:05:44
Y lo más importante 01:05:47
Bueno, hay que saberse la fórmula, pero lo más importante es cómo interpretarla 01:05:48
Es decir, si es igual a 0 01:05:51
Ya sabemos que es mesocúrtica 01:05:52
Mesocúrtica quiere decir que es 01:05:54
Prácticamente es, el curtosis 0 01:05:55
Es una, pues prácticamente 01:05:58
Una instrucción normal, como la campana 01:06:00
Clásica campana de Gauss 01:06:02
Y luego está la platicúrtica 01:06:03
Plati, o sea 01:06:07
Aplanada o achatada 01:06:08
Que sea esta 01:06:10
Y la otra es, ¿cómo se llama? 01:06:11
No, mesocúrtica, perdón, mesocúrtica era esta 01:06:14
Y la normal 01:06:17
La otra es leptocúrtica, ¿no? 01:06:18
Y la otra es leptocúrtica, a ver, ya no sé 01:06:20
Lo pone aquí, ¿no? 01:06:22
Ah, sí, es verdad, lleva razón, la leptocúrtica es esta 01:06:24
La platicúrtica, plati 01:06:26
De plato será 01:06:27
Madre mía, qué complicado 01:06:28
Y la mesocórtica es la normal. Otra medida para poder analizar, todo esto son herramientas para analizar nuestra información. 01:06:31
y nos quedaría 01:06:44
ver la parte de 01:06:47
del 01:06:49
contraste de hipótesis que es un poquito más 01:06:51
que es 01:06:53
en realidad esto es útil porque nos da 01:06:55
ideas de cómo se 01:06:57
distribuye y cómo está nuestra información 01:06:59
pero la otra nos permite 01:07:01
llegar a conclusiones y a tomar decisiones 01:07:03
por tanto es todavía más importante 01:07:06
contraste de hipótesis, etcétera 01:07:07
con la diferencia de estadística 01:07:09
y esto es el más o menos 01:07:10
no sé si he aclarado algo o la bola es que esta final es practicar porque si yo te aseguro que 01:07:12
si solo hacemos un ejercicio te digo yo que el 90% no vamos a aprobar no vamos a hacerlo 01:07:27
eso te aseguro y no te hago 01:07:36
ningún estadístico 01:07:39
al menos 01:07:41
que lo sepas 01:07:42
a ver si puedo 01:07:44
encontrar ejercicios 01:07:47
y os subo unos ejercicios 01:07:48
y miráis esos que son los que voy a intentar 01:07:49
que caigan 01:07:52
una pregunta 01:07:53
ya puestas así 01:07:57
el examen 01:07:58
¿cómo se va a plantear? 01:08:00
¿el examen son 01:08:02
tipo test? 01:08:05
30, son 30 tipos de test 01:08:06
teórico, teórica 01:08:08
y luego tienes una parte práctica 01:08:10
pero que la voy a poner también de tipo test 01:08:12
es decir, ya que no voy a 01:08:14
restar, no voy a restar 01:08:16
ah, no vas a restar, no voy a restar 01:08:18
pero eso sí, la parte práctica 01:08:20
la parte práctica 01:08:22
es cero o nada 01:08:24
en el sentido de que si os pongo un ejercicio 01:08:26
me tenéis, tenéis cuatro opciones 01:08:28
y tenéis que decirme cuáles 01:08:30
pero yo no voy a tener 01:08:32
Bueno, pero tienes que hacer el ejercicio para saber qué opción es, ¿no? 01:08:33
Exacto, pero que no voy a tener en cuenta, o sea, yo voy a mirar que tenéis un apartado donde podéis hacer los números y eso, tampoco van a ser muy complicados. 01:08:37
Vale, te refieres que aunque hagamos una parte bien del ejercicio, pero pongamos mal la que es, es cero. 01:08:47
Es mal, efectivamente. 01:08:52
Vale, vale, que no puntúa cero, cincos, cero quince. 01:08:54
¿Cuánto va a ser la parte teórica o cuánto va a ser la parte práctica? 01:08:57
La parte teórica práctica 01:09:00
tenéis en la 01:09:03
programación didáctica 01:09:04
ahí tenéis, lo veis, porque va por porcentajes 01:09:06
Sí, va por porcentajes 01:09:09
Entonces vosotros miráis 01:09:10
y ahí tenéis exactamente 01:09:12
ahora mismo exactamente no sé los porcentajes 01:09:14
pero ahí tenéis 01:09:16
todos los porcentajes 01:09:19
y cómo se va a determinar 01:09:20
Entonces voy a poner 01:09:22
una parte práctica 01:09:23
por cada uno de los resultados de aprendizaje 01:09:26
es decir, por cada una de las unidades 01:09:28
como son 5 unidades 01:09:30
para tema tiene que haber una parte práctica 01:09:31
exacto, voy a poner una práctica, lo único que 01:09:33
lo pongo un ejercicio chiquitillo 01:09:35
y a función de eso pues lo respondéis 01:09:37
pero no va a ser muy complicado 01:09:40
porque tampoco da tiempo 01:09:42
porque no sé cuánto tiempo es el examen 01:09:43
puede ser una hora yo creo 01:09:46
pues tampoco tenéis tanto tiempo 01:09:48
como para que os ponga 4 ejercicios 01:09:50
no miento, hora y media me parece que es 01:09:52
yo creo, no, hora y media no es 01:09:54
¿no? 01:09:55
Yo creo que el año pasado 01:09:56
Era más de una hora el año pasado 01:09:58
Pues no sé este año 01:10:00
A lo mejor este año que el año ha cambiado 01:10:02
Como ha cambiado todo 01:10:05
Me pasaste tú las 01:10:06
Los exámenes 01:10:08
A ver un momentín 01:10:09
El año pasado era más de una hora 01:10:15
Pero este año no lo he mirado 01:10:17
Es una hora, hora y algo 01:10:19
Pero no es hora y media 01:10:21
Los míos no 01:10:21
Una hora y cuarto 01:10:24
Una hora y cuarto 01:10:25
Con los test que os voy a poner 01:10:27
Las prácticas van a ser 01:10:31
No van a ser muy grandes 01:10:33
O sea, no va a ser un ejercicio práctico 01:10:35
Porque si no, es imposible 01:10:37
Si, si no, no da tiempo 01:10:39
Los nervios y el examen 01:10:40
Pero es importante 01:10:43
Miraos 01:10:44
Miraos las 01:10:45
Las tareas 01:10:48
Aunque no lleguéis a ellas 01:10:50
Aunque no 01:10:52
Miraoslas 01:10:53
Porque hay temas en los que no hay parte práctica en el sentido de ejercicios numéricos. Entonces, yo tengo que poner una parte práctica de esas unidades, de un estado de aprendizaje, y puede ser un caso práctico, pero algo más subjetivo o algo que es de relacionar conceptos, no de utilizar cálculos numéricos. 01:10:56
que no hay, si no hay cálculo numérico 01:11:22
no, en la de las encuestas 01:11:24
y todo eso 01:11:27
ahí a lo mejor tenéis que interpretar algo 01:11:28
y va ahí hilado 01:11:31
con las tareas 01:11:33
yo te digo 01:11:34
lo que yo creo que me encuentro y yo creo que 01:11:37
los demás compañeros nos encontramos 01:11:39
o sea, el detectar 01:11:40
bueno, al final un muestreo 01:11:43
y tal, saber más o menos 01:11:45
qué tipo de muestreo puede ser aleatorio 01:11:46
o no aleatorio, tal, no sé qué 01:11:48
ahí es mucho más fácil porque son siete 01:11:50
pero el tema de lo de las encuestas 01:11:52
o el tipo de esto, a mí 01:11:55
se me hace 01:11:57
un mundo 01:11:59
el saber 01:12:00
es que ahora mismo no sé decirte en qué punto 01:12:02
tal, pero hay cosas 01:12:05
de los dos primeros temas 01:12:06
de los dos primeros temas 01:12:08
yo siempre presento los ejercicios 01:12:09
pero muchas veces me veo loco para encontrar 01:12:14
información sobre 01:12:17
aparte hay conceptos que a lo mejor 01:12:18
son demasiado genéricos 01:12:20
ahí no se profundiza mucho 01:12:22
y entonces hay efectos de 01:12:24
bueno, es que 01:12:25
sí, sí, hay cosas, sobre todo la parte 01:12:27
hay parte de, sobre todo 01:12:29
cosas, bueno, como lo que 01:12:32
la parte multivariable 01:12:33
cuando lo leáis 01:12:36
bueno, el factorial 01:12:36
el análisis factorial 01:12:39
pues ni os imagináis, el análisis factorial es algo 01:12:41
bastante complejo, entonces 01:12:44
que suene 01:12:45
ahí os suene 01:12:47
no perdáis el tiempo 01:12:49
tiene que sonar 01:12:51
porque al final 01:12:53
la estadística de lo que os he dicho 01:12:55
en el mundo real es complejo 01:12:57
se utilizan más esos modelos 01:12:59
que lo que vamos a ver 01:13:02
pero tenéis que tener unas nociones 01:13:03
de estadística y tenéis que saber 01:13:06
algo de todo esto 01:13:08
y yo creo que es importante 01:13:09
incluso yo pienso que de las 5 unidades 01:13:12
lo más 01:13:14
para mí, lo más bonito es esto 01:13:14
sí, además 01:13:17
a mí los números me encantan 01:13:19
y de hecho intento cuando tú estás hablando 01:13:21
ir haciendo cosas también, lo que pasa que 01:13:23
es verdad que yo sí, lo de la moda mediana 01:13:25
y tal, pues sí, porque al final 01:13:27
y son cosas que aplicas a tu día a día 01:13:28
sin darte cuenta y al final lo haces 01:13:30
o yo que soy más especial 01:13:33
cuando voy a un mercado y miro los precios 01:13:35
que había, los que hay y tal 01:13:36
y la decisión de compra o no, ¿sabes? 01:13:39
pero es verdad que 01:13:41
son muchos conceptos 01:13:42
que al final hacer un cuadro como 01:13:44
el primero para ir sacando todos los datos 01:13:47
al final no te va a suponer nada 01:13:49
porque al final lo vas a hacer de manera automática 01:13:51
va a ser una cosa más 01:13:53
si que a lo mejor con este último 01:13:55
pues va a ser más complicado 01:13:57
a la hora de recordar si te dejas 01:13:59
algún paso o no te dejas algún paso 01:14:01
estos son más complicados 01:14:03
y también no son tan intuitivos 01:14:05
si no dices bueno es que 01:14:07
termino un paso y al siguiente es que ya 01:14:09
lo veo, cierro los ojos 01:14:11
no, si cerrar los ojos lo veo 01:14:13
pues no 01:14:15
pues no, entonces 01:14:16
lo que decíamos incluso 01:14:18
en contraste de hipótesis es lo mismo, es decir 01:14:20
hay un montón de estadísticos 01:14:22
como el F estadístico 01:14:23
de un montón de matemáticos 01:14:25
que los crearon y en función, y va a depender 01:14:28
de los factores 01:14:30
y hay que aplicarlos, pero aquí no 01:14:33
nos vamos a complicar, ni vamos a mirar 01:14:34
tantas cosas, que nos vamos a centrar 01:14:36
en un solo estadístico, en la análisis de varianza 01:14:38
nos centramos en este 01:14:40
y punto 01:14:41
y el contraste de hipótesis 01:14:42
pues igual, y es tener unas nociones 01:14:46
para que realmente sepáis lo que es 01:14:47
como habéis visto 01:14:49
es útil 01:14:51
una utilidad, y parece que no, pero es muy 01:14:52
útil, yo creo que esto 01:14:55
es importante que lo sepáis 01:14:57
te quería hacer una pregunta 01:14:58
respecto a todo lo que son las unidades 01:15:01
veo que en algunas 01:15:03
sí que hay unos anexos 01:15:05
y en otras no tienen anexos 01:15:07
yo entiendo que los anexos 01:15:09
recogen toda la información 01:15:11
de la unidad, en esos anexos 01:15:12
y viene como 01:15:15
resumida 01:15:16
o más explícita 01:15:18
hay un anexo en el 4 01:15:20
que viene un montón 01:15:23
que es para el cálculo 01:15:25
de las muestras 01:15:27
yo eso 01:15:29
no lo había subido 01:15:31
no perdáis el tiempo 01:15:32
el anexo creo que es el 4 01:15:35
es de la unidad 4 01:15:37
01:15:40
Sí, pero sin embargo los tres primeros anexos que no, que es solamente el resumen de todo lo que son las muestras y tal, ese sería como el resumen de toda la unidad. 01:15:41
Sí, pero incorpora cosas que no están en la unidad. 01:15:54
Te habrás fijado que incorpora cosas que no están en la unidad. 01:15:58
Pero nos tenemos que centrar entonces en lo que pone la unidad, ¿no? 01:16:01
Centraros en la unidad. 01:16:04
Vale, por eso digo, es que si no, madre mía. 01:16:05
No, es que yo suelo hacer resúmenes de todas las unidades. Y es verdad que sí que he visto que ciertos anexos vienen muy bien, pero otros vienen cosas que incorporan nuevas, que no hace mención. 01:16:07
Y en ese anexo hay una parte que lo estoy mirando, lo hablé con Moisés, y lo he mirado y que no. 01:16:22
Centrados en lo que, si hay alguna fórmula, algún tipo de cálculo de una muestra, lo que sea, centrados en lo que viene en la propia unidad. 01:16:32
Porque yo creo que el anexo es casi un poquito, más que un resumen, profundiza algunas cosas. 01:16:39
O incluso aumenta o amplía. 01:16:46
Sí, porque de hecho los test que hacemos 01:16:49
de cada unidad 01:16:52
son preguntas de la propia unidad 01:16:53
Exacto, y eso es lo que os voy a preguntar 01:16:56
estamos a distancia 01:16:58
no tenéis clases presenciales 01:17:00
entonces no puedo preguntaros 01:17:03
algo que no esté ahí 01:17:04
Sí, pero bueno 01:17:05
es que esto es como igual 01:17:09
la primera autoevaluación de la unidad 4 01:17:10
te hace una pregunta 01:17:12
de la siguiente parte del muestreo 01:17:13
o sea que 01:17:17
¿Hasta qué punto? 01:17:17
¿Sabes qué te dice? 01:17:21
Es que es muy 01:17:23
cojonudo porque 01:17:25
dice 01:17:26
te dice 01:17:27
a ver dónde está 01:17:30
dice 01:17:33
¿Los muestreos por cuotas 01:17:35
estratificados y conglomerados 01:17:36
son muestreos aleatorios? 01:17:39
Y pongo falso 01:17:42
dice buena respuesta, pero es que 01:17:43
el muestreo por cuotas viene en la siguiente 01:17:44
en el 1.4, o sea, que es que no te habla 01:17:47
de las cuotas en la anterior, o sea 01:17:49
¿me creas tú que...? 01:17:50
Pero de todas formas, las preguntas 01:17:52
de examen normalmente suelen dar 01:17:55
cuatro opciones, no suelen ser verdadero o falso 01:17:57
¿no? Sí, yo voy a dar 01:17:59
una única opción 01:18:00
es la verdad. Una única opción correcta, ¿verdad? 01:18:03
pensad, y lo recuerdo 01:18:05
los test de autoevaluación que tenéis 01:18:08
son para practicar y para 01:18:11
autoevaluarse vosotros 01:18:12
¿Por qué? Porque mi examen se hace 01:18:14
desde cero, es decir, no hay ninguna pregunta 01:18:17
de las que... 01:18:19
Yo pusiera las preguntas, o sea, si pusiera los test 01:18:20
que vienen en la autoglación, tendríais 01:18:23
un conocimiento parcial 01:18:25
porque te sabes 01:18:27
los test, pero hay que saber 01:18:29
en general, entonces no 01:18:31
sé si... pero yo no pongo 01:18:32
los test de... yo los creo 01:18:35
Sí, sí, sí, sí. No, eso es para practicar 01:18:37
lo que has estudiado en ese momento 01:18:39
Voy bien, voy mal, pero 01:18:41
Pero es parcial, porque si en un punto solo hay un test y yo os cambio y de ese punto os cambio y os pregunto lo que no viene en ese test, en realidad tienes un conocimiento parcial. 01:18:43
Vas a fallarlo, sí o sí. 01:18:55
Porque únicamente te sabes el test. 01:18:57
Hay que mirarse todo. 01:19:00
Sí, sí, sí. 01:19:02
No, no, está claro, no, sí. 01:19:03
No miras. 01:19:04
Perfecto. 01:19:06
y nada más 01:19:07
yo espero que esto haya servido 01:19:10
de esclarecer un poco 01:19:11
o al menos que os haga pensar 01:19:14
si, no, pensad 01:19:16
si la cuestión es 01:19:18
practicarlo 01:19:20
la estadística 01:19:21
la matemática en general 01:19:23
es practicar, practicar, practicar 01:19:25
y hay un momento que hay cosas que no las verás 01:19:27
a lo mejor las ves a la semana 01:19:30
hay otras cosas que necesitas años en verlas 01:19:31
y cosas que no las verás en tu vida 01:19:34
es así 01:19:35
pero todo esto que estamos viendo 01:19:37
esto lo podéis ver perfectamente 01:19:39
vale, vale 01:19:41
es alcanzable 01:19:43
muy bien 01:19:45
perfecto 01:19:46
y bueno, nada más 01:19:48
agradeceros que 01:19:49
estéis aquí 01:19:52
nada, gracias a ti 01:19:54
y bueno, voy a 01:19:57
como está grabándose, pues lo subiré 01:19:59
muy bien 01:20:01
y no dejes este tema, por favor 01:20:02
os voy a subir unos ejercicios tipo 01:20:04
y haremos otra videoconferencia 01:20:10
con la parte que nos queda 01:20:13
¿los ejercicios vendrán con respuesta 01:20:16
al final para poder verificar que lo hemos hecho bien? 01:20:19
sí, sí, yo os doy las soluciones 01:20:23
si no podéis ver, si es que estáis a distancia 01:20:25
tenéis opción 01:20:28
Me podéis preguntar por cualquier medio. Podéis llamarme, podéis ir a la videoconferencia, lo que queráis. Pero como estamos a distancia, lo lógico es que os pongan los resultados. 01:20:30
Vale, perfecto. 01:20:42
Porque podéis asociar, hombre, yo lo que os traslado es que primero intentéis hacer el ejercicio, porque si ya miráis el resultado, pues no se va a quedar. Tratar de hacerlo y luego la compensación es luego verlo, pero hay que hacerlo, hay que intentarlo. 01:20:43
Sí, sí, por lo menos con la unidad 01:20:58
sirviendo la fórmula y eso 01:21:01
para ir recortándolas 01:21:02
Y no van a ser, de verdad, y a lo mejor 01:21:03
y voy a poner los ejercicios 01:21:05
que a lo mejor tipo de cómo pueden ser 01:21:07
en el día de hoy 01:21:10
van a ser cortos 01:21:11
Cortos, perfecto 01:21:13
Vale, pues muchas gracias 01:21:15
Bueno, pues nada, venga 01:21:17
Muchísimas gracias por asistir 01:21:19
Venga ya, ánimo 01:21:20
Gracias, hasta luego, adiós 01:21:22
Idioma/s:
es
Materias:
Economía y empresa
Etiquetas:
Empresa
Niveles educativos:
▼ Mostrar / ocultar niveles
  • Formación Profesional
    • Ciclo formativo de grado básico
      • Primer Curso
      • Segundo Curso
    • Ciclo formativo de grado medio
      • Primer Curso
      • Segundo Curso
    • Ciclo formativo de grado superior
      • Primer Curso
      • Segundo Curso
Autor/es:
José Antonio González Constanza
Subido por:
Jose Antonio G.
Licencia:
Todos los derechos reservados
Visualizaciones:
65
Fecha:
18 de febrero de 2025 - 14:11
Visibilidad:
Público
Centro:
IES CIFP a Distancia Ignacio Ellacuría
Duración:
1h′ 21′ 37″
Relación de aspecto:
1.78:1
Resolución:
1920x1080 píxeles
Tamaño:
1.17

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid