Activa JavaScript para disfrutar de los vídeos de la Mediateca.
Conceptos básicos estadísticos - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Conceptos básicos de estadística
Primero de todo, agradeceros que estéis aquí, que hayáis venido hoy, que estéis presentes. Esta videoconferencia va dirigida a tratar de esclarecer un poco los conceptos estadísticos.
00:00:07
Yo no sé qué nivel tenéis cada uno. Yo con Moisés hablé contigo. Bueno, pues más o menos, el resto no lo sé. Pero bueno, ¿tenéis más o menos conceptos estadísticos?
00:00:29
Yo hace años, años, que no... Pues hasta que acabé el bachillerato, ¿sabes? Que era de ciencias.
00:00:41
Sí, pues precisamente por eso. Es importante que analicemos esos conceptos. Voy a hacer dos. Hoy no voy a dar la parte de análisis probabilístico y no voy a dar la diferencia estadística.
00:00:48
vamos a empezar una introducción
00:01:05
ahora lo vemos
00:01:06
se prepara una presentación
00:01:09
y con esa presentación a ver si hay algún ejemplo
00:01:10
a ver si podemos esclarecer un poco
00:01:13
la parte de
00:01:15
luego tenéis también
00:01:17
dime
00:01:18
esto grabarlo es imposible
00:01:20
porque yo en algún momento tendré que salir
00:01:23
lo estoy grabando ahora mismo
00:01:25
genial
00:01:27
has hecho una prueba antes
00:01:28
genial, genial, vale, pues muchas gracias
00:01:30
vale, entonces lo que decía
00:01:32
me voy a centrar sobre todo en univariable
00:01:34
es decir, una única variable
00:01:37
aunque el temario hace mención
00:01:39
también de multivariable
00:01:41
y hace mención de los métodos, etcétera
00:01:42
pues ahí tampoco se centra mucho
00:01:45
como no
00:01:47
simplemente lo menciona
00:01:49
pues tampoco nos vamos a meter, además es mucho más
00:01:51
complejo, entonces con la parte
00:01:53
de una variable yo creo que está
00:01:55
pues si acaso
00:01:57
yo tuviera que poner, como tengo que poner
00:01:59
práctica, si tuviera que poner algún tipo de ejercicio
00:02:01
o algo pues va a ser de una variable
00:02:03
entonces
00:02:05
vamos a
00:02:06
un momento por favor
00:02:09
si
00:02:11
venga, gracias
00:02:12
me informan que tenías problemas
00:02:16
para conectarte
00:02:19
vale, vale, ya está
00:02:21
bueno pues sigo
00:02:22
lo vamos a centrar
00:02:25
sobre todo en univariable
00:02:27
de acuerdo
00:02:29
y bueno vamos a ver un poquito
00:02:29
las nociones básicas
00:02:32
y espero que esto os sirva
00:02:36
para cuando empecéis
00:02:37
la próxima unidad del módulo
00:02:39
que es la 5
00:02:42
pues no sea tan complicado
00:02:42
os iba a decir que tenéis también
00:02:44
series temporales
00:02:48
pero también
00:02:48
lo menciona más o menos
00:02:51
y tampoco voy a profundizar mucho
00:02:54
series temporales es más complicado
00:02:56
¿de acuerdo?
00:02:57
voy a compartir
00:02:59
voy a compartir lo que es
00:03:00
la presentación
00:03:03
y lo vamos viendo
00:03:05
es esta la presentación
00:03:05
¿lo veis bien?
00:03:11
bueno, pues está la información
00:03:12
de mercado, concepto básico, etc.
00:03:15
entonces, y así puedo ir
00:03:17
pasando las
00:03:26
slides
00:03:27
vale, está aquí
00:03:29
¿lo veis bien?
00:03:38
¿perfecto?
00:03:41
si, si, seguimos viendo la misma
00:03:42
lo he puesto en powerpoint
00:03:44
antes estaba en el pdf
00:03:48
entonces ahora yo le voy pinchando
00:03:49
a medida que voy y así es más
00:03:52
queda más chulo
00:03:53
bueno empezamos
00:03:55
presentación, bueno el propósito de la presentación
00:03:58
bueno pues lo que os he dicho
00:04:00
vamos a tratar de indagar un poquito
00:04:01
en los conceptos de estadística
00:04:04
y ver un poquito
00:04:05
porque el estado de módulo es importante
00:04:06
aunque se centre al final
00:04:08
yo creo que debería
00:04:11
a efectos de las unidades
00:04:13
debería introducirse un poquito antes
00:04:17
bueno, ya en la 4 ha hablado un poquito de muestra
00:04:18
etcétera, pero debería introducirse un poquito antes
00:04:21
porque luego todo viene de golpe
00:04:23
en la unidad 5
00:04:24
y lo que decís que se hace bola
00:04:26
claro, se va a hacer bola
00:04:29
pero vamos, de acuerdo
00:04:30
hay dos apartados
00:04:32
o lo que es la
00:04:33
el temario o la unidad
00:04:35
pues hace referencia a análisis de datos
00:04:40
y análisis probabilístico
00:04:42
Como os he comentado, vamos a centrarnos hoy en análisis de datos, que es más o menos lo que veremos que son los análisis de datos.
00:04:43
Y luego el análisis probabilístico va centrado más en la diferencia estadística, que es un poquito más complejo, que es el intervalo de confianza, etc.
00:04:51
Y eso lo vamos a ver en otra videoconferencia, que lo voy a dividir en dos partes para que no sea tan largo.
00:05:02
Bueno, entonces, cuando decimos análisis de datos, en realidad lo que queremos hacer es analizar la información.
00:05:07
Es decir, nosotros podemos tener una gran cantidad de información, información sobre un hecho, un suceso o un determinado aspecto que queremos estudiar o que queremos analizar.
00:05:17
y lo analizamos. Entonces, para ello tenemos una serie de herramientas, que son herramientas estadísticas,
00:05:29
que son las que nos van a permitir hacer un análisis y comprobar o llegar a obtener una serie de conclusiones
00:05:35
que nos van a permitir tomar decisiones o lo que fuera. Entonces, esto es lo que realmente nos vamos a centrar.
00:05:46
Nos vamos a centrar en qué medidas o qué herramientas contamos para poder analizar o determinar cómo está la información que en este caso queremos estudiar.
00:05:53
Entonces, estas herramientas, las herramientas estadísticas, nos vamos a centrar en cuatro partes.
00:06:09
Análisis de la varianza, las medidas de, bueno, análisis de la varianza es comparar cuando tenemos varias muestras, en lugar de tener una sola muestra.
00:06:15
Vemos cómo varían o si tenemos varias muestras tenemos varias medias.
00:06:23
Entonces en expulsión de esas medias vamos a ver cómo varían o cómo se alejan nuestras observaciones con respecto a esas medias.
00:06:29
Luego análisis univariable, ahí nos centraremos en medidas de posición y dispersión.
00:06:37
Y me hace entrar única y exclusivamente en univariable, una única variable.
00:06:42
Es decir, variable, miraos lo que viene en la unidad, en el temario del módulo y más o menos se hace mención de una serie de procedimientos para usar con la análisis de más de una variable.
00:06:45
En realidad, nuestro mundo es un mundo complejo. En nuestra realidad, o lo que realmente nosotros vemos, o lo que deberíamos estudiar no es una única variable, sino son muchas.
00:07:05
Perdona, José, seguimos viendo el PDF. No sé si lo vemos.
00:07:18
Ah, ¿seguimos viendo el PDF?
00:07:23
Sí.
00:07:24
No vemos, sí.
00:07:25
Si lo estás hablando, no sale de lo que estamos viendo.
00:07:26
Espera un momento, a ver, espera un momento, entonces voy a ir a, claro, porque a lo mejor he compartido el, pero por siempre es el, perdón, perdón, perdón.
00:07:29
No, no pasa nada.
00:07:39
Pues el, pues no me dejo, me va a hacer el PowerPoint, ¿por qué no me deja? Si está aquí. Bueno, venga, lo hago con el PDF y lo voy moviendo el PDF, porque no sé por qué no me deja la ventana, bueno, al final es lo mismo, sí.
00:07:43
entonces me he centrado
00:08:05
bueno, ahora veis el
00:08:08
cero presentación, perdonad
00:08:10
el propósito
00:08:11
como os he dicho es obtener los conceptos
00:08:13
básicos, teníamos análisis de datos
00:08:16
y análisis probabilístico
00:08:18
esta es la
00:08:19
slide en donde estábamos
00:08:22
y decidí dónde viene
00:08:23
todo esto
00:08:26
pues como veis
00:08:27
son cuatro puntos
00:08:30
tenemos unas herramientas
00:08:31
lo que os he dicho, a nivel real
00:08:33
pues tendríamos que analizar más de una variable
00:08:36
porque lo que nos rodea es más de una variable
00:08:38
pero bueno, pero como lo que
00:08:40
buscamos es
00:08:42
adquirir una serie de conocimientos o refrescar
00:08:42
los conocimientos básicos
00:08:46
o de estadística, pues vamos a
00:08:48
centraros en una única variable
00:08:50
y así conocer todos los
00:08:52
estadísticos o todas las herramientas
00:08:54
estadísticas que
00:08:56
hay para analizar los datos
00:08:56
¿de acuerdo? Entonces tenemos medida de
00:09:00
Exposición y dispersión, que estas van a ser las típicas, la media, la varianza, todo eso sonará.
00:09:01
Luego análisis de la varianza, que como os he dicho ya no es una muestra, sino lo que permite es analizar o comparar varias muestras, luego lo veremos.
00:09:09
Y luego medidas de forma de la distribución, es decir, sabiendo cómo es, todos conocéis lo que es una distribución normal.
00:09:19
La distribución normal es la clásica campana de Gauss, que hace como una forma de campana, donde la parte de arriba es lo más probable o las observaciones que más probable se den, y luego a medida que te vas yendo hacia los lados, pues va bajando.
00:09:28
¿Por qué? Porque la probabilidad de que esa variable se dé o se obtenga es menor
00:09:44
Y entonces va disminuyendo y disminuyendo a medida que nos vamos alejando de lo que es el eje X
00:09:53
Partimos del centro, el centro sería la media
00:09:59
Y esto es lo que vamos a medir a través de estas medidas de forma de la distribución
00:10:02
Es decir, lo que vamos a ver es primero si realmente estamos en una distribución normal, simétrica
00:10:07
o si se tiende hacia la derecha, hacia la izquierda, o si es más achatada o más pronunciada.
00:10:14
Eso es lo que va a permitir medir la forma de la distribución, que es interesante y es importante.
00:10:19
Estas son herramientas que tenemos para analizar los datos o la información que tengamos.
00:10:28
¿Para qué? Pues lo que hemos hecho, para llegar a una serie de conclusiones
00:10:32
o verificar realmente lo que realmente estemos buscando.
00:10:36
Dimos el número de datos, tenemos unas herramientas y a partir de esas herramientas, pues analizamos. Entonces, seguimos. Empezamos con análisis univariable de datos. Bueno, pues como hemos dicho, análisis univariable significa que vamos a utilizar una única variable, es decir, vamos a centrar en el comportamiento de las variables, pero de forma individual, es decir, no van a estar afectadas por otro tipo de variables, en este caso solo una.
00:10:40
Y aquí nos centramos en, vamos a repasar lo que es distribución de frecuencias, la medida de tendencia central, que esto si lo recordaréis o sabéis que es la media, también hay otras, pero la media aritmética o media ponderada es la más utilizada.
00:11:05
medidas de dispersión, pues aquí tenemos la varianza
00:11:23
o la desviación típica
00:11:25
que no lo veremos, y luego la inferencia estadística
00:11:27
que hago una mención pero lo dejo para
00:11:29
el siguiente videoconferencia
00:11:31
esto es más complicado
00:11:32
hay que introducir
00:11:35
un ejemplo y darle más tiempo
00:11:37
entonces
00:11:39
distribución de frecuencia, distribución de frecuencia simplemente es
00:11:40
pues si tenemos
00:11:43
una determinada
00:11:45
variable que estamos estudiando
00:11:47
y tenemos un montón de observaciones
00:11:49
sobre esa variable
00:11:51
Pues ver cuántas veces se repite. Es decir, la frecuencia lo que nos indica es, como si veis aquí, os pongo número de litros de leche consumidos en el hogar a la semana.
00:11:52
Pues nuestra variable, lo que estamos estudiando es el número de litros que se consumen por semana.
00:12:03
Por tanto, ¿qué nos determina la frecuencia o por qué es importante la frecuencia?
00:12:11
Porque nos va a permitir saber si se repite más un determinado valor que otro.
00:12:14
Si os fijáis, tenemos aquí en esto que veis en gris, tenemos en la frecuencia, toda la parte, la cabecera en rojo y luego todo lo que viene en naranja, bueno, en naranja aquí también tenía que haber puesto en naranja, pero bueno.
00:12:20
Entonces, esto son la frecuencia. ¿Qué indica la frecuencia? Que, por ejemplo, el valor 3, es decir, 3 litros por semana que ha consumido un, pues, simplemente imaginaos que habéis hecho una encuesta, habéis cogido un montón de individuos y un individuo o 118 individuos nos han dicho que consumen 3 litros por semana.
00:12:38
Por lo tanto, esa es la frecuencia. Es importante porque nos permite saber cuál de esos valores que toma nuestra variable se repite más.
00:12:57
En este caso, además, estos 118 coinciden con la mayor frecuencia o el mayor número de todos los encuestados, que son 836.
00:13:11
indicamos que la mayor frecuencia se encuentra en 118
00:13:23
que son los 3 litros por semana
00:13:29
esto es lo que estamos midiendo con la frecuencia
00:13:31
determinar realmente
00:13:34
lo repetitivo que se da a un determinado valor
00:13:36
de nuestras observaciones
00:13:41
y lo debemos acompañar
00:13:43
debe estar reflejado de manera porcentual
00:13:46
la manera porcentual es importante
00:13:51
y aquí lo veis, sobre todo la acumulada, aquí nos indica qué porcentaje, por ejemplo, la primera es un 1,9 porcentaje, o sea, es un 1,8 con respecto al total.
00:13:53
Con respecto al total, es decir, casi el 2% se da que toman un litro por semana determinadas personas.
00:14:06
Pues esto es importante ¿para qué? Pues para reflejar en el acumulado cuál es el porcentaje o cómo, o incluso para dividir lo que es la distribución con todas las observaciones y saber realmente dónde está el mayor peso o el menor peso.
00:14:18
No sé si lo veis. Esto es sencillo. En realidad simplemente estamos midiendo por porcentajes cuánto se repiten un determinado valor del conjunto de observaciones.
00:14:36
si yo entiendo las dos primeras columnas vale al final es asignar la frecuencia vale y luego darle
00:14:46
el porcentaje porque eso lo hago yo en mis ventas para saber qué porcentaje de ventas se tiene con
00:14:53
cada cliente del 100% vale pero luego la del un percent que creo que hay un missing es abajo si
00:14:57
me sientes a lo mejor que es algún valor que a lo mejor se marcaba pero luego a nivel de valor
00:15:06
no daba y es como ha metido como un error que suele ocurrir cuando tomas información o haces
00:15:12
una encuesta o lo que sea pues puede ocurrir errores entonces a efectos del porcentaje está
00:15:20
incluido en 836 es un 4,1 por ciento pero como es missing y no tenemos un valor pues entonces
00:15:25
como si lo calcula otra vez el porcentaje es decir en realidad está serían 836 menos 34
00:15:32
sería 802 no 802 sería el total de observaciones válidas y se hace sobre eso efectivamente sobre
00:15:41
esa calcula y por eso nada más que se ha añadido un missing para que veáis que también vale y la
00:15:51
cuarta es perfecto todos y la cuarta entonces y la cuarta la acumulada acumulada sabán el primero
00:15:58
1,9 más 12,5 son los 14,3. ¿Por qué necesitamos la acumulada? Porque nos va a determinar o nos va a permitir saber si es el 100%, ¿no?
00:16:05
O dividir toda la distribución en, por ejemplo, la mitad de la distribución estaría en, llegaría a 55.
00:16:20
Ahí más o menos estaría la, y como veremos luego, permite obtener la mediana.
00:16:30
Yo, perdona, pero la acumulada no sé de dónde sale.
00:16:36
La acumulada es donde pone valid percent, aquí, en la columna, espera, señalo, ¿se ve el ratón?
00:16:40
Sí.
00:16:48
pues aquí va sumando
00:16:48
va acumulando por 9
00:16:50
luego suma estas dos
00:16:52
luego estas tres y así
00:16:54
hasta claro, la suma de todas nos tiene que dar
00:16:55
aquí el 100
00:16:58
que ha sumado todo
00:16:59
¿de acuerdo?
00:17:01
es importante ese acumulado, ¿por qué?
00:17:04
porque nos va a permitir luego ver dónde está la mediana
00:17:06
que es la que divide la distribución
00:17:08
en dos partes iguales
00:17:12
¿ha estado claro todo más o menos?
00:17:15
esto es simplemente eso
00:17:18
Fijarse en qué observaciones se repiten para un determinado valor y conocer así.
00:17:19
En función de eso, es un método, es una forma de analizar los datos y determinar cuál se repite más o cuál se va a...
00:17:26
Es importante. Son herramientas, nada más.
00:17:34
Basamos a las medidas de tendencia central.
00:17:40
Las medidas de tendencia central supongo que son las típicas, las de siempre.
00:17:41
La media aritmética, que es una media aritmética, pero no simple, es una media aritmética ponderada. ¿Qué significa ponderada? Que como tenemos, como si todos los valores de litros de la semana únicamente se lo hubiéramos encuestado a una persona, o sea, si por cada valor de litros por semana consumidos únicamente correspondiese a una persona, a un encuestado, pues sí, tendríamos una media aritmética.
00:17:45
La media aritmética es simple, pero como se repiten, es decir, hay determinados valores, como hemos dicho, el 3 litros por semana se repite hasta 118 veces. De los 800 y pico encuestados, 118 consumen 3. Por tanto, tendrá más peso a efectos de determinar la media aritmética ese que el resto, ¿o no?
00:18:15
Por tanto, hay que ponderarlo. Es como si cuando le multiplicas cada valor, el 3 por 118, lo que estás determinando es darle un peso.
00:18:39
Si os fijáis, aquí la media dice un sumatorio de la frecuencia, que es como si dijéramos el peso, y del valor.
00:18:49
Todo ello dividido entre n.
00:18:57
Vemos aquí, y efectivamente son, van multiplicando cada valor por su peso.
00:18:59
Y así hasta dividirlos, ¿ves aquí lo que os decía? Son 802 observaciones en realidad. ¿Por qué? 34 eran missing, o sea, no eran válidas. Entonces, ¿qué va multiplicando? Vamos multiplicando cada valor, en este caso el 1, valor 1 por su frecuencia 15, más 2 por 100, más 3 por 118. ¿Por qué? Porque no puede ser simple, tiene que ser ponderada porque el 2 tiene mayor importancia que el 1.
00:19:06
¿por qué? porque se repite 100 veces
00:19:33
frente al otro que son 15
00:19:36
por lo tanto la forma de darle un peso
00:19:38
y darle una mayor importancia en una media aritmética
00:19:39
es multiplicándole
00:19:42
por su frecuencia
00:19:44
se multiplican cada una de ellas, se suman todas
00:19:45
y una vez sumadas se dividen
00:19:48
por el número de observaciones que había
00:19:50
que son 802
00:19:51
y eso tiene 6,68
00:19:53
porque si no hiciéramos el peso
00:19:55
si no fijáramos ese peso
00:19:57
pues realmente
00:19:59
estaría distorsionada la media
00:20:01
No sería real. ¿De acuerdo? Casi son, no sé, son aproximadamente 24, si lo divides, no saldría a orden.
00:20:03
Entonces es necesario hacer esa ponderación. Eso en cuanto a la media.
00:20:15
¿Y qué nos determina esa media aritmética? Simplemente que el conjunto de todas las observaciones, ¿cuál es el que se da como media?
00:20:19
Es decir, de todos ellos, 6,68 más o menos, es los litros que de media, cogiendo esas 802 observaciones, te da, es el valor que realmente da como media del conjunto de todas las observaciones.
00:20:25
es una medida central
00:20:46
es decir, de nuestra distribución
00:20:51
si nuestra distribución es normal
00:20:52
y hace forma de una campana
00:20:55
pues la media estaría justo en el medio
00:20:56
que es el valor
00:21:00
y esa media son los 6,7
00:21:02
simplemente es otra herramienta
00:21:04
para analizar los datos
00:21:10
es decir, para decirnos
00:21:11
que de todo ese conjunto de datos
00:21:12
lo normal es que si coges una observación
00:21:14
lo más normal es que te vaya
00:21:17
a estar cercano a los 6
00:21:18
porque es la media
00:21:20
vale
00:21:23
en cuanto a la mediana, la mediana es la que divide
00:21:25
la divide
00:21:28
la distribución, cuando hablamos de distribución
00:21:29
es el conjunto de todas las observaciones
00:21:32
como hemos dicho anteriormente
00:21:34
nuestra distribución
00:21:35
y le hemos hecho un acumulado
00:21:37
se ha ido sumando, sumando
00:21:39
de tal manera que
00:21:41
cuando tenemos más o menos la mitad
00:21:42
cuando está dividido entre dos
00:21:46
pues justo cuando
00:21:47
cuando nuestro porcentaje sea
00:21:49
cercano al 50%
00:21:51
y si os fijáis, más o menos
00:21:53
coincide con el 6, estaría entre el 5 y el 6
00:21:55
¿no?
00:21:58
5 y pico, más o menos
00:21:59
determinamos que la mediana
00:22:00
en este caso, sería el 6 litros
00:22:03
¿vale? es otra herramienta
00:22:06
para determinar o para analizar los tornados
00:22:08
¿y qué nos quedaría? pues la moda
00:22:10
la moda es el
00:22:11
el que tiene un mayor
00:22:13
todos los valores
00:22:16
que tenemos, el que más
00:22:18
se revisa, el que tiene
00:22:20
una mayor frecuencia.
00:22:22
¿Y cuál habíamos determinado que era el que tiene
00:22:24
mayor frecuencia?
00:22:26
El que tenía un total
00:22:27
de 118 encuestados
00:22:29
habían determinado que consumían
00:22:32
3 litros por semana.
00:22:34
Este es el valor.
00:22:35
Ya tenemos 3
00:22:38
métodos o 3 herramientas
00:22:40
que ya nos...
00:22:42
De un conjunto de 802
00:22:44
observaciones,
00:22:46
Te las vemos, tú puedes ver los números y dices, bueno, veo los números y muy bien.
00:22:48
Pero ya con estas tres medidas o estas tres herramientas ya tienes una idea,
00:22:51
ya empiezas a tener una idea un poquito más clara de toda esa masa de números que tienes que no te dicen nada.
00:22:57
Pues para eso, ese es el objetivo de estas medidas o de estos, pues determinar algo,
00:23:03
que podamos llegar a unas conclusiones o podamos ver los números, que no son solo números,
00:23:09
sino que realmente interpretarlos
00:23:15
y llegar a
00:23:17
pues algo, algo que nos diga
00:23:18
pues oye, esto es así
00:23:20
por eso es tan útil
00:23:22
la estadística en general
00:23:24
es muy muy útil
00:23:27
prácticamente nos permite casi
00:23:28
ver el futuro
00:23:30
y yo creo que de hecho la utilizamos a diario
00:23:31
lo que pasa que a lo mejor no sabemos cuál de ellas
00:23:35
no somos conscientes
00:23:37
pero es muy muy útil
00:23:40
y bueno y ahora ya
00:23:42
bueno antes
00:23:43
Entonces, bueno, lo que es el tratamiento de datos y todo esto ya se daba antes. La diferencia entre antes y ahora es que parece que ahora hay un boom con el tratamiento de datos. Antes se ha hecho tratamiento de datos desde los 60, 70, años 70.
00:23:44
Es decir, la diferencia es que ahora tenemos la información, tenemos un mayor volumen de información, tenemos una mayor velocidad a través de ordenadores, a través de base de datos, etc.
00:24:00
Y entonces nos permite hacer cosas que a lo mejor no se podían hacer antes.
00:24:13
Pero antes se utilizaban prácticamente las mismas herramientas de estadísticas o la misma modelización estadística para poder llegar a determinar el futuro.
00:24:17
pero es eso
00:24:27
es el boom, lo conocéis
00:24:31
el boom del Big Data
00:24:32
y del
00:24:33
Machine Learning, etc.
00:24:36
bueno
00:24:39
más, otra medida de tendencia central
00:24:39
son los presentiles, cuartiles
00:24:42
esto simplemente lo que hace
00:24:44
realmente es dividir, como hemos hecho con la mediana
00:24:46
lo que hace es dividir nuestra distribución
00:24:48
en partes
00:24:51
que también es interesante
00:24:51
son cuartiles, en realidad lo que está dividiendo
00:24:53
es en tres partes
00:24:56
Si cogemos un intervalo, en realidad, desde 0 hasta Q1, desde Q1 hasta Q2, desde Q2 hasta Q3 y hasta el final.
00:24:57
Por lo tanto, estamos dividiendo en tres partes, sabiendo que el Q2 es, en realidad, el que me va a dividir la distribución, el conjunto de observaciones, en dos.
00:25:08
O sea, en realidad debe coincidir con la mediana.
00:25:18
En realidad esto es lo único que hace
00:25:21
Bueno, tiene aquí una formulita
00:25:24
Que aquí, por ejemplo, para conseguir el Q2
00:25:25
Pues sería 2 por el número de observaciones partido de 4
00:25:27
En este caso, a ver que más lo he hecho
00:25:30
Es decir, si tú coges ahora mismo los cuartiles
00:25:33
Y coges las 800
00:25:36
800
00:25:38
Son 802, ¿no?
00:25:39
802 observaciones
00:25:42
Que es n
00:25:43
Y lo multiplicas por m
00:25:44
Por 2
00:25:46
Y luego lo divides entre 4
00:25:50
porque estamos viviendo en cuatro partes
00:25:51
sabemos que es igual
00:25:53
si podríamos
00:25:55
ver esto con algún ejemplo
00:25:57
porque por cuartiles y todo esto
00:25:59
pues no
00:26:01
en realidad el ejemplo lo hemos visto antes
00:26:02
¿por qué? porque en realidad hemos dividido
00:26:05
en realidad hemos dividido
00:26:07
si os fijáis en el 55
00:26:08
aquí, donde está el 55
00:26:10
el porcentaje 55
00:26:13
que es prácticamente el 50
00:26:14
en realidad es la mediana
00:26:17
determinada la mediana
00:26:18
ahí sería el Q2
00:26:20
¿por qué? porque está dividiendo
00:26:21
el Q2 divide, si dividimos en cuatro partes
00:26:23
nuestra distribución, es decir, todo esto
00:26:25
en realidad el Q2 es como
00:26:27
dividirlo entre dos partes
00:26:30
pues ese es el ejemplo
00:26:31
lo único que puedes dividirlo entre
00:26:33
deciles, pues diez partes
00:26:35
centiles, en cien partes
00:26:37
lo que necesites
00:26:38
la analisis, etcétera, pero en realidad es lo mismo
00:26:40
por eso nos decía que la mediana
00:26:43
debe coincidir con ese Q2
00:26:46
que es el Q2 que divide en cuatro partes
00:26:47
¿Me estoy explicando?
00:26:49
En realidad es simplemente
00:26:53
Es decir, esas medidas de tendencia central
00:26:54
Lo que hacen es dividir nuestra distribución en partes
00:26:56
Pues para analizar
00:26:58
Pues imagínate que una parte
00:27:00
Una parte está más concentrada
00:27:01
Otra menos, pues simplemente para eso
00:27:03
Es otra herramienta
00:27:05
Otra herramienta de análisis, nada más
00:27:07
Y utiliza esta fórmula
00:27:09
La fórmula que
00:27:15
Simplemente n es el número de soluciones
00:27:16
Que en nuestro caso son 802
00:27:19
m es
00:27:20
el cuartil, si estamos en cuartiles
00:27:22
el cuartil que necesites determinar
00:27:24
si queremos determinar el cuartil 2
00:27:26
pues se multiplicaría por 2
00:27:28
y k sería el número de partes
00:27:30
en las que se divide nuestro
00:27:32
en este caso
00:27:33
un ejemplo, si queremos hacer un cuartil
00:27:35
sería 4 por n partido de
00:27:38
k
00:27:40
que sería
00:27:41
los 802
00:27:43
por 2
00:27:44
y entre 4
00:27:48
sale los 401, pues ya sabemos que
00:27:50
hay
00:27:53
401, claro, es lógico
00:27:55
si tenemos 802, la mitad tiene que ser 401
00:27:58
observaciones, es decir, las primeras 401
00:28:01
observaciones, que es ahí donde se determina o se obtiene
00:28:04
la mediana, es donde se
00:28:07
divide nuestra, que queremos saber, claro, aquí sabíamos que
00:28:11
era por la mitad y ya está, pero es simplemente para saber
00:28:13
cómo dividir la distribución
00:28:16
y saber el número de observaciones que hay en cada una de las partes.
00:28:19
Vale, pero ¿por qué has utilizado lo del cuartil 2?
00:28:26
Que yo no llego a entender bien.
00:28:29
Como veo el cuartil 1, cuartil 2, cuartil 3, ¿por qué es el 2?
00:28:31
Porque el 2, en realidad, si tú coges un intervalo de...
00:28:35
Si tú coges un intervalo...
00:28:41
A ver, espera, voy a abrir este.
00:28:43
Claro, no, tengo que compartirlo.
00:28:48
Es que no tengo ninguna para dibujar.
00:28:59
Vale, la fórmula la entiendo.
00:29:01
que lo entiendo bien porque coges el cuartil 2
00:29:03
vale, espera
00:29:05
os lo dibujo
00:29:16
en un papel, así lo veis
00:29:18
vale
00:29:20
porque es que en este tampoco
00:29:21
voy a compartir
00:29:23
estamos aquí
00:29:37
dejo de compartir
00:29:38
¿me veis ahora a mí?
00:29:41
no
00:29:43
ah vale, ¿y ahora?
00:29:43
ahora sí, ¿no?
00:29:56
ahora sí
00:29:58
pues esto es
00:29:59
¿veis este interno?
00:30:01
¿Lo veis?
00:30:03
Sí
00:30:04
¿Veis cómo se coloca el Q1, Q2 y Q3?
00:30:04
Sí
00:30:08
¿El Q2 dónde está?
00:30:08
En el medio
00:30:10
Por tanto, tiene que ser la mediana
00:30:11
Vale, vale
00:30:13
El problema no lo veis porque
00:30:15
¿Cómo se coloca?
00:30:17
Claro, es que no entendía
00:30:18
Siempre va a ser impar
00:30:19
Si el número es par de partes en que se divide
00:30:22
Los que van a dividirla tienen que ser impar
00:30:25
Vale, vale
00:30:28
Por eso
00:30:29
En realidad lo que estamos haciendo es eso
00:30:30
Eso es lo que estamos haciendo a la hora de dividir lo que es la...
00:30:32
Vale, vale.
00:30:36
Vale.
00:30:37
En este momento voy a compartir otra vez.
00:30:38
Y nada más, no tiene más, de verdad.
00:30:42
Simplemente eso.
00:30:44
Salen las fórmulas, a ver qué es lo que hace, es dividir la distribución y ya está.
00:30:44
Medidas de dispersión.
00:30:51
Las medidas de dispersión, pues son lo que realmente vamos a medir aquí,
00:30:52
es cómo varían las distintas observaciones, cómo varían con respecto a nuestra media.
00:30:57
Si nosotros hemos calculado una media que son de 6,68 y cogemos una de las, yo que sé, la de 24 litros por semana, pues tenemos una, ahí la varianza, o en este caso la división estándar,
00:31:03
lo que nos está midiendo realmente es cómo se aleja esa observación de 24 sobre la media. Eso es lo que nos va a medir.
00:31:23
Es decir, nos va a medir la variabilidad. En este caso sea grande, claro, porque hemos cogido el valor de la observación más alto, ¿vale? Cuando realmente son 6,68. Pues esto es lo que nos sirve las medidas de dispersión, es decir, cómo se dispersa el conjunto de valores de nuestras observaciones y en función de ello, pues determinar, pues analizar cómo son nuestros datos, nuestra información.
00:31:30
¿Por qué se utiliza
00:31:57
varianza y desviación estándar?
00:31:59
Si tenemos la varianza, ¿por qué tenemos que utilizar
00:32:02
otra unidad
00:32:04
si nos dice lo mismo?
00:32:05
Y la única diferencia es que tiene
00:32:07
una raíz cuadrada
00:32:09
Bueno, primero
00:32:11
perdón, primero defino la varianza
00:32:13
simplemente es, como veis, vas cogiendo
00:32:15
cada uno de los valores
00:32:17
le resta la media
00:32:19
¿vale? Eso nos dice
00:32:20
cómo
00:32:23
a qué distancia está de la media
00:32:23
ese valor en concreto, lo eleva al cuadrado, ¿eleva al cuadrado para qué? Pues para evitar números negativos, ¿vale?
00:32:27
Dejarlo en un valor absoluto y le multiplica por la frecuencia para darle el peso, como hacíamos antes.
00:32:35
Todo ello dividido entre n menos 1, que es el número de observaciones, ¿vale?
00:32:41
Esto nos indica la varianza, nos va a indicar la varianza. ¿Por qué utilizamos la derivación estándar?
00:32:45
porque nuestros valores, por ejemplo el 3, 3 litros por semana, 14 litros por semana,
00:32:51
están fijados en determinadas unidades.
00:33:01
Si tú lo elevas al cuadrado, ya la unidad que nos va a dar va a diferir de las unidades que tenemos en los valores de las observaciones.
00:33:03
por eso lo que hacemos es
00:33:16
aplicar la raíz cuadrada
00:33:19
para que esas unidades sean comparables
00:33:21
¿me he explicado?
00:33:23
si no lo vemos
00:33:27
esto si no lo vemos con algo
00:33:27
se nos va a hacer porque
00:33:29
hay una fórmula
00:33:31
te iba a preguntar, perdona, esto en teoría
00:33:32
es para que veamos mejor
00:33:35
lo que es el temario que vamos a ver y tal
00:33:37
pero lo tenemos que saber más
00:33:39
a nivel teórico o lo vamos a tener que
00:33:41
poner en práctica
00:33:43
vais a tener que poner en práctica
00:33:45
porque os voy a poner práctica de esto
00:33:46
vale, por eso, que es práctica también
00:33:49
no os voy a poner ni cosas extraordinarias
00:33:50
voy a poner cosas que estén
00:33:53
sí, pero me refiero, como dice César
00:33:55
que al viéndolo así es como que te quedas un poco
00:33:57
y luego será
00:33:59
fácil seguramente, pero
00:34:01
como yo voy a tener que
00:34:03
perdona César, perdona
00:34:04
dime, dime
00:34:06
como yo voy a tener que abandonar en breve
00:34:07
y esto queda grabado
00:34:10
te pediría si pudieras mandar
00:34:13
mandarnos en base a esto
00:34:14
algún ejercicio
00:34:17
práctico que creas
00:34:19
que no vaya a ser útil
00:34:21
para el examen.
00:34:22
Porque es como que yo estoy perdido porque luego
00:34:25
todo esto no sé cómo digerirlo o no sé cómo
00:34:26
llevarlo a un ejercicio o me preocupa
00:34:29
que no vaya a entender con esta teoría luego
00:34:30
el ejercicio.
00:34:32
En realidad de las partes
00:34:34
tenemos los ejercicios.
00:34:36
Aquí tenemos cómo se calcula
00:34:39
y luego
00:34:41
también tenéis aquí un análisis de la varianza
00:34:42
también tenéis un ejercicio entero
00:34:45
con todos los pasos, es decir
00:34:46
os estoy incorporando
00:34:48
es decir, como se calculaba la media
00:34:52
la mediana, aquí tenéis ya el ejercicio
00:34:55
es decir, esto lo tenéis
00:34:56
como la dispersión, pues ahora os digo
00:34:57
como se calcula
00:35:00
y luego el análisis de la varianza también
00:35:02
y luego lo que daría, lo que es la inferencia
00:35:04
estadística con lo de
00:35:06
los intervalos de confianza, etcétera, que también incorporaría
00:35:07
Y luego, aparte, tendréis los que ya vienen en el temario. Estos son concretamente de aquí, de lo que veis aquí, que lo he puesto como recurso. Pues lo he sacado ahí. Pero en realidad lo tenéis, usados métodos de ejercicio.
00:35:10
De acuerdo.
00:35:25
Y os subo, si queréis, os subo el PDF y ya está.
00:35:26
Luego, ¿esta grabación, para verla, va a aparecer directamente en la unidad?
00:35:31
¿Esta grabación va a aparecer en la unidad? Pues sí.
00:35:35
la incorporaré en la segunda
00:35:38
o sea en la unidad 5
00:35:42
perdón
00:35:44
estamos hablando de la unidad 5 en realidad
00:35:45
lo único que me he anticipado
00:35:48
para que cuando llegue diga
00:35:50
madre mía esto que es
00:35:51
claro, estoy viéndolo así, la verdad que se ve
00:35:52
como un poco fuerte
00:35:55
lo de la bola, pues la bola tiene que ser
00:35:56
vamos, se te hace bola, no
00:35:59
bolón, sabes
00:36:00
sobre todo yo, a mí me pasa
00:36:02
por ejemplo, no sé si a los demás, pero claro
00:36:05
como, si es verdad que tú dices, tienes ejercicio
00:36:06
pero claro, ves una tabla, ves muchos datos
00:36:08
ves mucho, y como que a mí eso
00:36:10
me lía un poco, pero
00:36:12
en realidad, porque esto es
00:36:14
siempre lo mismo, esto bueno, si queréis os subo
00:36:16
os pondré algún ejercicio de cómo
00:36:18
se calcula la varianza y la duración
00:36:20
pero esto es simplemente
00:36:22
aplicar la fórmula, claro, tú coges
00:36:23
los valores en una columna
00:36:26
en Excel, pones los valores en una columna
00:36:28
todos los valores, luego, la siguiente
00:36:30
todas las frecuencias, como estaba aquí
00:36:32
Aquí mira, ya tienes todos los valores
00:36:33
Y todas las frecuencias, pero ahora lo único que hay que hacer
00:36:36
Es la siguiente columna ya no es porcentaje
00:36:38
La siguiente columna será el x sub i
00:36:39
Que es este, que es el valor
00:36:42
Menos la media que hayas conseguido
00:36:43
Y vas a poner todos los valores de aquí
00:36:46
De x sub i menos la media
00:36:47
Luego, la siguiente columna que será
00:36:49
x sub i menos la media elevado al cuadrado
00:36:51
Pues pones todos los valores de aquí
00:36:53
Y ya cuando tengas aquí abajo la suma
00:36:55
De x sub i menos la media
00:36:57
Elevado al cuadrado, luego le multiplicas la frecuencia
00:37:00
has hecho la última columna
00:37:02
que es x sub i menos la media
00:37:07
y elevado al cuadrado por la frecuencia
00:37:09
la sumas y ya la divides entre el menos uno
00:37:12
y ahora ya tiene la variación
00:37:14
y luego ya sin aplicar la raíz cuadrada
00:37:15
ya tiene la división típica
00:37:18
es repetitivo
00:37:19
en realidad es largo
00:37:22
a mi ahora mismo me parece difícil pero porque lo tengo
00:37:23
que ver bien, tranquila
00:37:26
y tal, pero que es verdad que bueno
00:37:28
será practicarlo me imagino
00:37:29
un ejercicio de javier yo creo es muy bueno pero es esto yo creo más complicado efectos
00:37:31
de comprensión porque esto es al fin y al cabo es mecánico lo haces y más o menos lo estás
00:37:46
interpretando en realidad es bueno pues es una fórmula matemática lo estás le estás sacando lo
00:37:51
que es la variación que corresponde a cada con respecto a la medida de cada una de las
00:37:56
observaciones, lo levas al cuadrado
00:38:00
para hacerlo absoluto
00:38:02
y luego le pones el peso que es la frecuencia
00:38:04
y lo divides entre el de menos uno y te tiene que dar la varianza
00:38:06
es decir, como media, cuál es
00:38:08
la variación que hay, eso es lo que te está dando
00:38:10
¿vale? Antes dábamos
00:38:12
cuál es la media y ahora vemos cuál es
00:38:14
como si dijéramos una media de lo que realmente
00:38:16
varía, ¿vale?
00:38:18
Yo creo que es más complicado luego lo que veremos
00:38:20
luego en la análisis de la varianza y sobre todo
00:38:22
lo que es los titulares de confianza
00:38:24
y el contraste de hipótesis
00:38:29
eso es un poquito más complicado
00:38:31
porque ahí ya dices, bueno, no lo veo claro
00:38:32
no es
00:38:35
esto es más mecánico
00:38:36
pero vamos, si queréis ejercicios
00:38:39
yo creo que en el cálculo de la varianza
00:38:41
el cálculo de la media, todo lo tenéis en la unidad
00:38:43
todavía no lo he visto
00:38:46
pero me adelanto
00:38:47
ahí hay ejercicios
00:38:49
entonces vamos
00:38:50
estábamos aquí, bueno, pues lo que os he dicho
00:38:53
aquí lo que he hecho es simplemente los valores
00:38:55
si os fijáis, bueno, he puesto frecuencia
00:38:57
vale, bueno, y ya aquí
00:38:59
automáticamente lo ha calculado y ya está
00:39:00
se calcularía como os he dicho
00:39:02
de todas formas lo tenéis
00:39:04
un ejemplo igual de esto lo tenéis
00:39:06
en la unidad
00:39:08
entonces, saca una varianza
00:39:10
lo que os decía, si os fijáis
00:39:12
la varianza sale de 18
00:39:15
pero es
00:39:16
consecuencia de haber
00:39:18
todas esas diferencias
00:39:20
las hemos elevado al cuadrado
00:39:22
por tanto, nuestro valor estará
00:39:23
no está expresado en las unidades
00:39:26
de nuestros valores de observaciones
00:39:29
aquí tienes 1, 2, 3, 4, 5
00:39:31
así hasta el 24
00:39:34
que creo que era
00:39:34
pues es necesario
00:39:36
utilizar esa raíz cuadrada
00:39:39
para volver a transformar
00:39:42
esta varianza en un valor que realmente
00:39:43
se corresponda con las unidades
00:39:45
aquí decimos que son 4
00:39:47
con 24 en realidad
00:39:50
si son 4,24
00:39:51
litros por semana
00:39:53
que varía de la media
00:39:55
¿Me explico? Sin embargo, el 18 no. El 18 no son 18. Serían litros, pero como lo hemos elevado al cuadrado, ya distorsionan las unidades. Por eso tienes que transformarlo en una derivación típica. Es decir, aplicando la raíz cuadrada.
00:39:56
¿Me estoy explicando lo que estoy diciendo? Por eso se utiliza la definición estándar o científica, lo que queráis. Por eso hay que utilizar la raíz cuadrada o aplicarla sobre la varianza.
00:40:15
para que tengas una forma
00:40:30
de que a nivel de unidades
00:40:33
sea comparable
00:40:34
y entonces te sirva
00:40:36
porque al fin y al cabo lo que estamos utilizando esto son herramientas
00:40:37
que estamos utilizando
00:40:40
y te sirva para ver que dices como media
00:40:41
en nuestro
00:40:44
caso de los litros por semana
00:40:46
que consumían, pues más o menos nuestra distribución
00:40:48
se mueve entre
00:40:51
o más 4,24 o menos 4,24
00:40:52
¿me estoy explicando?
00:40:55
Eso que has dicho ahora de más 4 y menos 4
00:40:58
¿Por qué?
00:41:02
Porque está en valor absoluto
00:41:03
Es decir, en realidad puede variar
00:41:04
Si la media eran 6 con 68
00:41:06
Pues a lo mejor una observación puede estar más o menos
00:41:09
En 10 con 68
00:41:12
Consistente
00:41:14
Pero otra puede estar en 2 con 68
00:41:16
Vale, vale
00:41:18
¿Me explico?
00:41:19
Sí
00:41:20
Esto es lo que te está marcando la varianza o la definición típica
00:41:20
Vale
00:41:24
¿Cómo se están variando nuestras observaciones?
00:41:25
con respecto al valor que sería
00:41:27
nada más que eso
00:41:29
chicos yo os tengo que dejar
00:41:32
muchas gracias
00:41:34
hasta luego
00:41:35
pues eso es lo que me diría
00:41:38
bueno aquí
00:41:40
os he puesto también son medidas de dispersión
00:41:42
pero bueno como lo veremos luego después
00:41:46
con las formas de distribución
00:41:47
coeficiente de simetría y coeficiente de apuntamiento
00:41:49
luego lo veremos
00:41:51
la simetría
00:41:53
Si es una campana
00:41:55
La clásica campana de Gauss
00:41:58
Que es esta
00:42:00
Pues la simetría nos indica cómo está
00:42:00
Si es hacia un lado o hacia el otro
00:42:03
Y el apuntamiento nos indica si es aplanada
00:42:05
O achatada
00:42:08
O pronunciada
00:42:09
Nos está midiendo la forma
00:42:11
Que luego lo vemos
00:42:14
Inferencia estadística
00:42:15
Una vez analizado los datos
00:42:17
Hay que verificarlos
00:42:21
verificarlo, es decir
00:42:22
en realidad lo que estamos haciendo con ese análisis de datos
00:42:25
únicamente estamos cogiendo toda esa masa de datos
00:42:27
o esa información que tenemos o que hemos hecho a través
00:42:29
de encuestas o de lo que sea
00:42:31
y analizando cómo están
00:42:33
los datos, como pues tener una idea
00:42:35
de cómo, por dónde van
00:42:38
o por dónde no vienen, o sea
00:42:39
por dónde, sí, analizando
00:42:41
que realmente pues
00:42:43
cuál es el valor
00:42:44
central, cuál es el valor
00:42:47
qué variaciones que puede haber entre, con respecto
00:42:49
al central, cómo es la distribución, etc.
00:42:51
Pero claro, una vez que tenemos ese análisis
00:42:55
hay que comprobar y verificar para llegar
00:42:57
a una serie de conclusiones. Y para eso se utiliza la inferencia
00:43:00
estadística. Aquí pone que
00:43:04
en investigación, siempre en base a unos valores
00:43:06
conocidos a priori o teóricos. Hay veces que ni siquiera hay valores
00:43:09
a priori. Pero bueno, esto lo veremos
00:43:12
en la próxima videoconferencia.
00:43:14
supongo que os acordáis
00:43:18
del contraste de hipótesis
00:43:20
la hipótesis nula, la alternativa
00:43:22
Bueno, a mí
00:43:25
de sonarme os me suena poco
00:43:26
pero yo lo recuerdo todo, la verdad
00:43:28
marcas un porcentaje de probabilidad
00:43:30
que es el nivel de significación
00:43:33
es decir, lo que estás
00:43:35
determinando es
00:43:36
lo que tratas de hacer es
00:43:38
rechazar o no una hipótesis
00:43:39
que has marcado desde el principio
00:43:42
¿Cómo? En función de un estadístico
00:43:44
y en función de un nivel de probabilidad.
00:43:46
Entonces, no es lo mismo decir que yo que sé,
00:43:51
no es lo mismo decir, bueno, pues en general la gente consume
00:43:56
tres litros o seis litros de leche por semana,
00:44:02
que decir, pues tengo una probabilidad del 95%
00:44:08
de que se consumen 6 litros, 6 litros, o mejor aún, no 6 litros, se consumen entre 6 y 7 litros de leche por semana.
00:44:12
Estás acotando, estás acotando. Dentro de nuestra distribución estás acotando cuáles, porque no somos Dios
00:44:27
Y no podemos saber exactamente todo. En el sentido de que no podemos llegar a saber con exactitud cuántos son los litros por semana de media que se consumen. ¿Por qué? Porque nosotros hemos cogido una muestra, no hemos cogido toda la población.
00:44:34
Y si dijéramos mejor entre 5 y 7 litros, aún así haríamos más...
00:44:50
si dijéramos
00:44:55
si cogieramos un intervalo entre 5 y 7 litros
00:44:57
y tienes un 95%
00:44:59
bueno, pues sería brutal
00:45:01
fíjate, ya tienes algo que no tenías
00:45:02
estás con un 95%
00:45:06
de probabilidad, cuando realmente
00:45:08
nuestra población, hemos hecho una muestra de 800 personas
00:45:09
y la población
00:45:12
son 40 millones
00:45:14
y estás
00:45:15
determinando que entre 5 y 7
00:45:17
litros, con un 95%
00:45:20
de probabilidad, yo creo que está bien, ¿no?
00:45:21
Cuánto más se amplíe
00:45:25
el rango
00:45:29
más probabilidad
00:45:30
Cuánto más
00:45:32
observaciones tengas
00:45:34
más acotas el campo
00:45:36
y cuanto más amplías
00:45:38
por supuesto, cuanto más amplías
00:45:40
te vas alejando
00:45:42
si tenemos esta
00:45:43
si es una
00:45:45
distribución normal
00:45:47
si cogemos entre estos dos
00:45:49
a medida que te vas alejando
00:45:51
te vas echando a la izquierda y a la derecha
00:45:53
esto que baja es que realmente
00:45:56
cada vez es menos probable que se dé
00:45:58
aquí es muy probable
00:46:00
que se dé, que es la media
00:46:02
y luego a medida que lo que calculábamos
00:46:04
la división típica
00:46:08
los movimientos hacia la derecha y los movimientos hacia la izquierda
00:46:09
es en realidad la desviación típica
00:46:12
nos vamos moviendo por desviaciones típicas
00:46:14
nuestra desviación típica eran, ¿cuánto?
00:46:16
cuatro, ¿no?
00:46:18
pues movernos hacia la derecha
00:46:20
una división típica sería 4
00:46:22
4 litros
00:46:24
¿me explico? y así
00:46:25
en adelante, o dos deviaciones típicas
00:46:27
o tres deviaciones típicas, hasta que llegamos
00:46:30
a estas zonas
00:46:32
que son las zonas en las que casi es muy
00:46:32
poco probable que realmente se dé
00:46:35
el valor que estamos buscando
00:46:38
claro, si yo digo un 95%
00:46:39
habría que ver qué intervalo es
00:46:41
aunque muchas veces el 95%
00:46:44
es de aquí hasta aquí
00:46:45
todo esto, ¿sabes?
00:46:47
sí, es decir, entre 1
00:46:49
uno y el máximo
00:46:51
claro, pero tenemos una herramienta
00:46:53
para por lo menos decir algo
00:46:55
sí, decir que la mayor parte
00:46:57
para evitar tener que
00:47:00
para evitar tener que hacer una
00:47:01
una encuesta de
00:47:03
40 millones de personas
00:47:05
imagínate
00:47:06
el gasto vamos, el gasto
00:47:09
es con una
00:47:11
pequeña muestra
00:47:13
pequeña muestra no, cuando son muy pequeñas las muestras
00:47:14
tampoco son, cuando es muy
00:47:17
pequeña, luego a nivel
00:47:19
para determinar los valores es muy
00:47:21
poco significativa, hay muestras que son muy poco significativas
00:47:24
por eso es importante el tamaño de la muestra
00:47:26
cuanto mayor es la muestra
00:47:28
más te acercas a los valores que buscas
00:47:29
es obvio
00:47:32
pero claro, hay que buscar ese equilibrio
00:47:32
entre no utilizar 40 millones de personas
00:47:35
o utilizar una muestra
00:47:37
con la suficiente como para
00:47:40
llegar a conclusiones y a tomar decisiones
00:47:41
de manera adecuada
00:47:44
eso es lo que buscan
00:47:44
se busca nada más
00:47:47
entonces, hemos dicho
00:47:48
estamos aquí
00:47:50
lo que es la diferencia
00:47:55
esto ya lo veremos
00:47:58
y hablaremos
00:47:59
de los intervalos de confinamiento
00:48:00
cómo determinarlos
00:48:02
y cómo
00:48:04
hacer contraste de hipótesis
00:48:05
rechazando o aceptando
00:48:09
las hipótesis
00:48:11
para llegar a verificar
00:48:13
los resultados
00:48:15
de esa información que tenemos
00:48:16
análisis de la varianza
00:48:18
El análisis de la varianza aquí ya no solo contamos con una muestra, sino que contamos con muchas muestras, o varias muestras.
00:48:20
Entonces lo que vamos a tratar de determinar es, a través de lo que se llama NOVA, o análisis de la varianza,
00:48:27
es comparar esas muestras y llegar a una conclusión.
00:48:32
¿Cómo hacemos? Bueno, aquí os he puesto un...
00:48:36
Como esto es un poquito más complejo y ya utiliza un estadístico,
00:48:40
y el estadístico prácticamente te lo tienes que saber de memoria, es decir, es una fórmula y tampoco nos vamos a ir más allá.
00:48:44
es decir
00:48:49
tú cuando conduces el coche
00:48:50
no es necesario
00:48:53
vosotros sabéis todo
00:48:54
lo que conforma un coche
00:48:56
para poder conducir
00:49:00
no, os abstraes
00:49:01
te abstraes, sabes conducir
00:49:02
coges el coche, pero no
00:49:05
en ningún momento estás pensando
00:49:06
que están los pistones
00:49:07
ni cómo va a nivel eléctrico
00:49:09
simplemente cosas
00:49:13
pero eso es lo que vamos a tratar de hacer
00:49:14
hay determinadas cosas que es mejor abstraernos
00:49:16
y darlas como que realmente son así
00:49:19
porque si no es imposible
00:49:21
por ejemplo
00:49:23
los estadísticos o muchas fórmulas
00:49:26
o las tablas que están generadas
00:49:27
son generadas por gente
00:49:29
matemáticos
00:49:30
entonces ya tenemos que
00:49:32
solo tenemos que como asumir
00:49:35
o darlo por hecho, es decir, en este caso
00:49:37
aquí utilizaremos un estadístico y el estadístico es esta fórmula
00:49:39
¿lo veis aquí?
00:49:42
sí
00:49:43
yo más o menos os explico
00:49:44
cómo va el ejercicio
00:49:47
Pero tampoco tenéis que, porque es que es imposible. Tampoco es ese el objetivo. El objetivo es que a través de estos procedimientos, de estos ocho pasos, podáis determinar que si tenemos tres fertilizantes, el A, el B y el C, y cada uno, con tres observaciones cada uno, nos indica que ha crecido la planta tantos centímetros, saber si uno de los tres es mejor o si los tres fertilizantes no hay ninguna variación.
00:49:48
sino que realmente los tres dan lo mismo.
00:50:18
O sea, producen lo mismo.
00:50:21
Pues eso es lo que son tres observaciones.
00:50:22
Una observación con un fertilizante A,
00:50:25
una observación con un fertilizante B
00:50:27
y otra con un fertilizante C.
00:50:29
Y cada una y las muestras de cada observación son tres.
00:50:32
¿Vale?
00:50:35
Diez, doce, nueve, catorce, quince, catorce, dieciséis
00:50:35
y ocho, siete, nueve.
00:50:39
Entonces, ahora mismo, si lo vemos así,
00:50:40
lo único que vemos son tres letras y nueve números.
00:50:43
Yo te diría que es en la A.
00:50:45
Es en la A, vale.
00:50:47
pues tú dirías que es el A
00:50:48
y a lo mejor
00:50:49
otro diría
00:50:51
o otra diría que es el B
00:50:53
pero yo te diría
00:50:55
es el A, ¿por qué?
00:50:57
Claro, pues tendrías que hacerlo para saber cuál es, ¿no?
00:50:59
Efectivamente, pero...
00:51:01
Porque la planta
00:51:03
que creció en 9 respecto a la 12
00:51:06
yo diría
00:51:08
que es por el S, pero bueno, yo diría que es esa
00:51:09
Hombre, yo por números
00:51:12
yo diría que es el A-B
00:51:14
porque ha crecido más
00:51:15
centímetros la que más diferencia tiene es la ya que tiene un crecimiento desde la última hasta
00:51:17
la del medio de cuatro centímetros hay más hay más la varianza sería mayor está diciendo la
00:51:24
dirección típica y lo haría más yo creo que esto así a ojo no se puede seríamos seríamos adivinos
00:51:31
No, a lo mejor tenéis una mente privilegiada, pero yo no. Yo tengo que hacer números, ¿vale? Entonces, en realidad, si os fijáis, lo que ha dicho podría tener algún sentido en el sentido de que en el A hay una mayor variación.
00:51:40
Es decir, la división, si os fijáis
00:51:56
Entre 9 y 10 hay
00:51:59
Bueno, entre 9 y 10 hay 1
00:52:01
Pero entre 9 y 12 hay 3
00:52:02
Sin embargo, en las otras
00:52:04
Más o menos es una variación de 1
00:52:07
O de 2
00:52:09
Pero bueno, ahora sí es difícil
00:52:10
Sí, hay que hacerlo para verlo
00:52:12
Vamos a ir poco a poco los pasos
00:52:14
Primero se plantea la hipótesis
00:52:17
¿Qué es una hipótesis? Lo que decía
00:52:19
Cuando planteas una hipótesis siempre hay una
00:52:20
Lo que se llama una hipótesis nula
00:52:22
que se suele denominar
00:52:24
o se suele reflejar como H0
00:52:27
y luego una hipótesis alternativa
00:52:29
que es la H1. ¿Por qué establecemos
00:52:31
dos hipótesis? Porque a efectos de un estadístico
00:52:33
y en función de si es estadístico
00:52:35
y es mayor o menor
00:52:37
vamos a aceptar o rechazar
00:52:39
estas hipótesis. Siempre la hipótesis nula
00:52:41
va a ser la negativa.
00:52:43
En este caso nos indica
00:52:45
no hay diferencia entre los fertilizantes.
00:52:47
Es decir, que nos va a dar igual coger el A, el B o el C.
00:52:49
¿Vale? Porque al fin y al cabo
00:52:52
eso es lo que estamos buscando
00:52:53
nosotros estamos buscando si realmente hay una
00:52:54
hay una diferencia entre unos y otros
00:52:57
¿vale? pues por tanto
00:52:59
lo que nos importa es si hay
00:53:01
diferencia entre unos y otros
00:53:03
nuestra hipótesis nula
00:53:04
tiene que ser que no hay ninguna diferencia
00:53:07
y la hipótesis alternativa es que algún
00:53:09
fertilizante es diferente a los demás
00:53:11
¿vale?
00:53:13
con todo este proceso
00:53:15
lo que haremos es o rechazar
00:53:16
o aceptar la hipótesis nula
00:53:19
¿vale?
00:53:20
Que en realidad es lo mismo que aceptar o rechazar la alternativa, pero bueno, se dice así. Ese es nuestro objetivo, llegar a una conclusión. Antes estábamos analizando datos, nada más. Aquí no, aquí vamos a llegar a una conclusión.
00:53:22
Vamos a tratar de, con las herramientas estadísticas, tratar de llegar a la conclusión o tomar la decisión.
00:53:37
Porque la decisión sería, pues voy a comprar el A, el B o el C.
00:53:46
¿No? Hay una decisión.
00:53:50
Nos interesa llegar a esa conclusión.
00:53:52
Entonces, lo primero que hace es calcular la media de cada grupo.
00:53:56
La media de cada grupo es, en la media de A son 10,33 centímetros,
00:54:00
la media de B son 15 centímetros
00:54:04
y la media de C
00:54:07
que en realidad es una media
00:54:07
simple, si os fijáis aquí
00:54:10
no hay frecuencia, aquí no hay ponderación
00:54:12
lo divide entre 3
00:54:14
porque son 3 tipos
00:54:16
3 medidas
00:54:18
3, 3, 3
00:54:20
ya tenemos
00:54:21
un dato, el dato es la media
00:54:23
de cada uno de los fertilizantes
00:54:26
y son 33, 15 y 8
00:54:28
ahora calculamos
00:54:30
la media general. La media general es coger
00:54:32
todos y lo dividimos
00:54:34
entre el número que hay.
00:54:36
Igual, hacemos una media aritmética
00:54:38
simple. Si no, cuando no hay
00:54:40
frecuencias, pues simple.
00:54:42
Es como si cada uno se multiplicara por uno.
00:54:44
Esa sería su frecuencia.
00:54:47
Su frecuencia es uno. Y son 11 con 11.
00:54:48
Entonces, el siguiente paso es calcular
00:54:51
la variedad total.
00:54:52
La variedad total,
00:54:55
ahora ya no estamos calculando medias.
00:54:57
En realidad,
00:54:58
en el análisis de la varianza, en realidad
00:54:59
estás calculando varianzas.
00:55:02
Pero no lo
00:55:05
hace, o sea, no lo divide
00:55:06
por el número de observaciones, sino que
00:55:07
lo que hace es, hace la suma de cuadrados
00:55:10
totales. Lo que se llama SST
00:55:12
o suma de cuadrados totales, ¿vale?
00:55:14
Vale. Que bueno que viene en inglés,
00:55:16
pero bueno, suma de cuadrados totales. Y lo que hace
00:55:18
realmente es comparar
00:55:19
cada uno de los valores
00:55:22
de los que teníamos, de todos estos,
00:55:24
compararlo con la media general
00:55:26
y calcular un valor.
00:55:27
Vale.
00:55:30
47,56
00:55:30
eso es lo que en realidad varía
00:55:32
el conjunto de todas las observaciones
00:55:35
de las tres fertilizantes
00:55:37
comparándolo con
00:55:38
la media general
00:55:41
y elevándolo al cuadrado
00:55:42
¿para qué? pues para obtener
00:55:45
esas variaciones en valor absoluto
00:55:47
para que no haya negativos
00:55:49
principalmente para eso
00:55:51
la siguiente
00:55:53
otra variabilidad
00:55:55
hemos hecho la variabilidad total
00:55:56
Ahora va a hacer la variabilidad entre los grupos
00:55:59
¿Qué es entre los grupos? Pues comparar
00:56:01
La medida de cada uno de ellos
00:56:03
¿Vale? Sobre el general
00:56:04
Antes lo hemos hecho todo sobre el general
00:56:06
Y ahora, de cada grupo, sobre el general
00:56:08
¿Vale?
00:56:11
Pero claro, hay un problema
00:56:12
Si nosotros queremos comparar esta variabilidad
00:56:14
Con esta variabilidad
00:56:16
Esta la ha hecho sobre nueve valores
00:56:17
Y aquí lo vamos a hacer sobre tres
00:56:20
Por eso multiplica por tres
00:56:22
Porque es como si hubiese tres veces
00:56:24
¿Vale?
00:56:26
Y así lo hace comparable
00:56:27
¿De acuerdo?
00:56:29
Entonces tenemos 47 con 56, 44 con 22
00:56:31
Calcula la variabilidad
00:56:34
De los grupos, que es la diferencia entre los dos
00:56:36
Ajá
00:56:38
Y finalmente es cuando
00:56:39
Bueno, pues aquí es cuando hay que abstraerse
00:56:41
Ay, vale
00:56:44
Cuando ya llegas a ese punto
00:56:45
Y lo pones mal y ya no te...
00:56:48
Pero hay que abstraerse mucho, ¿vale?
00:56:49
Entonces
00:56:50
Hay un estadístico que se llama el F-Statistic
00:56:51
O estadístico F
00:56:54
que lo inventó o lo creó un determinado señor
00:56:55
en el que nos indica que para determinar
00:57:00
o para comparar o hacer la comparación
00:57:03
hay que utilizar esta fórmula.
00:57:05
Se utiliza el SSB, que hemos dicho que el SSB
00:57:09
era la mayoría de grupos
00:57:12
partido de la variabilidad dentro de los grupos.
00:57:16
Pero en realidad lo que está haciendo
00:57:24
es, anteriormente solo hemos calculado
00:57:25
esto ya no es abstracción, esto lo podemos
00:57:27
deducir, en realidad está comparando
00:57:29
en el denominador
00:57:31
y en el numerador
00:57:33
entre el numerador y el denominador está comparando dos varianzas
00:57:34
una es la varianza
00:57:37
de grupos
00:57:39
de varianza
00:57:43
de, ¿dónde está?
00:57:45
aquí, una variabilidad
00:57:47
entre los grupos
00:57:49
con respecto a la variabilidad dentro de los grupos
00:57:50
son dos varianzas, ¿por qué? porque lo está dividiendo
00:57:54
entre k menos uno, que ahora os lo diré que es
00:57:57
y n menos k
00:57:58
que es lo que llaman grados de libertad
00:57:59
¿qué son los grados de libertad?
00:58:02
pues los grados de libertad
00:58:04
lo voy a explicar con un ejemplo así sencillo
00:58:06
y si os fijáis que siempre
00:58:09
resta por menos uno o menos k
00:58:10
¿por qué resta por menos uno?
00:58:12
porque en realidad
00:58:15
es como si tres de vosotros
00:58:16
vais a un restaurante y tenéis que elegir
00:58:18
una pizza cada uno
00:58:21
pero solo hay tres pizzas
00:58:22
entonces, uno de vosotros
00:58:24
coge la primera pizza
00:58:27
elige
00:58:30
la que quiera, tiene un grado de libertad
00:58:31
claro
00:58:34
el segundo de vosotros coge
00:58:34
la segunda pizza, tiene grado de libertad
00:58:36
porque puede elegir entre dos, el primero puede elegir
00:58:39
entre tres, y el último tiene grado de libertad
00:58:41
no
00:58:43
es lo que
00:58:44
lo que le han dejado
00:58:46
las sobras
00:58:48
por eso se divide entre menos uno
00:58:49
Esos son los grados de libertad. Utilizamos esta fórmula y en función de esta fórmula, que es el F estadístico, nos da un valor. Este valor es el que debemos comparar con una tabla. La tabla, en función de esos grados de libertad, nos dará otro determinado valor.
00:58:52
Si es mayor, pues entonces rechazamos la hipótesis en la que no, aceptamos la hipótesis alternativa. Es así. Yo pienso que en cuanto a los conceptos y en cuanto a lo que debe venir en vuestro módulo, yo creo que ir más allá no es necesario.
00:59:10
¿Nosotros llegaremos a analizar la tabla?
00:59:34
Sí, claro, tienen que editar la tabla. Si no tienen la tabla, no tienes el king.
00:59:38
Pero la tabla no la proporciona...
00:59:41
Claro, si yo os puse en un ejercicio o algo,
00:59:43
ponemos el valor crítico, 5K14.
00:59:45
Si no, ¿cómo lo comparáis?
00:59:48
Entonces, efectivamente,
00:59:50
si es más grande, significa que los fertilizantes
00:59:51
no son iguales.
00:59:53
Entonces, la opción que deberíamos coger
00:59:55
es la más alta.
00:59:57
Pues eso. Este es un procedimiento simplemente
00:59:59
para comparar muestras.
01:00:01
Bueno, tenemos varias muestras.
01:00:03
Es muy útil. Parece que no,
01:00:06
pero es muy útil.
01:00:07
incluso para cosas de logística
01:00:08
o de lo que estéis dando
01:00:11
es decir, es muy útil
01:00:13
a todo tipo de... o incluso
01:00:14
una inversión, si tenéis tres inversiones
01:00:16
imaginaos que tenéis tres inversiones
01:00:18
tres inversiones de tres fondos de inversión
01:00:20
y no sabes
01:00:23
cuál meter vuestro dinero
01:00:24
pues igual, sería exactamente lo mismo
01:00:26
Ya, pero ahí lo haríamos con el BAN
01:00:28
y nos haría más rentable
01:00:31
hacer el cálculo
01:00:32
Pues yo creo que no
01:00:34
no lo sé, con el BAN no sé si lo podrías hacer
01:00:36
o BAN o el TIR
01:00:39
me acuerdo si es el BAN o el TIR
01:00:40
pero seguramente veríamos cuál es el
01:00:42
más provechoso
01:00:45
tú imagínate
01:00:46
que te digo que
01:00:49
yo que sé
01:00:50
que Apple, vas a invertir
01:00:53
Apple te da un 10%
01:00:55
anual
01:00:57
y Amazon te da
01:01:00
un 11%
01:01:02
anual
01:01:04
y yo que sé, otra tercera
01:01:06
el BBVA te da
01:01:08
un 6%
01:01:13
¿cuál elegirías?
01:01:14
o sea, si la CNL
01:01:18
bueno, si la
01:01:20
10, 11 y 6, ¿cuál cogerías?
01:01:22
hombre, pues
01:01:25
haría el cálculo de los intereses
01:01:26
que voy a recibir
01:01:29
o sea, de lo que voy a ganar y seguramente
01:01:30
sería con
01:01:32
el de Amazon
01:01:33
que sea un 11%
01:01:36
Ahora te digo, Apple es un 10%, ¿vale? Pero tiene una varianza o una diversificación típica de 10. Amazon tiene una desviación típica de 9. Y BBVA, que era el más bajo, que era el 6%, tiene una desviación típica de 1. ¿Cuál cogerías? ¿Cuál cogerías el último?
01:01:37
porque el riesgo, es decir
01:02:00
el primero, el de los 10
01:02:02
tiene una diversión típica de 10
01:02:04
es decir, te puedes quedar a 0
01:02:06
y el otro tiene una diversión típica
01:02:07
del 9, es decir, ves como no es
01:02:10
entonces
01:02:12
el análisis de las varianzas es muy muy muy importante
01:02:13
al final BBVA
01:02:16
como muchos se te puede bajar a 5
01:02:18
ese es el
01:02:19
ese es el kit
01:02:24
entonces esto es muy útil
01:02:25
yo pienso que es muy útil
01:02:28
porque no solo tenemos que fijarnos en la media
01:02:29
tenemos que fijarnos también en la varianza
01:02:32
cómo se dispersan los datos
01:02:34
o los valores de las observaciones
01:02:36
y en función de esas
01:02:39
variaciones
01:02:40
pues determinar
01:02:42
si realmente
01:02:45
es más aconsejable una opción u otra
01:02:45
y eso es lo que se está buscando
01:02:49
con esto
01:02:51
y bueno, el procedimiento yo sé que hay cosas que aquí
01:02:51
cuando llegas aquí pues
01:02:54
sí, y lo de los grados de libertad
01:02:56
pero es la forma o es el procedimiento
01:02:59
para determinar
01:03:01
igual no va a pasar en el contraste de hipótesis
01:03:01
en el contraste de hipótesis también
01:03:04
utilizaremos un estadístico y en función de este estadístico
01:03:05
si es mayor o menor
01:03:08
es prácticamente lo mismo
01:03:09
si es mayor o menor que
01:03:13
el valor crítico
01:03:14
pues ahí determinaremos si cogemos
01:03:16
la hipótesis en un lado o no
01:03:18
y eso ya lo vemos
01:03:19
y bueno y ya me
01:03:22
para no alargarlo
01:03:24
vamos aquí
01:03:26
voy a hablar un poquito
01:03:27
de las medidas de asimetría
01:03:30
Bueno, a medida que se me tira lo que decía, es decir, cómo una distribución, es decir, si la distribución más o menos tiene la forma de normal, la distribución normal, la distribución normal es aquella que empieza aquí con mayor probabilidad y luego se va alejando hacia los lados pero de manera simétrica, ¿vale?
01:03:31
De la manera que las colas, o las zonas de los lados, son las que tienen menor.
01:03:46
¿Qué ocurre cuando no es simétrica, como este caso?
01:03:52
Es decir, que está más abombada, o más hacia la derecha, o más hacia la izquierda.
01:03:57
Pues eso es lo que nos va a medir el coeficiente de asimetría, que es este, el g1.
01:04:01
Y simplemente es m3, que es igual.
01:04:08
En lugar de restar x sub i menos la media, al cuadrado lo pone al cubo.
01:04:11
Partido de n. Bueno, pues simplemente sabiendo esta fórmula y determinando si g sub 1 es igual a 0,
01:04:16
estaremos ante una distribución simétrica de esta forma.
01:04:27
Y si es mayor que 0 o menor que 0, ya nos determina que es asimétrica positiva o negativa.
01:04:33
Simplemente es una forma de medir cómo son nuestras distribuciones.
01:04:41
Y si realmente estamos ante una distribución normal, que es lo que realmente buscamos siempre, que es más fácil a nivel de cálculo.
01:04:45
Y en cuanto al apuntamiento curtosis, pues en lugar de determinar la simetría, lo que determina ese apuntamiento es que si se achata, o sea, bomba, o tiende hacia arriba.
01:04:54
Es decir, lo está determinando la forma de la distribución.
01:05:07
Claro, la distribución, todo esto son, en realidad, todo esto son montones, montones de observaciones, valores, ¿vale?
01:05:12
Que se van recogiendo, formando una curva, que en realidad son montones, ¿vale?
01:05:17
Y bueno, ¿y cómo se mide? Pues igual, se mide con otro que se llama G4 y bueno, es lo mismo.
01:05:23
No sabemos la fórmula, que no tiene más y sabemos cómo...
01:05:28
La fórmula es la misma que la de la otra, pero con el 4, ¿no?
01:05:31
Exacto, es el número 4
01:05:35
A ver, si no, lo único que tiene aquí es un menos 3
01:05:37
También, si te fijas
01:05:39
Aquí un menos 3 y aquí lo que no tenía
01:05:40
Pues simplemente
01:05:42
Desarrollas esto
01:05:44
Y lo más importante
01:05:47
Bueno, hay que saberse la fórmula, pero lo más importante es cómo interpretarla
01:05:48
Es decir, si es igual a 0
01:05:51
Ya sabemos que es mesocúrtica
01:05:52
Mesocúrtica quiere decir que es
01:05:54
Prácticamente es, el curtosis 0
01:05:55
Es una, pues prácticamente
01:05:58
Una instrucción normal, como la campana
01:06:00
Clásica campana de Gauss
01:06:02
Y luego está la platicúrtica
01:06:03
Plati, o sea
01:06:07
Aplanada o achatada
01:06:08
Que sea esta
01:06:10
Y la otra es, ¿cómo se llama?
01:06:11
No, mesocúrtica, perdón, mesocúrtica era esta
01:06:14
Y la normal
01:06:17
La otra es leptocúrtica, ¿no?
01:06:18
Y la otra es leptocúrtica, a ver, ya no sé
01:06:20
Lo pone aquí, ¿no?
01:06:22
Ah, sí, es verdad, lleva razón, la leptocúrtica es esta
01:06:24
La platicúrtica, plati
01:06:26
De plato será
01:06:27
Madre mía, qué complicado
01:06:28
Y la mesocórtica es la normal. Otra medida para poder analizar, todo esto son herramientas para analizar nuestra información.
01:06:31
y nos quedaría
01:06:44
ver la parte de
01:06:47
del
01:06:49
contraste de hipótesis que es un poquito más
01:06:51
que es
01:06:53
en realidad esto es útil porque nos da
01:06:55
ideas de cómo se
01:06:57
distribuye y cómo está nuestra información
01:06:59
pero la otra nos permite
01:07:01
llegar a conclusiones y a tomar decisiones
01:07:03
por tanto es todavía más importante
01:07:06
contraste de hipótesis, etcétera
01:07:07
con la diferencia de estadística
01:07:09
y esto es el más o menos
01:07:10
no sé si he aclarado algo o la bola es que esta final es practicar porque si yo te aseguro que
01:07:12
si solo hacemos un ejercicio te digo yo que el 90% no vamos a aprobar no vamos a hacerlo
01:07:27
eso te aseguro y no te hago
01:07:36
ningún estadístico
01:07:39
al menos
01:07:41
que lo sepas
01:07:42
a ver si puedo
01:07:44
encontrar ejercicios
01:07:47
y os subo unos ejercicios
01:07:48
y miráis esos que son los que voy a intentar
01:07:49
que caigan
01:07:52
una pregunta
01:07:53
ya puestas así
01:07:57
el examen
01:07:58
¿cómo se va a plantear?
01:08:00
¿el examen son
01:08:02
tipo test?
01:08:05
30, son 30 tipos de test
01:08:06
teórico, teórica
01:08:08
y luego tienes una parte práctica
01:08:10
pero que la voy a poner también de tipo test
01:08:12
es decir, ya que no voy a
01:08:14
restar, no voy a restar
01:08:16
ah, no vas a restar, no voy a restar
01:08:18
pero eso sí, la parte práctica
01:08:20
la parte práctica
01:08:22
es cero o nada
01:08:24
en el sentido de que si os pongo un ejercicio
01:08:26
me tenéis, tenéis cuatro opciones
01:08:28
y tenéis que decirme cuáles
01:08:30
pero yo no voy a tener
01:08:32
Bueno, pero tienes que hacer el ejercicio para saber qué opción es, ¿no?
01:08:33
Exacto, pero que no voy a tener en cuenta, o sea, yo voy a mirar que tenéis un apartado donde podéis hacer los números y eso, tampoco van a ser muy complicados.
01:08:37
Vale, te refieres que aunque hagamos una parte bien del ejercicio, pero pongamos mal la que es, es cero.
01:08:47
Es mal, efectivamente.
01:08:52
Vale, vale, que no puntúa cero, cincos, cero quince.
01:08:54
¿Cuánto va a ser la parte teórica o cuánto va a ser la parte práctica?
01:08:57
La parte teórica práctica
01:09:00
tenéis en la
01:09:03
programación didáctica
01:09:04
ahí tenéis, lo veis, porque va por porcentajes
01:09:06
Sí, va por porcentajes
01:09:09
Entonces vosotros miráis
01:09:10
y ahí tenéis exactamente
01:09:12
ahora mismo exactamente no sé los porcentajes
01:09:14
pero ahí tenéis
01:09:16
todos los porcentajes
01:09:19
y cómo se va a determinar
01:09:20
Entonces voy a poner
01:09:22
una parte práctica
01:09:23
por cada uno de los resultados de aprendizaje
01:09:26
es decir, por cada una de las unidades
01:09:28
como son 5 unidades
01:09:30
para tema tiene que haber una parte práctica
01:09:31
exacto, voy a poner una práctica, lo único que
01:09:33
lo pongo un ejercicio chiquitillo
01:09:35
y a función de eso pues lo respondéis
01:09:37
pero no va a ser muy complicado
01:09:40
porque tampoco da tiempo
01:09:42
porque no sé cuánto tiempo es el examen
01:09:43
puede ser una hora yo creo
01:09:46
pues tampoco tenéis tanto tiempo
01:09:48
como para que os ponga 4 ejercicios
01:09:50
no miento, hora y media me parece que es
01:09:52
yo creo, no, hora y media no es
01:09:54
¿no?
01:09:55
Yo creo que el año pasado
01:09:56
Era más de una hora el año pasado
01:09:58
Pues no sé este año
01:10:00
A lo mejor este año que el año ha cambiado
01:10:02
Como ha cambiado todo
01:10:05
Me pasaste tú las
01:10:06
Los exámenes
01:10:08
A ver un momentín
01:10:09
El año pasado era más de una hora
01:10:15
Pero este año no lo he mirado
01:10:17
Es una hora, hora y algo
01:10:19
Pero no es hora y media
01:10:21
Los míos no
01:10:21
Una hora y cuarto
01:10:24
Una hora y cuarto
01:10:25
Con los test que os voy a poner
01:10:27
Las prácticas van a ser
01:10:31
No van a ser muy grandes
01:10:33
O sea, no va a ser un ejercicio práctico
01:10:35
Porque si no, es imposible
01:10:37
Si, si no, no da tiempo
01:10:39
Los nervios y el examen
01:10:40
Pero es importante
01:10:43
Miraos
01:10:44
Miraos las
01:10:45
Las tareas
01:10:48
Aunque no lleguéis a ellas
01:10:50
Aunque no
01:10:52
Miraoslas
01:10:53
Porque hay temas en los que no hay parte práctica en el sentido de ejercicios numéricos. Entonces, yo tengo que poner una parte práctica de esas unidades, de un estado de aprendizaje, y puede ser un caso práctico, pero algo más subjetivo o algo que es de relacionar conceptos, no de utilizar cálculos numéricos.
01:10:56
que no hay, si no hay cálculo numérico
01:11:22
no, en la de las encuestas
01:11:24
y todo eso
01:11:27
ahí a lo mejor tenéis que interpretar algo
01:11:28
y va ahí hilado
01:11:31
con las tareas
01:11:33
yo te digo
01:11:34
lo que yo creo que me encuentro y yo creo que
01:11:37
los demás compañeros nos encontramos
01:11:39
o sea, el detectar
01:11:40
bueno, al final un muestreo
01:11:43
y tal, saber más o menos
01:11:45
qué tipo de muestreo puede ser aleatorio
01:11:46
o no aleatorio, tal, no sé qué
01:11:48
ahí es mucho más fácil porque son siete
01:11:50
pero el tema de lo de las encuestas
01:11:52
o el tipo de esto, a mí
01:11:55
se me hace
01:11:57
un mundo
01:11:59
el saber
01:12:00
es que ahora mismo no sé decirte en qué punto
01:12:02
tal, pero hay cosas
01:12:05
de los dos primeros temas
01:12:06
de los dos primeros temas
01:12:08
yo siempre presento los ejercicios
01:12:09
pero muchas veces me veo loco para encontrar
01:12:14
información sobre
01:12:17
aparte hay conceptos que a lo mejor
01:12:18
son demasiado genéricos
01:12:20
ahí no se profundiza mucho
01:12:22
y entonces hay efectos de
01:12:24
bueno, es que
01:12:25
sí, sí, hay cosas, sobre todo la parte
01:12:27
hay parte de, sobre todo
01:12:29
cosas, bueno, como lo que
01:12:32
la parte multivariable
01:12:33
cuando lo leáis
01:12:36
bueno, el factorial
01:12:36
el análisis factorial
01:12:39
pues ni os imagináis, el análisis factorial es algo
01:12:41
bastante complejo, entonces
01:12:44
que suene
01:12:45
ahí os suene
01:12:47
no perdáis el tiempo
01:12:49
tiene que sonar
01:12:51
porque al final
01:12:53
la estadística de lo que os he dicho
01:12:55
en el mundo real es complejo
01:12:57
se utilizan más esos modelos
01:12:59
que lo que vamos a ver
01:13:02
pero tenéis que tener unas nociones
01:13:03
de estadística y tenéis que saber
01:13:06
algo de todo esto
01:13:08
y yo creo que es importante
01:13:09
incluso yo pienso que de las 5 unidades
01:13:12
lo más
01:13:14
para mí, lo más bonito es esto
01:13:14
sí, además
01:13:17
a mí los números me encantan
01:13:19
y de hecho intento cuando tú estás hablando
01:13:21
ir haciendo cosas también, lo que pasa que
01:13:23
es verdad que yo sí, lo de la moda mediana
01:13:25
y tal, pues sí, porque al final
01:13:27
y son cosas que aplicas a tu día a día
01:13:28
sin darte cuenta y al final lo haces
01:13:30
o yo que soy más especial
01:13:33
cuando voy a un mercado y miro los precios
01:13:35
que había, los que hay y tal
01:13:36
y la decisión de compra o no, ¿sabes?
01:13:39
pero es verdad que
01:13:41
son muchos conceptos
01:13:42
que al final hacer un cuadro como
01:13:44
el primero para ir sacando todos los datos
01:13:47
al final no te va a suponer nada
01:13:49
porque al final lo vas a hacer de manera automática
01:13:51
va a ser una cosa más
01:13:53
si que a lo mejor con este último
01:13:55
pues va a ser más complicado
01:13:57
a la hora de recordar si te dejas
01:13:59
algún paso o no te dejas algún paso
01:14:01
estos son más complicados
01:14:03
y también no son tan intuitivos
01:14:05
si no dices bueno es que
01:14:07
termino un paso y al siguiente es que ya
01:14:09
lo veo, cierro los ojos
01:14:11
no, si cerrar los ojos lo veo
01:14:13
pues no
01:14:15
pues no, entonces
01:14:16
lo que decíamos incluso
01:14:18
en contraste de hipótesis es lo mismo, es decir
01:14:20
hay un montón de estadísticos
01:14:22
como el F estadístico
01:14:23
de un montón de matemáticos
01:14:25
que los crearon y en función, y va a depender
01:14:28
de los factores
01:14:30
y hay que aplicarlos, pero aquí no
01:14:33
nos vamos a complicar, ni vamos a mirar
01:14:34
tantas cosas, que nos vamos a centrar
01:14:36
en un solo estadístico, en la análisis de varianza
01:14:38
nos centramos en este
01:14:40
y punto
01:14:41
y el contraste de hipótesis
01:14:42
pues igual, y es tener unas nociones
01:14:46
para que realmente sepáis lo que es
01:14:47
como habéis visto
01:14:49
es útil
01:14:51
una utilidad, y parece que no, pero es muy
01:14:52
útil, yo creo que esto
01:14:55
es importante que lo sepáis
01:14:57
te quería hacer una pregunta
01:14:58
respecto a todo lo que son las unidades
01:15:01
veo que en algunas
01:15:03
sí que hay unos anexos
01:15:05
y en otras no tienen anexos
01:15:07
yo entiendo que los anexos
01:15:09
recogen toda la información
01:15:11
de la unidad, en esos anexos
01:15:12
y viene como
01:15:15
resumida
01:15:16
o más explícita
01:15:18
hay un anexo en el 4
01:15:20
que viene un montón
01:15:23
que es para el cálculo
01:15:25
de las muestras
01:15:27
yo eso
01:15:29
no lo había subido
01:15:31
no perdáis el tiempo
01:15:32
el anexo creo que es el 4
01:15:35
es de la unidad 4
01:15:37
sí
01:15:40
Sí, pero sin embargo los tres primeros anexos que no, que es solamente el resumen de todo lo que son las muestras y tal, ese sería como el resumen de toda la unidad.
01:15:41
Sí, pero incorpora cosas que no están en la unidad.
01:15:54
Te habrás fijado que incorpora cosas que no están en la unidad.
01:15:58
Pero nos tenemos que centrar entonces en lo que pone la unidad, ¿no?
01:16:01
Centraros en la unidad.
01:16:04
Vale, por eso digo, es que si no, madre mía.
01:16:05
No, es que yo suelo hacer resúmenes de todas las unidades. Y es verdad que sí que he visto que ciertos anexos vienen muy bien, pero otros vienen cosas que incorporan nuevas, que no hace mención.
01:16:07
Y en ese anexo hay una parte que lo estoy mirando, lo hablé con Moisés, y lo he mirado y que no.
01:16:22
Centrados en lo que, si hay alguna fórmula, algún tipo de cálculo de una muestra, lo que sea, centrados en lo que viene en la propia unidad.
01:16:32
Porque yo creo que el anexo es casi un poquito, más que un resumen, profundiza algunas cosas.
01:16:39
O incluso aumenta o amplía.
01:16:46
Sí, porque de hecho los test que hacemos
01:16:49
de cada unidad
01:16:52
son preguntas de la propia unidad
01:16:53
Exacto, y eso es lo que os voy a preguntar
01:16:56
estamos a distancia
01:16:58
no tenéis clases presenciales
01:17:00
entonces no puedo preguntaros
01:17:03
algo que no esté ahí
01:17:04
Sí, pero bueno
01:17:05
es que esto es como igual
01:17:09
la primera autoevaluación de la unidad 4
01:17:10
te hace una pregunta
01:17:12
de la siguiente parte del muestreo
01:17:13
o sea que
01:17:17
¿Hasta qué punto?
01:17:17
¿Sabes qué te dice?
01:17:21
Es que es muy
01:17:23
cojonudo porque
01:17:25
dice
01:17:26
te dice
01:17:27
a ver dónde está
01:17:30
dice
01:17:33
¿Los muestreos por cuotas
01:17:35
estratificados y conglomerados
01:17:36
son muestreos aleatorios?
01:17:39
Y pongo falso
01:17:42
dice buena respuesta, pero es que
01:17:43
el muestreo por cuotas viene en la siguiente
01:17:44
en el 1.4, o sea, que es que no te habla
01:17:47
de las cuotas en la anterior, o sea
01:17:49
¿me creas tú que...?
01:17:50
Pero de todas formas, las preguntas
01:17:52
de examen normalmente suelen dar
01:17:55
cuatro opciones, no suelen ser verdadero o falso
01:17:57
¿no? Sí, yo voy a dar
01:17:59
una única opción
01:18:00
es la verdad. Una única opción correcta, ¿verdad?
01:18:03
Y
01:18:05
pensad, y lo recuerdo
01:18:05
los test de autoevaluación que tenéis
01:18:08
son para practicar y para
01:18:11
autoevaluarse vosotros
01:18:12
¿Por qué? Porque mi examen se hace
01:18:14
desde cero, es decir, no hay ninguna pregunta
01:18:17
de las que...
01:18:19
Yo pusiera las preguntas, o sea, si pusiera los test
01:18:20
que vienen en la autoglación, tendríais
01:18:23
un conocimiento parcial
01:18:25
porque te sabes
01:18:27
los test, pero hay que saber
01:18:29
en general, entonces no
01:18:31
sé si... pero yo no pongo
01:18:32
los test de... yo los creo
01:18:35
Sí, sí, sí, sí. No, eso es para practicar
01:18:37
lo que has estudiado en ese momento
01:18:39
Voy bien, voy mal, pero
01:18:41
Pero es parcial, porque si en un punto solo hay un test y yo os cambio y de ese punto os cambio y os pregunto lo que no viene en ese test, en realidad tienes un conocimiento parcial.
01:18:43
Vas a fallarlo, sí o sí.
01:18:55
Porque únicamente te sabes el test.
01:18:57
Hay que mirarse todo.
01:19:00
Sí, sí, sí.
01:19:02
No, no, está claro, no, sí.
01:19:03
No miras.
01:19:04
Perfecto.
01:19:06
y nada más
01:19:07
yo espero que esto haya servido
01:19:10
de esclarecer un poco
01:19:11
o al menos que os haga pensar
01:19:14
si, no, pensad
01:19:16
si la cuestión es
01:19:18
practicarlo
01:19:20
la estadística
01:19:21
la matemática en general
01:19:23
es practicar, practicar, practicar
01:19:25
y hay un momento que hay cosas que no las verás
01:19:27
a lo mejor las ves a la semana
01:19:30
hay otras cosas que necesitas años en verlas
01:19:31
y cosas que no las verás en tu vida
01:19:34
es así
01:19:35
pero todo esto que estamos viendo
01:19:37
esto lo podéis ver perfectamente
01:19:39
vale, vale
01:19:41
es alcanzable
01:19:43
muy bien
01:19:45
perfecto
01:19:46
y bueno, nada más
01:19:48
agradeceros que
01:19:49
estéis aquí
01:19:52
nada, gracias a ti
01:19:54
y bueno, voy a
01:19:57
como está grabándose, pues lo subiré
01:19:59
muy bien
01:20:01
y no dejes este tema, por favor
01:20:02
os voy a subir unos ejercicios tipo
01:20:04
y haremos otra videoconferencia
01:20:10
con la parte que nos queda
01:20:13
¿los ejercicios vendrán con respuesta
01:20:16
al final para poder verificar que lo hemos hecho bien?
01:20:19
sí, sí, yo os doy las soluciones
01:20:23
si no podéis ver, si es que estáis a distancia
01:20:25
tenéis opción
01:20:28
Me podéis preguntar por cualquier medio. Podéis llamarme, podéis ir a la videoconferencia, lo que queráis. Pero como estamos a distancia, lo lógico es que os pongan los resultados.
01:20:30
Vale, perfecto.
01:20:42
Porque podéis asociar, hombre, yo lo que os traslado es que primero intentéis hacer el ejercicio, porque si ya miráis el resultado, pues no se va a quedar. Tratar de hacerlo y luego la compensación es luego verlo, pero hay que hacerlo, hay que intentarlo.
01:20:43
Sí, sí, por lo menos con la unidad
01:20:58
sirviendo la fórmula y eso
01:21:01
para ir recortándolas
01:21:02
Y no van a ser, de verdad, y a lo mejor
01:21:03
y voy a poner los ejercicios
01:21:05
que a lo mejor tipo de cómo pueden ser
01:21:07
en el día de hoy
01:21:10
van a ser cortos
01:21:11
Cortos, perfecto
01:21:13
Vale, pues muchas gracias
01:21:15
Bueno, pues nada, venga
01:21:17
Muchísimas gracias por asistir
01:21:19
Venga ya, ánimo
01:21:20
Gracias, hasta luego, adiós
01:21:22
- Idioma/s:
- Materias:
- Economía y empresa
- Etiquetas:
- Empresa
- Niveles educativos:
- ▼ Mostrar / ocultar niveles
- Formación Profesional
- Ciclo formativo de grado básico
- Primer Curso
- Segundo Curso
- Ciclo formativo de grado medio
- Primer Curso
- Segundo Curso
- Ciclo formativo de grado superior
- Primer Curso
- Segundo Curso
- Ciclo formativo de grado básico
- Autor/es:
- José Antonio González Constanza
- Subido por:
- Jose Antonio G.
- Licencia:
- Todos los derechos reservados
- Visualizaciones:
- 65
- Fecha:
- 18 de febrero de 2025 - 14:11
- Visibilidad:
- Público
- Centro:
- IES CIFP a Distancia Ignacio Ellacuría
- Duración:
- 1h′ 21′ 37″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1920x1080 píxeles
- Tamaño:
- 1.17