1 00:00:00,300 --> 00:00:15,279 bueno pues vamos a hablar de la introducción digamos en temas muy técnicos básicamente el 2 00:00:15,279 --> 00:00:20,199 viaje de cómo han evolucionado las redes desde lo más básico hasta digamos los modelos que 3 00:00:20,199 --> 00:00:25,879 conoce los técnicos historias y luego al final un pequeño un poco en educación 4 00:00:25,879 --> 00:00:29,559 pues luego hablaré un poquito de una buena idea 5 00:00:34,679 --> 00:00:37,200 la verdad es un poco más técnica pero bueno 6 00:00:39,799 --> 00:00:41,179 para este lado 7 00:00:41,179 --> 00:00:56,859 es un típico diagrama de b es digamos aquí lo que hagamos es con un nivel genérico entonces 8 00:00:56,859 --> 00:01:04,340 lo primero digamos sería englobar todo tipo de interés de modelos luego hay una parte que es 9 00:01:04,340 --> 00:01:14,040 para que predica predica cosas que quieres que predica y luego ya nos metemos un poco en el tema 10 00:01:14,040 --> 00:01:18,120 de aprendizaje profundo lo que llamamos la tip learning básicamente es la red de normales 11 00:01:18,120 --> 00:01:24,359 básicamente voy a definir esto como contigo digamos características en función del enfoque 12 00:01:24,359 --> 00:01:30,659 características las tareas que desempeñan luego su adaptación digamos a las diferentes situaciones 13 00:01:30,659 --> 00:01:35,739 y luego la capacidad que tengan de más o menos potentes este tipo de modelos. 14 00:01:36,379 --> 00:01:41,019 Lo primero, digamos, que va a empezar por arriba, que sería la inteligencia física aplicada, 15 00:01:41,019 --> 00:01:43,939 la inteligencia física aplicada, esta que todo el mundo conoce, 16 00:01:44,040 --> 00:01:51,900 que es la inteligencia que tiene un enfoque para predecir una situación en función de unos datos que queremos que revivan. 17 00:01:52,819 --> 00:02:00,120 Las características de estos modelos son que, obviamente, los datos que tú tienes que darle son datos que tú le das para que el modelo aprenda, 18 00:02:00,659 --> 00:02:14,479 Y desempeñan tareas específicas. Ahora hay otros modelos, pues obviamente, aunque nosotros pensamos que realmente puede hacer cualquier cosa, todavía no hemos llegado a ese nivel, que sería, digamos, la siguiente, que alguno de los estudios es la AGIE, ¿no?, que ya no tiene nada que ver con eso. 19 00:02:15,400 --> 00:02:16,780 Luego, la capacidad de adaptación. 20 00:02:17,259 --> 00:02:18,819 Pues claro, la capacidad de adaptación de una empresa 21 00:02:18,819 --> 00:02:21,680 que está limitada, digamos, en su contexto. 22 00:02:22,099 --> 00:02:24,099 O sea, no puede darte información que él no sabe. 23 00:02:24,759 --> 00:02:26,319 Es verdad que puede darte información 24 00:02:26,319 --> 00:02:29,280 que tú no le has entrenado, ¿vale? 25 00:02:29,860 --> 00:02:32,400 Pero, obviamente, es siempre teniendo un contexto 26 00:02:32,400 --> 00:02:33,560 de algo que ha aprendido. 27 00:02:33,699 --> 00:02:36,199 Puede, digamos, interpretar ciertas cosas 28 00:02:36,199 --> 00:02:38,139 que no esté primando en un contexto 29 00:02:38,139 --> 00:02:40,219 que tú realmente le has dado. 30 00:02:40,759 --> 00:02:41,819 Y luego, bueno, la capacidad. 31 00:02:42,000 --> 00:02:43,719 Pues la capacidad tiene sus límites, ¿no? 32 00:02:43,719 --> 00:02:46,419 porque como hemos dicho, la hemos entrenado en una serie de características, 33 00:02:47,060 --> 00:02:49,139 pues eso al final no deja de ser la capacidad que tiene. 34 00:02:50,259 --> 00:02:50,500 Vale. 35 00:02:51,280 --> 00:02:52,379 Entonces, bueno, voy a hablar de esa, 36 00:02:55,710 --> 00:02:57,490 y luego vamos a seguir con la siguiente, ¿no? 37 00:02:57,490 --> 00:03:00,909 Inteligencia articular general. 38 00:03:01,289 --> 00:03:02,169 Esto es lo que llaman la... 39 00:03:02,169 --> 00:03:03,169 Esto está muy demorado ahora, 40 00:03:03,750 --> 00:03:04,849 pero claro, es lo que usa todo el mundo, 41 00:03:04,949 --> 00:03:06,370 es la carrera de fondo, ¿no? 42 00:03:06,669 --> 00:03:09,050 Todos estos TPT y tal, lo que buscan al final es 43 00:03:09,050 --> 00:03:11,590 tener una inteligencia articular general. 44 00:03:12,110 --> 00:03:12,930 ¿Qué es lo que te permite? 45 00:03:13,430 --> 00:03:15,550 Esto ya es un poco... 46 00:03:15,550 --> 00:03:21,289 Es verdad que ahora mismo estamos en una fase en la que este tipo de modelos sí que más o menos son un poco, son un poquito ágiles. 47 00:03:21,750 --> 00:03:27,569 Luego comentaremos por qué, porque las clientes al final aprenden cosas que no sabes que han aprendido. 48 00:03:27,729 --> 00:03:29,889 Luego con un par de ejemplos sí se entenderán mucho mejor. 49 00:03:30,509 --> 00:03:35,430 El enfoque de estas generales, pues, que sea, digamos, un enfoque que se va dando como un humano. 50 00:03:36,349 --> 00:03:38,389 Es un poco ficticio, pero bueno, es la idea. 51 00:03:38,389 --> 00:03:44,550 Esto al final se definió hace muchos años y obviamente ahora mismo los temas están un poquito más impulsos. 52 00:03:44,550 --> 00:03:55,550 Luego, las características, pues solamente eso. Al final las características son lo que le hemos entrenado y es capaz de inferir cosas que no se han inferido. 53 00:03:55,550 --> 00:04:04,550 Ahora, ¿cuál es la característica que tiene? Pues que, a ver, esto trabaja por señas. Tú a un GPT le enseñas texto o imagen, pues qué pasa. 54 00:04:04,550 --> 00:04:06,409 las tenedas de teoría 55 00:04:06,409 --> 00:04:07,270 deberían interpretar 56 00:04:07,270 --> 00:04:08,729 cualquier tipo de señal 57 00:04:08,729 --> 00:04:09,509 sea algo que sea 58 00:04:09,509 --> 00:04:10,189 definitiva 59 00:04:10,189 --> 00:04:11,370 el texto 60 00:04:11,370 --> 00:04:11,789 y que todo 61 00:04:11,789 --> 00:04:12,250 al final 62 00:04:12,250 --> 00:04:13,229 se convierta en algo 63 00:04:13,229 --> 00:04:14,810 y te vuelva a devolver 64 00:04:14,810 --> 00:04:15,509 algo 65 00:04:15,509 --> 00:04:16,810 con todos 66 00:04:16,810 --> 00:04:17,350 esos tipos de 67 00:04:17,350 --> 00:04:18,290 ¿vale? 68 00:04:18,990 --> 00:04:19,269 luego 69 00:04:19,269 --> 00:04:20,430 las tareas que desempeña 70 00:04:20,430 --> 00:04:21,990 pues todas 71 00:04:21,990 --> 00:04:23,129 básicamente 72 00:04:23,129 --> 00:04:24,009 lo que haría un humano 73 00:04:24,009 --> 00:04:25,449 supongamos que 74 00:04:25,449 --> 00:04:26,290 quieres que 75 00:04:26,290 --> 00:04:26,730 yo lo sea 76 00:04:26,730 --> 00:04:27,709 arregle un coche 77 00:04:27,709 --> 00:04:28,189 le dicen 78 00:04:28,189 --> 00:04:28,910 arreglar un coche 79 00:04:28,910 --> 00:04:30,490 una vez nunca se subía 80 00:04:30,490 --> 00:04:31,810 en teoría 81 00:04:31,810 --> 00:04:32,689 esa es la idea 82 00:04:32,689 --> 00:04:33,490 luego 83 00:04:33,490 --> 00:04:34,189 la adaptación 84 00:04:34,189 --> 00:04:40,850 nosotros somos capaces de adaptarnos por ejemplo una foto y tú luego sabes 85 00:04:42,589 --> 00:04:44,649 una foto 86 00:04:47,610 --> 00:04:53,269 que hay un letrero y ahí que dice tal como dice esto es que es una pieza será de una 87 00:04:53,269 --> 00:04:58,189 mostrar la capacidad de acción que tiene este tipo de este tipo de modelo a veces 88 00:04:58,189 --> 00:05:08,649 y luego esto para esto ya es la superintegra artificial pues 89 00:05:11,790 --> 00:05:21,990 que realmente sean digamos que es que superan al humano en todos los sentidos 90 00:05:21,990 --> 00:05:29,939 entonces vamos a lo que es lo de abajo que es lo que más nos ha servido 91 00:05:29,939 --> 00:05:35,519 el principio con cuatro por el semisupervisado 92 00:05:36,899 --> 00:05:43,139 nosotros le damos unos datos y esta pared generar una infancia 93 00:05:43,139 --> 00:05:48,439 él va aprendiendo una serie de cosas y al final tú le dices pues esto es un 94 00:05:48,439 --> 00:06:04,459 el resultado y también era una persona se dedica a etiquetar aquí viene la parte digamos que se 95 00:06:04,459 --> 00:06:11,899 está quitando ahora mismo porque todos los modelos antiguos como todos supervisados 96 00:06:12,560 --> 00:06:12,800 ¿Por qué? 97 00:06:12,879 --> 00:06:13,319 Porque tú tenías 98 00:06:13,319 --> 00:06:14,339 un equipo de personas 99 00:06:14,339 --> 00:06:15,519 que te iban dando datos, 100 00:06:16,500 --> 00:06:17,300 creando datos 101 00:06:17,300 --> 00:06:18,019 y que luego 102 00:06:18,019 --> 00:06:18,899 tú el modelo aprendes. 103 00:06:19,860 --> 00:06:20,839 Luego veremos 104 00:06:20,839 --> 00:06:21,560 que ahora mismo 105 00:06:21,560 --> 00:06:22,199 lo que se está llevando 106 00:06:22,199 --> 00:06:23,139 es el no supervisado. 107 00:06:27,550 --> 00:06:27,850 Entonces, 108 00:06:28,089 --> 00:06:28,550 el enfoque 109 00:06:28,550 --> 00:06:30,290 de este tipo de modelos 110 00:06:30,290 --> 00:06:31,029 es resolver 111 00:06:31,029 --> 00:06:32,209 unas tareas concretas. 112 00:06:33,589 --> 00:06:34,250 Por ejemplo, 113 00:06:34,410 --> 00:06:34,990 nosotros tenemos 114 00:06:34,990 --> 00:06:36,569 una imagen 115 00:06:36,569 --> 00:06:37,790 que es capaz de detectar 116 00:06:37,790 --> 00:06:38,829 un gato. 117 00:06:39,050 --> 00:06:39,209 Entonces, 118 00:06:39,310 --> 00:06:40,189 el link que le vamos a dar 119 00:06:40,189 --> 00:06:40,850 a una cola de gato 120 00:06:40,850 --> 00:06:41,509 es capaz de 121 00:06:41,509 --> 00:06:43,250 interpretarlo. 122 00:06:43,850 --> 00:06:50,209 las tareas específicas y luego de una capacidad de aprendizaje limita 123 00:06:52,730 --> 00:06:53,769 es súper bien 124 00:06:57,769 --> 00:07:04,550 simplemente son casos muy concretos donde tú le das datos etiquetados y datos no etiquetados 125 00:07:05,509 --> 00:07:06,490 Realmente no hay ninguna red, 126 00:07:06,589 --> 00:07:07,769 realmente simplemente este tipo de cosas. 127 00:07:08,889 --> 00:07:10,410 Luego tenemos la aplicación de los localizados. 128 00:07:10,569 --> 00:07:10,689 Entonces, 129 00:07:10,750 --> 00:07:11,709 que dan las redes normales, 130 00:07:11,750 --> 00:07:12,329 como vemos ahora, 131 00:07:12,509 --> 00:07:13,290 el B2 y esta, 132 00:07:13,949 --> 00:07:14,850 que tú le das un, 133 00:07:15,949 --> 00:07:17,470 coge todo internet y lo sube, 134 00:07:17,569 --> 00:07:17,730 ¿vale? 135 00:07:18,050 --> 00:07:18,250 Entonces, 136 00:07:18,290 --> 00:07:18,589 ¿qué pasa? 137 00:07:18,649 --> 00:07:19,730 Que ahí tú no tienes una persona que diga, 138 00:07:19,790 --> 00:07:22,490 cogen internet y aprenden todo lo que vean 139 00:07:22,490 --> 00:07:23,569 y lo van aprendiendo. 140 00:07:23,689 --> 00:07:24,470 Por eso no es localizado, 141 00:07:24,589 --> 00:07:25,509 porque tú no tienes una persona 142 00:07:25,509 --> 00:07:27,410 que de hecho ahí también es la parte 143 00:07:27,410 --> 00:07:28,810 de muchas vulnerabilidades, 144 00:07:29,089 --> 00:07:30,750 que aprenden cosas que no quieren que aprendan, 145 00:07:30,850 --> 00:07:31,370 pero aprenden, 146 00:07:31,910 --> 00:07:32,089 ¿vale? 147 00:07:32,089 --> 00:07:33,550 Porque al final tú no le estás limitando 148 00:07:33,550 --> 00:07:34,509 la capacidad de proyectaje, 149 00:07:34,550 --> 00:07:38,790 todo lo que puedas y ya es que esto después de un sitio de pago una vulnerabilidad 150 00:07:40,550 --> 00:07:44,990 es el problema con el que se está lanzando ahora no como hacer un modelo aprenda cosas que no 151 00:07:44,990 --> 00:07:51,790 quieren pero si tú le coges le metes trillones de datos que persona humana está ponen a separar 152 00:07:51,790 --> 00:07:56,089 cuáles son los datos buenos y los malos y luego la ventaja por refuerzo esto está muy chulo porque 153 00:07:56,089 --> 00:08:01,810 esto es la señora del grito pero hay modelos que realmente tú por ejemplo imagínate tú tienes un 154 00:08:01,810 --> 00:08:07,370 videojuego estudiaba dando aprendiendo por ejemplo superman es un caso muy típico 155 00:08:08,370 --> 00:08:15,730 aprende 156 00:08:15,730 --> 00:08:21,170 aprendido que 157 00:08:21,170 --> 00:08:26,790 tiene que saltar a iterar de forma dinámica en función de los de los 158 00:08:26,790 --> 00:08:29,370 hijos que le va dando este barro terminando y aprendiendo digamos 159 00:08:29,370 --> 00:08:33,710 dinámicamente esto es que estábamos en robótica por ejemplo el perrito de 160 00:08:33,710 --> 00:08:38,210 boston dinamics pues lo que hacen así porque tú le pones al perrito y le dices 161 00:08:38,210 --> 00:08:41,870 tú quédate de pie para perfectos o más o menos le cuesta pero que lo consiga 162 00:08:41,870 --> 00:08:45,850 hacer ahora muy de para adelante con una pata más se cae 163 00:08:45,850 --> 00:08:53,049 aprendiendo poco a poco a que la pata pues como colocar 164 00:08:55,789 --> 00:08:58,350 son modelos que cuesta mucho entrenar pero luego queda 165 00:09:01,850 --> 00:09:09,190 pero una parte que no sea supervisado puede salir a producción 166 00:09:09,190 --> 00:09:21,450 un problema 167 00:09:21,450 --> 00:09:28,070 de la firma 168 00:09:28,070 --> 00:09:33,409 no tiene 169 00:09:33,409 --> 00:09:42,590 sí que está aprendiendo que ciertos elementos 170 00:09:42,590 --> 00:09:49,250 seguramente entonces tú luego le pones aprendido que ciertos colores 171 00:09:49,250 --> 00:09:57,590 visual pero tú estás seguramente tú estás etiquetando que él ha entendido 172 00:09:57,590 --> 00:10:02,590 que son ciertas características, es donde termina que una persona de raza negra. 173 00:10:02,590 --> 00:10:05,590 Tú luego le pones algo parecido y te lo va a dar. 174 00:10:05,590 --> 00:10:08,590 Eso es el típico sesgo, se ve mucho, por ejemplo, 175 00:10:08,590 --> 00:10:10,590 cuando está, por ejemplo, el lenguaje que dice. 176 00:10:10,590 --> 00:10:13,590 Es el típico caso, ¿no? Tú le pones podita. 177 00:10:13,590 --> 00:10:15,590 Entonces, tú le dices que el médico es un, 178 00:10:15,590 --> 00:10:17,590 entonces seguramente te diga que es un hombre, 179 00:10:17,590 --> 00:10:19,590 pero yo lo probaré. 180 00:10:19,590 --> 00:10:21,590 Y si además vos te pones una enfermera, ¿qué? 181 00:10:21,590 --> 00:10:22,590 Entonces está aquí. 182 00:10:22,590 --> 00:10:25,590 El enfermero, a lo mejor te dice un nombre de mujer. 183 00:10:25,590 --> 00:10:30,450 porque porque si tú coges todos los históricos tradicionalmente el hombre 184 00:10:30,450 --> 00:10:37,970 con datos de hace cuatro años 185 00:10:40,970 --> 00:10:45,149 entonces es supervisado pero 186 00:10:45,149 --> 00:11:01,529 en los nombres de un médico o médica digamos que alterna el médico con él 187 00:11:01,529 --> 00:11:03,110 pero es un curro que haces 188 00:11:03,110 --> 00:11:03,789 dentro de la mente 189 00:11:03,789 --> 00:11:06,710 y luego las aceptas 190 00:11:06,710 --> 00:11:08,450 como deberían 191 00:11:08,450 --> 00:11:09,450 pero está bien 192 00:11:09,450 --> 00:11:11,970 entiendo que todo esto entonces 193 00:11:11,970 --> 00:11:13,669 estás contando 194 00:11:13,669 --> 00:11:15,090 la base 195 00:11:15,090 --> 00:11:18,429 la base son datos 196 00:11:18,429 --> 00:11:20,070 de aprendizaje 197 00:11:20,070 --> 00:11:22,549 entiendo que todo, todo, todo 198 00:11:22,549 --> 00:11:24,809 estará basado en la calidad de estos datos 199 00:11:24,809 --> 00:11:26,330 ¿cómo se mide esa calidad? 200 00:11:26,830 --> 00:11:27,970 a ver, esta calidad final 201 00:11:27,970 --> 00:11:30,750 la mide, permite que lo vaya evaluando 202 00:11:30,750 --> 00:11:33,190 después 203 00:11:33,190 --> 00:11:35,309 claro, que de uno a otro, tú tienes un equipo de personas 204 00:11:35,309 --> 00:11:36,870 que tú dices, ¿con qué tabla haces? 205 00:11:37,330 --> 00:11:39,190 como acabo de poner yo, y te lo das 206 00:11:39,190 --> 00:11:40,909 tú tienes que iterar y decir, vale 207 00:11:40,909 --> 00:11:41,909 ¿por qué has pedido eso? 208 00:11:42,269 --> 00:11:43,049 por lo que te he comentado 209 00:11:43,049 --> 00:11:46,169 puedes hacer muchas técnicas, como lo he enseñado 210 00:11:46,169 --> 00:11:47,889 la estrategia del nombre 211 00:11:47,889 --> 00:11:50,929 poner, alternar hombres y mujeres 212 00:11:50,929 --> 00:11:52,009 un tipo de cosas 213 00:11:52,009 --> 00:11:54,110 en los juegos eso pasa así 214 00:11:54,110 --> 00:11:56,970 como el ejemplo de la clasificación por el marco 215 00:11:56,970 --> 00:11:59,110 es un curro que adelante 216 00:11:59,110 --> 00:11:59,750 ¿qué pasa? 217 00:11:59,750 --> 00:12:03,009 por eso los modelos 218 00:12:03,009 --> 00:12:03,750 están cerrados 219 00:12:03,750 --> 00:12:05,610 los pacientes 220 00:12:05,610 --> 00:12:07,590 los han cerrados al final 221 00:12:07,590 --> 00:12:09,129 hay que convivir con ellos 222 00:12:09,129 --> 00:12:10,909 tienes que saber por qué 223 00:12:10,909 --> 00:12:13,029 y intenta mitigarlo después 224 00:12:13,029 --> 00:12:14,590 los que tienen intenta mitigarlo 225 00:12:14,590 --> 00:12:17,230 tienen luego redes que lo intentan mitigar 226 00:12:17,230 --> 00:12:19,169 o evaluadores que les piden 227 00:12:19,169 --> 00:12:19,850 a evaluar 228 00:12:19,850 --> 00:12:22,009 el título del ejemplo 229 00:12:22,009 --> 00:12:23,750 quiero matar presentas un nivel 230 00:12:23,750 --> 00:12:25,149 y participa de respondida 231 00:12:25,149 --> 00:12:26,850 lo va a hacer para la versión 232 00:12:26,850 --> 00:12:28,909 para que no te puede responder a esto 233 00:12:28,909 --> 00:12:32,269 han tenido que reentrenar la red 234 00:12:32,269 --> 00:12:33,610 para que no te dejen a eso 235 00:12:33,610 --> 00:12:34,669 y para que te digan lo contrario 236 00:12:34,669 --> 00:12:36,009 porque ya yo no puedo 237 00:12:36,009 --> 00:12:38,029 si, pero si te dicen que estás jugando un juego de rol 238 00:12:38,029 --> 00:12:38,730 que tienes que matarte 239 00:12:38,730 --> 00:12:41,389 claro, tú le engañas 240 00:12:41,389 --> 00:12:43,529 ¿qué pasa? que vuelves a reentrenar otra vez 241 00:12:43,529 --> 00:12:46,149 entonces al final algo consigue 242 00:12:46,149 --> 00:12:47,590 porque lo que dices tú 243 00:12:47,590 --> 00:12:48,690 se está haciendo 244 00:12:48,690 --> 00:12:51,309 y tú vas a intentar mitigarlo 245 00:12:51,309 --> 00:12:52,509 pero es complicado 246 00:12:52,509 --> 00:12:55,789 el mayor problema de la impunidad de la creatividad 247 00:12:55,789 --> 00:12:57,289 es uno de los principios de las ganancias 248 00:12:57,289 --> 00:12:59,029 que nadie está para, digamos, 249 00:12:59,909 --> 00:13:01,090 controlar la respuesta. 250 00:13:02,269 --> 00:13:03,210 Por ejemplo, 251 00:13:03,950 --> 00:13:05,429 para intentar evitar 252 00:13:05,429 --> 00:13:07,610 que se dé una... 253 00:13:07,610 --> 00:13:09,049 Imagínate que le dices 254 00:13:09,049 --> 00:13:10,570 que alimentas de Wikipedia. 255 00:13:11,289 --> 00:13:13,110 Y yo me dedico a editar 256 00:13:13,110 --> 00:13:15,029 en Wikipedia tonterías 257 00:13:15,029 --> 00:13:16,090 para sacar tonterías. 258 00:13:16,649 --> 00:13:17,850 ¿Hay alguna forma de decirle 259 00:13:17,850 --> 00:13:19,809 no te expongas de Wikipedia? 260 00:13:20,110 --> 00:13:22,029 Pues déjalo, ponlo en otro sitio más 261 00:13:22,029 --> 00:13:24,230 y en el que encuentres más posibilidades 262 00:13:24,230 --> 00:13:25,529 de que se elimine, 263 00:13:25,529 --> 00:13:28,889 a ver 264 00:13:28,889 --> 00:13:30,929 supongo que lo podrás hacer 265 00:13:30,929 --> 00:13:32,529 yo sinceramente no lo puedo 266 00:13:32,529 --> 00:13:35,129 puede que lo haga GPT 267 00:13:35,129 --> 00:13:36,169 o alguna de esas cosas 268 00:13:36,169 --> 00:13:37,730 yo realmente 269 00:13:37,730 --> 00:13:41,610 no creo que lo hagan 270 00:13:41,610 --> 00:13:43,370 yo muchas veces lo hacen después 271 00:13:43,370 --> 00:13:44,149 y me entregan 272 00:13:44,149 --> 00:13:46,450 porque a ver 273 00:13:46,450 --> 00:13:48,289 tú quieres cotejar 274 00:13:48,289 --> 00:13:51,429 trillones y trillones de datos centrales 275 00:13:51,429 --> 00:13:52,649 y obviamente no lo puedes hacer 276 00:13:52,649 --> 00:13:54,269 pero es un gasto brutal 277 00:13:54,269 --> 00:13:59,769 pues hacer este tipo de técnicas 278 00:14:00,769 --> 00:14:16,230 son modelos muy hechos a una tarea concreta y ahí lo busco hacer este tipo de cosas pero 279 00:14:16,230 --> 00:14:25,289 cuando tú haces tu modelo grande de m ahí lo que estamos diciendo es vale tú estás metiendo 280 00:14:25,289 --> 00:14:31,950 los 6 pero si yo quiero tocar la red realmente les meten otros es por mí pero si yo quiero que 281 00:14:31,950 --> 00:14:35,730 la red no aprende a hacer estas cosas yo les quise estar en la propia red para que lo haga 282 00:14:37,889 --> 00:14:45,129 pero al final no sea como las redes pequeñas y que yo he visto que lo intentan hacer pero 283 00:14:46,230 --> 00:14:57,789 pero bueno al final tú quieres que vamos a intentar dejar las preguntas para el final 284 00:14:57,789 --> 00:15:05,429 así que vamos a argumentar de cuenta porque si no lo hemos terminado 285 00:15:05,429 --> 00:15:14,190 a nivel básico hasta un nivel más 286 00:15:14,190 --> 00:15:21,929 tenemos las convolucionales que son las de imagen lo que es lo que se basan es que tú tienes una 287 00:15:21,929 --> 00:15:30,809 imagen de imágenes de píxeles entonces éstas funcionan con una especie de filtro que va a 288 00:15:30,809 --> 00:15:35,970 estar escaneando cada una de las de los píxeles y luego a través de las técnicas pues para 289 00:15:35,970 --> 00:15:43,470 absorbiendo la información de la imagen luego tenemos la recurrente 290 00:15:43,470 --> 00:15:46,350 porque ahora ya no se están a recurrentes 291 00:15:46,350 --> 00:15:48,009 se usan las redes 292 00:15:48,009 --> 00:15:49,389 digamos, las plataformas 293 00:15:49,389 --> 00:15:52,429 la red de las recurrentes 294 00:15:52,429 --> 00:15:53,549 imagínate, yo tengo una frase 295 00:15:53,549 --> 00:15:56,429 el perro come un hueso 296 00:15:56,429 --> 00:15:57,850 entonces tú vas practicando 297 00:15:57,850 --> 00:16:00,629 luego el perro 298 00:16:00,629 --> 00:16:02,730 y a veces parte de lo que ha tenido de él 299 00:16:02,730 --> 00:16:04,129 lo come 300 00:16:04,129 --> 00:16:05,629 y no se llama recurrente 301 00:16:05,629 --> 00:16:07,750 porque vas retroalimentando la red 302 00:16:07,750 --> 00:16:08,490 por lo anterior 303 00:16:08,490 --> 00:16:11,549 y luego tenemos las pantalones, que estas tan guays 304 00:16:11,549 --> 00:16:17,490 porque está lo que hacen es una red y luego tienes otra red entonces digamos que el juego 305 00:16:17,490 --> 00:16:26,490 es que tú eres una red y la otra vez intenta necesitamos molestar a la otra entonces intenta 306 00:16:26,490 --> 00:16:31,169 ser entre ellas rivales a ver cuál da el mejor resultado la forma que entre ellas se retroalimentan 307 00:16:31,169 --> 00:16:37,029 y aprende esto es tan chulo eso estos labores que durante los años funcionan bastante bien 308 00:16:37,029 --> 00:16:54,429 esto es un perfecto esto es una foto un poco pues la única foto de wikipedia 309 00:16:54,429 --> 00:16:59,769 esto digamos la unidad básica de una neurona esto intenta simular digamos una final sino 310 00:16:59,769 --> 00:17:07,569 de una neurona y cómo funcionan los gustos a ver esto nosotros le damos una entrada vale un x1 311 00:17:09,250 --> 00:17:18,910 estamos dando y luego tenemos una especie de esto es la clave de cómo nosotros tenemos una 312 00:17:18,910 --> 00:17:28,210 función que es una función mx más vale hay la clave todo es que tenemos un valor vale es el 313 00:17:28,210 --> 00:17:35,809 por lo que se va a multiplicar la entrada. Luego hacemos una suma ponderada de estas 314 00:17:35,809 --> 00:17:43,230 señales y luego sumadora y luego tenemos la aproximación. Esto sería como una neurona 315 00:17:43,230 --> 00:17:48,470 le manda una serie de señales y luego la neurona decide si esta información se activa 316 00:17:48,470 --> 00:17:53,369 o no. Significa que va a pasar a la siguiente neurona y le va a entrar la información o 317 00:17:53,369 --> 00:18:00,329 esto porque porque funciona así porque ahora mismo tú tienes una información lo que haces 318 00:18:00,329 --> 00:18:07,650 es entrenar a la neurona para que este texto le dé un valor al al digamos al mismo la forma de 319 00:18:07,650 --> 00:18:14,109 local no lo veremos cada neurona al final se va a especializar en una de las de los del tipo de 320 00:18:14,109 --> 00:18:17,089 como el cerebro humano 321 00:18:17,089 --> 00:18:19,849 si alguno ve las típicas fotos del cerebro humano 322 00:18:19,849 --> 00:18:22,210 ve que hay neuronas que se entienden y neuronas que se apagan 323 00:18:22,210 --> 00:18:24,069 básicamente es una 324 00:18:24,069 --> 00:18:25,069 entretada replicada 325 00:18:25,069 --> 00:18:27,890 entonces, para que una neurona 326 00:18:27,890 --> 00:18:29,029 pase de una zona a otra 327 00:18:29,029 --> 00:18:30,529 hay un proceso 328 00:18:30,529 --> 00:18:33,250 simulado con las funciones lineales 329 00:18:33,250 --> 00:18:36,029 y luego, sumas todos los lados 330 00:18:36,029 --> 00:18:37,710 de las funciones lineales y luego decimos 331 00:18:37,710 --> 00:18:39,250 esto pasa o no pasa 332 00:18:39,250 --> 00:18:41,309 y se lo comunica a la siguiente neurona 333 00:18:41,309 --> 00:18:48,910 Ahora vamos a ver, sabiendo que se llama el perfecto, perfecto, ¿vale? 334 00:18:49,609 --> 00:18:53,710 Ahora, una renal no solamente es un conjunto de perfectores, ¿vale? 335 00:18:53,930 --> 00:18:56,329 Es de integramiento de las cargas, ¿vale? 336 00:18:57,730 --> 00:18:59,869 Nosotros tenemos ahora mismo varias entradas. 337 00:18:59,869 --> 00:19:07,549 Entonces, como os he comentado, una neurona se especializa al final en una de las cosas, digamos, que él acaba aprendiendo. 338 00:19:07,549 --> 00:19:26,150 tengo pelotas 339 00:19:26,150 --> 00:19:28,309 para llover 340 00:19:28,309 --> 00:19:37,670 si no si tengo todas las ramas correctas para poder eso es muy fácil porque es un camino ahora 341 00:19:37,670 --> 00:19:48,029 aquí no es el camino pues ahora porque tú no entres ahora no hay dios que sepa qué hace cada 342 00:19:48,029 --> 00:19:59,829 3 375 millones de panamá 275 millones de pesos 343 00:20:02,529 --> 00:20:17,710 a ver básicamente como ves estas líneas son las intercomunicaciones 344 00:20:17,710 --> 00:20:22,230 la entrada 345 00:20:26,230 --> 00:20:30,809 y se interconectan entre ellas y luego tenemos una única 346 00:20:30,809 --> 00:20:35,930 capa de salir de la capa de salir 347 00:20:35,930 --> 00:20:42,049 hay una cosa clave que es el alimento ha sido como un tipo de válida 348 00:20:44,490 --> 00:20:50,869 esto no funciona tú le metes una cosa y tiene un peso una mente aleatoria va pasando por las 349 00:20:50,869 --> 00:20:58,930 capas y llega hasta que la salida y yo me diste este resultado es correcto no pues hay una función 350 00:20:58,930 --> 00:21:00,710 que tiene el error 351 00:21:00,710 --> 00:21:03,650 hay una función de error 352 00:21:03,650 --> 00:21:05,869 que junto con la función de optimización 353 00:21:05,869 --> 00:21:07,190 lo que hace es llevar para atrás 354 00:21:07,190 --> 00:21:08,890 el error 355 00:21:08,890 --> 00:21:11,829 que tiene, entonces va digamos de forma iterativa 356 00:21:11,829 --> 00:21:13,369 va cambiando sus pesos 357 00:21:13,369 --> 00:21:16,829 para correr, es muy bruto 358 00:21:16,829 --> 00:21:18,970 pero funciona, sigue iterando 359 00:21:18,970 --> 00:21:20,609 continuamente para que al final 360 00:21:20,609 --> 00:21:22,190 funcione 361 00:21:22,190 --> 00:21:24,069 muy bruto pero funciona 362 00:21:24,069 --> 00:21:26,829 hace millones y millones de iteraciones 363 00:21:26,829 --> 00:21:28,109 hasta que al final da la vuelta 364 00:21:28,109 --> 00:21:30,089 entonces aquí los pesos los va modificando 365 00:21:30,309 --> 00:21:33,190 la arquitectura y lo que han publicado 366 00:21:36,549 --> 00:21:41,690 la arquitectura tienes pero eso no es importante 367 00:21:45,130 --> 00:21:51,509 vale ahora venimos a la parte digamos que es revolucionado el mercado que estás por esto 368 00:21:51,509 --> 00:22:02,069 que dieron con una clave que es el transformar que es un tipo de arquitectura diferente hemos 369 00:22:02,069 --> 00:22:08,990 hablado de que las redes recurrentes va liderando sobre una palabra que va metiendo la alimentación 370 00:22:10,670 --> 00:22:18,670 digamos pasándole pues esto no esto es todo el tiempo de golpe y tú lo vas a procesar a 371 00:22:18,670 --> 00:22:40,680 la clave es atención porque tuvieron que pero aquí tengo que prestar atención el perro que he comido 372 00:22:40,680 --> 00:22:49,859 una zanahoria en todas las técnicas es en mi casa pero con mi casa está súper 373 00:22:49,859 --> 00:22:55,259 mente relacionado porque es mi tu cabeza sabe que me traté al perro pero si tú 374 00:22:55,259 --> 00:22:58,559 estás una recurrente es en y se va perdiendo a lo largo de las frases 375 00:22:58,559 --> 00:23:03,180 poder circular entonces por eso la clave de todo esto es que le metemos todo de 376 00:23:03,180 --> 00:23:09,859 golpe para que todo digamos tenga la misma red aquí hay una serie de papeles 377 00:23:10,680 --> 00:23:20,859 tenemos ahora mismo le estamos metiendo todo el texto esto tiene una serie de capas 378 00:23:24,440 --> 00:23:29,019 como funciona la frase y cada una de las palabras 379 00:23:29,019 --> 00:23:34,400 como dos una que es él 380 00:23:35,720 --> 00:23:40,299 qué es lo que significa 381 00:23:42,740 --> 00:23:48,960 de lo que se trata de lo que se trata en este juego es decirle a un la palabra no se hizo pero 382 00:23:48,960 --> 00:23:56,259 con mi casa tiene que tener una relación bastante bastante cercana llegamos aquí sería la consulta 383 00:23:56,259 --> 00:24:01,240 sería el verbo y luego la clave sería que mi casa porque hay porque tú lo que quieres es que 384 00:24:01,240 --> 00:24:10,660 esa parte primera esté muy relacionada con eso esto es una red que dice la información 385 00:24:10,660 --> 00:24:20,839 porque imagínate yo le meto mucho aspecto jurídico y la diva y la verdad es que se las 386 00:24:20,839 --> 00:24:27,160 asesinó infinitamente cada vez que llegue a carlos rodríguez para decir que es el asesino 387 00:24:28,619 --> 00:24:34,920 porque por eso a veces te dan las fuerzas te dan cosas las modelos 388 00:24:34,920 --> 00:24:47,740 porque el parejo entre la palabra y la clave están muy cercanas porque lo que han aprendido 389 00:24:47,740 --> 00:25:02,740 Esto al final determina una matriz de cómo está relacionada una palabra con el resto. 390 00:25:02,740 --> 00:25:08,740 Entonces, esto realmente tiene un montón de capas de atención, no tiene sólidas, tiene infinitas. 391 00:25:08,740 --> 00:25:15,740 De tal forma que al final, cada una de las capas de atención se va a fijar en ciertos aspectos. 392 00:25:15,740 --> 00:25:23,119 entonces lo que nos va a dar es que al final el resultado digamos de una consulta con muchas 393 00:25:23,119 --> 00:25:30,599 palabras se deriva al final en un elemento que contenía todo una única clave donde tienes un 394 00:25:30,599 --> 00:25:39,259 instrumento de toda la fase anterior entonces luego le metemos luego se normaliza pero bueno 395 00:25:39,259 --> 00:25:42,079 al final 396 00:25:44,119 --> 00:25:50,720 a una costa 397 00:25:56,539 --> 00:25:58,579 para que todo tenga igual de importancia 398 00:25:58,579 --> 00:26:10,940 si es importante que esté romántico o sí 399 00:26:12,140 --> 00:26:23,519 y luego tenemos una capa de tipo y lo mismo vamos atrás hasta que al final 400 00:26:23,519 --> 00:26:25,519 este es el bloque de transforma 401 00:26:25,519 --> 00:26:29,799 entonces vamos quitando continuamente 402 00:26:29,799 --> 00:26:31,480 a la capa de atención 403 00:26:31,480 --> 00:26:34,259 vale, aquí hay una cosa que es 404 00:26:34,259 --> 00:26:35,279 bueno, se nos 405 00:26:35,279 --> 00:26:37,940 aquí hay una parte que es el botizar en code 406 00:26:37,940 --> 00:26:41,599 ¿cómo funciona esto? 407 00:26:41,900 --> 00:26:44,579 yo os he dicho que las redes recurrentes 408 00:26:44,579 --> 00:26:45,720 van de izquierda a derecha 409 00:26:45,720 --> 00:26:46,940 así 410 00:26:46,940 --> 00:26:49,539 bueno, en el blog 411 00:26:49,539 --> 00:26:51,279 vamos de izquierda a derecha 412 00:26:51,279 --> 00:26:54,460 ¿el orden de las palabras para un transforma es importante? 413 00:26:55,099 --> 00:26:56,299 como hemos visto, no 414 00:26:57,099 --> 00:26:58,240 ¿Qué es lo que hace esta función? 415 00:26:59,059 --> 00:27:05,240 Esta función transforma la posición de las palabras en funciones sinusoidales. 416 00:27:06,640 --> 00:27:12,220 Digamos que cada palabra, cada posición de la palabra vibra a una frecuencia diferente. 417 00:27:15,380 --> 00:27:23,180 Entonces, esta palabra, digamos, si yo le hiciera esto, el orden de las palabras sería muy relevante. 418 00:27:23,299 --> 00:27:29,019 Yo no quiero que el orden de las palabras sea relevante. 419 00:27:29,380 --> 00:27:37,380 Entonces, a través de este posibilidad de encoding, nosotros le estamos dando una especie de ordenación, pero llevado, digamos, a función, si no se oye. 420 00:27:37,380 --> 00:27:50,380 Entonces, con este posibilidad de encoding, vosotros quedaros con que al final esta capa lo que hace es decirle un orden a la red. Esto porque imagínate que tú tienes una traducción. 421 00:27:50,380 --> 00:27:53,779 yo digo el perro 422 00:27:57,819 --> 00:28:11,359 hay una palabra que traduzca la palabra 2 está relacionado con la 3 y la 3 con la 2 423 00:28:11,359 --> 00:28:19,880 entonces con este tipo de técnicas lo tiene muy bien para traducir porque yo le estoy yo 424 00:28:19,880 --> 00:28:26,079 le estoy diciendo en qué parte de la palabra tiene que fijarse el él 425 00:28:26,079 --> 00:28:29,400 pero la capa 426 00:28:31,400 --> 00:28:32,400 más o menos 427 00:28:38,079 --> 00:28:43,880 entonces bueno está claro o no el transforme vale 428 00:28:47,880 --> 00:28:49,619 en la capa de transforme 429 00:28:49,619 --> 00:28:54,880 esta sería la capa de lo que llaman el encoder 430 00:28:54,880 --> 00:28:57,099 esta sería la parte que 431 00:28:57,099 --> 00:28:59,839 y nosotros queremos traducir 432 00:28:59,839 --> 00:29:02,759 con nosotros aquí le meteríamos la traducción 433 00:29:02,759 --> 00:29:05,720 esto tiene también una capa de atención 434 00:29:05,720 --> 00:29:07,500 que haría lo mismo que 435 00:29:07,500 --> 00:29:12,339 la suma de estas dos vectores 436 00:29:12,339 --> 00:29:15,019 se inyecta aquí con otra capa de atención 437 00:29:15,019 --> 00:29:17,279 y ahí digamos que haríamos el parejo 438 00:29:17,279 --> 00:29:19,079 que se ha montado entre una traducción y otra 439 00:29:19,079 --> 00:29:24,559 de la palabra, de la inversión de palabras, uno está relacionado con su palabra en inglés. 440 00:29:24,859 --> 00:29:27,180 Esta sería la capa que iría a ese tipo de cosas. 441 00:29:28,220 --> 00:29:31,279 Y luego, bueno, normalizamos, el filtro para llevar atrás, 442 00:29:31,420 --> 00:29:33,480 llevamos para que el modelo pueda ser capaz de aprender, 443 00:29:34,519 --> 00:29:36,519 y al final te da un resultado. 444 00:29:37,819 --> 00:29:37,980 ¿Vale? 445 00:29:39,819 --> 00:29:42,099 Esto no queda muy bueno, ¿sí? 446 00:29:43,819 --> 00:29:44,259 Vale. 447 00:29:46,259 --> 00:29:46,740 LL. 448 00:29:46,740 --> 00:29:58,319 es una de las capas pero que algunas de las capas no es capaz de aprender toda la información que 449 00:29:58,319 --> 00:30:09,019 tiene un sistema entonces lo que se hace es meter muchas capas al final esto al final de lo que se 450 00:30:09,019 --> 00:30:14,940 trata es de yo tengo una una neurona una capa de transformar que estaba de una cierta una 451 00:30:14,940 --> 00:30:19,500 de esta parte de información que al final digamos se especializa en una parte en concreto como por 452 00:30:19,500 --> 00:30:25,059 ejemplo un cerebro pues tú tienes tus neuronas y tú por ejemplo en una parte te dedicas al 453 00:30:25,059 --> 00:30:31,799 alfato y otra te dedicas al ser, al oír, pues al final las señales, una es para interpretar, 454 00:30:31,799 --> 00:30:41,140 una es para escuchar y otra. Vale, entonces ¿qué es lo que hacemos con los LLM? Los LLM básicamente es meterle un montón de métodos, muchísimas 455 00:30:41,140 --> 00:30:50,119 capas transformen de la forma es capaz de aprender muchas cosas aquí tenemos por ejemplo un bloque 456 00:30:50,119 --> 00:30:58,960 transforme como el que hemos visto y esto tenía una combinación de capas sería un transforme 457 00:30:58,960 --> 00:31:11,259 adelante pues al final en cada una de las capas funciones digamos una concreta 458 00:31:12,680 --> 00:31:17,140 al final será un resultado que es comparable con porque absorbió toda 459 00:31:17,140 --> 00:31:23,500 la información que aprendió de cada una de las capas transformes 460 00:31:23,500 --> 00:31:35,519 de los modelos 461 00:31:40,099 --> 00:31:43,680 esto es un aprendizaje 462 00:31:43,680 --> 00:31:49,240 profundo 463 00:31:53,500 --> 00:31:57,279 Yo no te puedo decir, la capa 1 es tal, la capa 2... 464 00:31:57,279 --> 00:31:58,720 Pues haz un análisis, ¿vale? 465 00:31:58,720 --> 00:32:01,700 Tú puedes coger una palabra y decir, vale, ¿qué capa se ilumina? 466 00:32:02,160 --> 00:32:02,920 Y sí, se puede hacer. 467 00:32:03,599 --> 00:32:04,400 Pero creo que lo contas sí. 468 00:32:04,579 --> 00:32:08,460 Pero tú al final no puedes llegar a un valor concreto. 469 00:32:08,819 --> 00:32:10,619 Porque claro, tú como persona humana puedes decir, 470 00:32:10,680 --> 00:32:11,880 esta capa se edita matemáticamente. 471 00:32:12,500 --> 00:32:14,400 Pero a lo mejor por la capa de matemáticas también pasa 472 00:32:14,400 --> 00:32:18,000 otro tipo de redes, o sea, otro tipo de mensajes, 473 00:32:18,960 --> 00:32:21,039 aunque parezca que no es posible decir matemáticas, 474 00:32:21,039 --> 00:32:22,720 porque al final la red no está como aprendiz. 475 00:32:23,500 --> 00:32:39,500 porque a través de todo este aprendizaje estos modelos son capaces de comprender 476 00:32:39,500 --> 00:32:59,119 y esto al final tienes un final un conjunto de información digamos espacial donde toda 477 00:32:59,119 --> 00:33:04,460 la información obtenida en sus relaciones entre las redes estaba de comprender todo 478 00:33:04,460 --> 00:33:10,619 el contexto a la vez hemos visto que es por eso comprender todo el contexto es un contexto 479 00:33:13,619 --> 00:33:18,539 estas son de propósito general general pero para un caso funcional que tú deseas 480 00:33:20,279 --> 00:33:28,420 utilizamos redes y nosotros tenemos documentos judiciales para los autos 481 00:33:28,420 --> 00:33:37,420 no lo han visto porque lo han entrado con wikipedia 482 00:33:40,640 --> 00:33:47,579 hay cuatro por ejemplo tenemos que meterle una una aprendizaje para que se plantea 483 00:33:47,579 --> 00:33:54,180 el texto y realmente lo que le metes es un motor de textos jurídicos y luego le dices completa la 484 00:33:54,180 --> 00:34:01,160 la frase. Entonces, cuando tú le dices que completa la frase, realmente tú coges la 485 00:34:01,160 --> 00:34:04,619 frase, ¿no? Te dice, ¿sabes? Sigue con la frase. Tú sabes realmente cómo acaba. Entonces, 486 00:34:04,720 --> 00:34:09,800 tú le dices, este es el acusado, ¿no? Y te dice, pues, y realmente interpreta, este 487 00:34:09,800 --> 00:34:15,699 es el demandado, es el malo, es el acusado. Entonces, va hacia atrás y va aprendiendo 488 00:34:15,699 --> 00:34:21,659 interativamente a relacionar el acusado con ciertas palabras. Por ejemplo, el delito se 489 00:34:21,659 --> 00:34:30,000 acusado con acusado estaba aprendiendo que tú le dices continuará como hemos visto esto 490 00:34:30,000 --> 00:34:32,340 ha comentado 491 00:34:37,900 --> 00:34:41,699 aprende de todo el código penal y criminal 492 00:34:41,699 --> 00:34:47,519 y le dices 493 00:34:47,519 --> 00:35:00,760 el modelo que responde 494 00:35:00,760 --> 00:35:02,619 y luego, solamente sale 495 00:35:02,619 --> 00:35:04,019 el quijote es un libro 496 00:35:04,019 --> 00:35:06,860 el modelo realmente, el modelo te responde 497 00:35:06,860 --> 00:35:08,179 define el quijote 498 00:35:08,179 --> 00:35:10,940 esto es un libro, te lo da todo 499 00:35:10,940 --> 00:35:12,139 junto, para que tú lo cortas 500 00:35:12,139 --> 00:35:14,320 y tú me dices que ves esta parte cortada 501 00:35:14,320 --> 00:35:16,599 de la izquierda, tú te la quitas 502 00:35:16,599 --> 00:35:18,179 para que te responda, pero realmente tú 503 00:35:18,179 --> 00:35:20,179 le estás metiendo todo el rato el mismo 504 00:35:20,179 --> 00:35:21,980 digamos que es un otro tipo todo el rato 505 00:35:21,980 --> 00:35:23,300 pero realmente es un modelo 506 00:35:23,300 --> 00:35:24,940 que significa 507 00:35:24,940 --> 00:35:26,940 agente generativo 508 00:35:26,940 --> 00:35:28,800 entonces 509 00:35:28,800 --> 00:35:33,539 al final lo que va haciendo es generar texto 510 00:35:33,539 --> 00:35:46,380 y aprende más ganando y aprendiendo de hecho es para comentar en el siguiente slide 511 00:35:46,380 --> 00:35:57,119 de parámetros 512 00:35:57,119 --> 00:36:14,099 por ejemplo 513 00:36:16,380 --> 00:36:25,639 esta frase es positiva y nunca para aprender 514 00:36:25,639 --> 00:36:26,280 este contexto 515 00:36:31,820 --> 00:36:35,940 en este contexto el libro escrito por serrano 516 00:36:39,420 --> 00:36:43,980 en ningún momento seguramente el modelo de una similar pero se va a responder 517 00:36:43,980 --> 00:36:46,980 es un libro escrito por cero. 518 00:36:46,980 --> 00:36:49,980 ¿Esto cómo lo ha aprendido? Pues ahí está la magia. 519 00:36:49,980 --> 00:36:52,980 Realmente tú no le has dicho cómo tiene que responder. 520 00:36:52,980 --> 00:36:54,980 Él aprende a responder el solito. 521 00:36:54,980 --> 00:36:57,980 Eso fue lo que, digamos, la gente se dijo, 522 00:36:57,980 --> 00:37:00,980 es que esto, realmente yo le estoy haciendo preguntas 523 00:37:00,980 --> 00:37:02,980 que no lo he entrado y, sin embargo, 524 00:37:02,980 --> 00:37:04,980 había inferido este tipo de situaciones. 525 00:37:04,980 --> 00:37:06,980 Y la verdad es que eso, 526 00:37:06,980 --> 00:37:09,980 cuando lo probaron y empezó a funcionar, 527 00:37:09,980 --> 00:37:11,980 supo un poquito, pero dices, 528 00:37:11,980 --> 00:37:13,760 aprende cosas que yo no le he dicho 529 00:37:13,760 --> 00:37:16,400 pero has podido leer 530 00:37:16,400 --> 00:37:17,860 que el autor está firmado 531 00:37:17,860 --> 00:37:20,460 pero claro, tú le estás preguntando 532 00:37:20,460 --> 00:37:21,119 a un contexto 533 00:37:21,119 --> 00:37:23,980 y en este contexto, tú no le has enseñado 534 00:37:23,980 --> 00:37:24,800 preguntas exactas 535 00:37:24,800 --> 00:37:26,619 tú le has enseñado 536 00:37:26,619 --> 00:37:30,159 simplemente le has leído un montón de textos 537 00:37:30,159 --> 00:37:32,119 de la Wikipedia y es lo único aprendido a decir 538 00:37:32,119 --> 00:37:34,159 que una frase por ejemplo es positiva o negativa 539 00:37:34,159 --> 00:37:36,280 antes tú cogías 540 00:37:36,280 --> 00:37:36,840 y decías 541 00:37:36,840 --> 00:37:39,239 esta frase es positiva 542 00:37:39,239 --> 00:37:40,719 porque al final tu tío le decía 543 00:37:40,719 --> 00:37:45,699 por ejemplo 544 00:37:45,699 --> 00:37:52,260 aprendido 545 00:37:52,260 --> 00:37:54,239 cosas 546 00:37:54,239 --> 00:37:57,960 general 547 00:37:57,960 --> 00:37:59,980 pero hay un poquito 548 00:37:59,980 --> 00:38:02,320 de este conocimiento 549 00:38:02,320 --> 00:38:03,380 que dices 550 00:38:03,380 --> 00:38:04,579 la definición de ágil 551 00:38:04,579 --> 00:38:07,780 aprende cosas que tú no le enseñas 552 00:38:07,780 --> 00:38:10,420 obviamente aprende cosas que no haces 553 00:38:10,719 --> 00:38:14,719 Y esta fue la propuesta. 554 00:38:14,719 --> 00:38:16,719 A ver, al final, ¿cuántos de ustedes entendieron? 555 00:38:16,719 --> 00:38:18,719 Yo no sé si ellos sabían realmente qué iba presentando. 556 00:38:18,719 --> 00:38:20,719 Porque con el GPT-2, por ejemplo, tú le haces preguntas 557 00:38:20,719 --> 00:38:22,719 y no la acaban de responder. 558 00:38:22,719 --> 00:38:24,719 Cuando ellos entendieron el trabajo con el GPT-3, dijeron, 559 00:38:24,719 --> 00:38:26,719 ¿qué responde a todas? ¿Quién lo entera? 560 00:38:26,719 --> 00:38:28,719 Ojalá, son 175 millones de pagamentos. 561 00:38:28,719 --> 00:38:32,719 Pues había aprendido cosas, de cierta manera lo has dicho, ¿vale? 562 00:38:32,719 --> 00:38:35,719 Obviamente, ahora con el modelo de ahora, el 4, pues, 563 00:38:35,719 --> 00:38:37,719 es una barbaridad. 564 00:38:37,719 --> 00:38:39,719 Menos de 4 billones de pagamentos, pero es una bestialidad. 565 00:38:40,719 --> 00:38:47,500 yo a nosotros les hemos probado y el grano para los modelos más más antiguos y es una 566 00:38:47,500 --> 00:38:53,300 barbaridad como cambiará pues no es capaz de obtener una respuesta óptima 567 00:38:58,760 --> 00:39:03,460 esto es un problema general porque porque hemos 568 00:39:03,460 --> 00:39:10,699 he dicho está para interpretar cosas que realmente no viste y bueno se basa nuevamente la generación 569 00:39:10,699 --> 00:39:15,539 de estos documentados en las historias y al final va generando texto de hecho una cosa que 570 00:39:15,539 --> 00:39:16,679 en los elementos 571 00:39:16,679 --> 00:39:18,599 ¿vale? 572 00:39:18,739 --> 00:39:19,260 cojando todos 573 00:39:19,260 --> 00:39:19,980 hay lo que es un JSON 574 00:39:19,980 --> 00:39:20,179 ¿no? 575 00:39:20,239 --> 00:39:20,920 y le doy un momento 576 00:39:20,920 --> 00:39:22,920 pues dado este JSON 577 00:39:22,920 --> 00:39:24,880 un JSON 578 00:39:24,880 --> 00:39:25,980 respuesta 579 00:39:25,980 --> 00:39:27,139 positiva o negativa 580 00:39:27,139 --> 00:39:28,440 yo le paso el ejemplo 581 00:39:28,440 --> 00:39:29,280 y le digo 582 00:39:29,280 --> 00:39:30,460 y le pongo un ejemplo 583 00:39:30,460 --> 00:39:31,280 el 584 00:39:31,280 --> 00:39:32,219 entonces 585 00:39:32,219 --> 00:39:33,960 el 586 00:39:33,960 --> 00:39:35,139 no me gusta la comida 587 00:39:35,139 --> 00:39:35,420 ¿vale? 588 00:39:35,579 --> 00:39:35,920 y le digo 589 00:39:35,920 --> 00:39:36,519 que respondeme 590 00:39:36,519 --> 00:39:37,400 en esta forma 591 00:39:37,400 --> 00:39:38,760 y yo le bajo un JSON 592 00:39:38,760 --> 00:39:39,659 y le digo 593 00:39:39,659 --> 00:39:40,659 si está 594 00:39:40,659 --> 00:39:41,360 si es positivo 595 00:39:41,360 --> 00:39:42,340 ponme la verdadera 596 00:39:42,340 --> 00:39:43,159 si es negativo 597 00:39:43,159 --> 00:39:43,840 ponme la negativa 598 00:39:43,840 --> 00:39:44,599 porque el modelo 599 00:39:44,599 --> 00:39:45,059 que responde 600 00:39:45,059 --> 00:40:15,039 esto es lo que se llama one shot con cualquier palabra, esto se llama one shot, que tú le das un ejemplito, vale, y es capaz de responder el mismo que tú le das, respondeme así, yo lo uso en el lápiz, para que tú lo veas con el lápiz, me gusta eso, súper cómodo, pues tú le dices, devuelve una pieza de informar, una pieza de informar, y tienes una pieza ahí y se me hace una pregunta, le pones un ejemplo o dos si quieres, siempre se utilizan los agentes, por ejemplo yo tengo una página web y yo le digo, quiero que mi página web responda a mi pregunta, 601 00:40:15,039 --> 00:40:21,039 a frases que tienen que ver con mi tienda. Y le pongo tres ejemplos. Y le pongo tres ejemplos negativos. 602 00:40:21,039 --> 00:40:27,039 Y le digo, si alguien me pregunta por... Este ejemplo lo he visto yo en Microsoft, ¿vale? 603 00:40:27,039 --> 00:40:34,039 Ellos lo meten en su tienda y alguien de ellos le pone el ejemplo de, si alguien te pregunta por productos de Zony, 604 00:40:34,039 --> 00:40:40,039 dice que no lo vende. Y en tiempo real, pues lo pasa. Y tú le preguntas, quiero comprar la pete. 605 00:40:40,039 --> 00:41:04,760 los modelos ahora ahora realmente 606 00:41:04,760 --> 00:41:07,300 casi lo que quieres en el momento 607 00:41:07,300 --> 00:41:10,320 funcionar funciona 608 00:41:10,320 --> 00:41:11,760 a ver, no es perfecto 609 00:41:11,760 --> 00:41:13,780 pero si se puede hacer 610 00:41:13,780 --> 00:41:15,079 ¿vale? 611 00:41:15,820 --> 00:41:17,260 entonces bueno, este es el modelo GPT original 612 00:41:17,260 --> 00:41:19,360 obviamente después 613 00:41:19,360 --> 00:41:21,099 la primera versión de GPT era 614 00:41:21,099 --> 00:41:23,880 2020 fue la primera versión 615 00:41:23,880 --> 00:41:24,380 de GPT 616 00:41:24,380 --> 00:41:27,119 y al final 617 00:41:27,119 --> 00:41:29,500 GPT-3 y GPT-4 es lo mismo pero más grande 618 00:41:29,500 --> 00:41:31,679 y mete muchos más parámetros 619 00:41:31,679 --> 00:41:32,579 y mucha más información 620 00:41:32,579 --> 00:41:35,380 y es capaz de experimentar 621 00:41:35,380 --> 00:41:37,679 luego por ejemplo 622 00:41:37,679 --> 00:41:40,619 si tú quieres hacer un panel de unicom 623 00:41:40,619 --> 00:41:41,159 puedes hacer 624 00:41:41,159 --> 00:41:44,860 una serie de documentos que el modelo no haya visto 625 00:41:44,860 --> 00:41:46,800 y 626 00:41:46,800 --> 00:41:49,139 se lo puedes 627 00:41:49,139 --> 00:41:49,920 entrenar 628 00:41:49,920 --> 00:41:52,380 ¿por qué? 629 00:41:52,460 --> 00:41:54,440 porque el modelo generaliza bien 630 00:41:54,440 --> 00:41:56,820 todo lo que tú quieras pero hay palabras que no conoces 631 00:41:56,820 --> 00:41:58,820 entonces te vas a dar palabras que no conoces 632 00:41:58,820 --> 00:42:00,039 y si hay palabras que no conoces 633 00:42:00,039 --> 00:42:01,940 pues lo que te hizo 634 00:42:01,940 --> 00:42:18,940 ¿Cómo funciona esto en inglés? Tú le has metido a los brutos textos en español, textos en inglés, textos en alemán, tú le metes todo ahí de golpe. 635 00:42:18,940 --> 00:42:25,920 no le están diciendo como activamente esto y esto es introducido 636 00:42:25,920 --> 00:42:29,179 todos los idiomas 637 00:42:29,179 --> 00:42:30,400 y esto para el nuevo futuro 638 00:42:30,400 --> 00:42:32,820 entonces 639 00:42:32,820 --> 00:42:34,239 es un idioma 640 00:42:34,239 --> 00:42:37,179 entonces 641 00:42:37,179 --> 00:42:39,900 esta parte ya es más 642 00:42:39,900 --> 00:42:42,380 vale, uno de los principales 643 00:42:42,380 --> 00:42:43,780 todo el mundo los conoce 644 00:42:43,780 --> 00:42:46,500 porque todo el mundo conoce este tipo de modelos 645 00:42:46,500 --> 00:42:48,619 entonces, este es el modelo que va a ir a definir 646 00:42:48,619 --> 00:42:49,860 entonces, este es como 647 00:42:49,860 --> 00:42:55,980 a lo que son inicialmente pero luego como hemos visto son capaces de producir porque 648 00:42:55,980 --> 00:43:01,920 al final tú le dices produce méxico y lo acaba traduciendo que al final hay que lo que puede 649 00:43:01,920 --> 00:43:09,719 pasar vamos a pensar porque la misma en urbana que dice el perro es la misma en urbana nacional 650 00:43:09,719 --> 00:43:16,360 que activa el perro es el perro que es lazy tendrá una urbana adelante que le diga que es cambiar luego el idioma 651 00:43:16,360 --> 00:43:20,920 pero realmente al final el conocimiento de la frase es la misma 652 00:43:20,920 --> 00:43:22,800 es el mismo concepto 653 00:43:22,800 --> 00:43:27,420 el resumen, esto es muy típico 654 00:43:27,420 --> 00:43:31,820 yo lo he probado mucho, cuando tienes un documento muy grande 655 00:43:31,820 --> 00:43:33,440 te lo pasas y le dices, hazme un resumen 656 00:43:33,440 --> 00:43:36,460 aquí hay una cosa que es importante 657 00:43:36,460 --> 00:43:39,219 el contexto 658 00:43:39,219 --> 00:43:44,059 esto tiene una limitación 659 00:43:44,059 --> 00:43:46,800 los modelos tú no los puedes meter 660 00:43:46,800 --> 00:43:48,159 toda la información del mundo 661 00:43:48,159 --> 00:43:49,599 tú cuando los entrenas 662 00:43:49,599 --> 00:43:51,440 los vas entrenando con cachitos 663 00:43:51,440 --> 00:43:52,980 tú le metes unos cachitos 664 00:43:52,980 --> 00:43:53,820 y le metes otros cachitos 665 00:43:53,820 --> 00:43:57,500 entonces tú cuando 666 00:43:57,500 --> 00:43:59,079 si tú le metes un cartel más o menos grande 667 00:43:59,079 --> 00:44:00,639 lo que va a hacer el modelo es cortar 668 00:44:00,639 --> 00:44:03,780 no sé si lo habéis visto 669 00:44:03,780 --> 00:44:04,940 pero le metes un texto muy grande 670 00:44:04,940 --> 00:44:07,420 al par de la información que se queda afuera 671 00:44:07,420 --> 00:44:08,039 porque no cabe 672 00:44:08,039 --> 00:44:10,079 como os he comentado 673 00:44:10,079 --> 00:44:11,760 tú no le vas a poner un bloque 674 00:44:11,760 --> 00:44:14,059 pero eso no significa 675 00:44:14,059 --> 00:44:15,199 que yo lo puedo meter 676 00:44:15,199 --> 00:44:16,440 todo el mundo 677 00:44:16,440 --> 00:44:16,780 porque 678 00:44:16,780 --> 00:44:17,699 a ver 679 00:44:17,699 --> 00:44:18,099 puedo hacer 680 00:44:18,099 --> 00:44:19,440 pero claro 681 00:44:19,440 --> 00:44:20,780 el modelo crece exponencialmente 682 00:44:20,780 --> 00:44:21,800 sabes 683 00:44:21,800 --> 00:44:23,059 tú puedes hacer un modelo 684 00:44:23,059 --> 00:44:24,139 de un millón de entradas 685 00:44:24,139 --> 00:44:24,900 o sea de un millón 686 00:44:24,900 --> 00:44:25,840 de palabras 687 00:44:25,840 --> 00:44:26,920 pero el modelo crece 688 00:44:26,920 --> 00:44:27,519 exponencialmente 689 00:44:27,519 --> 00:44:27,780 y todo 690 00:44:27,780 --> 00:44:29,900 aunque los últimos modelos 691 00:44:29,900 --> 00:44:30,920 son bastante grandes 692 00:44:30,920 --> 00:44:32,280 te puedes meter 693 00:44:32,280 --> 00:44:33,840 bastantes filas de palabras 694 00:44:33,840 --> 00:44:35,980 finales 695 00:44:35,980 --> 00:44:36,760 si tienes 696 00:44:36,760 --> 00:44:37,500 que te propenas 697 00:44:37,500 --> 00:44:38,440 y este tipo de gente 698 00:44:38,440 --> 00:44:39,019 pues tienes 699 00:44:39,019 --> 00:44:39,519 cosas 700 00:44:39,519 --> 00:44:41,400 tengo el dinero 701 00:44:41,400 --> 00:44:56,659 nosotros teníamos una base de datos 702 00:45:00,659 --> 00:45:05,960 las vacaciones 703 00:45:05,960 --> 00:45:19,699 va a ser capaz de buscar la información dentro de mi base de datos y va a poder recuperar a lo mejor 704 00:45:19,699 --> 00:45:30,440 en el texto no pone las vacaciones que le corresponde a un empleado puede disfrutar 705 00:45:30,440 --> 00:45:37,400 tantos días obviamente no es exactamente en un buscador que si no es la palabra 706 00:45:39,340 --> 00:45:45,699 ahora como obviamente sabemos que comprende el lenguaje pues es capaz de 707 00:45:45,699 --> 00:45:49,059 responder 708 00:45:49,059 --> 00:45:55,320 la información 709 00:45:59,619 --> 00:46:06,280 cuando yo quiero obtener 710 00:46:08,800 --> 00:46:09,400 una 711 00:46:09,400 --> 00:46:19,420 de esta palabra de este texto las a las personas 712 00:46:25,960 --> 00:46:33,840 a ver al final un charco de una estructura verás lo mismo solo voy a estar virtual 713 00:46:33,840 --> 00:46:43,079 es que tiene información previa por ejemplo tiene una empresa y tienen los datos de trabajador los 714 00:46:46,079 --> 00:46:47,960 y no conoce nada 715 00:46:49,480 --> 00:46:58,519 ahora mismo esto bueno pero todo esto es posible aquí vamos por si queréis decir algo 716 00:46:58,519 --> 00:47:05,480 si quieres preguntar lo que sea 717 00:47:07,340 --> 00:47:08,820 nadie 718 00:47:15,820 --> 00:47:22,519 la siguiente es la que comentó cosas de educación que puede ser 719 00:47:22,519 --> 00:47:27,079 y me interesa un poco también saber yo 720 00:47:27,079 --> 00:47:34,260 qué problemas hay en la educación 721 00:47:34,260 --> 00:47:44,280 todos estos modelos 722 00:47:44,280 --> 00:47:49,159 en mi hogar 723 00:47:50,739 --> 00:47:54,400 porque no sé cómo 724 00:47:54,400 --> 00:48:01,659 es 725 00:48:01,659 --> 00:48:14,099 muy fiable y que tiene un lenguaje periodístico que luego está 726 00:48:14,099 --> 00:48:19,619 muy bien para hacer artículos pero generar un artículo de tax claro si tú le metes el 727 00:48:19,619 --> 00:48:27,280 esto es 728 00:48:28,559 --> 00:48:42,380 aquí 729 00:48:42,380 --> 00:48:47,099 y 730 00:48:47,099 --> 00:48:53,280 utilizado 731 00:48:53,280 --> 00:48:58,039 que no han tenido este tipo de problemas 732 00:48:58,039 --> 00:49:18,340 ellos curan y perjuran de que han usado datos públicos, no lo saben, si esto pasa tampoco a mi me van a hacer mal, porque ellos necesitan un artículo que está digamos en público, entonces a mi probablemente no lo pueden hacer nada, yo puedo cambiar el modelo por otro 733 00:49:18,340 --> 00:49:25,500 Pero, por ejemplo, los datos pueden ser públicos y estar haciendo un scrapping que a lo mejor no está automatizado. 734 00:49:25,820 --> 00:49:27,019 Sí, de hecho eso lo hacen. 735 00:49:27,719 --> 00:49:28,840 Pero claro, eso no es lo que vamos a mostrar. 736 00:49:30,519 --> 00:49:34,019 Y el New York Times, yo me puedo creer como lo han picado. 737 00:49:34,820 --> 00:49:37,340 Porque al final de ellos lo que hacen es entrar en un modelo que detecta. 738 00:49:37,880 --> 00:49:42,659 Según lo que han cogido, han cogido un modelo para detectar que el modelo hace una escena de la cabeza. 739 00:49:42,659 --> 00:49:44,639 y detectas 740 00:49:44,639 --> 00:49:46,880 y le pasan los artículos 741 00:49:46,880 --> 00:49:48,500 de New York Times 742 00:49:48,500 --> 00:49:50,739 y le dicen 743 00:49:50,739 --> 00:49:52,260 ¿este artículo es de New York Times o no? 744 00:49:52,539 --> 00:49:54,139 y al final 745 00:49:54,139 --> 00:49:56,800 supongo que la van a descartar 746 00:49:56,800 --> 00:49:58,280 ¿no es serio? 747 00:49:59,059 --> 00:50:00,559 claro, realmente no lo sé 748 00:50:00,559 --> 00:50:03,099 porque realmente no se me ha detectado 749 00:50:03,099 --> 00:50:04,880 porque, o sea, no te va a dar la información 750 00:50:04,880 --> 00:50:07,000 es que va a perforar siempre 751 00:50:07,000 --> 00:50:08,440 que no nos va a dar 752 00:50:08,440 --> 00:50:11,559 también hay 753 00:50:11,559 --> 00:50:22,969 hay una vez por ejemplo que el otro día 754 00:50:22,969 --> 00:50:27,289 salió hace unas semanas 755 00:50:29,130 --> 00:50:33,250 tenemos un poco la imagen trabajo modelo 756 00:50:33,250 --> 00:50:46,869 el modelo previo ya ha modificado a nivel de píxeles que los humanos no ve si no ve 757 00:50:46,869 --> 00:50:51,989 y el modelo se sucia 758 00:50:56,989 --> 00:50:59,610 pero no sé cómo han hecho pero 759 00:50:59,610 --> 00:51:14,170 un castillo de imágenes de castillos que tiene esta red que envenena 760 00:51:14,170 --> 00:51:16,090 el resultado que le va a dar va a ser 761 00:51:16,090 --> 00:51:18,789 la calidad que 762 00:51:18,789 --> 00:51:19,809 al final, nice test 763 00:51:19,809 --> 00:51:23,280 sí, sí, o sea, pero con el EPS 764 00:51:23,280 --> 00:51:25,579 más difícil, porque tú el texto lo ves 765 00:51:25,579 --> 00:51:26,760 sí, cuando el texto 766 00:51:26,760 --> 00:51:28,219 es el plan 767 00:51:28,219 --> 00:51:29,900 puede venir 768 00:51:29,900 --> 00:51:32,480 y es un plan 769 00:51:32,480 --> 00:51:35,099 tú no puedes saber, por ejemplo, si eso ha entrado 770 00:51:35,099 --> 00:51:36,940 o no con unos datos, o sea, tú puedes pensar 771 00:51:36,940 --> 00:51:39,079 que la resta de un resultado parecido a lo que 772 00:51:39,079 --> 00:51:40,639 la resta es de una persona 773 00:51:40,639 --> 00:51:42,860 en realidad es un estilo con una persona 774 00:51:42,860 --> 00:51:44,960 tú no puedes decir realmente que este 775 00:51:44,960 --> 00:51:48,960 que este modelo ha aprendido de mí, o de ti. 776 00:51:48,960 --> 00:51:53,960 Si tú tienes una línea de distancia artificial que ve como el reverte, 777 00:51:53,960 --> 00:51:57,960 pues el reverte puede decir, esta línea de distancia artificial me está plagiando. 778 00:51:57,960 --> 00:52:00,960 Sí, entonces supongo que es el que yo le he mostrado antes. 779 00:52:00,960 --> 00:52:04,960 Bueno, no lo podemos notar porque hay herramientas para ese replacio 780 00:52:04,960 --> 00:52:07,960 que dice que esto lo he moverto más o menos un 90% 781 00:52:07,960 --> 00:52:09,960 Tiene que ir a la derecha. 782 00:52:09,960 --> 00:52:11,960 Tiene que ir a la derecha, pero bueno, así tú vas... 783 00:52:11,960 --> 00:52:20,059 hasta los modelos sentados para ti porque vas a decir que este modelo ha aprendido 784 00:52:20,059 --> 00:52:37,099 realmente no puede demostrar que si tienes una red que se diga que este 785 00:52:37,099 --> 00:52:41,559 este artículo está escrito por mí está realmente trae una respetada para que 786 00:52:41,559 --> 00:52:44,800 no sé a qué nivel puede demostrar 787 00:52:45,940 --> 00:52:51,960 pero no sé si no 788 00:52:51,960 --> 00:53:00,039 todavía 789 00:53:00,039 --> 00:53:13,519 para que no se descontrole 790 00:53:13,519 --> 00:53:19,719 a lo mejor lo que tengo que hacer primero es la legislación 791 00:53:19,719 --> 00:53:21,820 de duración del país 792 00:53:21,820 --> 00:53:25,119 y todo lo que se haga de esto 793 00:53:25,119 --> 00:53:27,400 en estos parámetros 794 00:53:27,400 --> 00:53:35,239 antes de enterrarlos pero seguramente las dos cosas 795 00:53:36,360 --> 00:53:46,000 esto 796 00:53:46,000 --> 00:53:50,480 de lo que dice la educación en España 797 00:53:50,480 --> 00:53:53,300 y que esto no... 798 00:53:53,300 --> 00:53:56,219 Sí, eso lo hacen, muchas veces 799 00:53:56,219 --> 00:53:57,360 han analizado las respuestas 800 00:53:57,360 --> 00:54:00,920 el resultado luego lo pasan por una vez 801 00:54:00,920 --> 00:54:03,139 que termina si es un resultado, digamos 802 00:54:03,139 --> 00:54:07,550 legal o no 803 00:54:07,550 --> 00:54:09,630 pero tú has enterado una respuesta que es clara 804 00:54:09,630 --> 00:54:11,489 ¿estás supervisado o no? 805 00:54:12,190 --> 00:54:13,590 esa parte sí que es supervisada 806 00:54:13,590 --> 00:54:15,989 pero el modelo grande 807 00:54:15,989 --> 00:54:20,190 son mitigaciones 808 00:54:20,190 --> 00:54:34,889 quiero un artículo de educación que hable de 809 00:54:34,889 --> 00:54:41,510 deporte a lo mejor la palabra deporte es un artículo de fútbol 810 00:54:41,510 --> 00:54:43,789 o solamente va a estar relacionado, entonces tú puedes 811 00:54:43,789 --> 00:54:45,650 coger artículos y los puedes 812 00:54:45,650 --> 00:54:47,989 contextualizar en una base de datos, entonces una persona 813 00:54:47,989 --> 00:54:49,650 te hace mirar los documentos 814 00:54:49,650 --> 00:54:51,929 únicamente le dices, yo te doy 815 00:54:51,929 --> 00:54:53,750 10 clases, como hemos visto, y le dices 816 00:54:53,750 --> 00:54:55,489 vale, ¿y este texto a qué clase te pertenece? 817 00:54:55,590 --> 00:54:57,449 un punto, un punto, el otro va a ser un punto 818 00:54:57,449 --> 00:54:59,329 y va a funcionar bastante bien 819 00:54:59,329 --> 00:55:01,949 vale, como se trata de multidioma, obviamente tú le metes 820 00:55:01,949 --> 00:55:04,429 le metes en inglés, le metes en español 821 00:55:04,429 --> 00:55:05,969 o alemán y 822 00:55:05,969 --> 00:55:07,010 va a ver si está funcionando 823 00:55:07,010 --> 00:55:09,190 la opción, son muy útiles para la opción 824 00:55:09,190 --> 00:55:15,809 al final como se ha dicho con el encoder de poder de transforme capaz de equilibrar las posiciones 825 00:55:15,809 --> 00:55:17,449 en el contenido 826 00:55:17,449 --> 00:55:18,289 por ejemplo 827 00:55:18,289 --> 00:55:19,050 genera ejercicio 828 00:55:19,050 --> 00:55:19,809 tú le das un texto 829 00:55:19,809 --> 00:55:20,750 de educación 830 00:55:20,750 --> 00:55:21,389 y le dices 831 00:55:21,389 --> 00:55:22,909 eh 832 00:55:22,909 --> 00:55:25,409 dime preguntas 833 00:55:25,409 --> 00:55:26,250 para este artículo 834 00:55:26,250 --> 00:55:26,869 en concreto 835 00:55:26,869 --> 00:55:27,989 mandas al niño 836 00:55:27,989 --> 00:55:28,510 le dices 837 00:55:28,510 --> 00:55:29,889 le mandas las preguntas 838 00:55:29,889 --> 00:55:30,789 en función de 839 00:55:30,789 --> 00:55:32,349 si no tienes que currar 840 00:55:32,349 --> 00:55:33,030 entonces 841 00:55:33,030 --> 00:55:33,530 en inglés 842 00:55:33,530 --> 00:55:34,469 a ver 843 00:55:34,469 --> 00:55:34,909 esto lo hace 844 00:55:34,909 --> 00:55:35,590 el niño 845 00:55:35,590 --> 00:55:35,889 claro 846 00:55:35,889 --> 00:55:36,909 claro 847 00:55:36,909 --> 00:55:38,230 lo vio 848 00:55:38,230 --> 00:55:39,929 con esto 849 00:55:39,929 --> 00:55:40,349 y no 850 00:55:40,349 --> 00:55:40,789 tú lo dices 851 00:55:40,789 --> 00:55:41,590 para generar ejercicio 852 00:55:41,590 --> 00:55:42,190 es que yo lo uso 853 00:55:42,190 --> 00:55:42,710 para el joven 854 00:55:42,710 --> 00:55:43,909 claro 855 00:55:43,909 --> 00:55:45,769 yo creo que 856 00:55:45,769 --> 00:55:53,389 la forma de valorar el esfuerzo que un alumno tiene que hacer para resolver una tarea 857 00:55:53,389 --> 00:56:02,090 pero 858 00:56:02,090 --> 00:56:14,650 resumen de síntesis 859 00:56:14,650 --> 00:56:19,269 eso con google maps 860 00:56:19,269 --> 00:56:23,909 yo que sepa 861 00:56:23,909 --> 00:56:25,429 yo pienso que cada vez nos volvemos tontos 862 00:56:25,429 --> 00:56:26,269 con este tipo de herramientas 863 00:56:26,269 --> 00:56:28,969 yo antes con google maps sabía considerar 864 00:56:28,969 --> 00:56:30,289 en cualquier momento que haya 865 00:56:30,289 --> 00:56:31,889 pero más o menos tiene una cierta orientación 866 00:56:31,889 --> 00:56:34,369 y ahora yo con google maps no sé ni ir a 867 00:56:34,369 --> 00:56:35,289 ¿cuál? 868 00:56:36,750 --> 00:56:38,789 eso es lo que yo creo que hay que revolucionar 869 00:56:38,789 --> 00:56:40,309 sí, pero vamos a ver cómo 870 00:56:40,309 --> 00:56:42,869 porque cada vez existe la herramienta 871 00:56:42,869 --> 00:56:43,989 a ver qué le haces, que no lo hago 872 00:56:43,989 --> 00:56:52,389 en este ámbito del sitio 873 00:56:52,389 --> 00:57:14,369 no sólo 874 00:57:14,369 --> 00:57:20,469 los tipos de contestas 875 00:57:20,469 --> 00:57:35,869 que yo pensaba 876 00:57:35,869 --> 00:57:46,469 todos hemos visto 877 00:57:46,469 --> 00:57:57,449 tenemos como hemos dicho como bien dicho los retos y monedales son los datos como entrenan 878 00:57:57,449 --> 00:58:02,369 los entrenamientos luego el modelo 879 00:58:02,369 --> 00:58:12,210 entonces 880 00:58:12,210 --> 00:58:33,699 el modelo 881 00:58:33,699 --> 00:58:37,519 todo lo que le ha dicho piensa que es correcto 882 00:58:37,519 --> 00:58:39,340 entonces él dice 883 00:58:39,340 --> 00:58:39,960 la siguiente palabra 884 00:58:39,960 --> 00:58:43,219 la siguiente palabra más probable es esa 885 00:58:43,219 --> 00:58:44,059 la siguiente palabra más probable 886 00:58:44,059 --> 00:58:47,500 ¿qué pasa? él no asume que la palabra que le ha dicho 887 00:58:47,500 --> 00:58:49,280 está mal, es como una persona 888 00:58:49,280 --> 00:58:50,840 yo voy hablando y digo 889 00:58:50,840 --> 00:58:51,820 me he equivocado, perdón 890 00:58:51,820 --> 00:58:53,559 como me ha pasado antes 891 00:58:53,559 --> 00:58:56,800 entonces él asume que todo lo que dice está bien 892 00:58:56,800 --> 00:58:59,079 entonces claro, hay un momento en que empieza a alucinar 893 00:58:59,079 --> 00:59:01,460 y empieza a decir 894 00:59:01,460 --> 00:59:02,099 última ocasión 895 00:59:02,099 --> 00:59:03,820 pero claro, si luego lo veis 896 00:59:03,820 --> 00:59:05,559 son divulgaciones por él 897 00:59:05,559 --> 00:59:08,000 o sea, que es un texto con que 898 00:59:08,000 --> 00:59:10,119 se le ha ido la olla, pero está bien 899 00:59:10,119 --> 00:59:11,000 está bien escrito 900 00:59:11,000 --> 00:59:14,260 ¿sabes? ese es el problema, porque él asume que lo ve y que está bien 901 00:59:14,260 --> 00:59:16,860 y pues vale 902 00:59:16,860 --> 00:59:19,139 de hecho 903 00:59:19,139 --> 00:59:21,579 eso pasa, por ejemplo 904 00:59:21,579 --> 00:59:23,000 de hecho, mira, hay un problema, por ejemplo 905 00:59:23,000 --> 00:59:24,280 que está entendiendo los funcionarios 906 00:59:24,280 --> 00:59:26,840 toda la gente, vale, él ha aprendido que 907 00:59:26,840 --> 00:59:28,900 el antiguo 908 00:59:28,900 --> 00:59:30,360 que es el otro día 909 00:59:30,360 --> 00:59:38,239 porque el aprendido que era antes 910 00:59:40,239 --> 00:59:43,559 yo le digo el nuevo de twitter es de los más 911 00:59:46,199 --> 00:59:53,980 y me sigue diciendo que es cuando yo le he dicho definitivamente que es su pasada 912 00:59:53,980 --> 01:00:04,539 muchas cosas hay una técnica que es coger una red y que luego salen la pregunta a otra vez un poco 913 01:00:04,539 --> 01:00:11,179 diferente y la pregunta es la primera y al final entiendan cómo es que son técnicas de 914 01:00:11,179 --> 01:00:16,800 porque todavía una mayor cantidad de páginas 915 01:00:16,800 --> 01:00:22,099 en medio de este corregido esta es la gracia 916 01:00:23,099 --> 01:00:44,960 seguro que en algún sitio de internet 917 01:00:46,800 --> 01:01:10,239 derivado de la primera parte que es la capa de atención que es la capa de acción 918 01:01:10,239 --> 01:01:19,300 de la cual está el valor están relacionados pues solamente tiene una razón muy directa en ese 919 01:01:19,300 --> 01:01:47,260 claro esto pasa mucho con gpt pero en los nuevos modelos no está sucediendo 920 01:01:49,300 --> 01:01:57,579 han creado unos modelos 921 01:01:58,619 --> 01:02:01,659 han hecho como os he dicho que cada capa 922 01:02:01,659 --> 01:02:08,559 y han cogido modelos que se especializan en cada una de las cosas 923 01:02:10,639 --> 01:02:13,699 de tal forma que hay modelos 924 01:02:13,699 --> 01:02:32,960 para que el trono en alguna de las cosas para que el trono sea mucho más relevante y no divague 925 01:02:32,960 --> 01:02:40,219 porque hay una capa que ha perdido mucho esa parte pero esta capa que no los modelos así 926 01:02:40,219 --> 01:02:46,780 se ha mitigado bastante bueno aquí con estos estallentados vamos aquí al final 927 01:02:46,780 --> 01:02:56,360 pues un segmento de datos 928 01:02:56,360 --> 01:03:08,239 que coges el modelo y lo reentrenas intentando mitigar 929 01:03:10,219 --> 01:03:18,260 más representativos y luego evaluar 930 01:03:18,260 --> 01:03:24,420 los datos 931 01:03:24,420 --> 01:03:33,539 sintéticos os he dicho al final yo puedo una palabra 932 01:03:33,539 --> 01:03:45,840 una organización y quitarle el nombre o al quitar una palabra y poner datos sintéticos para no meter 933 01:03:45,840 --> 01:03:55,500 datos datos sensibles para que no aprendas de estas cosas por ejemplo si tú quieres para un 934 01:03:55,500 --> 01:04:02,340 caso concreto de ya no preguntas y respuestas pero si tú lo quieres por ejemplo para que se 935 01:04:02,340 --> 01:04:07,619 resumas de estas cosas es muy útil lo único que quiere es que sepa lenguaje 936 01:04:10,079 --> 01:04:20,820 para evitar que asocien conocimientos y luego alucinación a ver hay una parte muy fácil 937 01:04:20,820 --> 01:04:28,880 el modelo y luego reentrenarlo para cada una de las encuestas como se ha dicho 938 01:04:30,880 --> 01:04:37,059 este es el contexto y este es el resumen 939 01:04:39,320 --> 01:04:44,699 obviamente el modelo no hace modelo digamos estoy jugando para que 940 01:04:44,699 --> 01:05:01,860 pero estoy quitando la continuación porque lo he 941 01:05:01,860 --> 01:05:08,800 para que se fijen mucho en el contexto y resumen con esto es muy útil para las 942 01:05:08,800 --> 01:05:15,179 solucionaciones caso concreto de que querrán tarea muy específica esto funciona muy bien 943 01:05:15,179 --> 01:05:20,179 otra cosa que se ha comentado aplicaciones y ejemplos pues yo te pongo un ejemplo 944 01:05:20,179 --> 01:05:36,079 en teoría se hace este es el twitter responde con esta pregunta yo tengo muchos ejemplos para 945 01:05:36,079 --> 01:05:41,639 que tú estás después a lo que yo quiero y se fijan mucho en lo que no lo que él sabe sino 946 01:05:41,639 --> 01:05:46,519 lo que lo que yo estoy metiendo en el contexto con esto me lleva bastante las funciones que 947 01:05:46,519 --> 01:05:54,539 en general pero para casos muy concretos y que se te funcionan 948 01:05:56,019 --> 01:06:04,199 en la conclusión como al final esto es un mundo abierto entonces hay que comprender los límites 949 01:06:04,199 --> 01:06:25,519 y luego una variación de la privacidad y luego estos modelos tienen que ser más adaptables y 950 01:06:25,519 --> 01:06:31,960 continuamente están haciendo al final lo que hacen es 951 01:06:34,199 --> 01:06:36,460 cabellos más grandes, más grandes, más grandes 952 01:06:36,460 --> 01:06:38,159 vale 953 01:06:38,159 --> 01:06:39,599 y ya está