Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

Curso IA programamos.es -- cómo entienden el texto los ordenadores - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 27 de marzo de 2024 por David G.

58 visualizaciones

Descargar la transcripción

Como ya sabemos, los ordenadores solo pueden trabajar con números, y sin embargo, existen sistemas informáticos que son capaces de entender nuestros textos. 00:00:00
¿Esto cómo ocurre? 00:00:08
Lo que se utiliza es un mecanismo para traducir palabras o frases a una representación numérica que se conoce como embeddings. 00:00:10
Como Romea Jeremy Howard en su libro Aplicaciones de IA sin tener un doctorado, 00:00:17
a la comunidad de inteligencia artificial les gusta a veces utilizar nombres un poco pomposos para conceptos que en realidad son muy simples. 00:00:22
Y con los embeddings pasa un poco esto. Veamos cómo se construyen. 00:00:30
Imaginemos que estamos en esta situación en la que ya se ha asignado una representación numérica a un conjunto de palabras, utilizando dos números. 00:00:34
¿Dónde colocaríamos la palabra manzana? 00:00:42
Cerca de la posición A hay varios objetos redondos. Cerca de la B hay palabras que tienen que ver con construcciones. 00:00:45
Pero en la posición C tendríamos la palabra manzana cerca de otras relacionadas con frutas. 00:00:53
Esta sería una buena localización, puesto que el objetivo de los embeddings es que palabras 00:00:58
similares se correspondan con puntos cercanos, y palabras que son diferentes se correspondan 00:01:02
con puntos lejanos. 00:01:07
Veamos otro ejemplo. 00:01:09
Supongamos que ya hemos asignado la representación numérica a las palabras perro, cachorro y 00:01:11
ternera. 00:01:17
¿Dónde colocaríamos la palabra vaca? 00:01:18
Las tres posiciones podrían tener cierto sentido, pero si la colocamos en la posición 00:01:20
C estaríamos capturando algunas relaciones entre las palabras, que es precisamente otro 00:01:25
de los objetivos de los embeddings. En este caso estaríamos capturando dos analogías. 00:01:30
Por un lado, cachorro es a perro, lo que ternera es a vaca. Y por otro, cachorro es a ternera, 00:01:36
lo que perro es a vaca. Así, este embedding estaría capturando dos propiedades de las 00:01:42
palabras, edad y tamaño. Y básicamente estos son los embeddings. Lo que ocurre es que los 00:01:49
que utilizamos en aplicaciones reales tienen cientos o miles de dimensiones, es 00:01:54
decir, que una palabra se traduce a un vector de cientos o miles de números. 00:01:58
Como detallamos en el artículo asociado a este vídeo, estos embeddings permiten 00:02:04
realizar visualizaciones y actividades en clase que son muy interesantes y que 00:02:08
podrían ser el equivalente del siglo XXI a aprender a explorar un diccionario. 00:02:13
Pero estos embeddings de palabras tienen ciertas limitaciones a la hora de 00:02:19
reconocer frases, puesto que una misma palabra puede significar cosas diferentes en función del 00:02:22
contexto. Afortunadamente, desde que nacieron los transformers con su mecanismo de atención que 00:02:28
permite entender el contexto, ya contamos también con embeddings que son capaces de asignar una 00:02:34
representación numérica a frases completas de manera coherente. Así, podemos ver que la frase 00:02:39
nada me gusta más que el baloncesto está más cerca semánticamente de me encanta el baloncesto 00:02:45
que la frase me encanta el fútbol, a pesar de que estas dos últimas comparten más palabras 00:02:51
iguales. E incluso ya existen embeddings de frases multilingües en los que frases que 00:02:56
significan lo mismo en diferentes idiomas reciben una representación numérica cercana. 00:03:02
Como veremos en próximas entregas, estos embeddings de palabras y frases son la base 00:03:07
de los grandes modelos de lenguaje como GPT-3 y Bloom. Pero mientras llegamos a ello, no 00:03:12
No dejes de jugar con los desafíos y retos que te proponemos en nuestra web, ya que te 00:03:17
van a permitir interactuar de manera directa con el funcionamiento interno de muchos de 00:03:22
los sistemas de inteligencia artificial que utilizamos a diario. 00:03:26
Idioma/s:
es
Autor/es:
programamos.es
Subido por:
David G.
Licencia:
Reconocimiento
Visualizaciones:
58
Fecha:
27 de marzo de 2024 - 12:16
Visibilidad:
Público
Centro:
IES MARIE CURIE Loeches
Duración:
03′ 30″
Relación de aspecto:
1.78:1
Resolución:
1280x720 píxeles
Tamaño:
10.72 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid