Activa JavaScript para disfrutar de los vídeos de la Mediateca.
Curso IA programamos.es -- cómo entienden el texto los ordenadores - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Como ya sabemos, los ordenadores solo pueden trabajar con números, y sin embargo, existen sistemas informáticos que son capaces de entender nuestros textos.
00:00:00
¿Esto cómo ocurre?
00:00:08
Lo que se utiliza es un mecanismo para traducir palabras o frases a una representación numérica que se conoce como embeddings.
00:00:10
Como Romea Jeremy Howard en su libro Aplicaciones de IA sin tener un doctorado,
00:00:17
a la comunidad de inteligencia artificial les gusta a veces utilizar nombres un poco pomposos para conceptos que en realidad son muy simples.
00:00:22
Y con los embeddings pasa un poco esto. Veamos cómo se construyen.
00:00:30
Imaginemos que estamos en esta situación en la que ya se ha asignado una representación numérica a un conjunto de palabras, utilizando dos números.
00:00:34
¿Dónde colocaríamos la palabra manzana?
00:00:42
Cerca de la posición A hay varios objetos redondos. Cerca de la B hay palabras que tienen que ver con construcciones.
00:00:45
Pero en la posición C tendríamos la palabra manzana cerca de otras relacionadas con frutas.
00:00:53
Esta sería una buena localización, puesto que el objetivo de los embeddings es que palabras
00:00:58
similares se correspondan con puntos cercanos, y palabras que son diferentes se correspondan
00:01:02
con puntos lejanos.
00:01:07
Veamos otro ejemplo.
00:01:09
Supongamos que ya hemos asignado la representación numérica a las palabras perro, cachorro y
00:01:11
ternera.
00:01:17
¿Dónde colocaríamos la palabra vaca?
00:01:18
Las tres posiciones podrían tener cierto sentido, pero si la colocamos en la posición
00:01:20
C estaríamos capturando algunas relaciones entre las palabras, que es precisamente otro
00:01:25
de los objetivos de los embeddings. En este caso estaríamos capturando dos analogías.
00:01:30
Por un lado, cachorro es a perro, lo que ternera es a vaca. Y por otro, cachorro es a ternera,
00:01:36
lo que perro es a vaca. Así, este embedding estaría capturando dos propiedades de las
00:01:42
palabras, edad y tamaño. Y básicamente estos son los embeddings. Lo que ocurre es que los
00:01:49
que utilizamos en aplicaciones reales tienen cientos o miles de dimensiones, es
00:01:54
decir, que una palabra se traduce a un vector de cientos o miles de números.
00:01:58
Como detallamos en el artículo asociado a este vídeo, estos embeddings permiten
00:02:04
realizar visualizaciones y actividades en clase que son muy interesantes y que
00:02:08
podrían ser el equivalente del siglo XXI a aprender a explorar un diccionario.
00:02:13
Pero estos embeddings de palabras tienen ciertas limitaciones a la hora de
00:02:19
reconocer frases, puesto que una misma palabra puede significar cosas diferentes en función del
00:02:22
contexto. Afortunadamente, desde que nacieron los transformers con su mecanismo de atención que
00:02:28
permite entender el contexto, ya contamos también con embeddings que son capaces de asignar una
00:02:34
representación numérica a frases completas de manera coherente. Así, podemos ver que la frase
00:02:39
nada me gusta más que el baloncesto está más cerca semánticamente de me encanta el baloncesto
00:02:45
que la frase me encanta el fútbol, a pesar de que estas dos últimas comparten más palabras
00:02:51
iguales. E incluso ya existen embeddings de frases multilingües en los que frases que
00:02:56
significan lo mismo en diferentes idiomas reciben una representación numérica cercana.
00:03:02
Como veremos en próximas entregas, estos embeddings de palabras y frases son la base
00:03:07
de los grandes modelos de lenguaje como GPT-3 y Bloom. Pero mientras llegamos a ello, no
00:03:12
No dejes de jugar con los desafíos y retos que te proponemos en nuestra web, ya que te
00:03:17
van a permitir interactuar de manera directa con el funcionamiento interno de muchos de
00:03:22
los sistemas de inteligencia artificial que utilizamos a diario.
00:03:26
- Idioma/s:
- Autor/es:
- programamos.es
- Subido por:
- David G.
- Licencia:
- Reconocimiento
- Visualizaciones:
- 58
- Fecha:
- 27 de marzo de 2024 - 12:16
- Visibilidad:
- Público
- Centro:
- IES MARIE CURIE Loeches
- Duración:
- 03′ 30″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1280x720 píxeles
- Tamaño:
- 10.72 MBytes