1 00:00:00,520 --> 00:00:04,740 El aquí está como tema de mi proyecto porque me interesaba aprender más acerca de la programación 2 00:00:04,740 --> 00:00:10,779 y de la inteligencia artificial, sobre todo de los usos que puede tener en Internet y en el mundo de la difusión de información. 3 00:00:11,539 --> 00:00:15,400 Voy a comenzar hablando un poco de la historia, cuyos inicios se remontan a 1950, 4 00:00:16,120 --> 00:00:20,179 cuando el matemático Alan Turing publicó su artículo Conflict in Machinery and Intelligence, 5 00:00:20,339 --> 00:00:23,839 en el que hablaba acerca de la posibilidad de crear máquinas inteligentes. 6 00:00:24,399 --> 00:00:28,839 Aunque yo acredito que puede considerarse el inicio de la inteligencia artificial, es la conferencia de Darwin. 7 00:00:28,839 --> 00:00:34,240 en 1956, cuando numerosos matemáticos se reunieron para discutir las posibilidades 8 00:00:34,240 --> 00:00:38,240 de crear máquinas inteligentes. Este también fue el lugar en que se le acuñó el término 9 00:00:38,240 --> 00:00:43,219 inteligencia artificial. Voy a continuar hablando un poco acerca de la suplantación de identidad, 10 00:00:43,679 --> 00:00:47,179 que es la suplantación de identidad, que es la propagación indebida de la identidad 11 00:00:47,179 --> 00:00:51,960 de otra persona para beneficiarse de uno mismo o para perjudicar a otro. El Código Penal 12 00:00:51,960 --> 00:00:56,320 hace una distinción entre suplantación en línea o suplantación física, y actualmente 13 00:00:56,320 --> 00:01:00,700 existen numerosas formas de suplantar la identidad. Yo voy a tratar tres de las más comunes, 14 00:01:00,780 --> 00:01:05,319 que son FISIC, hacerse pasar por una entidad de confianza para mandar mensajes o correos 15 00:01:05,319 --> 00:01:10,739 y robar la información personal. FARAMIC, que consiste en suplantar, en crear una página 16 00:01:10,739 --> 00:01:14,120 web igual a la original, para engañar a los usuarios y que estos pongan su información 17 00:01:14,120 --> 00:01:18,719 personal. Y por último, suplantación en redes, hacerse pasar por otra persona en redes 18 00:01:18,719 --> 00:01:23,959 sociales para dañar su imagen. Ahora bien, ¿qué es la inteligencia artificial? La inteligencia 19 00:01:23,959 --> 00:01:28,060 artificial es el término acuñado de las tecnologías que son capaces de simular la inteligencia 20 00:01:28,060 --> 00:01:32,739 humana, es decir, resolver problemas, tomar decisiones y aprender de las experiencias. 21 00:01:33,420 --> 00:01:37,140 Estas tecnologías se fundamentan en el Machine Learning, que son algoritmos que son capaces 22 00:01:37,140 --> 00:01:41,659 de aprender por ellos mismos. Existen numerosas formas de Machine Learning, pero yo voy a 23 00:01:41,659 --> 00:01:47,400 hablar de cinco en concreto. Aprendizaje supervisado. Consiste en que el aprendizaje supervisado 24 00:01:47,400 --> 00:01:53,219 utiliza datos etiquetados, es decir, los patrones que se deben encontrar ya se conocen. 25 00:01:53,879 --> 00:01:56,959 Aprendizaje no supervisado. Los datos no están etiquetados. 26 00:01:57,379 --> 00:02:00,459 Este es un sistema muy útil cuando se quiere analizar grandes bases de datos. 27 00:02:01,260 --> 00:02:03,519 A continuación, aprendizaje autosupervisado. 28 00:02:05,299 --> 00:02:10,439 En este, este es muy útil cuando la cantidad de datos necesarios etiquetados puede llegar a ser prohibitiva. 29 00:02:10,960 --> 00:02:14,360 Por ende, lo que se hace es que coge primero una pequeña muestra que el sistema etiquetará, 30 00:02:14,740 --> 00:02:17,580 para posteriormente usarla para aprender con el resto de datos. 31 00:02:18,360 --> 00:02:22,819 Y aprendizaje por refuerzo. Este es una tecnología que utiliza un sistema de recompensa. 32 00:02:23,219 --> 00:02:27,560 donde el sistema es premiado si se obtiene el resultado esperado y castigado si no. 33 00:02:27,860 --> 00:02:32,280 Una vez terminado, hará los cambios necesarios para reducir el error que pueda tener. 34 00:02:33,400 --> 00:02:34,960 También existe el deep learning. 35 00:02:35,159 --> 00:02:39,759 El deep learning es una tecnología que lo que pretende es replicar el funcionamiento del cerebro humano. 36 00:02:40,280 --> 00:02:44,400 Concretamente, cómo la información se altera a medida que pasa a través de las neuronas. 37 00:02:45,080 --> 00:02:51,020 Esto lo consigo utilizando las redes neuronales, las cuales están formadas por neuronas que se alumbran en capas. 38 00:02:51,020 --> 00:02:55,360 Como mínimo, un sistema debe tener dos capas, una de entrada y una de salida. 39 00:02:55,800 --> 00:03:01,780 Aunque el añadir capas intermedias puede hacer que el sistema encuentre patrones más complejos o estratos. 40 00:03:02,800 --> 00:03:04,000 Pero, ¿cómo funciona? 41 00:03:04,439 --> 00:03:13,560 La información es mandada para las capas de entrada, donde las neuronas van a hacer una predicción. 42 00:03:13,939 --> 00:03:20,120 Esta información pasa a las siguientes capas, donde cada neurona recibe la información de varias neuronas anteriores. 43 00:03:20,120 --> 00:03:26,360 En estas se va a realizar una suma ponderada y esto es porque a cada neurona le corresponde un peso o una importancia. 44 00:03:26,780 --> 00:03:29,139 Este proceso se repite hasta obtener un valor final. 45 00:03:30,800 --> 00:03:39,000 Ahora bien, mi parte práctica consiste en una inteligencia artificial que fuera capaz de diferenciar entre tres cosas que ha escrito un ser humano con una inteligencia artificial. 46 00:03:39,620 --> 00:03:48,960 Para ello se desarrolló en un tiempo aproximado de un mes, donde la mayoría de los días se usaron para aprender y los últimos tres para desarrollar la inteligencia artificial en sí. 47 00:03:49,939 --> 00:03:53,520 El código es demasiado largo, así que simplemente lo iré explicando parte por parte. 48 00:03:54,180 --> 00:03:56,099 Comenzando con las primeras siete líneas. 49 00:03:56,580 --> 00:04:03,240 Estas sirven para importar librerías al código, es decir, código ya escrito que yo puedo usar utilizando palabras clave. 50 00:04:03,939 --> 00:04:05,960 También se puede entender como fórmulas vacías. 51 00:04:06,860 --> 00:04:12,740 Continuando con las líneas 9 a la 23, sirven para comprobar si existe una base de datos en el sistema. 52 00:04:13,460 --> 00:04:16,980 Si no existe, ésta la creará y añadirá en él las siguientes muestras, 53 00:04:17,480 --> 00:04:20,160 las cuales usará posteriormente para aprender. 54 00:04:21,379 --> 00:04:25,980 Las siguientes cuatro líneas sirven para convertir las palabras que hay en la base de datos en números. 55 00:04:26,420 --> 00:04:28,980 Esto facilita trabajar con ellos. 56 00:04:29,660 --> 00:04:34,720 También la va a dividir en un 80% que va a usar para aprender y un 20% que va a usar para verificar la información. 57 00:04:35,939 --> 00:04:38,680 Estas dos líneas son las que utiliza el sistema para aprender de verdad 58 00:04:38,680 --> 00:04:41,199 y se conocen como algoritmos de Naive-Pandis. 59 00:04:41,360 --> 00:04:46,740 Naive del inglés ingenuo porque este sistema no tiene en cuenta la relación que existe entre las palabras en una oración. 60 00:04:46,980 --> 00:04:51,660 Esta fue una tecnología revolucionaria en el campo del procesamiento del lenguaje natural. 61 00:04:52,300 --> 00:04:57,000 Y Valles, porque utiliza el sistema de Valles, el cual nos dice la probabilidad de que un texto pertenezca a una clase 62 00:04:57,000 --> 00:04:59,319 dependiendo de las palabras que haya en este mismo. 63 00:05:00,519 --> 00:05:03,759 Las siguientes tres líneas sirven para medir la precisión del módulo. 64 00:05:04,839 --> 00:05:10,399 Y la parte final del código es la siguiente, y esta la que hace es pedirnos que añadamos un texto 65 00:05:10,399 --> 00:05:14,540 sobre el cual haga una predicción y después nos preguntará si es correcta o no. 66 00:05:14,540 --> 00:05:20,100 Una vez lo corrijamos, añadirá esta información a la base de datos para usarla en posteriores predicciones. 67 00:05:22,860 --> 00:05:28,199 Se continuó con una fase experimental en la que se comparó mi inteligencia artificial con esa GPT. 68 00:05:28,600 --> 00:05:31,500 Se pidió que analizara 20 textos. 69 00:05:32,040 --> 00:05:39,779 Se realizaron dos pruebas individuales y luego una tercera en la que mi inteligencia artificial y esa GPT analizaron los mismos 20 textos. 70 00:05:40,519 --> 00:05:48,120 Los resultados obtenidos son que la precisión de mi teoría, que el porcentaje de acción de mi inteligencia artificial fue de un 60, 75 y 70%. 71 00:05:48,120 --> 00:05:56,120 La CBT obtuvo un 95 y se equivocó únicamente en la siguiente frase, la cual lo escribió una inteligencia artificial pero pensaba que era humana. 72 00:05:57,720 --> 00:06:06,459 Viendo estos resultados, son los esperados. Mi inteligencia artificial contaba con únicamente 350 muestras en el momento de hacer las pruebas. 73 00:06:07,339 --> 00:06:12,279 También los algoritmos elegidos no son los más eficaces para este tipo de tareas. 74 00:06:13,060 --> 00:06:18,819 Dado todo esto, podemos observar que mi inteligencia artificial fue mejorando el porcentaje de acierto a medida que avanzaron las pruebas. 75 00:06:19,519 --> 00:06:27,100 Y también se detectó un patrón, y es que los errores que cometió fue en textos en ciberinteligencia artificial y pensado que eran nuevos. 76 00:06:27,579 --> 00:06:30,220 Dado todo esto, se podría considerar que fue un fracaso. 77 00:06:30,220 --> 00:06:32,240 que fue un fracaso, pero como he comentado 78 00:06:32,240 --> 00:06:34,259 al principio de la exposición, mi objetivo era aprender 79 00:06:34,259 --> 00:06:36,660 más acerca de la programación y la informática 80 00:06:36,660 --> 00:06:38,519 y al acabar el proyecto 81 00:06:38,519 --> 00:06:40,060 el sentimiento ha sido bastante positivo 82 00:06:40,060 --> 00:06:42,560 entonces para acabar intentaré resolver vuestras preguntas