La IA generativa

La inteligencia artificial generativa se convirtió en una de las tecnologías más impactantes y prometedoras de los últimos años, debido a que ha experimentado avances revolucionarios que cambiaron la forma en que interactuamos con la tecnología en nuestra vida cotidiana.

Esta tecnología ha abierto las puertas a desarrollos que van desde asistentes virtuales que responden a nuestras preguntas, hasta sistemas de traducción automática. La inteligencia artificial generativa se ha convertido en una fuerza poderosa en el mundo actual.

Primero debemos comprender qué es. Este tipo de inteligencia artificial (IA) hace referencia a la creación de contenido como imágenes, textos, audio y video. Los resultados obtenidos son gracias a los grandes modelos de IA, ya que estos realizan varias tareas simultáneamente para generar el contenido antes mencionado; incluso a estos se les puede aplicar un proceso de preparación para adaptarlos a casos específicos. Además de generar contenido, la IA es capaz de incrementar la calidad de las imágenes, editar videos, aumentar conjuntos de datos y más; en fin, tiene muchas aplicaciones.

Al igual que cualquier otro tipo de IA, la generativa se basa en modelos de machine learning que se entrenan con un gran volumen de datos. Una de las clases de los modelos de IA generativa son los GPT, llamados comúnmente modelos de lenguaje de gran tamaño; como lo dice su nombre, se especializan en tareas relacionadas con el lenguaje. Dado que tienen una gran cantidad de parámetros, sus capacidades de adaptabilidad son muy elevadas, por lo que es posible personalizarles el modelo con el entrenamiento adecuado. Generalmente estos modelos suelen ser entrenados con miles de millones de parámetros; esto permite que los modelos puedan tener contexto de las entradas que se les dan para generar respuestas con base en el contexto.

EL PODER DE LA INTELIGENCIA ARTIFICIAL GENERATIVA Y EL PASADO QUE LO SOÑÓ
ChatGPT es una de las aplicaciones de la IA generativa y pertenece a los modelos de lenguaje. Como podemos ver, la IA está cada vez más presente en nuestras vidas y, según Goldman Sachs, podría impulsar un aumento del 7 % del PIB mundial, así como también llegar a tener un impacto en la productividad incrementando 1.5 puntos porcentuales en un periodo de 10 años. Gracias a las características que posee este tipo de inteligencia, se pueden reinventar la mayoría delas experiencias de usuarios creando aplicaciones capaces de ayudar a las personas a aumentar su nivel de productividad.

Esta tecnología abre nuevas posibilidades en diversos sectores, como en el desarrollo de software, donde se pueden usar aplicaciones impulsadas por modelos de generación de código como CodeWhisper o Copilot; otro sector es el financiero, en el cual es posible implementar chatbots impulsados por IA generativa.

Crear máquinas inteligentes no es reciente, se remonta a la época de la Segunda Guerra Mundial, cuando los científicos comenzaron a idear algoritmos y a debatir las posibilidades de que las computadoras fueran inteligentes. Para que la inteligencia artificial generativa haya llegado hasta este punto fue necesario un proceso de evolución y maduración tecnológica. A fin de comprender cómo llegó hasta lo que aplicamos hoy en día, podemos comenzar por los precursores de la IA. En el año 1936, R. A. Fisher, uno de los padres de la estadística moderna, propuso un método para la clasificación de muestras de flores que podía pertenecer a dos clases. Lo que planteó Fisher es un ejemplo temprano de lo que se conoce actualmente como aprendizaje supervisado, y lo que busca este enfoque es crear un clasificador óptimo identificando los parámetros que separan las clases. Este trabajo ayudó a sentar las bases de las técnicas de aprendizaje automático moderno.

Al mismo tiempo que Fisher desarrollaba su método, se empezaron a generar las ideas que más tarde llevaron a la aparición de la primera computadora. En el mismo año, Alan Turing, padre de las ciencias de la computación, presentó su artículo más influyente, donde define la Máquina de Turing. Este concepto fue revolucionario, ya que permitía realizar cualquier cálculo por medio de un programa.

A pesar de que la idea de IA ya había sido trabajada y propuesta por Alan Turing, no fue sino hasta 1956 que nació la IA en una conferencia de verano en el Dartmouth College. En 1943, el neurólogo W. McCulloch y el lógico W.Pitts propusieron un modelo matemático que simulaba una neurona; este constaba de varias entradas y salidas. Años más tarde, F. Rosenblatt le dio el nombre de Perceptrón y propuso un algoritmo en el que la neurona se actualizaba de manera iterativa convirtiéndolo en un clasificador óptimo. De esta forma, era posible entrenar la neurona para diferenciar entre dos clases que podían ser linealmente separables. Este algoritmo fue de inspiración para las redes neuronales artificiales, puesto que estas permiten la interconexión de varias neuronas para poder realizar clasificaciones. Pese a esta motivación, en 1969, Marvin Minsky y Seymour Papert demostraron que el Perceptrón no podía aprender funciones lógicas complejas; esto detuvo el desarrollo de las redes neuronales artificiales por más de una década.

Hasta 1980 se reanudaron las investigaciones de las redes neuronales artificiales, año en el que Rumelhart, Hinton y Williams mostraron que podían solucionar el problema que se había planteado anteriormente creando capas de neuronas. Asimismo, introdujeron el concepto de backpropagation, que trataba de minimizar el error al clasificar por medio de la actualización de las capas. Con las redes neuronales multicapa se abrieron nuevas posibilidades; simultáneamente, se hacían más descubrimientos de la neurociencia que mostraban la estructura multicapa en el cerebro.

En ese mismo año destacaron desarrollos como el Neocognitron de Kunihiko Fukushima, el cual trataba de una red neuronal inspirada en la corteza visual con el fin de detectar caracteres escritos a mano; este desarrollo fue la primera red neuronal convolucional.

Tiempo después, Yann LeCun propuso configurar con varias capas de red neuronal convolucional a través del método de backpropagation. Al implementar esto, se alcanzaron resultados que llegaban a superar los obtenidos por humanos en el reconocimiento de caracteres manuscritos.

En la década de 1990 se consiguieron grandes avances para la IA, tales como la construcción de carros robots automáticos, artefactos domésticos impulsados por técnicas de inteligencia artificial como

Furby y AIBO, programas como el proyecto COG de Brooks, Stein y Breazeal, en el cual se propusieron crear un robot humanoide para explorar la integración entre la percepción, el aprendizaje y la acción de máquinas inteligentes, entre otros.

LO QUE ES Y LO QUE SIGUE
Aunque se hicieron intentos previos para aplicar la IA, no fue hasta el siglo 21 que finalmente se comenzó a implementar para resolver problemas. Esto se debe a que, a partir de aquí, hubo mayor disponibilidad de volúmenes de datos extensos y hardware económico con poder de cálculo. Gracias a esto se vieron avances clave para la evolución de la IA.

La introducción de grandes redes neuronales artificiales con cientos de capas dio origen a la arquitectura deep learning, que dio frutos en el lenguaje natural y el reconocimiento de imágenes. Este tipo de arquitecturas aprenden de los datos de entrenamiento ajustando las neuronas desde las primeras capas lo que permite que estas se encarguen de detectar patrones elementales, mientras que las finales aprenden a identificar patrones más complejos.

En vista de la implementación de redes neuronales en GPUs, en 2014, Ian Goodfellow y sus colegas in-
trodujeron las Generative Adversarial Nets (GAN), que eran capaces de sintetizar artificialmente datos nuevos extrayendo las características esenciales de los datos de entrenamiento para poder generar resultados similares. En 2016, Deep Mind, empresa perteneciente a Google, desarrolló un sistema con IA para jugar GO y logró vencer al campeón mundial de aquel tiempo.

Con esto nos podemos dar una idea de cómo la IA supera en ciertos aspectos la cognición del ser humano.

EL CLUB DE INTELIGENCIA DE LA UDEM
La evolución de esta tecnología ha llegado hasta lo que conocemos como inteligencia artificial generativa. Aquí en la UDEM, recientemente se abrió el Club de Inteligencia Artificial (CIAA), donde se fomentan diferentes proyectos que, por medio de la IA, atienden las necesidades de diversos entornos.

Personalmente formo parte de un proyecto enfocado en desarrollar un chat impulsado por inteligencia artificial generativa para asistir a los estudiantes de la universidad en la página del CIAA. El proyecto ya se encuentra en etapa de desarrollo. Para esto formamos un grupo de seis integrantes divididos en tres roles: los que se encargan de la parte gráfica de la aplicación, los que tienen en sus manos la parte del servidor y las conexiones, y por último, los que entrenan los modelos de inteligencia artificial.

Este proyecto es uno de muchos ejemplos de las formas en que se está aplicando la inteligencia artificial generativa en la UDEM. En este caso lo estamos enfocando a mejorar las experiencias de los estudiantes, pero podría ser aplicado de muchas maneras.

El CIAA de la UDEM presenta una oportunidad con mucho potencial que puede brindar innovaciones a la
institución; sobre todo con los crecientes cambios en la IA se abren las puertas a ideas que pueden trans-
formar la experiencia en la UDEM.