La revoluci贸n de nuestros tiempos
El lanzamiento de ChatGPT-3, en noviembre de 2022, catapult贸 a las inteligencias artificiales al tope de las discusiones sobre el futuro del arte, el trabajo y la sociedad en general. En paralelo, estableci贸 una carrera entre las diferentes empresas de tecnolog铆a por superar las expectativas de los usuarios, en una aceleraci贸n que acerca ese futuro, a煤n bajo an谩lisis, a pasos agigantados.
Por Luis Cabrera
Para cuando esta revista llegue a sus manos, al menos parte del contenido de esta nota estará desactualizado. Un ejercicio frustrante para cualquier redactor, pero una prueba fehaciente de la velocidad de la revolución tecnológica que la inteligencia artificial (IA) está viviendo en estos momentos, desde que se transformara en tema de discusión de las masas en noviembre de 2022, con el lanzamiento de ChatGPT-3. A modo de ejemplo, esa versión del famoso sistema de chat ya se vio reemplazada, en pocos meses y en pleno apogeo, por ChatGPT-4.
La explosión de ChatGPT, que permite mantener conversaciones con una AI capaz de elaborar complejos textos que responden, en la mayoría de los casos, de manera más que adecuada a las preguntas que se le realiza, dejó boquiabiertos a millones de usuarios del mundo entero.
La tecnología en cuestión es una AI generativa, una red neuronal compleja, de múltiples niveles o capas, que fue entrenada utilizando billones de datos -texto en el caso de ChatGPT, imágenes en el caso de otras como Midjourney- hasta ser capaz de elaborar contenidos nuevos dentro del lenguaje aprendido. La AI lee las oraciones, aprende sus palabras, la posición que ocupan en el texto y traduce todo a números que pasan a formar parte de sus algoritmos. ChatGPT-4 es tan potente que hará obsoletos a los buscadores tradicionales, como Google.
Las redes sociales se han visto inundadas de ejemplos de brillantes diálogos -y otros no tanto- con chatbots, los cuales con facilidad podrían pasar el Test de Turing. También de fantásticas imágenes creadas por una computadora a partir de diferentes indicaciones (prompts); incluso algunas resultan tan reales que se necesita mucha agudeza para detectarlas como falsas. Es una experiencia lúdica, de sorpresa y descubrimiento, que por su accesibilidad, ha cautivado al mundo entero.
«El mayor logro que hizo ChatGPT es poner la tecnología a disposición de cualquiera con una conexión a internet», afirma Federico Lecumberry, profesor asociado en Procesamiento de Señales y Aprendizaje Automático en el Departamento de Ingeniería Eléctrica de la Facultad de Ingeniería. «Esto es algo que vengo estudiando desde hace 25 años; a veces nos miramos entre los colegas y no podemos creer que estamos de moda».
No es casualidad, subraya Lecumberry, que la popularidad y la aceleración de la tecnología se esté dando ahora. Si miramos solamente un elemento, la cantidad de datos (el dataset) que se requiere para entrenar a la IA, era necesario contar con las tecnologías de almacenamiento y transmisión de datos actuales. «El desarrollo del hardware ha ido acompañando el desarrollo de los fundamentos matemáticos y de ingeniería detrás de estos modelos de aprendizaje automático», explica. «Es un momento donde se dan todas las cosas».
El negocio de las IA La aceleración que la tecnología vive en estos años no disminuirá; es una «carrera de armas», como la llamó el New York Times, porque detrás hay un negocio millonario: según Grand View Research, el mercado de la IA se valoró en 136.550 millones de dólares en 2022 y se prevé que se expanda a una tasa de crecimiento anual compuesta del 37,3% hasta 2030.
Empresas como OpenAI, que está detrás de ChatGPT y Dall-E, o Midjourney, creadora de la homónima AI generadora de imágenes, han visto su valor multiplicarse. OpenAI dobló su valor de mercado en el último año hasta alcanzar los 29.000 millones de dólares.
Midjourney funciona bajo un modelo de suscripción: los usuarios, que deben tener una cuenta en la plataforma de chat Discord, pueden realizar una cantidad limitada de creaciones de manera gratuita. Luego deberán elegir entre tres planes, que van de los 10 a los 60 dólares al mes.
La versión básica de ChatGPT, en cambio, se puede usar de manera gratuita. OpenAI, que nació como una empresa sin fines de lucro, genera ganancias de diferentes maneras, entre ellas ofreciendo los servicios de sus AI más avanzadas a terceros.
Junto a estos dos referentes, gigantes como Meta, Google, Amazon y Apple, luego de años de trabajar en machine learning para sus asistentes y otros servicios, hoy desarrollan sus propios proyectos de IA generativas. Lo mismo hacen miles de pequeñas empresas que se han visto impulsadas por el momento que vive la tecnología.
«Todo este impacto es positivo porque nos lleva como sociedad a hablar de temas relacionados a la tecnología que van de fondo, porque es hablar del sesgo en la inteligencia artificial, de la protección de los datos y de su impacto en el trabajo», afirma Lecumberry.
Los sesgos de los datos
La tecnología no es perfecta, y si bien ya ha sido puesta a prueba, por ejemplo, por estudiantes acorralados por la fecha de entrega de su tesis, los errores son importantes: las imágenes generadas por IA, aunque han mejorado, aún pueden tener elementos extraños -manos, dientes o dedos extras, por ejemplo-, mientras que los textos «artificiales» muchas veces desinforman con gran seguridad en sus palabras. «ChatGPT es muy bueno, pero lo que sabe es estructurar el texto; el contenido puede estar mal», explica Lecumberry. «Eso puede mejorar, pero siempre debe haber un humano dando el feedback. Es una colaboración».
Bastante más preocupante es el uso de IA en otras áreas de la vida: en materia de salud, la tecnología ya está ayudando a la detección temprana de enfermedades y su diagnóstico salvará vidas, pero ¿qué ocurre si se le utiliza para administrar las camas de un hospital o un CTI? O, como ya ocurre, para filtrar qué CVs llegan al potencial empleador o evaluar a quién se le entrega un crédito bancario.
«Ese tipo de sistema ¿cómo llega a sus decisiones?», pregunta Lecumberry. «Te da una respuesta, pero debemos examinar cómo llegó a esa decisión. No es tan sencillo saberlo por la cantidad de parámetros que tienen estos sistema. Otra pregunta es con qué certidumbre llega a esas respuestas».
Es aquí que los sesgos introducidos durante el entrenamiento, mediante ese dataset que forma parte de su aprendizaje, juegan un papel fundamental: «Hay un caso famoso de una investigadora afrodescendiente cuya cara no era detectada por un sistema de detección de rostros, hasta que se puso una máscara blanca», recuerda Lecumberry.
«Hay discriminación en cómo son entrenados los sistemas. Según lo que le enseñemos, así trabajará. Igual a una persona», afirma el profesor.
El futuro del trabajo
En materia de trabajo, esta revolución se parece mucho a las anteriores: algunos trabajos desaparecerán y otros, que aún no imaginamos, serán creados por la presencia de la inteligencia artificial. «La revolución industrial planteó un desafío para el trabajo. También lo hizo la pandemia. El trabajo ante toda revolución tecnológica debe adaptarse», comenta Lecumberry.
«La tecnología y los sistemas pueden solucionar cosas tediosas o trabajos hasta peligrosos. También hay que invertir en la reconversión laboral y en formaciones de calidad. Las carreras deben mantenerse y valerse de estas herramientas. Son ayudas que debemos aceptar».
Si bien el profesor advierte sobre lo significativo de los cambios que se avecinan -«estos son procesos que implican cambios sociales grandes, por ejemplo en materia de seguridad social»- no puede dejar de ser optimista sobre el futuro de la IA: «Estando en el área que estoy, no podría ser otra cosa», afirma.
DAVID HOLZ, EL HOMBRE DETRÁS DE MIDJOURNEY
Es sencillo crear una IA generativa que sea capaz de elaborar imágenes de alta calidad a partir de textos. La demanda de tiempo y trabajo para elaborar la compleja arquitectura de la inteligencia artificial es el primer desafío; acceder a millones de imágenes para alimentar su algoritmo puede ser aún más difícil. Por eso es que el éxito de MidJourney, creada por un laboratorio compuesto por diez personas, es tan llamativo. Al frente del proyecto está David Holz, quien se define como un «emprendedor serial». Cuando cursaba liceo en Florida (EEUU), ya tenía un negocio de diseño. Estudió Matemáticas en la universidad y preparaba su doctorado en Mecánica de Fluidos mientras trabajaba en el Centro de Investigación Langley, de la NASA, y el Instituto Max Planck de Florida. «Me abrumé en un momento y dejé todas esas cosas a un lado», comentó en una entrevista con The Verge en 2022. Se mudó a San Francisco, donde abrió la empresa Leap Motion en 2011.
Estuvo más de diez años al frente de la compañía, que vendía un poderoso hardware de captura de movimiento, antes de volver a dejar todo para fundar MidJourney. Pese a su pequeño tamaño, el laboratorio se propuso trabajar en múltiples proyectos, si bien hoy es sinónimo de la IA creadora de imágenes, un éxito inmediato desde su beta pública en julio de 2022. Por supuesto, la popularidad trajo aparejada la polémica: lo difícil de conseguir las millones de imágenes necesarias para entrenar la AI está en hacerlo sin infringir el derecho de autor de terceros. «No hay forma de obtener cien millones de imágenes y saber de dónde proceden», afirmaba Holz en otra nota a Forbes de 2022, esta a Forbes. «No hay forma de encontrar una imagen en Internet, rastrearla automáticamente hasta su propietario y hacer algo para autentificarla».
Sobre la otra polémica, el impacto de AIs como Midjourney en el trabajo de artistas visuales, Holz responde con una mirada humanista: «Nos gusta decir que estamos tratando de expandir los poderes imaginativos de la especie humana. El objetivo es hacer que los humanos sean más imaginativos, no hacer máquinas imaginativas, lo que creo que es una distinción importante», afirmó.
Esa mirada llevó a que Midjourney se lanzara dentro de la plataforma de Discord, como una construcción comunitaria: «Las personas quieren hacer cosas de manera comunitaria», explicó Holz. En marzo se actualizó a la version 5 de la IA, y comenzó a publicarse una revista impresa mensual, porque les parecía «que sería divertido».
Hay mucho de lúdico, de juego y exploración, en Holz y su trabajo, por eso en la tapa de nuestra actual edición, utilizamos la IA para, a partir de una foto actual, crear al CEO de Midjourney de niño. Es David Holz por David Holz.
«No estamos bajo presión para vender algo o ser una empresa pública», explicó él sobre el futuro de su laboratorio. «Se trata simplemente de tener un hogar durante los próximos 10 años para trabajar en proyectos geniales que sean importantes, con suerte no solo para mí, sino para el mundo. Y para divertirme».
BREVE GLOSARIO SOBRE INTELIGENCIA ARTIFICIAL
AI GENERATIVA
El tipo de inteligencia artificial en boga, que crea contenidos nuevos -ya sean textos imágenes o videos-, sin intervención humana, mediante algoritmos alimentados por billones de datos (fotos, libros, etc) introducidos en su entrenamiento. Es la tecnología detrás de Midjourney, ChatGPT, Dall-E y muchos otras.
MACHINE LEARNING
En uso desde hace varios años, el aprendizaje automático es una categoría muy amplia de elementos que, a la vez, es englobado por el concepto de AI. Como todo, posee un alto nivel de complejidad, pero se puede entender como el proceso que permite a un sistema tecnológico reconocer patrones, aprender sobre ellos y realizar predicciones basadas en datos.
DEEP LEARNING
Una de las principales técnicas de aprendizaje automático. La información que ingresa pasa por múltiples «capas» de redes neuronales, generando un modelo no lineal muy complejo, más cercano al funcionamiento del cerebro humano. Es capaz de funcionar con una gigantesca cantidad de datos sin sufrir significativamente en su performance.
DEEP REINFORCEMENT LEARNING
Una técnica en la IA se entrenan mediante prueba y error. El humano puede encargarse de ofrecer la recompensa y guiar a la IA en el camino correcto. Se le ha utilizado para enseñar a jugar al ajedrez (Deep Blue), el go (AlphaGo) o, más recientemente, el Atari Breakout (DeepMind). También se utiliza mucho en la robótica.
LARGE SCALE LANGUAGE MODELS
Conocidos como LLM, estos modelos de redes neuronales han sido entrenados con una gran cantidad de datos buscando aprender y poder reproducir el lenguaje en el que se especializan. Los LLM (o LVM, si trabajan con imágenes) están detrás de los chatbots y tecnologías similares. Son la pieza clave del negocio de empresas como OpenAI, que vende paquetes de suscripción a potentes versioens de esta tecnología, cuyo precio varía según la cantidad de palabras que pueden producir.
TRANSFORMER
La T en Chat GPT. Un tipo de arquitectura que facilita la comprensión de lenguajes. El transformer le permite a la red neuronal aprender el contexto y el significado de una oración mediante el análisis de las relaciones de las palabras, que no son otra cosa que datos secuenciales. Transforma las oraciones en diferentes vectores -uno sobre la secuencia de palabras, otro sobre las posiciones de las mismasy luego pasa esta información a representaciones numéricas para que sean procesadas por la red.
KHIPU: INTELIGENCIA ARTIFICIAL DESDE LATINOAMÉRICA PARA LATINOAMÉRICA
La Facultad de Ingeniería recibió del 6 al 10 de marzo la cuarta edición de Khipu, un evento internacional que busca fortalecer los lazos en la materia de inteligencia artificial (IA) y machine learning dentro de América Latina. «Khipu como organización tiene tres objetivos: dar formación de la más alta calidad en el área de IA a los estudiantes avanzados en materias cuantitativas; crear comunidad latinoamericana en esta área, porque estamos muy desconectados; y crear consciencia de las capacidades que tiene la IA para el desarrollo general en la región», detalló Federico Lecumberry, profesor asociado de la Udelar.
El evento cuenta con un excelente nivel de clases y conferencias, y casi todos los países de la región están representados entre sus participantes. «La idea de Khipu es inteligencia artificlal desde Latinoamerica para Latinoamerica», subraya el profesor uruguayo. «Obviamente que aprendemos de afuera y generamos conocimiento para el mundo, pero muchas de las aplicaciones que nos motivan están relacionadas con lo local».
Khipu 2023 dedicó sus primeros tres días a una escuela de verano en la que se trabajó sobre fundamentos de machine learning y deep learning, para luego profundizar en redes generativas y LLMs, entre otros. Los dos días siguientes se enfocaron en conferencias, que incluyeron charlas dictadas por profesores latinoamericanos y otros referentes internacionales invitados. El cierre se realizó en el Teatro Solís, con charlas de divulgación abiertas al público. «Tuvimos el apoyo de la banda No Te Va a Gustar, lo que fue fantástico», agregó Lecumberry.
Khipu también organizó el evento «Mujeres en la IA», que busca darle visibilidad al rol de la mujer en la materia. «La Facultad de Ingeniería ha hecho un trabajo muy fuerte en esa dirección, como es el caso del movimiento Chicas TIC, que apunta a visualizar que el género no tiene que ver con la profesión». Pese a que se promueve el acercamiento de las mujeres al área de las STEM (por sus siglas en inglés: ciencia, tecnología, ingeniería y matemáticas), se trata de una problemática general en el mundo.
A nivel regional, otro desafío está dado por la falta de presupuesto y la dificultad de retener los recursos humanos: «No se le puede pagar a los profesionales para competir con las ofertas de empresas internacionales», señaló Lecumberry. «Es algo que se sabe desde hace años: hay falta de mano de obra especializada en ingeniería, especialmente en estas áreas, que tiene desempleo negativo»