Vuelven los technobits después de la inactividad del verano que sólo rompimos para el tradicional análisis del Hype Cycle 2022. Precisamente de un par de las tecnologías presentes en este Hype Cycle hablaremos hoy, Generative Design IA y Foundation Models y de que quizá están más avanzadas de lo que Gartner dice.
De esto hablamos en este technobits de Capital Radio con Luis Vicente Muñoz:
Sin duda, uno de los temas de los que hemos hablado más últimamente en este blog es de la Inteligencia Artificial. Y lo cierto es que muchas veces lo hemos hecho para hablar de su lado más oscuro, cómo cuando hablamos de LaMDA, una máquina diseñada para engañar a las personas y hacerles pensar que hablan con otra persona y no una máquina.
Pero LaMDA es también un prodigio de la tecnología, y un buen ejemplo de eso que llama Gartner Foundation Models y que están protagonizando una revolución, aún silenciosa, de áreas de conocimiento que hasta hace poco considerábamos exclusivas de los humanos.
Hace poco el New York Times publicaba un artículo titulado «We Need to Talk About How Good A.I. Is Getting» en el que se habla de todo esto. El argumento principal es que vivimos una especie de «verano de la IA» después de una primavera en el que se ha invertido mucho en IA y que ahora estamos recogiendo sus frutos. Por cierto, primavera que vino después de un duro invierno.
El artículo da algunas recomendaciones para llegar a una visión pragmática y realista de la realidad de la IA, lejos del optimismo desbocado de los tecnófilos, pero también lejos de los distópicos. Me parece muy interesante la petición que hace a las empresas que están desarrollando estas tecnologías para ser más transparentes.
Precisamente, sólo empezamos a oír hablar de LaMDA cuando uno de sus desarrolladores decidió contratarle un abogado para su protección. Pero también es cierto que recientemente, y a medida que algunos de estos sistemas han madurado, sus desarrolladores han empezado a dejar que un mayor número de usuarios lo utilicen.
Antes de hablar de algunos de estos ejemplos, conviene hablar de uno de los sistemas más «veteranos» del grupo, DeepMind ha seguido iterando sus Alpha que ya no sólo juegan al StartCraft o al Go, en su versión AlphaFold ha sido capaz de predecir la estructura en tres dimensiones de las 200 millones de proteínas conocidas, algo que se los biólogos moleculares llevaban décadas haciendo una a una.
Y qué decir también de GPT-3 o CoPilot. GPT-3 está ya escribiendo libros completos, en muchos casos colaborando con humanos (entrando en la categoría de Generative Design AI). Y CoPilot (por cierto, basado en GPT-3) está ayudando a centenares de miles de programadores a escribir código en GitHub.
Pero este verano, la protagonista ha sido Dall-e. Si ya nos sorprendieron sus sillas-aguacate, este verano cuando OpenAI abrió su beta a un millón de usuarios, las redes sociales se llenaron con sus creaciones. Cierto es que una gran mayoría de la gente se dedicó a poco más que jugar con Dall-e, pero hay gente que consiguió dibujos muy interesantes. Aquí hay algunos muy chulos, pero en el propio artículo del NYT hay algunos espectaculares.
Hay que recordar que en este paso de abrir Dall-e a tantos usuarios, OpenAI ha abierto también el uso comercial de las imágenes generadas. Esto, que es muy interesante y que abre además las puertas una colaboración entre máquinas y personas más intensa, creo que puede tener unas implicaciones enormes en el mundo de los derechos de autor.
No soy experto, pero leyendo artículos cómo este o este, está claro que estamos ante un momento que definirá el futuro de los derechos de autor y que va a exigir grandes cambios en las normas actuales.
Intentando resumir, partimos de la base de que OpenAI está cediendo los derechos de explotación de las imágenes, pero no los derechos de autor. Esto probablemente se deba a que en muchas partes del mundo, las imágenes generadas por una IA no tienen derechos de autor y se consideran de domino público. Además, Dall-e funciona de dos maneras, una en la que tú a través de texto, describes el dibujo que quieres y el sistema lo genera automáticamente en base a su aprendizaje, y otra en la que tú subes una imagen y le pides al sistema que la retoque. Ahí hay otro potencial problema, si subes una imagen con derechos de autor y la retocas, OpenAI no quiere ninguna responsabilidad sobre eso.
Hilando más fino, tú le puedes pedir a Dall-e que dibuje una escena utilizando Legos, o en el universo de la Guerra de las Galaxias. ¿Qué pasa con esos derechos de autor? Es probable que las compañías propietarias de esos derechos tuvieran algo que decir en el caso de que una imagen generara mucho dinero… o mucha atención.
Pero aún más complicado es el tema del plagio. Dall-e, cómo todas las IA de este tipo, han aprendido viendo millones y millones de imágenes. Muchas de ellas con derechos de autor. Cuándo le dices a Dall-e que dibuje una escena con el estilo de Van Gogh puede hacerlo porque ha visto y analizado todos sus cuadros y su estilo. El caso de Van Gogh es menos problemático, ¿pero qué pasa con un artista vivo? Y aún peor, al haber aprendido viendo imágenes de multitud de artistas, puede que en algún caso determinado el sistema elija el estilo de uno en particular para «dibujar» una petición. ¿Podríamos hablar entonces de plagio?
Aquí hay un interesante artículo sobre el tema, y la visión diferente de dos artistas «plagiados». En uno de los casos Dall-e ha incluso imitado la firma del autor.
What makes this AI different is that it’s explicitly trained on current working artists. You can see below that the AI generated image(left) even tried to recreate the artist’s logo of the artist it ripped off.
This thing wants our jobs, its actively anti-artist. pic.twitter.com/4zXDeaIUzw
— RJ Palmer (@arvalis) August 14, 2022
Por cierto, todo lo dicho hasta ahora sobre imágenes, es también aplicable a modelos que escriben, y también hay casos de potenciales plagios (y errores).
Lo que está claro es que efectivamente, a pesar también del lado oscuro de la IA, y también de las áreas dónde está un poco atascada, hay actividades en las que está brillando de forma clara y abriendo oportunidades inimaginables hace poco. Sin embargo, también está abriendo melones muy serios, y este de los derechos de autor lo es. Que las máquinas aprendan a dibujar o a escribir puede quitar trabajo a los artistas, pero parece que de momento dará más trabajo a los abogados.
@resbla