Ciencia 

DALLE-E 2: La nueva IA que permite crear cualquier foto a partir de una frase

  • Esta IA es capaz de crear imágenes nuevas o a partir de otras ya existentes
  • Aprende los conceptos y luego establece relaciones entre ellos

DALL-E 2 es la nueva tecnología de inteligencia artificial (IA) desarrollada por la compañía estadounidense Open AI´s que te permite crear cualquier imagen, existente o nueva, a partir de una frase.

La IA es una de las tecnologías en la que más invierten las compañías, la posibilidad de crear que un sistema sea capaz de pensar y actuar lo más parecido a una persona nos abriría un enorme abanico de posibilidades. Son muchos los que prueban cosas nuevas, sin embargo, no todos los proyectos salen hacía delante, de hecho, esta misma compañía sacó en enero de 2021 DALLE-E, la versión anterior de la IA que estamos hablando hoy.

Y es que el primer proyecto estuvo bien, pero no alcanzó los niveles esperados por lo que la compañía ha continuado desarrollando su IA para llegar a DALLE-E 2. Esta IA puede crear imágenes realistas y originales al igual que obras de arte, a partir de cero o tomando otra obra como ejemplo. Lo más destacado es que crea las imágenes tomando la frase que el usuario le da, es decir le pides «Un perro con gafas de sol conduciendo un coche» y la IA crea su interpretación de esa imagen.

La IA puede combinar palabras, conceptos, atributos y hasta estilos que le han enseñado para crear una imagen que nunca ha existido antes, al igual que es capaz de editar, eliminar o añadir cosas a una imagen ya existente, en ambos casos ofrecer una imagen de alta resolución. La IA ha sido entrenada a partir de imágenes acompañadas de un texto con su descripción, pero no solo entiende lo que es cada objeto, sino que también establece las relaciones entre estos.

Por ejemplo, la IA sabe lo que es un oso panda y también sabe lo que es patinar sobre hielo, y sabe qué hace cada cosa, por lo que si le pides un oso panda patinando sobre hielo, aunque no exista ese concepto como tal comprende las funciones de cada uno y genera una imagen.

Gracias a esta tecnología se podrá crear imágenes que antes parecían imposibles o que simplemente una persona por sí sola no podía crear, también si DALLE-E 2 es capaz de generar algo que le hemos pedido demuestra que la IA es capaz de entendernos.

Aunque como es lógico, DALLE-E 2 tiene sus limitaciones. Todo lo que sabe la IA es porque alguien se lo ha enseñado, por lo que, si se le enseña un concepto mal, cada vez que lo necesite para crear una imagen lo hará erróneamente, al igual que tiene brechas de conceptos que todavía no ha aprendido.

Aunque esto lo suple con su capacidad de interpretación, por lo que a pesar de que no conozca un concepto, puede hilar otros que sí sabe para ofrecer una imagen final lo más cercana a lo que se ha pedido. Por el momento esta tecnología no estará al alcance de todos, ya que la compañía está estudiando cómo evitar que se utilice la IA para un uso indebido, empezando por capar la posibilidad de crear imágenes que muestren violencia, odio y contenido sexual.

Compartir:

Entradas relacionadas