OpenAI presentó hoy una versión mejorada de su herramienta de conversión de texto a imagen, DALL-E, que utiliza ChatGPT, el chatbot viral de IA de OpenAI, para aliviar parte del dolor de las indicaciones.
Actualmente, la mayoría de las herramientas de generación de imágenes de vanguardia basadas en inteligencia artificial toman indicaciones (descripciones de imágenes) y las convierten en obras de arte en una variedad de estilos, que van desde el fotorrealista hasta el fantástico. Pero elaborar el mensaje correcto puede ser un desafío, hasta el punto de que la “ingeniería rápida” se está convirtiendo en una auténtica profesión.
La nueva herramienta de OpenAI, DALL-E 3, utiliza ChatGPT para ayudar a completar las solicitudes. A través de ChatGPT, los suscriptores de los planes ChatGPT premium de OpenAI, ChatGPT Plus y ChatGPT Enterprise, pueden escribir una solicitud de imagen y perfeccionarla a través de conversaciones con el chatbot, recibiendo los resultados directamente dentro de la aplicación de chat.
ChatGPT tomará un mensaje de tan solo unas pocas palabras y lo hará más descriptivo, brindando más orientación para el modelo DALL-E 3.
La integración de ChatGPT no es la única novedad de DALL-E 3. DALL-E 3 también genera imágenes de mayor calidad que reflejan con mayor precisión las indicaciones, dice OpenAI, especialmente cuando se trata de indicaciones más largas. Y maneja mejor el contenido que históricamente ha tropezado con los modelos de generación de imágenes, como el texto y las manos humanas.
Una imagen generada por DALL-E 3. Créditos de imagen: AbiertoAI
Más allá de esto, DALL-E 3 tiene nuevos mecanismos para reducir el sesgo algorítmico y mejorar la seguridad, o eso dice OpenAI. Por ejemplo, DALL-E 3 rechazará solicitudes que soliciten una imagen al estilo de artistas vivos o que representen figuras públicas. Y los artistas ahora pueden optar por no utilizar ciertas (o todas) sus obras de arte para entrenar generaciones futuras de modelos de conversión de texto a imagen de OpenAI. (OpenAI, junto con algunos de sus rivales, se enfrenta a una demanda por supuestamente utilizar el trabajo protegido por derechos de autor de los artistas para entrenar sus modelos de imágenes generativas de IA).
El lanzamiento de DALL-E 3 se produce cuando la carrera de la IA generativa se intensifica, particularmente en el dominio de la síntesis de imágenes. Competidores como Midjourney y Stability AI continúan perfeccionando sus modelos de generación de imágenes, presionando a OpenAI para que se mantenga al día.
OpenAI planea implementar DALL-E 3 para usuarios premium de ChatGPT en octubre, seguido de laboratorios de investigación y sus clientes de API. La compañía no dijo cuándo (o si) planea lanzar una herramienta web gratuita, como lo hizo con DALL-E 2 y el modelo DALL-E original.
Source link