Google volverá a permitir la creación de imágenes utilizando la inteligencia artificial de Gemini. Después de la controversia causada por representaciones erróneas, como un monarca inglés con piel negra o nazis de origen asiático, la compañía había retirado su herramienta generativa en febrero. Sin embargo, tras varios meses de ajustes y pruebas, Gemini regresa, prometiendo generar imágenes fotorrealistas de personas a partir de descripciones de texto.
El gigante tecnológico ha confirmado una actualización significativa para sus modelos de lenguaje, que incluye la capacidad de generar imágenes mediante Imagen 3. Presentado durante la conferencia I/O 2024, Imagen 3 es un nuevo modelo diseñado para crear imágenes realistas a partir de instrucciones textuales. Los usuarios solo necesitan introducir una descripción (prompt), similar a cómo se interactúa con Gemini o ChatGPT.
Imagen 3 emplea lenguaje natural, permitiendo a los usuarios escribir descripciones tan detalladas como deseen. Aunque Google mostró los avances de este modelo durante su conferencia para desarrolladores, no se ha confirmado una fecha de lanzamiento específica. La buena noticia es que esta herramienta estará disponible para todos los usuarios.
«En una código 404lia gama de pruebas, Imagen 3 ha demostrado un rendimiento superior en comparación con otros modelos de generación de imágenes», afirmó Dave Citron, director de Gestión de Productos para Gemini. «Al igual que con Imagen 2, estamos utilizando SynthID, nuestra herramienta para marcar imágenes generadas por IA.»
Medio de comunicación masivo, en formato digital, que permite comunicar noticias recientes o temas de actualidad e interés público. Estamos enfocados especialmente en la región sur de la República Dominicana.