[theme-my-login default_action="register" show_links="0"]

¿Perdiste tu contrseña? Ingresa tu correo electrónico. Recibirás un correo para crear una nueva contrseña.

[theme-my-login default_action="lostpassword" show_links="0"]

Regresar

Cerrar

Publicidad

Ciencia & Tec

Parti: el nuevo modelo autorregresivo de Google capaz de generar imágenes fotorrealistas a partir de textos


IMAGEN y Parti son “complementarios”, ya que cada uno explora “dos familias diferentes de modelos generativos: de difusión y autorregresivos, respectivamente”.

foto-articulo-Ciencia & Tec

Google ha presentado Pathways Autoregressive Text-to-Image model (Parti), un modelo autorregresivo que genera imágenes fotorrealistas a partir de textos gracias a modelos avanzados de lenguaje.

La tecnológica presentó a finales de mayo IMAGEN, un modelo basado en Inteligencia Artificial (IA) capaz de crear imágenes de gran realismo a partir de breves descripciones de texto. Ahora es el turno de Parti, que Google introduce en su propio sitio web.

IMAGEN y Parti son “complementarios”, según la compañía de Mountain View. Cada uno explora “dos familias diferentes de modelos generativos: de difusión y autorregresivos, respectivamente”.

La materia prima de Parti son las secuencias de tokens de imágenes, en lugar de tokens de texto formulados en otro lenguaje. Utiliza el ‘tokenizador’ de imágenes ViT-VQGAN, que entrena para codificar las imágenes en forma de secuencias de tokens.

Los investigadores han probado en el proceso de codificación y decodificación con cuatro escalados distintos de parámetros: 350 millones, 750 millones, 3.000 millones y 20.000 millones. A mayor número de parámetros, mayor fidelidad al texto.

Finalmente, ViT-VQGAN reconstruye la imagen al ‘destokenizar’ las secuencias de tokens como si de piezas de puzle se trataran.

Un abanico de más de 1 mil 600 indicaciones en inglés

Los creadores de Parti destacan que este tipo de herramientas son “más interesantes” cuando permite “crear escenas nunca vistas”. A este propósito ayuda que Parti sea capaz de gestionar indicaciones “largas y complejas” que le exigen reflejar, entre otros, su “preciso conocimiento del mundo”, además de componer imágenes que incluyen la interacción de varios objetos y participantes y la capacidad de aderirse a un formato y estilo específico.

Para cumplir estos objetivos, los investigadores han creado PartiPromts (P2), un abanico de más de 1.600 indicaciones en inglés que puede ser utilizado para medir las capacidades de Parti.

Las indicaciones que P2 proporciona pueden ser tanto simples como complejas. Esto permite a los expertos medir el progreso de su herramienta con descripciones de hasta 67 palabras.

Te puede interesar:

Agencias
Las mejores agencias de noticias desplegadas por todo el mundo, reportando los hechos para elPeriódico.

Publicidad


Esto te puede interesar

noticia Redacción/elPeriódico
Pilotos de transporte pesado anuncian paro el próximo lunes
noticia AFP
Oposición pide condicionar posible acuerdo energético EE.UU.-Venezuela a “transición” democrática
noticia Europa Press
PUBG: Battlegrounds ya es gratuito en PC, Xbox y PlayStation


Más en esta sección

Irma Palencia asume como presidente del TSE

otras-noticias

Un recorrido por los barrios históricos

otras-noticias

Se inicia feria de Jocotenango en honor a la Virgen de la Asunción

otras-noticias

Publicidad