Computer Vision

AI May 03, 2026

VILA: La Familia de Modelos de Lenguaje Visual de Codigo Abierto de NVIDIA NVlabs

Los Modelos de Lenguaje Visual (VLM) que pueden razonar sobre imagenes y texto se han convertido en una de las areas mas activas en la …

AI May 03, 2026

Los graficos vectoriales estan en todas partes, desde iconos y logotipos hasta ilustraciones y visualizaciones de datos. Pero generar SVGs …

AI May 02, 2026

StoryDiffusion es un proyecto de investigación de la Universidad de Nankai y ByteDance que aborda uno de los problemas más difíciles en IA …

AI May 02, 2026

LLaMA-VID es un proyecto de investigación de ECCV 2024 que aborda el cuello de botella fundamental en la comprensión de video con LLMs: la …

AI May 02, 2026

Animate Anyone es un proyecto de investigación del grupo HumanAIGC de Alibaba que convierte una sola foto en un video completamente animado de …