AI

OmniSVG: Modelo Unificado de Generacion SVG Multimodal (NeurIPS 2025)

OmniSVG es la primera familia de generadores SVG multimodales de extremo a extremo utilizando VLM, capaz de generar SVGs complejos desde iconos hasta personajes de anime.

Keeping this site alive takes effort — your support means everything.
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分! 無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!
OmniSVG: Modelo Unificado de Generacion SVG Multimodal (NeurIPS 2025)

Los graficos vectoriales estan en todas partes, desde iconos y logotipos hasta ilustraciones y visualizaciones de datos. Pero generar SVGs complejos programaticamente ha seguido siendo un desafio de investigacion persistente, con la mayoria de los enfoques limitados a formas geometricas simples o que requieren extensos datos de entrenamiento. OmniSVG, publicado en NeurIPS 2025, supera estas limitaciones al introducir la primera familia unificada de generadores SVG multimodales de extremo a extremo construidos sobre modelos de lenguaje visual.

El proyecto en github.com/OmniSVG/OmniSVG representa un cambio de paradigma en la generacion SVG. En lugar de depender de renderizado diferenciable o aprendizaje por refuerzo (los enfoques dominantes antes de OmniSVG), ajusta VLM pre-entrenados para generar codigo SVG directamente. Esto permite que el modelo aproveche el vasto conocimiento visual codificado en los VLM modernos mientras aprende la sintaxis y estructura de SVG como lenguaje objetivo.

Los resultados son impresionantes: OmniSVG puede generar SVGs detallados que van desde iconos simples hasta personajes de anime complejos, con una diversidad y calidad sin precedentes. El modelo comprende conceptos visuales, referencias de estilo y relaciones estructurales, produciendo codigo SVG limpio y componible en lugar de aproximaciones de pixeles. El conjunto de datos MMSVG adjunto, la coleccion mas grande de pares SVG-texto jamas ensamblada, tambien se publica para la comunidad investigadora.

Que es OmniSVG?

OmniSVG es la primera familia de generadores SVG multimodales de extremo a extremo basados en modelos de lenguaje visual. Genera codigo SVG complejo y estructurado a partir de descripciones de texto, imagenes de referencia o una combinacion de ambos. El modelo produce graficos vectoriales limpios que van desde iconos simples hasta personajes de anime detallados, sin requerir conversion intermedia de raster a vector.

Que tamanos de modelo estan disponibles?

OmniSVG se publica en multiples tamanos para adaptarse a diferentes escenarios de implementacion.

ModeloParametrosVLM BaseMejor Para
OmniSVG-S0.5BPhi-3.5-miniGeneracion rapida, dispositivos de borde
OmniSVG-B2.7BPhi-3.5-mediumUso general, equilibrio calidad-velocidad
OmniSVG-L7BLLaVA-NeXTMaxima calidad, escenas complejas
OmniSVG-XL13BLLaVA-NeXT-13BMaxima calidad, investigacion

Todos los modelos comparten la misma arquitectura pero difieren en capacidad y costo de inferencia. Las variantes B y L se recomiendan para la mayoria de los casos de uso.

Como empezar con OmniSVG?

OmniSVG esta disponible a traves de la libreria Transformers y un paquete Python independiente:

# Instalar
pip install omnisvg

# Generar SVG desde descripcion de texto
from omnisvg import OmniSVG

model = OmniSVG.from_pretrained("OmniSVG/OmniSVG-L")
svg_code = model.generate("A minimalist mountain landscape at sunset")
print(svg_code[:200])

El codigo SVG generado puede guardarse directamente en archivos .svg y abrirse en cualquier editor de graficos vectoriales o navegador web.

Que es el conjunto de datos MMSVG?

El conjunto de datos MMSVG (SVG Multimodal) es la coleccion mas grande de pares SVG-texto jamas publicada publicamente.

Aspecto del Conjunto de DatosCantidad
Total de pares SVG-texto1.2 millones
SVGs a nivel de icono800,000
SVGs a nivel de ilustracion300,000
SVGs de anime/manga100,000
Descripciones de texto1.2 millones (subconjunto verificado humano: 200K)
Vocabulario unico de tokens SVG8,432 tokens de comando

El conjunto de datos cubre una amplia gama de estilos visuales incluyendo iconos planos, ilustraciones detalladas, diagramas tecnicos y arte de personajes. Cada SVG esta emparejado con una descripcion de texto, y un subconjunto de 200,000 pares ha sido verificado por humanos para calidad.

Bajo que licencia se publica OmniSVG?

OmniSVG se publica bajo la Licencia Apache 2.0. El conjunto de datos MMSVG se publica bajo CC-BY 4.0. Ambas licencias permiten uso comercial, modificacion y redistribucion con atribucion.

Preguntas Frecuentes

Que es OmniSVG?

OmniSVG es la primera familia de generadores SVG multimodales de extremo a extremo que utilizan modelos de lenguaje visual, publicado en NeurIPS 2025. Genera codigo SVG complejo a partir de descripciones de texto o imagenes de referencia, desde iconos simples hasta personajes de anime detallados.

Que tamanos de modelo estan disponibles?

Cuatro tamanos: OmniSVG-S (0.5B parametros, dispositivos de borde), OmniSVG-B (2.7B, uso general), OmniSVG-L (7B, maxima calidad) y OmniSVG-XL (13B, investigacion). Las variantes B y L se recomiendan para la mayoria de las aplicaciones.

Como empiezo con OmniSVG?

Instale via pip install omnisvg, cargue un modelo con OmniSVG.from_pretrained() y llame a .generate() con una descripcion de texto. La salida es codigo SVG valido que puede guardarse en un archivo.

Que es el conjunto de datos MMSVG?

El conjunto de datos MMSVG contiene 1.2 millones de pares SVG-texto que cubren iconos, ilustraciones, diagramas tecnicos y arte de anime/manga. Es la coleccion publicamente disponible mas grande de su tipo, con un subconjunto de 200K verificado por humanos.

Bajo que licencia se publica OmniSVG?

Apache License 2.0 para los modelos y CC-BY 4.0 para el conjunto de datos MMSVG. Ambas permiten uso comercial con atribucion.

Lecturas Adicionales

TAG
CATEGORIES