Categories

Machine Learning

AI May 03, 2026

TensorRT-LLM: La Biblioteca de Codigo Abierto de NVIDIA para Inferencia de LLM Optimizada

Implementar modelos de lenguaje grandes en produccion requiere mas que solo cargar pesos en una GPU. Para lograr rendimiento y latencia …

AI May 03, 2026

GPTQModel: Kit de Cuantizacion de LLM Listo para Produccion para GPU y CPU

Los modelos de lenguaje grandes son potentes, pero su tamano los hace costosos de implementar. Un modelo de 70 mil millones de parametros en …