Todas las etiquetas

Etiqueta

inference

5 posts

25 de abril de 2026

Microsoft BitNet 1.58: La Era de los Modelos de Lenguaje de 1 Bit
18 de abril de 2026

TurboQuant: Cuantificación Vectorial en Línea con Tasa de Distorsión Casi Óptima
11 de abril de 2026

SGLang: Lenguaje de Generación Estructurada para Serving Eficiente de LLMs
9 de abril de 2026

vLLM: Inferencia de LLM de Alto Throughput a Escala
8 de abril de 2026

Ollama: Ejecuta LLMs Locales en Tu Propio Hardware