Saltar al contenido
octagono
Experiencia Tecnologías Contacto Blog
ES | EN
← Todas las etiquetas
Etiqueta

inference

5 posts

  • Microsoft BitNet 1.58: La Era de los Modelos de Lenguaje de 1 Bit
    25 de abril de 2026
    Microsoft BitNet 1.58: La Era de los Modelos de Lenguaje de 1 Bit
  • TurboQuant: Cuantificación Vectorial en Línea con Tasa de Distorsión Casi Óptima
    18 de abril de 2026
    TurboQuant: Cuantificación Vectorial en Línea con Tasa de Distorsión Casi Óptima
  • SGLang: Lenguaje de Generación Estructurada para Serving Eficiente de LLMs
    11 de abril de 2026
    SGLang: Lenguaje de Generación Estructurada para Serving Eficiente de LLMs
  • vLLM: Inferencia de LLM de Alto Throughput a Escala
    9 de abril de 2026
    vLLM: Inferencia de LLM de Alto Throughput a Escala
  • Ollama: Ejecuta LLMs Locales en Tu Propio Hardware
    8 de abril de 2026
    Ollama: Ejecuta LLMs Locales en Tu Propio Hardware
© 2026 octagono
RSS