
Ahí van doce modelos muy interesantes en 2026, cada uno con sus casos de uso:
- Llama 4 Scout: El primer modelo multimodal open-weight de Meta.
- DeepSeek V4: Un modelo de mezcla de expertos bajo licencia MIT con una ventana de contexto nativa de un millón de tokens. Rendimiento muy potentea a una fracción del coste por token.
- Qwen3: El modelo insignia open-weight de Alibaba con modos de pensamiento y no pensamiento conmutables, todo bajo Apache 2.0.
- Gemma 4: La familia de modelos open-weight de Google lanzada bajo Apache 2.0, con la cobertura lingüística más amplia de cualquier modelo en esta lista.
- Phi 4: El modelo compacto de Microsoft entrenado casi en su totalidad con datos sintéticos y seleccionados. Una opción práctica para implementaciones en dispositivos y en el Edge.
- Mistral Small 3.1: Un VLM (modelo de lenguaje virtual) con una ventana de contexto amplia que cabe en una computadora de consumo.
- Nemotron 3 Super: Modelo híbrido de evaluación de errores (MoE) de NVIDIA con una ventana de contexto de un millón de tokens. Pesos, conjuntos de datos y recetas completamente abiertos, con excelentes resultados en pruebas de codificación de agentes.
- GLM 5.1: El primer modelo de pesos abiertos en liderar el SWE-Bench Pro. Publicado bajo licencia MIT sin restricciones comerciales.
- Kimi K2.6: Competitivo en codificación con los principales modelos cerrados con un coste mucho menor por millón de tokens. Disponible en Hugging Face bajo una licencia MIT modificada.
- StarCoder2: Uno de los modelos de código más transparentes.
- OLMo 2 (AI2): El ejemplo más completo de reproducibilidad de código abierto en la lista. Pesos, datos de entrenamiento, código y recetas completas publicados bajo Apache 2.0.
- Falcon 3: Una familia de modelos ligeros de pesos abiertos diseñados para ejecutarse en una sola GPU.

Deja un comentario