Guía de Modelos

¿Qué Modelo Debo Usar para Fine-tuning?

Llama, Qwen, Mistral, Phi... Guía completa para seleccionar el modelo ideal para tu caso de uso.

Pasos para Elegir

Código, chat, visión, análisis de documentos...

Apache 2.0, Llama License, restricciones comerciales

VRAM disponible, storage, tiempo de entrenamiento

<300 filas → Instruct, 1000+ filas → Base

Pre-entrenado con instrucciones incorporadas. Listo para usar sin fine-tuning.

Versión original sin instruction tuning. Diseñado para personalización completa.

Filas	Recomendación	Razón
< 300	Instruct	Preserva capacidades existentes
300 - 1,000	Ambos viables	Evalúa calidad del dataset
1,000+	Base	Máximo control y personalización

💡 Tip: AstrApp optimiza automáticamente la configuración para tu modelo elegido.

Modelo	Tamaños	Mejor Para	Licencia
Llama 3.3	70B	Mejor modelo 70B	Llama License
Llama 3.1	8B, 70B, 405B	General, alta calidad	Llama License
Qwen 2.5	0.5B-72B	Multilingüe, versátil	Apache 2.0
Mistral	7B	Eficiente, rápido	Apache 2.0
Phi-4	14B	Compacto, eficiente	MIT

Modelo	Tamaños	Mejor Para	Licencia
Qwen Coder 2.5	1.5B-32B	Mejor para código	Apache 2.0
DeepSeek Coder V2	16B, 236B	Alta calidad	DeepSeek
CodeLlama	7B, 13B, 34B	Python, C++	Llama

Modelo	Tamaños	Mejor Para	Licencia
Llama 3.2 Vision	11B, 90B	Imágenes + texto	Llama License
Qwen2-VL	2B, 7B, 72B	Visión multimodal	Apache 2.0

Modelo	Tamaños	Mejor Para	Licencia
DeepSeek-R1	1.5B-70B	Chain-of-thought	DeepSeek
Qwen2.5-Math	1.5B-72B	Matemáticas	Apache 2.0

Llama 3.1 8B

Instruct

Qwen Coder 2.5 7B

Instruct

Llama 3.2 Vision 11B

Vision

DeepSeek-R1 8B

Reasoning