shadcn/studio
Volver a Guía de Fine-tuning
Guía de Modelos

¿Qué Modelo Debo Usar para Fine-tuning?

Llama, Qwen, Mistral, Phi... Guía completa para seleccionar el modelo ideal para tu caso de uso.

Pasos para Elegir

1

Identifica tu caso de uso

Código, chat, visión, análisis de documentos...

2

Revisa licencias y requisitos

Apache 2.0, Llama License, restricciones comerciales

3

Evalúa tus recursos

VRAM disponible, storage, tiempo de entrenamiento

4

Considera tu dataset

<300 filas → Instruct, 1000+ filas → Base


¿Modelo Instruct o Base?

Modelo Instruct

Pre-entrenado con instrucciones incorporadas. Listo para usar sin fine-tuning.

  • Menos datos requeridos
  • Chat templates: ChatML, ShareGPT
  • Mejor para datasets <1000 filas

Modelo Base

Versión original sin instruction tuning. Diseñado para personalización completa.

  • Control total sobre el comportamiento
  • Templates: Alpaca, Vicuna
  • Mejor para datasets 1000+ filas

Recomendación por Tamaño de Dataset

FilasRecomendaciónRazón
< 300InstructPreserva capacidades existentes
300 - 1,000Ambos viablesEvalúa calidad del dataset
1,000+BaseMáximo control y personalización

Requisitos de VRAM

Tamaño del ModeloQLoRA (4-bit)LoRA (16-bit)
1B-3B2-4 GB8-12 GB
7B-8B4-6 GB16-24 GB
13B8-10 GB32-40 GB
30B-34B16-20 GB64-80 GB
70B35-48 GB140+ GB

💡 Tip: AstrApp optimiza automáticamente la configuración para tu modelo elegido.


Catálogo de Modelos

Propósito General

ModeloTamañosMejor ParaLicencia
Llama 3.370BMejor modelo 70BLlama License
Llama 3.18B, 70B, 405BGeneral, alta calidadLlama License
Qwen 2.50.5B-72BMultilingüe, versátilApache 2.0
Mistral7BEficiente, rápidoApache 2.0
Phi-414BCompacto, eficienteMIT

Especializados en Código

ModeloTamañosMejor ParaLicencia
Qwen Coder 2.51.5B-32BMejor para códigoApache 2.0
DeepSeek Coder V216B, 236BAlta calidadDeepSeek
CodeLlama7B, 13B, 34BPython, C++Llama

Visión (VLMs)

ModeloTamañosMejor ParaLicencia
Llama 3.2 Vision11B, 90BImágenes + textoLlama License
Qwen2-VL2B, 7B, 72BVisión multimodalApache 2.0

Razonamiento

ModeloTamañosMejor ParaLicencia
DeepSeek-R11.5B-70BChain-of-thoughtDeepSeek
Qwen2.5-Math1.5B-72BMatemáticasApache 2.0

Recomendaciones por Caso de Uso

Chatbot general

Llama 3.1 8B

Instruct

Asistente de código

Qwen Coder 2.5 7B

Instruct

Análisis de imágenes

Llama 3.2 Vision 11B

Vision

Razonamiento

DeepSeek-R1 8B

Reasoning