Capítulo 4: GPUs Soportadas

Base de Datos de GPUs

Local Inference Calculator incluye una base de datos completa de más de 40 GPUs, incluyendo tarjetas de consumidor, datacenter y entornos cloud.

GPUs NVIDIA GeForce - Serie RTX 30

GPU	VRAM	Arquitectura
RTX 3060	12 GB	Ampere
RTX 3060 Ti	8 GB	Ampere
RTX 3070	8 GB	Ampere
RTX 3070 Ti	8 GB	Ampere
RTX 3080	10 GB	Ampere
RTX 3080 Ti	12 GB	Ampere
RTX 3090	24 GB	Ampere
RTX 3090 Ti	24 GB	Ampere

GPUs NVIDIA GeForce - Serie RTX 40

GPU	VRAM	Arquitectura
RTX 4060	8 GB	Ada Lovelace
RTX 4060 Ti	8 GB	Ada Lovelace
RTX 4060 Ti (16GB)	16 GB	Ada Lovelace
RTX 4070	12 GB	Ada Lovelace
RTX 4070 Ti	12 GB	Ada Lovelace
RTX 4070 Ti Super	16 GB	Ada Lovelace
RTX 4080	16 GB	Ada Lovelace
RTX 4080 Super	16 GB	Ada Lovelace
RTX 4090	24 GB	Ada Lovelace

GPUs NVIDIA GeForce - Serie RTX 50 (Latest!)

GPU	VRAM	Arquitectura
RTX 5050	TBD	Blackwell
RTX 5060	TBD	Blackwell
RTX 5060 Ti	TBD	Blackwell
RTX 5070	TBD	Blackwell
RTX 5070 Ti	TBD	Blackwell
RTX 5080	TBD	Blackwell
RTX 5090	TBD	Blackwell

GPUs Datacenter

GPU	VRAM	Uso Principal
A100 (40GB)	40 GB	Datacenter
A100 (80GB)	80 GB	Datacenter
H100 (80GB)	80 GB	IA/HPC
L4	24 GB	Inferencia

Ejemplo de Uso

Verificar Compatibilidad

bash

# Verificar qué modelos caben en RTX 4090
python main.py --context 4096 --only-runs

# Especificar una GPU
python main.py --model 70 --context 8192 --gpu "RTX 4090"

Salida de Ejemplo

$ python main.py --model 7 --context 8192 -q int4

============================================
COMPATIBILIDAD DE GPUs
============================================
✓ RTX 3090 (24GB) - 75% VRAM utilizado
✓ RTX 4090 (24GB) - 75% VRAM utilizado  
✓ RTX 4080 (16GB) - 100% VRAM utilizado
✓ RTX 4070 (12GB) - No compatible (requiere 18GB)

Porcentaje de VRAM Libre

bash

python main.py --model 70 --context 4096

# Muestra:
# RTX 4090 (24GB) - 45% libre
# RTX 3090 (24GB) - 45% libre

Tipo de GPU

CONSUMER

Enfocadas en gamers y enthusiasts
Mejor precio/rendimiento
Limitaciones en drivers para datacenter

DATACENTER

Optimizadas para IA/HPC
Soporte NVLink
Mayor VRAM
driversenterprise

Google Colab

La herramienta también incluye GPUs de Google Colab para planificación de uso en entornos cloud gratuitos/de pago.

Commits Relacionados

feat: Add NVIDIA GeForce RTX 50 series GPUs to database - Agrega latest GPUs

Siguiente Capítulo

En el Capítulo 5, exploraremos las técnicas de optimización como layer offload.

Capítulo 4: GPUs Soportadas ​

Base de Datos de GPUs ​

GPUs NVIDIA GeForce - Serie RTX 30 ​

GPUs NVIDIA GeForce - Serie RTX 40 ​

GPUs NVIDIA GeForce - Serie RTX 50 (Latest!) ​

GPUs Datacenter ​

Ejemplo de Uso ​

Verificar Compatibilidad ​

Salida de Ejemplo ​

Porcentaje de VRAM Libre ​

Tipo de GPU ​

CONSUMER ​

DATACENTER ​

Google Colab ​

Commits Relacionados ​

Siguiente Capítulo ​