Appearance
Capítulo 4: GPUs Soportadas
Base de Datos de GPUs
Local Inference Calculator incluye una base de datos completa de más de 40 GPUs, incluyendo tarjetas de consumidor, datacenter y entornos cloud.
GPUs NVIDIA GeForce - Serie RTX 30
| GPU | VRAM | Arquitectura |
|---|---|---|
| RTX 3060 | 12 GB | Ampere |
| RTX 3060 Ti | 8 GB | Ampere |
| RTX 3070 | 8 GB | Ampere |
| RTX 3070 Ti | 8 GB | Ampere |
| RTX 3080 | 10 GB | Ampere |
| RTX 3080 Ti | 12 GB | Ampere |
| RTX 3090 | 24 GB | Ampere |
| RTX 3090 Ti | 24 GB | Ampere |
GPUs NVIDIA GeForce - Serie RTX 40
| GPU | VRAM | Arquitectura |
|---|---|---|
| RTX 4060 | 8 GB | Ada Lovelace |
| RTX 4060 Ti | 8 GB | Ada Lovelace |
| RTX 4060 Ti (16GB) | 16 GB | Ada Lovelace |
| RTX 4070 | 12 GB | Ada Lovelace |
| RTX 4070 Ti | 12 GB | Ada Lovelace |
| RTX 4070 Ti Super | 16 GB | Ada Lovelace |
| RTX 4080 | 16 GB | Ada Lovelace |
| RTX 4080 Super | 16 GB | Ada Lovelace |
| RTX 4090 | 24 GB | Ada Lovelace |
GPUs NVIDIA GeForce - Serie RTX 50 (Latest!)
| GPU | VRAM | Arquitectura |
|---|---|---|
| RTX 5050 | TBD | Blackwell |
| RTX 5060 | TBD | Blackwell |
| RTX 5060 Ti | TBD | Blackwell |
| RTX 5070 | TBD | Blackwell |
| RTX 5070 Ti | TBD | Blackwell |
| RTX 5080 | TBD | Blackwell |
| RTX 5090 | TBD | Blackwell |
GPUs Datacenter
| GPU | VRAM | Uso Principal |
|---|---|---|
| A100 (40GB) | 40 GB | Datacenter |
| A100 (80GB) | 80 GB | Datacenter |
| H100 (80GB) | 80 GB | IA/HPC |
| L4 | 24 GB | Inferencia |
Ejemplo de Uso
Verificar Compatibilidad
bash
# Verificar qué modelos caben en RTX 4090
python main.py --context 4096 --only-runs
# Especificar una GPU
python main.py --model 70 --context 8192 --gpu "RTX 4090"Salida de Ejemplo
$ python main.py --model 7 --context 8192 -q int4
============================================
COMPATIBILIDAD DE GPUs
============================================
✓ RTX 3090 (24GB) - 75% VRAM utilizado
✓ RTX 4090 (24GB) - 75% VRAM utilizado
✓ RTX 4080 (16GB) - 100% VRAM utilizado
✓ RTX 4070 (12GB) - No compatible (requiere 18GB)Porcentaje de VRAM Libre
bash
python main.py --model 70 --context 4096
# Muestra:
# RTX 4090 (24GB) - 45% libre
# RTX 3090 (24GB) - 45% libreTipo de GPU
CONSUMER
- Enfocadas en gamers y enthusiasts
- Mejor precio/rendimiento
- Limitaciones en drivers para datacenter
DATACENTER
- Optimizadas para IA/HPC
- Soporte NVLink
- Mayor VRAM
- driversenterprise
Google Colab
La herramienta también incluye GPUs de Google Colab para planificación de uso en entornos cloud gratuitos/de pago.
Commits Relacionados
feat: Add NVIDIA GeForce RTX 50 series GPUs to database- Agrega latest GPUs
Siguiente Capítulo
En el Capítulo 5, exploraremos las técnicas de optimización como layer offload.