Claude Sonnet 4.6 vs GPT-5.3 Codex vs Gemini 3.1 Pro: Comparativa Definitiva [2026]
Febrero de 2026 ha sido el mes mas intenso en la historia de la inteligencia artificial. En apenas 15 dias, las tres grandes empresas de IA han lanzado modelos que redefinen lo que es posible: OpenAI presento GPT-5.3 Codex el 5 de febrero, Anthropic respondio con Claude Sonnet 4.6 el 17 de febrero, y Google cerro la semana con Gemini 3.1 Pro el 19 de febrero.
¿Quieres dominar la IA para programar? En La Escuela de IA analizamos cada modelo nuevo en profundidad. Unete gratis. Tambien en YouTube @JavadexAI y TikTok @javadex.
Tres modelos. Tres filosofias. Un solo objetivo: ser la IA que uses a diario. En esta comparativa analizo los benchmarks reales, los precios, las fortalezas y debilidades de cada uno, y te doy mi recomendacion personal sobre cual elegir segun tu caso de uso.
TL;DR - Resumen Rapido
Si tienes prisa, aqui va el resumen por caso de uso:
- Para programar y coding: GPT-5.3 Codex gana en tareas de terminal y proyectos de larga duracion; Claude Sonnet 4.6 gana en productividad de oficina y edicion precisa de codigo
- Para agentes autonomos y computer use: Claude Sonnet 4.6 es el claro ganador con un 72.5% en OSWorld
- Para razonamiento cientifico: Gemini 3.1 Pro domina con un 94.3% en GPQA Diamond y 77.1% en ARC-AGI-2
- Mejor relacion calidad-precio: Gemini 3.1 Pro a $2 por millon de tokens de entrada
- Mejor contexto largo: Claude Sonnet 4.6 y Gemini 3.1 Pro empatan con 1M de tokens; GPT-5.3 Codex se queda en 400K
- Para uso general diario: Claude Sonnet 4.6 ofrece el mejor equilibrio entre rendimiento y precio
En Resumen: No hay un ganador absoluto. GPT-5.3 Codex es el mas potente para coding puro. Claude Sonnet 4.6 es el mejor para agentes y uso de ordenador. Gemini 3.1 Pro lidera los benchmarks academicos al precio mas bajo. Tu eleccion depende de que necesitas hacer.
Tabla Comparativa General
Esta tabla resume las especificaciones y benchmarks clave de los tres modelos. Los valores en negrita indican al ganador de cada categoria.
| Caracteristica | Claude Sonnet 4.6 | GPT-5.3 Codex | Gemini 3.1 Pro |
|---|---|---|---|
| Empresa | Anthropic | OpenAI | Google DeepMind |
| Fecha de lanzamiento | 17 feb 2026 | 5 feb 2026 | 19 feb 2026 |
| Contexto entrada | 1M tokens | 400K tokens | 1M tokens |
| Tokens de salida max | 128K | 128K | 64K |
| SWE-Bench Verified | 79.6% | 79.2%* | 80.6% |
| SWE-Bench Pro (Public) | -- | 56.8% | 54.2% |
| OSWorld Verified | 72.5% | 64.7% | -- |
| Terminal-Bench 2.0 | -- | 77.3% | -- |
| ARC-AGI-2 | -- | -- | 77.1% |
| GPQA Diamond | -- | -- | 94.3% |
| GDPval-AA (Elo) | 1633 | -- | 1317 |
| LiveCodeBench (Elo) | -- | -- | 2887 |
| Precio input (por 1M tokens) | $3 | ~$1.25 | $2 |
| Precio output (por 1M tokens) | $15 | ~$10 | $12 |
| Computer use | Si (nativo) | Limitado | No |
| Multimodal | Texto + imagen | Texto + imagen | Texto + imagen + video + PDF |
| Velocidad | Rapido | 25% mas rapido que 5.2 | Rapido |
Claude Sonnet 4.6: El Equilibrio Perfecto
Claude Sonnet 4.6 llego el 17 de febrero como la actualizacion mas significativa de la linea Sonnet. Lo que sorprende no es que sea bueno en una cosa, sino que es consistentemente bueno en casi todo, acercandose al rendimiento de Opus 4.6 a una quinta parte de su precio.
Fortalezas de Claude Sonnet 4.6
- Mejor modelo de computer use del mundo: Con un 72.5% en OSWorld Verified (frente al 61.4% de Sonnet 4.5 y el 38.2% de GPT-5.2), Sonnet 4.6 puede navegar interfaces graficas, rellenar formularios, trabajar con hojas de calculo y coordinar acciones entre multiples aplicaciones
- Productividad de oficina lider: 1633 Elo en GDPval-AA, superando incluso a Opus 4.6. Esto mide tareas reales como escribir emails, analizar documentos y gestionar calendarios
- Analisis financiero: 63.3% en Finance Agent, el mejor de su clase para tareas que requieren razonamiento numerico y analisis de datos
- Uso de herramientas a escala: 61.3% en MCP-Atlas, superando a Opus 4.6 (60.3%) en la coordinacion de multiples herramientas simultaneamente
- Contexto de 1 millon de tokens: Puedes cargar repositorios completos, documentos extensos o historiales de conversacion largos sin perder coherencia
- 0% tasa de error en Replit: Segun Replit, Claude Sonnet 4.6 logro una tasa de error del 0% en su benchmark interno de edicion de codigo, frente al 9% de la generacion anterior
- Disponible en GitHub Copilot: Es el modelo por defecto del nuevo agente de coding de GitHub Copilot
Debilidades de Claude Sonnet 4.6
- No tiene benchmark publicado en ARC-AGI-2 ni en GPQA Diamond, lo que dificulta la comparacion directa en razonamiento abstracto con Gemini 3.1 Pro
- La ventana de salida (128K) es generosa pero no siempre la aprovecha al maximo en respuestas libres
- El precio de $15 por millon de tokens de salida es el mas caro de los tres en output
- No soporta video como input, a diferencia de Gemini 3.1 Pro
- Computer use, aunque lider, todavia esta lejos del rendimiento humano en tareas complejas
Cuando elegir Claude Sonnet 4.6
- Necesitas un agente que interactue con interfaces graficas (webs, apps de escritorio)
- Trabajas con repositorios de codigo grandes y necesitas contexto largo
- Priorizas consistencia y fiabilidad sobre velocidad bruta
- Usas GitHub Copilot y quieres el mejor modelo integrado
- Necesitas automatizar tareas de oficina (emails, documentos, hojas de calculo)
GPT-5.3 Codex: El Programador Incansable
GPT-5.3 Codex llego el 5 de febrero como la evolucion directa de GPT-5.2 Codex, y OpenAI no escatimo en ambicion: es el primer modelo que participo activamente en su propio entrenamiento, depurando errores en su propio proceso de desarrollo.
Fortalezas de GPT-5.3 Codex
- Lider en Terminal-Bench 2.0: Con un 77.3%, GPT-5.3 Codex domina las tareas de terminal y linea de comandos, que son el pan de cada dia de los desarrolladores
- SWE-Bench Pro lider: 56.8% en SWE-Bench Pro (Public), la puntuacion mas alta registrada, resolviendo issues reales de GitHub con menos tokens que cualquier modelo anterior
- 25% mas rapido que GPT-5.2: Gracias a optimizaciones en hardware NVIDIA GB200 NVL72, la latencia se ha reducido significativamente para bucles agenticos
- Interactividad en tiempo real: Es el primer modelo de OpenAI que permite interactuar con el mientras trabaja. Puedes redirigirlo, hacer preguntas o cambiar de direccion sin perder contexto, como trabajar con un colega
- Proyectos de larga duracion: GPT-5.3 Codex puede construir aplicaciones complejas a lo largo de dias, manteniendo coherencia entre sesiones
- Codex-Spark a 1000 tokens/segundo: La variante Spark, ejecutada en hardware Cerebras, ofrece respuestas en tiempo real para iteraciones rapidas (15x mas rapido que el modelo principal)
- Ecosistema completo: Disponible en Codex app, CLI, extensiones IDE y web
Debilidades de GPT-5.3 Codex
- Contexto limitado a 400K tokens: Frente al millon de tokens de Claude y Gemini, se queda corto para repositorios muy grandes
- Precio de API sin confirmar: A fecha de hoy, OpenAI no ha publicado precios oficiales de API para GPT-5.3 Codex, lo que genera incertidumbre para empresas
- Riesgos de ciberseguridad: OpenAI ha clasificado este modelo como "High capability" en ciberseguridad bajo su Preparedness Framework, retrasando el acceso completo para desarrolladores
- Computer use limitado: 64.7% en OSWorld frente al 72.5% de Claude Sonnet 4.6; no esta disenado para interaccion con interfaces graficas
- Codex-Spark es solo texto: La variante ultra-rapida no soporta vision ni imagenes
- Acceso restringido: El rollout es gradual y con controles mas estrictos de lo habitual por las implicaciones de seguridad
Cuando elegir GPT-5.3 Codex
- Tu trabajo principal es programar en terminal y linea de comandos
- Necesitas un agente que trabaje en proyectos durante horas o dias sin supervision
- Valoras la interactividad y poder redirigir al modelo mientras trabaja
- Necesitas iteraciones ultra-rapidas (Codex-Spark a 1000 tok/s)
- Ya usas el ecosistema de OpenAI (ChatGPT Pro, Codex app, CLI)
Gemini 3.1 Pro: El Rey de los Benchmarks
Google cerro la semana del 19 de febrero con Gemini 3.1 Pro, y los numeros hablan por si solos: lidera 13 de los 16 benchmarks mas relevantes. Es la primera vez que Google lanza un incremento ".1" en vez de una nueva generacion completa, pero los saltos en rendimiento son de nueva generacion.
Fortalezas de Gemini 3.1 Pro
- ARC-AGI-2: 77.1%: Mas del doble que Gemini 3 Pro (31.1%). ARC-AGI-2 mide razonamiento abstracto, la capacidad de generalizar a patrones completamente nuevos. Este es el benchmark que mas se acerca a medir "inteligencia general"
- SWE-Bench Verified lider: 80.6%: La puntuacion mas alta de los tres modelos en este benchmark estandar de resolucion de issues de GitHub
- GPQA Diamond: 94.3%: Preguntas de nivel doctorado en ciencias. Gemini 3.1 Pro roza la perfeccion
- LiveCodeBench Elo: 2887: El rating mas alto en coding competitivo, superando a modelos especializados
- MMMLU: 92.6%: Comprension multimodal avanzada que combina texto, imagenes y razonamiento
- Mejor precio del mercado: $2 por millon de tokens de entrada. Es 7.5 veces mas barato que Opus 4.6 y significativamente mas economico que Claude Sonnet 4.6 en input
- 1M de contexto + 64K de salida: Ventana de contexto identica a Claude, con salida mas que suficiente para la mayoria de tareas
- Multimodal nativo: Soporta texto, imagen, PDF y video como entrada. Es el unico de los tres que acepta video
- Disponible en GitHub Copilot: Los usuarios pueden seleccionarlo directamente desde el selector de modelos
- Razonamiento mas eficiente: Usa menos tokens de salida que su predecesor para llegar a las mismas conclusiones
Debilidades de Gemini 3.1 Pro
- Sin computer use nativo: A diferencia de Claude Sonnet 4.6, no puede interactuar con interfaces graficas de escritorio
- GDPval-AA significativamente inferior: 1317 Elo frente a los 1633 de Claude Sonnet 4.6 en productividad de oficina del mundo real
- Lanzado en preview: Al momento de escribir este articulo, Gemini 3.1 Pro esta en fase preview. Pueden haber cambios antes de la version estable
- Menos ecosistema de agentes: No tiene un equivalente a Codex (OpenAI) para proyectos de larga duracion
- Output limitado a 64K: La mitad que Claude Sonnet 4.6 y GPT-5.3 Codex (128K cada uno)
- Benchmarks vs mundo real: Liderar benchmarks no siempre se traduce en mejor rendimiento en tareas practicas del dia a dia
Cuando elegir Gemini 3.1 Pro
- Necesitas el maximo rendimiento por euro gastado
- Trabajas en investigacion cientifica o academica
- Tu flujo de trabajo es multimodal (texto + imagen + video + PDF)
- Usas el ecosistema de Google (Vertex AI, Google AI Studio, NotebookLM)
- Necesitas razonamiento abstracto y resolucion de problemas complejos
- Quieres analizar repositorios completos con 1M de contexto al menor coste
Comparativa de Precios Detallada
El precio es uno de los factores mas determinantes a la hora de elegir un modelo, especialmente para empresas y desarrolladores que hacen miles de llamadas al dia. Esta tabla desglosa los costes por millon de tokens.
| Concepto | Claude Sonnet 4.6 | GPT-5.3 Codex | Gemini 3.1 Pro |
|---|---|---|---|
| Input (por 1M tokens) | $3.00 | ~$1.25* | $2.00 |
| Output (por 1M tokens) | $15.00 | ~$10.00* | $12.00 |
| Input contexto largo (>200K) | $3.00 | ~$1.25* | $4.00 |
| Output contexto largo (>200K) | $15.00 | ~$10.00* | $18.00 |
| Suscripcion consumidor | $20/mes (Pro) | $20/mes (Plus) | $21.99/mes (Advanced) |
| Tier gratuito | Si (limitado) | Si (limitado) | Si (generoso) |
| Coste por 1M tokens combinado | $9.00 | ~$5.63 | $7.00* |
Analisis de coste-rendimiento
Para un desarrollador que hace 100 llamadas al dia con un promedio de 2000 tokens de entrada y 1000 de salida:
- Claude Sonnet 4.6: ~$0.54/dia = ~$16.20/mes
- GPT-5.3 Codex: ~$0.35/dia = ~$10.50/mes (estimado)
- Gemini 3.1 Pro: ~$0.52/dia = ~$15.60/mes
Para uso intensivo empresarial (10.000 llamadas/dia):
- Claude Sonnet 4.6: ~$54/dia = ~$1.620/mes
- GPT-5.3 Codex: ~$35/dia = ~$1.050/mes (estimado)
- Gemini 3.1 Pro: ~$52/dia = ~$1.560/mes
Conclusion de precios: A nivel de API, los tres son competitivos. GPT-5.3 Codex sera probablemente el mas barato en input, pero su precio final esta por confirmar. Gemini 3.1 Pro ofrece la mejor relacion benchmark-precio. Claude Sonnet 4.6 justifica su coste adicional con capacidades unicas como computer use.
Casos de Uso: Cual Elegir
Para programar y desarrollo de software
Los tres modelos son excelentes para codigo, pero cada uno brilla en un area distinta:
- GPT-5.3 Codex: 77.3% Terminal-Bench, 56.8% SWE-Bench Pro. Ideal para tareas de terminal, debugging en CLI y proyectos que requieren sesiones largas
- Claude Sonnet 4.6: 79.6% SWE-Bench Verified, 0% error rate en Replit. Ideal para edicion precisa de codigo y refactorizaciones en repositorios grandes
- Gemini 3.1 Pro: 80.6% SWE-Bench Verified, 2887 Elo LiveCodeBench. Ideal para coding competitivo y resolucion de issues complejas
Ganador: Empate tecnico. GPT-5.3 Codex para terminal y proyectos largos. Claude Sonnet 4.6 para edicion precisa y GitHub Copilot. Gemini 3.1 Pro para algoritmos complejos al mejor precio.
Para agentes autonomos y computer use
La capacidad de un modelo para actuar como agente autonomo --navegando interfaces, usando herramientas, completando flujos de trabajo multi-paso-- es cada vez mas importante.
- Claude Sonnet 4.6: 72.5% OSWorld, 61.3% MCP-Atlas. Puede navegar webs, rellenar formularios, coordinar multiples aplicaciones. Es el unico con computer use nativo maduro
- GPT-5.3 Codex: 64.7% OSWorld. Fuerte en agentes de codigo, mas limitado en computer use general. Su fortaleza es la interactividad en tiempo real
- Gemini 3.1 Pro: Sin benchmark de OSWorld publicado. Fuerte en razonamiento agentico pero sin capacidad de computer use nativa
Ganador: Claude Sonnet 4.6. Su ventaja en computer use y uso de herramientas a escala es clara y significativa.
Para uso general y productividad
Responder emails, resumir documentos, analizar datos, redactar informes: las tareas del dia a dia.
- Claude Sonnet 4.6: 1633 Elo en GDPval-AA (tareas de oficina). El mas consistente en tareas de productividad del mundo real
- GPT-5.3 Codex: Optimizado para coding, no para uso general. Pero el ecosistema ChatGPT lo complementa
- Gemini 3.1 Pro: 92.6% MMMLU. Fuerte en comprension multimodal, pero 1317 en GDPval-AA sugiere menos fiabilidad en tareas de oficina
Ganador: Claude Sonnet 4.6. Su rendimiento en productividad de oficina es superior y verificable.
Para empresas y equipos
Las empresas necesitan fiabilidad, integraciones y soporte.
- Claude Sonnet 4.6: Disponible en AWS Bedrock, Microsoft Foundry, GitHub Copilot. API estable con precios conocidos
- GPT-5.3 Codex: Ecosistema OpenAI maduro, pero precios de API sin confirmar y acceso restringido por preocupaciones de seguridad
- Gemini 3.1 Pro: Vertex AI, Google Cloud, Google AI Studio. Mejor precio, pero en fase preview
Ganador: Claude Sonnet 4.6 por disponibilidad y fiabilidad inmediatas. Gemini 3.1 Pro sera una opcion muy competitiva cuando salga de preview.
Para presupuesto limitado
Si cada euro cuenta:
- Gemini 3.1 Pro: $2/1M input, tier gratuito generoso, Google AI Studio sin coste para experimentar
- Claude Sonnet 4.6: $3/1M input, tier gratuito limitado pero funcional
- GPT-5.3 Codex: Precio estimado bajo (~$1.25/1M input) pero sin confirmar. ChatGPT Plus a $20/mes
Ganador: Gemini 3.1 Pro. El precio confirmado mas bajo con el rendimiento benchmark mas alto. Dificil de superar en relacion calidad-precio.
Para trabajo multimodal (texto + imagen + video)
- Gemini 3.1 Pro: Texto, imagen, PDF y video como entrada. El unico que soporta video nativamente
- Claude Sonnet 4.6: Texto e imagen. Sin soporte de video
- GPT-5.3 Codex: Texto e imagen. Sin soporte de video
Ganador: Gemini 3.1 Pro. Su soporte multimodal nativo es el mas completo de los tres.
Mi Recomendacion Personal
Despues de probar los tres modelos extensivamente durante las ultimas dos semanas, esta es mi opinion:
Para el 80% de los usuarios, Claude Sonnet 4.6 es la mejor opcion. Y no es porque sea el "mejor" en todos los benchmarks (no lo es), sino porque es el mas consistente y versatil. Cuando necesitas un modelo que funcione bien en todo --coding, redaccion, analisis, agentes--, Claude Sonnet 4.6 rara vez decepciona.
Si tu trabajo es 100% programacion, GPT-5.3 Codex merece una prueba seria. La interactividad en tiempo real es un cambio cualitativo: poder redirigir al modelo mientras trabaja, sin perder contexto, se siente como pair programming real. Y si tienes acceso a Codex-Spark, las iteraciones a 1000 tokens/segundo son adictivas.
Si buscas el maximo rendimiento por euro o trabajas en investigacion, Gemini 3.1 Pro es imbatible. Un 94.3% en GPQA Diamond y un 77.1% en ARC-AGI-2 a $2 por millon de tokens de entrada es absurdamente bueno. Cuando salga de preview, sera el modelo que muchas empresas elijan por defecto.
Mi setup actual:
- Agentes y automatizacion: Claude Sonnet 4.6 (computer use + MCP-Atlas)
- Coding diario: Claude Sonnet 4.6 via GitHub Copilot + GPT-5.3 Codex para sesiones largas
- Investigacion y analisis: Gemini 3.1 Pro (precio + contexto + multimodal)
- Iteraciones rapidas: GPT-5.3 Codex-Spark cuando necesito respuestas instantaneas
La buena noticia: en febrero de 2026, no hay una mala eleccion. Los tres modelos son extraordinarios. La mala noticia: dentro de un mes, probablemente haya nuevas versiones y tengamos que volver a comparar.
Preguntas Frecuentes (FAQ)
1. Cual es el mejor modelo de IA para programar en 2026?
Depende del tipo de programacion. Para trabajo en terminal y proyectos de larga duracion, GPT-5.3 Codex lidera con un 77.3% en Terminal-Bench 2.0 y un 56.8% en SWE-Bench Pro. Para edicion precisa de codigo en repositorios grandes, Claude Sonnet 4.6 destaca con un 79.6% en SWE-Bench Verified y un 0% de tasa de error en Replit. Para algoritmos complejos y coding competitivo, Gemini 3.1 Pro tiene el Elo mas alto en LiveCodeBench (2887). La recomendacion general para desarrolladores es Claude Sonnet 4.6 por su equilibrio entre rendimiento y versatilidad.
2. Merece la pena pagar mas por Claude Sonnet 4.6 en vez de usar Gemini 3.1 Pro?
Si tu caso de uso incluye agentes autonomos o computer use, si. Claude Sonnet 4.6 es el unico de los tres con capacidades maduras de interaccion con interfaces graficas (72.5% en OSWorld). Tambien es superior en tareas de productividad de oficina (1633 vs 1317 Elo). Sin embargo, si priorizas razonamiento cientifico, multimodal o precio, Gemini 3.1 Pro ofrece mas por menos.
3. GPT-5.3 Codex ya esta disponible para todos?
No completamente. OpenAI esta haciendo un rollout gradual con controles mas estrictos de lo habitual. El modelo esta disponible en las superficies de Codex (app, CLI, IDE, web) para usuarios de ChatGPT Pro, pero el acceso completo a la API y los precios oficiales aun no se han confirmado. Esto se debe a que OpenAI ha clasificado GPT-5.3 Codex como "High capability" en su Preparedness Framework de ciberseguridad.
4. Que es Codex-Spark y en que se diferencia de GPT-5.3 Codex?
Codex-Spark es una variante mas pequena de GPT-5.3 Codex, optimizada para velocidad en tiempo real. Genera mas de 1000 tokens por segundo (15x mas rapido que el modelo principal) ejecutandose en hardware Cerebras en lugar de NVIDIA. Tiene un contexto de 128K tokens (frente a los 400K de GPT-5.3 Codex), es solo texto (sin vision) y esta pensada para iteraciones rapidas donde la latencia importa tanto como la inteligencia. Esta disponible como research preview para usuarios de ChatGPT Pro.
5. Gemini 3.1 Pro es estable o esta en beta?
Gemini 3.1 Pro fue lanzado el 19 de febrero de 2026 en fase preview. Esto significa que esta accesible a traves de la app Gemini, Google AI Studio, Vertex AI, la API de Gemini y GitHub Copilot, pero Google podria hacer ajustes antes de la version estable definitiva. Para produccion critica, ten en cuenta que podrian haber pequenos cambios de comportamiento.
6. Cual de los tres modelos tiene mejor ventana de contexto?
Claude Sonnet 4.6 y Gemini 3.1 Pro comparten el liderazgo con 1 millon de tokens de entrada. GPT-5.3 Codex se queda en 400.000 tokens. En cuanto a la salida, Claude Sonnet 4.6 y GPT-5.3 Codex generan hasta 128K tokens, mientras que Gemini 3.1 Pro se limita a 64K. Para cargar repositorios completos, los tres son suficientes, pero Claude y Gemini tienen ventaja clara en contextos muy largos.
7. Que modelo elegir si nunca he usado IA para programar?
Si eres principiante, mi recomendacion es empezar con Gemini 3.1 Pro por dos razones: tiene un tier gratuito generoso y Google AI Studio es la interfaz mas intuitiva para experimentar. Una vez que tengas claro que tipo de tareas quieres automatizar, prueba Claude Sonnet 4.6 (especialmente si usas GitHub Copilot) o GPT-5.3 Codex (si prefieres el ecosistema ChatGPT).
Recursos Adicionales
Si quieres profundizar en alguno de estos modelos o en herramientas relacionadas, estos articulos de Javadex te seran utiles:
- Claude Opus 4.6 vs GPT-5.3 Codex: Comparativa Completa - Comparacion detallada de los modelos flagship de Anthropic y OpenAI
- Mejores Modelos IA Febrero 2026: Ranking Completo - Ranking actualizado de todos los modelos disponibles este mes
- Gemini 3 Pro: Tutorial Completo y Funciones - Guia paso a paso para sacar el maximo partido a Gemini
- Windsurf vs Cursor vs Claude Code vs Copilot: Comparativa 2026 - Cual es el mejor editor de codigo con IA
- La Mejor Inteligencia Artificial 2026: Ranking Completo - Que IA usar para cada tarea en 2026
- Claude vs ChatGPT: Cual es Mejor - La comparativa clasica actualizada
Ultima actualizacion: 20 de febrero de 2026. Los benchmarks y precios reflejan la informacion disponible a la fecha de publicacion. Los precios de GPT-5.3 Codex son estimaciones y se actualizaran cuando OpenAI confirme la tarificacion oficial de su API.