El lanzamiento que todos esperaban
OpenAI lanzó ChatGPT-5 con más bombo del habitual. Eventos, demos en vivo, comparativas de benchmarks. El hype fue enorme.
Llevo tres semanas usándolo diariamente como parte de mi flujo de trabajo como desarrollador. Acá está mi review honesta, sin el filtro del entusiasmo inicial.
Lo que realmente mejoró
Razonamiento en tareas complejas
Esto es real. ChatGPT-5 razona mejor en problemas que requieren múltiples pasos. Cuando le pido que analice una arquitectura de software con dependencias cruzadas, las respuestas son más coherentes y menos propensas a contradecirse a mitad del análisis.
Para debugging complejo, noto una diferencia genuina. Le paso un stack trace complicado con contexto, y las hipótesis que genera son más precisas. GPT-4 a veces se perdía en los síntomas. GPT-5 va más seguido a la causa raíz.
Consistencia en conversaciones largas
GPT-4 tenía un problema conocido: a medida que la conversación se extendía, empezaba a "olvidar" el contexto inicial y las respuestas perdían coherencia. GPT-5 maneja conversaciones largas mucho mejor. Podés tener un intercambio de 40 mensajes y el modelo sigue alineado con el contexto original.
Código más limpio out of the box
El código que genera GPT-5 necesita menos edición que el de su predecesor. Sigue los patrones del contexto que le das más consistentemente, y los errores comunes de lógica que aparecían en GPT-4 son menos frecuentes.
Lo que sigue igual (o casi)
Las alucinaciones no desaparecieron
Sigue inventando cosas. Menos que GPT-4, sí. Pero si le preguntás por documentación de una librería específica o versiones de APIs, verificá siempre. Confiar ciegamente en cualquier modelo de lenguaje en 2026 sigue siendo un error.
El límite de contexto sigue siendo un problema práctico
Aunque técnicamente tiene una ventana de contexto más grande, en la práctica cuando le pasás proyectos de código extensos, la calidad de las respuestas baja hacia el final de la ventana. No es tan dramático como en versiones anteriores, pero está ahí.
La lentitud en modo razonamiento
El modo de razonamiento extendido — similar al "thinking" que introdujeron antes — es más lento. Entiendo el tradeoff, pero cuando querés una respuesta rápida, tener que esperar 30 segundos de "razonamiento" es frustrante.
¿Vale la pena el precio?
ChatGPT Plus subió a $25/mes con GPT-5 disponible. Para uso casual: probablemente no. La versión gratuita con acceso limitado a GPT-5 cubre la mayoría de los casos de uso de alguien que no lo usa intensivamente.
Para profesionales que lo usan como herramienta de trabajo: sí, el precio es justificable si ya estabas pagando GPT-4. La mejora en razonamiento y en calidad de código es suficiente para justificar la diferencia.
Mi uso personal: lo tengo integrado en Cursor como proveedor de modelos y en un workflow propio que describí en otro post. En ese contexto, GPT-5 es una mejora real sobre GPT-4 Turbo.
La comparación que nadie quiere hacer
Claude 4 Opus de Anthropic sigue siendo competitivo en razonamiento y código. En algunas tareas específicas — especialmente análisis de código extenso — yo prefiero Claude. La diferencia ya no es tan grande como era hace un año, pero existe.
No hay un modelo que gane en todo. En 2026 la estrategia inteligente es tener acceso a más de uno y saber cuándo usar cuál.
Veredicto
ChatGPT-5 es una mejora real, no hype vacío. Pero tampoco es el salto revolucionario que el marketing quería hacer creer. Es una evolución sólida que mejora lo que ya era bueno y parchea algunas de las debilidades más obvias.
Si ya usabas ChatGPT para trabajo serio: actualizate. Si eras casual: la versión gratuita con acceso limitado es suficiente. Si nunca usaste ningún modelo: empezá por la versión gratuita y evaluá si el uso que le das justifica pagar.