6 novedades de prompt engineering que debes conocer esta semana

Qué cambió esta semana

El panorama de la IA avanzó rápido esta semana. Aquí van seis novedades que importan si escribes prompts para vivir, o si simplemente quieres mejores resultados de los modelos de IA.

1. GPT-5.4 es el nuevo modelo por defecto

OpenAI retiró GPT-5.1 el 11 de marzo y migró a los usuarios a GPT-5.4. El nuevo modelo favorece los prompts estructurados: piensa en esquemas JSON, scaffolding XML y el framework CTCO (Context, Task, Constraints, Output) por encima de un lenguaje conversacional.

Qué hacer: Fija tus aplicaciones de producción a snapshots de modelo específicos. Si dependes de salidas estructuradas como SQL o JSON, GPT-5.4 puede emitirlas directamente sin wrappers de markdown. Solo pídeselo.

2. Claude 4.6 introduce el parámetro de esfuerzo

Claude Opus 4.6 y Sonnet 4.6 de Anthropic ahora vienen con razonamiento adaptativo: el modelo decide cuándo y con qué profundidad razonar. Pero hay una trampa: Sonnet 4.6 usa por defecto un esfuerzo alto, lo que puede disparar la latencia si estás migrando desde Sonnet 4.5 sin ajustar la configuración.

Qué hacer: Configura el parámetro de esfuerzo de forma explícita. Usa esfuerzo alto para tareas de razonamiento complejas y bájalo para las más simples donde la velocidad importa más.

3. GEPA: una mejor forma de optimizar prompts automáticamente

GEPA (Genetic-Pareto Reflective Prompt Evolution) fue aceptado como presentación oral en ICLR 2026. Es un optimizador evolutivo de prompts que duplica las ganancias de MIPROv2 (el anterior mejor método) usando muchos menos recursos de cómputo que las alternativas de aprendizaje por refuerzo.

Qué hacer: Si usas DSPy, prueba dspy.GEPA como tu primer optimizador. Funciona mejor cuando tienes métricas de calidad medibles contra las cuales optimizar.

4. La ingeniería de contexto ya es una disciplina real

El giro de la ingeniería de prompts a la ingeniería de contexto ya no es solo una palabra de moda. Ahora hay buenas prácticas concretas documentadas en toda la industria:

La recuperación justo a tiempo supera a llenar todo tu prompt con tu base de conocimiento completa. Primero identifica la intención, luego trae solo lo relevante.
Mantén las selecciones de herramientas por debajo de 30. Aplicar RAG a las descripciones de herramientas produce una precisión de selección de herramientas 3 veces mejor.
Presta atención a dónde ubicas la información crítica. Los modelos muestran una curva de atención en forma de U: la precisión cae más del 30% para la información enterrada en medio de contextos largos. Coloca lo importante al principio o al final.

5. La orquestación multiagente se vuelve mainstream

Los sistemas multiagente ya no son experimentales. Roles de agente especializados (Planner, Implementer, Tester, Reviewer) trabajando en equipos coordinados son ahora la arquitectura por defecto de los sistemas de IA en producción. MCP (Model Context Protocol) superó los 10,000 servidores públicos activos y cuenta con soporte de ChatGPT, Cursor, Gemini y VS Code.

Qué hacer: Si estás construyendo con agentes, enfócate en definiciones de roles claras y protocolos de traspaso entre agentes, en lugar de amontonar instrucciones detalladas en cada uno.

6. Los modelos de pesos abiertos están cerrando la brecha

Llama 4 se envía en configuraciones de hasta 128x17B parámetros con razonamiento sólido. Mistral Small 3.2 alcanza 92.9% en HumanEval Plus mientras corre 3 veces más rápido que Llama 3.3 70B. Para la mayoría de los casos de uso empresariales, un buen prompting con ejemplos few-shot en modelos de pesos abiertos ya resuelve el trabajo sin necesidad de fine-tuning.

La conclusión

El tema en común de las seis novedades es el mismo: la estructura le gana a la creatividad. Ya sea con prompts estructurados para GPT-5.4, configuraciones de esfuerzo explícitas para Claude 4.6, o roles de agente bien definidos en sistemas multiagente, los modelos son cada vez mejores siguiendo instrucciones claras, y los mejores resultados vienen de darles exactamente eso.

Qué cambió esta semana

El panorama de la IA avanzó rápido esta semana. Aquí van seis novedades que importan si escribes prompts para vivir, o si simplemente quieres mejores resultados de los modelos de IA.

1. GPT-5.4 es el nuevo modelo por defecto

2. Claude 4.6 introduce el parámetro de esfuerzo

Qué hacer: Configura el parámetro de esfuerzo de forma explícita. Usa esfuerzo alto para tareas de razonamiento complejas y bájalo para las más simples donde la velocidad importa más.

3. GEPA: una mejor forma de optimizar prompts automáticamente

Qué hacer: Si usas DSPy, prueba dspy.GEPA como tu primer optimizador. Funciona mejor cuando tienes métricas de calidad medibles contra las cuales optimizar.

4. La ingeniería de contexto ya es una disciplina real

El giro de la ingeniería de prompts a la ingeniería de contexto ya no es solo una palabra de moda. Ahora hay buenas prácticas concretas documentadas en toda la industria:

La recuperación justo a tiempo supera a llenar todo tu prompt con tu base de conocimiento completa. Primero identifica la intención, luego trae solo lo relevante.
Mantén las selecciones de herramientas por debajo de 30. Aplicar RAG a las descripciones de herramientas produce una precisión de selección de herramientas 3 veces mejor.
Presta atención a dónde ubicas la información crítica. Los modelos muestran una curva de atención en forma de U: la precisión cae más del 30% para la información enterrada en medio de contextos largos. Coloca lo importante al principio o al final.

5. La orquestación multiagente se vuelve mainstream

Qué hacer: Si estás construyendo con agentes, enfócate en definiciones de roles claras y protocolos de traspaso entre agentes, en lugar de amontonar instrucciones detalladas en cada uno.

6 novedades de prompt engineering que debes conocer esta semana

Qué cambió esta semana

1. GPT-5.4 es el nuevo modelo por defecto

2. Claude 4.6 introduce el parámetro de esfuerzo

3. GEPA: una mejor forma de optimizar prompts automáticamente

4. La ingeniería de contexto ya es una disciplina real

5. La orquestación multiagente se vuelve mainstream

6. Los modelos de pesos abiertos están cerrando la brecha

La conclusión

Lleva PromptArch a tu equipo

6 novedades de prompt engineering que debes conocer esta semana

Qué cambió esta semana

1. GPT-5.4 es el nuevo modelo por defecto

2. Claude 4.6 introduce el parámetro de esfuerzo

3. GEPA: una mejor forma de optimizar prompts automáticamente

4. La ingeniería de contexto ya es una disciplina real

5. La orquestación multiagente se vuelve mainstream

6. Los modelos de pesos abiertos están cerrando la brecha

La conclusión

Lleva PromptArch a tu equipo