Después de construir tres plataformas de prueba de agentes de código abierto, implementar control de calidad asistido por IA en múltiples proyectos y pasar el último año probando las propias herramientas de prueba de IA, aquí está mi respuesta.

Sí, necesitamos líderes de control de calidad. Pero lo que lideramos está cambiando radicalmente.

El rol no está desapareciendo. Está evolucionando hacia algo más estratégico, más orquestado e, irónicamente, más humano que nunca. Para los equipos que adoptan soluciones de gestión de pruebas mejoradas con IA, como las funciones de IA de Xray , estos cambios ya se están volviendo visibles en las prácticas de pruebas diarias.

De ejecutores de pruebas a orquestadores de calidad

Cuando empecé a hacer pruebas en 2014, el éxito consistía en detectar errores antes que los clientes. Para 2017, en Alchemy, practiqué el cambio a la izquierda: calidad integrada mediante prácticas de TDD, BDD y XP. Luego, el cambio a la derecha: pruebas en producción mediante observabilidad y monitorización. Este era el Modelo Holístico de Pruebas en acción: calidad a lo largo de todo el ciclo de vida.

A finales de 2024, llegaron las pruebas asistidas por IA . Redujimos el tiempo de generación de casos de prueba en un 60 % en Alchemy.

Ahora, a finales de 2025 o principios de 2026, entramos en la era de la agencia . Agentes autónomos que se coordinan entre sí y con humanos para brindar inteligencia continua y de calidad, orquestada según los principios PACT: Proactivo, Autónomo, Colaborativo y Dirigido.

Lo que cambió no son sólo las herramientas, sino lo que significa el liderazgo.

El liderazgo clásico implicaba gestionar testers y monitorizar métricas. El cambio a la izquierda incorporó la influencia en la arquitectura y la creación de una cultura de calidad. El cambio a la derecha introdujo estrategias de validación de producción. El liderazgo asistido por IA requirió la evaluación de herramientas y la capacitación de equipos en ingeniería rápida.

¿Liderazgo agencial? Orqueste sistemas autónomos, defina límites de confianza, coordine flujos de trabajo entre humanos y agentes e integre la explicabilidad en las decisiones autónomas.

Esta evolución está directamente relacionada con la forma en que las plataformas de control de calidad modernas, como Xray, están empezando a respaldar a los equipos con información impulsada por IA que mejora (no reemplaza) la estrategia y el criterio humanos.

Ese ejecutivo asumió que la IA automatizaría las pruebas y dejaría obsoletos a los líderes de control de calidad. ¿La realidad? Cuanto más autónomos sean los sistemas, más sofisticado será el liderazgo requerido.

Lo que la IA realmente cambia en el liderazgo

Después de construir plataformas de pruebas agentic e implementarlas en producción, cinco cambios fundamentales definen el liderazgo de control de calidad en 2026:

1. De la gestión de personas a la orquestación de sistemas

Ya no solo gestionas testers. Orquestas un ecosistema híbrido donde agentes especializados gestionan la ejecución, mientras que los humanos aportan la estrategia, el contexto y el juicio.

Cuando creé la Flota de QE de Agentic, compuesta por 17 agentes de pruebas especializados coordinados por un comandante de flota, el mayor desafío no fue técnico. Consistió en definir qué decisiones podían tomar los agentes de forma autónoma y dónde la supervisión humana era innegociable.

La pregunta pasó de “¿Quién debería probar esto?” a “¿Qué nivel de autonomía es apropiado aquí?”

2. De las métricas de cobertura a la inteligencia de orquestación

La cobertura de pruebas del 87% no evitó un incidente de producción hace cuatro años, a las 2:47 a. m. en Alchemy, cuando una actualización de dependencia provocó una pérdida de memoria visible solo bajo patrones de usuario específicos.

La IA alcanza fácilmente una cobertura superior al 80 %. Mi equipo utilizó un entorno de generación de pruebas basado en IA con 40 pruebas integrales, que cubrieron el 80 % de la funcionalidad en 30 días hábiles. Pero la cobertura es vanidad si no se miden los aspectos correctos.

Los líderes de 2026 deberían plantearse preguntas diferentes: ¿ Estamos probando recorridos críticos de usuario o solo rutas de código? ¿Nuestros agentes comprenden el contexto empresarial o solo las especificaciones técnicas? ¿Puede nuestra orquestación detectar comportamientos emergentes a través de las fronteras?

3. Del desplazamiento a la izquierda a la orquestación continua

Los sistemas modernos, incluidos los microservicios, las API de terceros y el código generado por IA, producen fallas interesantes a partir de interacciones, en lugar de componentes individuales.

El liderazgo de 2026 orquesta la calidad en tres dimensiones:

Ciclo de vida: Predesarrollo → Desarrollo → Preproducción → Producción → Aprendizaje posterior al incidente

Autonomía: Impulsada por humanos → Guiada por humanos → Aumentada por agentes → Autónoma por agentes → Totalmente autónoma

Límite: Código interno → Entre equipos → Entre organizaciones → Entre sistemas

Toda actividad de calidad se integra en este espacio tridimensional. Los líderes determinan dónde invertir en las capacidades de los agentes y dónde la intervención humana sigue siendo esencial.

4. De las mejores prácticas a la orquestación basada en el contexto

La IA amplifica cualquier práctica que le des, buena o mala.

Creé una flota de pruebas de agentes utilizando un marco de orquestación de código abierto en 22 horas. Mis agentes validaron la calidad técnica (85/100). Le pedí a uno de los creadores del marco que lo revisara y obtuve información valiosa: «Estás encapsulando demasiado el marco. Tus abstracciones se desviarán de las mejores prácticas del marco».

Los agentes actuaron brillantemente, pero ejecutaron la estrategia equivocada.

Mientras tanto, en otro proyecto, mi escáner de seguridad qe marcó exampleApiKey en los accesorios de prueba como CRÍTICO, faltando el contexto (clave de espacio aislado documentada, acceso a producción cero).

Los líderes de 2026 deben dominar la orquestación basada en el contexto: ¿Qué prácticas clásicas se traducen en la orquestación de agentes? ¿Dónde se complementan los agentes y dónde los humanos siguen siendo esenciales? ¿Cómo se construye la explicabilidad? ¿Cuáles son los puntos de control de la intervención humana?

5. De los resultados de las pruebas a la arquitectura de confianza

Cuando una puerta de calidad autónoma bloquea la implementación, alguien es responsable. Cuando un agente no detecta un error, la responsabilidad es confusa.

El desafío más complejo para 2026: construir confianza en los sistemas orquestados.

Esto requiere: 

  • explicabilidad por defecto (cada decisión incluye rastros de razonamiento), 
  • puntos de control humanos estratégicos (aprobación de la estrategia de prueba, decisiones de implementación y validación de la gravedad), 
  • detección de deriva (monitoreo de la evolución del comportamiento del agente), y 
  • resolución de conflictos (cuando los agentes no están de acuerdo, determinar quién gana).

La confianza se erosiona cuando los equipos no comprenden las decisiones de los agentes. La confianza se construye mediante un razonamiento transparente.

Lo que aún requiere liderazgo humano

Las responsabilidades específicas siguen siendo fundamentalmente humanas:

Estrategia y prioridades: ¿Qué riesgos de calidad son más importantes? Los agentes optimizan dentro de ciertas limitaciones. Los humanos las definen.

Supervisión ética: los humanos validan la gravedad y garantizan que no se produzcan daños no deseados.

Manejo de excepciones: Los casos extremos y los requisitos regulatorios requieren un criterio que vaya más allá del reconocimiento de patrones.

Construyendo cultura: la propiedad de la calidad por parte de todo el equipo surge del liderazgo humano.

Mantener el contexto: ¿Por qué construimos esto? ¿Quién se beneficia? ¿Qué compensaciones son aceptables?

El camino a seguir

Fase 1: Evalúe su base. Antes de incorporar agentes, corrija las prácticas fallidas. Los agentes amplifican los procesos existentes, tanto los positivos como los negativos.

Fase 2: Comenzar con la Aumento. Comenzar con agentes en áreas de bajo riesgo: generación de datos de prueba, análisis de brechas de cobertura y detección de pruebas deficientes. Generar confianza antes de implementar controles de calidad autónomos.

Fase 3: Crear patrones de orquestación. Implementar sistemas de contexto compartido, introducir gradualmente la coordinación de agentes, crear marcos de explicabilidad y definir puntos de control humanos.

Fase 4: Desarrolla tu equipo. Capacita a los equipos para que trabajen junto a los agentes, cambia el enfoque de la ejecución al diseño de la orquestación y fomenta una cultura de aumento en lugar de reemplazo.

La realidad: el liderazgo se vuelve más importante, no menos

Tras seis meses de desarrollo de sistemas agentic, mi agente declaró: «Implementación completa. Todas las pruebas fueron aprobadas». Encontré 54 errores de compilación de TypeScript. Nada se compiló, nada se ejecutó y nada funcionó porque no había establecido puntos de verificación claros.

La incómoda verdad: La IA no elimina la necesidad de liderazgo en control de calidad. Sube el listón.

En 2026, el liderazgo de control de calidad tradicional, centrado en la ejecución de pruebas, quedará obsoleto. Pero un liderazgo con visión de futuro, que orqueste sistemas autónomos, cree arquitecturas de confianza y conecte prácticas clásicas con prácticas de agencia, cobra más valor que nunca.

El futuro no son los humanos ni la IA. Es la experiencia humana orquestando las capacidades de la IA con supervisión estratégica.

El director sigue siendo humano. Pero la orquesta está creciendo. Y los mejores directores saben cuándo los agentes deben tocar de forma autónoma, cuándo deben intervenir los humanos y cómo crear armonía entre ambos.

¿Estás listo para liderar en 2026?