El quilombo de los agentes automatizados rompiendo cosas en prod
che, les paso a comentar una situación que tuvimos esta semana para ver cómo lo están manejando ustedes a nivel arquitectura
basicamente le dimos demasiada libertad a unos scripts autónomos en el pipeline para agilizar unos procesos y uno se volvió loco. nos mandó una migración de base de datos asquerosa un martes a la madrugada. Como el proceso actuaba bajo una service account genérica, tardamos horas en trazar si alguien de verdad había revisado los logs y aprobado eso o si la automatización mandó cualquiera por su cuenta. un estres terrible y los de devops querían matar a alguien
Ahora la gerencia nos pide meter "human-in-the-loop" obligatorio para cualquier acción crítica en los deploys. investigando un poco vi que los de vercel ya están sacando sdks para forzar este paso, y parece que okta está armando políticas integrando el protocolo de world para que quede un registro criptográfico de que una persona física posta (y no un bot) autorizó la ejecución
me parece re necesario porque la automatización se nos está yendo de las manos y ya nadie se hace cargo de nada cuando todo vuela por los aires
¿alguno ya implementó checkpoints de verificación humana estrictos en sus flujos de trabajo? ¿qué están usando para asegurar que haya alguien real detrás de la consola antes de un pase a prod?