Pular para o conteúdo principal

AI Development Loop

AI Development Loop é um projeto para investigar um fluxo de desenvolvimento em que agentes recebem contexto, planejam tarefas, executam implementações e evoluem código com o mínimo de intervenção manual viável.

O objetivo não é remover humanos do processo. O objetivo é entender onde agentes criam valor real, onde falham, quais controles são necessários e como medir se o fluxo melhora o trabalho de engenharia.

Problema

Agentes conseguem executar partes relevantes do trabalho técnico, mas perdem qualidade quando o contexto está disperso, quando a validação é fraca ou quando decisões ficam presas em uma única sessão.

O projeto investiga como construir um ciclo mais confiável entre humano, agente, código, testes, documentação e feedback.

Perguntas iniciais

  • Como dividir trabalho entre humanos e agentes?
  • Como orientar agentes com contexto suficiente sem gastar tokens demais?
  • Como validar entregas feitas por IA?
  • Como evitar perda de contexto entre sessões?
  • Como transformar decisões em documentação persistente?
  • Como medir qualidade, custo e produtividade?
  • Como criar ciclos de feedback confiáveis?
  • Como agentes podem trabalhar com issues, código, testes e documentação?

Ciclo proposto

  1. Capturar contexto relevante do projeto.
  2. Transformar objetivo em plano de execução.
  3. Executar mudanças pequenas e verificáveis.
  4. Rodar validação estreita antes de ampliar escopo.
  5. Registrar decisões, limitações e evidências.
  6. Reutilizar o aprendizado na próxima sessão ou tarefa.

Critérios de validação

Um fluxo só é considerado útil quando deixa evidência concreta:

  • Diferença clara entre o que o agente fez e o que o humano precisou corrigir.
  • Comandos, testes ou verificações executadas.
  • Custos ou sinais de custo quando forem relevantes.
  • Limitações encontradas.
  • Conhecimento novo persistido perto do projeto.

Próximos registros

Os próximos documentos deste projeto devem detalhar experimentos reais, incluindo escopo, contexto fornecido ao agente, execução, validação, falhas e melhorias.