Da intenção à ação.
Agentes são lentos porque pensam um passo por vez. O Weft é o runtime que permite ao modelo expor tudo que precisa de uma vez — e executa tudo junto.
O gargalo
Pensando, um passo por vez.
Os agentes de hoje fazem loop: pensa, age, observa, repete — seriais por construção, queimando tempo e tokens com o mesmo raciocínio repetido.
A ideia
Emita o grafo inteiro, de uma vez.
O Weft permite ao modelo declarar tudo que precisa de antemão. Um runtime executa em paralelo, reutiliza trabalho repetido e divide a carga entre servidor e navegador — para que o trabalho termine junto, não em fila.
Projetado para
Mais rápido, por design.
A arquitetura mira uma mudança de patamar, não um ajuste fino. Estes são objetivos de design — sendo construídos e medidos, ainda não são benchmarks.
5× mais rápido — alvo
Execução paralela em vez de loop serial.
60–80% menos tokens
Sem raciocinar os mesmos passos repetidamente.
1 grafo, não um loop
Declare uma vez; o runtime faz o resto.
Observável por padrão
Veja o que rodou, quando e por quê — sem caixa-preta.