A Anthropic afirma que 80% de seu novo código de produção agora é de autoria de Claude – como sua empresa pode acompanhar

Edição - Istoé TECH

O cofundador e CEO da Anthropic, Dario Amodei, disse que isso estava chegando, mas ainda parece um marco: mais de 80% do código incorporado à base de código de produção da Anthropic em maio não foi de autoria de humanos, mas de seu próprio modelo de IA, Claude, de acordo com um novo relatório compartilhado hoje pela startup recorde de IA.

Essa transformação desencadeou um aumento de 8x no volume de código enviado por engenheiro por trimestre em comparação com a linha de base da empresa de 2021–2025, o que, segundo a empresa, significa ainda mais código que alguém ou algo deve revisar.

Para os líderes técnicos empresariais, esta não é mais uma curiosidade de pesquisa localizada; é uma base competitiva nova e agressiva.

Se um laboratório de IA de ponta puder transferir com sucesso a grande maioria de sua produção de engenharia para agentes autônomos – mostrando sinais do tão procurado Santo Graal da IA "autoaperfeiçoamento recursivo," modelos que podem pesquisar e atualizar-se de forma independente – o que impede as empresas de outros setores de automatizarem mais o seu desenvolvimento interno de software também com agentes de IA?

Obviamente, é mais fácil falar do que fazer. A Anthropic é uma das principais criadoras do atual boom da geração de IA, então seria de se esperar que eles soubessem como implantar a tecnologia de maneira eficaz.

Mas para outras empresas que buscam aumentar a quantidade de códigos e fluxos de trabalho gerenciados pelos agentes, a nova postagem no blog da Anthropic detalha os contornos de um plano geral que eles também podem adotar para reprojetar suas operações e fluxos de trabalho para aproveitar as vantagens dos mais recentes avanços da IA.

Roteiro da Antrópica que outros empreendimentos podem seguir

A transição da codificação centrada no ser humano para a orquestração autônoma requer a compreensão da evolução das capacidades de IA. A Anthropic descreve um continuum histórico claro que as empresas podem mapear em seus próprios roteiros de transformação digital:

2021–2023 (Escrita do Manual): Os engenheiros escrevem código e documentação nativamente em editores de texto locais.
2023–2025 (Assistência ao Chatbot): Os desenvolvedores usam modelos iniciais para gerar breves trechos de código, copiando e colando os resultados manualmente em seus ambientes.
2025–2026 (Agentes de Codificação): Agentes capacitados escrevem e editam ativamente arquivos inteiros de forma autônoma.
Atualidade (Agentes Autônomos): Os agentes executam código de forma independente, depuram ambientes ativos e delegam fluxos de trabalho de várias horas a subagentes especializados.

Esta rápida evolução é validada por benchmarks externos. Estruturas de avaliação de engenharia de software como o SWE-bench – que executa modelos com a resolução de relatórios de bugs reais em bases de código complexas e de código aberto – ficaram saturadas ao longo de um período de dois anos.

Além disso, avaliações de capacidade de longa duração demonstram que modelos como o Claude Opus 4.6 podem sustentar operações de forma confiável em tarefas de 12 horas, enquanto o Claude Mythos Preview ultrapassa 16 horas de resolução contínua de problemas.

Internamente, o salto tecnológico é ainda mais acentuado. Em problemas de engenharia altamente complexos e abertos, onde inicialmente não existem especificações claras, a taxa de sucesso de Claude subiu para 76% em maio de 2026 – um aumento de 50 pontos num período de seis meses.

Em benchmarks de otimização isolados, onde os modelos têm a tarefa de acelerar o código de treinamento do modelo de IA, o modelo interno Mythos Preview da Anthropic alcançou uma aceleração de 52x.

Para efeito de comparação, um desenvolvedor humano qualificado normalmente requer de quatro a oito horas de refatoração manual para atingir uma aceleração de apenas 4x na mesma base de código.

Plano de três etapas para automação mais completa do código de produção

Para que uma empresa reproduza o marco de 80% da Anthropic, os tomadores de decisão técnicos devem abandonar o "assistente de desenvolvedor" modelo mental e transição para um "fábrica automatizada" arquitetura. Essa mudança impacta o gerenciamento de produtos, as operações e os fluxos de trabalho dos desenvolvedores de três maneiras distintas:

1. Mudança da execução de código para supervisão de arquitetura

Quando a geração de código custa quase zero em tempo humano, a principal função da engenharia muda de escrever software para especificar metas e revisar resultados. Os líderes empresariais devem treinar novamente os desenvolvedores para atuarem como arquitetos e juízes de sistemas. Como observou um funcionário da Anthropic sobre a realidade operacional desta mudança:

"A forma das coisas hoje é aproximadamente “os humanos têm ideias e os modelos são capazes de implementá-las, testá-las e avaliá-las (uma ordem de grandeza) mais rapidamente do que antes”."

2. Supere o gargalo da revisão de código

A injeção de grandes quantidades de código gerado por IA em uma organização cria inevitavelmente atrito operacional.

De acordo com a lei de Amdahl, a aceleração de qualquer processo é estritamente limitada pelos seus gargalos seriais e não automatizados.

Na Anthropic, inundar o sistema com código sintético transformou instantaneamente a revisão humana de código em um gargalo crítico.

Para combater isso, as equipes empresariais devem implantar revisores automatizados de código de IA diretamente em seus pipelines de Integração Contínua/Implantação Contínua (CI/CD).

A Anthropic implementou um revisor Claude automatizado (uma versão acessível ao público, Claude Code Review lançada para uso comercial em março) com a tarefa de analisar cada solicitação pull em busca de defeitos arquitetônicos, falhas de segurança e bugs de regressão antes da fusão. Outras empresas dedicadas, como a Qodo, também oferecem ferramentas feitas sob medida para essa finalidade.

No caso da Anthropic, análises retrospectivas indicaram que a camada automatizada detectou aproximadamente um terço dos bugs de produção responsáveis por interrupções históricas no site principal claude.ai.

3. Visar dívida operacional de alto volume

As empresas ficam frequentemente paralisadas pela manutenção de códigos legados e dívidas técnicas há muito adiadas. Em vez de implantar agentes para escrever novos recursos especulativos, os líderes técnicos devem direcionar os agentes autônomos para operações de limpeza meticulosas e de ciclo fechado.

Em abril de 2026, um engenheiro da Anthropic implantou Claude para resolver uma classe persistente de erros de API. Operando de forma autônoma, o modelo enviou mais de 800 correções individuais, reduzindo com sucesso a taxa de erros por um fator de 1.000.

O engenheiro supervisor estimou que um desenvolvedor humano teria passado quatro anos completos executando o mesmo trabalho, devido à carga cognitiva de manter simultaneamente um contexto de código enorme e desconhecido em sua cabeça.

Considerações para as empresas que avançam em uma era de código gerado principalmente por IA

Operar uma base de código predominantemente criada por IA apresenta desafios de governança únicos que as equipes jurídicas e de segurança corporativas devem enfrentar.

Ao contrário dos modelos de licenciamento de código aberto (como a licença permissiva do MIT ou estruturas copyleft GPL), as bases de código empresariais que utilizam infraestrutura LLM proprietária permanecem sujeitas aos termos de serviço comerciais do respectivo fornecedor de IA.

A implantação de agentes autônomos requer protocolos de verificação rigorosos para garantir conformidade, segurança e proteção da propriedade intelectual:

Qualidade e manutenção do código: Os dados internos da Antrópico indicam que, embora o código de autoria da IA fosse objetivamente inferior em qualidade à produção humana no final de 2025, atingiu uma paridade aproximada em meados de 2026, com expectativas de ultrapassar os padrões humanos dentro de um ano. A governação empresarial deve adaptar-se a uma realidade em que a qualidade básica dos resultados automatizados é estruturalmente superior à codificação manual média.
Auditoria de segurança em escala: O grande volume de criação automatizada de código exige descoberta automatizada de vulnerabilidades. O Projeto Glasswing da Anthropic ilustra a escala desse problema: utilizando o Mythos Preview, o projeto identificou mais de 10.000 vulnerabilidades de software de gravidade alta e crítica em toda a infraestrutura digital global nas primeiras semanas. Isso mudou totalmente o desafio da segurança cibernética corporativa da vulnerabilidade descoberta corrigir Implantação velocidade.
O risco de cascatas de alinhamento: Os líderes técnicos devem manter portões de verificação rigorosos. Se uma empresa utiliza um sistema de IA para modificar, manter e expandir continuamente a sua infraestrutura de software proprietária, erros não detetados ou desalinhamentos subtis podem agravar-se ao longo de sessões sucessivas do agente, corrompendo gradualmente a integridade do sistema ou introduzindo explorações de segurança que escapam à atenção humana.

Prepare-se para a disrupção da cultura empresarial interna

A transição para uma base de código dominada pela IA está a alterar a dinâmica cultural das equipas de engenharia, introduzindo uma eficiência sem precedentes e um profundo atrito psicológico.

Publicamente, a Anthropic enquadrou essas métricas como um prenúncio de uma transformação mais ampla. Em comunicado oficial no X, a empresa observou:

"Nossos dados internos mostram que Claude está acelerando o desenvolvimento da IA – um caminho possível para o autoaperfeiçoamento recursivo ou para a IA construir autonomamente um sucessor mais capaz. Está acontecendo mais rápido do que pensávamos e as implicações merecem maior atenção."

Eles expandiram as implicações imediatas da produtividade logo depois:

"Hoje, os engenheiros da Anthropic enviam, em média, 8 vezes mais código por trimestre do que em comparação com 2021-2025… Muitos engenheiros também dizem que a qualidade do código de Claude está agora no mesmo nível do código humano; esperamos que seja melhor dentro do ano."

Por trás dessas métricas corporativas está uma realidade humana complexa. As comunicações internas dos funcionários revelam uma erosão distinta da colaboração tradicional no local de trabalho, à medida que a interação ponto a ponto entre desenvolvedores é sistematicamente substituída por chamadas assíncronas de agentes:

"O trabalho (e a vida) funcionava com base numa economia de dádivas de pequenos favores entre humanos. ‘Você pode me ajudar a executar esse script?’ (…) cada um criou um pouco de dívida, um pouco de consciência mútua. Claude comeu os favores. É mais rápido, cria dívida zero, mas cada uma destas situações é uma aposta perdida na colaboração humana."

Para colaboradores individuais, a automatização total do seu conjunto de competências primárias introduz uma ansiedade profissional aguda relativamente à relevância e ao controlo sistémico:

"Comecei a me dedicar fortemente à Claudificação há cerca de um ano. Tem sido uma aventura maluca e já se passaram cerca de 5 meses desde a última vez que escrevi qualquer código."

"Nos dias em que tudo funciona bem, não posso deixar de pensar que nada do que faço importa, tudo é automatizado, melhor e mais rápido do que jamais serei. Mas há dias em que tudo quebra e eu não entendo o porquê e percebo que não tenho mais ideia do que tenho feito."

Os líderes empresariais que pretendem igualar a velocidade técnica da Antrópica não podem dar-se ao luxo de ignorar esta dinâmica psicológica.

Alcançar uma base de código 80% automatizada requer mais do que comprar tokens de API ou configurar loops de agente; exige uma revisão cultural total, uma estratégia para mitigar a ansiedade da obsolescência do desenvolvedor e a implementação de proteções de verificação rigorosas e automatizadas para manter o controle humano final sobre a pilha de software.

Fonte ==> Cyberseo