Primeiras impressões do GPT-5.2: uma atualização poderosa, especialmente para tarefas de negócios e fluxos de trabalho

Edição - Istoé TECH

A OpenAI lançou oficialmente o GPT-5.2, e as reações dos primeiros testadores – entre os quais a OpenAI semeou o modelo vários dias antes do lançamento público, em alguns casos semanas atrás – pinta um quadro de dois tons: é um salto monumental para o raciocínio e codificação profundos e autônomos, mas potencialmente desanimador "incremental" atualização para conversadores casuais.

Após os períodos de acesso antecipado e a implementação mais ampla de hoje, executivos, desenvolvedores e analistas acessaram o X (antigo Twitter) e os blogs da empresa para compartilhar seus primeiros resultados de testes.

Aqui está um resumo das primeiras reações ao mais recente modelo carro-chefe da OpenAI.

"IA como um analista sério"

O maior elogio ao GPT-5.2 centra-se na sua capacidade de lidar com "problemas difíceis" que exigem tempo de reflexão prolongado.

Matt Shumer, CEO da HyperWriteAI, não mediu palavras em sua análise, chamando GPT-5.2 Pro "o melhor modelo do mundo."

Shumer destacou a tenacidade do modelo, observando que "ele pensa por **mais de uma hora** em problemas difíceis. E cumpre tarefas que nenhum outro modelo pode realizar."

Esse sentimento foi repetido por Allie K. Miller, empreendedora de IA e ex-executiva da AWS. Miller descreveu o modelo como um passo em direção "IA como um analista sério" em vez de um "companheiro amigável."

"O pensamento e a resolução de problemas parecem visivelmente mais fortes," Miller escreveu em X. "Dá explicações muito mais profundas do que estou acostumado a ver. A certa altura, ele literalmente escreveu código para melhorar seu próprio OCR no meio de uma tarefa."

Ganhos empresariais: Box relata saltos de desempenho distintos

Para o setor empresarial, a atualização parece ser ainda mais significativa.

Aaron Levie, CEO da Box, revelou no X que sua empresa está testando o GPT-5.2 no acesso antecipado. Levie relatou que o modelo tem um desempenho "7 pontos melhor que GPT-5.1" em seus testes de raciocínio expandido, que aproximam o trabalho de conhecimento do mundo real em serviços financeiros e ciências da vida.

"O modelo executou a maioria das tarefas muito mais rápido que o GPT-5.1 e o GPT-5 também," Levie observou, confirmando que a Box AI lançará a integração GPT-5.2 em breve.

Rutuja Rajwade, gerente sênior de marketing de produto da Box, expandiu isso em uma postagem no blog da empresa, citando melhorias específicas na latência.

"Extração complexa" as tarefas caíram de 46 segundos no GPT-5 para apenas 12 segundos no GPT-5.2.

Rajwade também observou um salto nas capacidades de raciocínio para a vertical de Mídia e Entretenimento, passando de 76% de precisão no GPT-5.1 para 81% no novo modelo.

UM "salto sério" para codificação e simulação

Os desenvolvedores estão achando o GPT-5.2 particularmente potente para "tiro único" geração de estruturas de código complexas.

Pietro Schirano, CEO da magicpathai, compartilhou um vídeo do modelo construindo um mecanismo gráfico 3D completo em um único arquivo com controles interativos. "É um grande avanço em raciocínio complexo, matemática, codificação e simulações," Schirano postou. "O ritmo do progresso é irreal."

Sda mesma forma, Ethan Mollick, professor da Wharton School of Business da Universidade da Pensilvânia e antigo usuário e escritor de LLM e IA, demonstrou a capacidade do modelo de criar um shader visualmente complexo – uma cidade neogótica infinita em um oceano tempestuoso – por meio de um único prompt.

A Era Agentic: Autonomia de longa duração

Talvez a mudança mais funcional seja a capacidade do modelo de permanecer concentrado na tarefa por horas sem perder o fio da meada.

Dan Shipper, CEO do boletim informativo de testes de IA Every, relatou que o modelo executou com sucesso uma análise de lucros e perdas (P&L) que exigiu que ele funcionasse de forma autônoma por duas horas. "Fez uma análise de P&L onde funcionou por 2 horas e me deu ótimos resultados," O remetente escreveu.

No entanto, o Shipper também observou que, para as tarefas do dia-a-dia, a atualização parece "principalmente incremental."

Em um artigo para Every, Katie Parrott escreveu que embora o GPT-5.2 seja excelente no seguimento de instruções, é "menos engenhoso" do que concorrentes como Claude Opus 4.5 em determinados contextos, como deduzir a localização de um usuário a partir de dados de e-mail.

As desvantagens: velocidade e rigidez

Apesar da capacidade de raciocínio, o "sentir" do modelo atraiu críticas.

Shumer destacou um significativo "penalidade de velocidade" ao usar o modo Pensamento do modelo. "Na minha experiência, o modo Pensamento é muito lento para a maioria das perguntas," Shumer escreveu em sua análise aprofundada. "Quase nunca uso o Instant."

Allie Miller também apontou problemas com o comportamento padrão do modelo. "A desvantagem é o tom e o formato," ela notou. "A voz padrão parecia um pouco mais rígida e o comportamento de comprimento/redução é extremo: uma pergunta simples se transformou em 58 marcadores e pontos numerados."

O veredicto

A reação inicial sugere que o GPT-5.2 é uma ferramenta otimizada para usuários avançados, desenvolvedores e agentes corporativos, em vez de bate-papo casual. Como Shumer resumiu em sua crítica: "Para pesquisas profundas, raciocínio complexo e tarefas que se beneficiam de uma reflexão cuidadosa, o GPT-5.2 Pro é a melhor opção disponível no momento."

No entanto, para usuários que buscam escrita criativa ou respostas rápidas e fluidas, modelos como o Claude Opus 4.5 continuam sendo fortes concorrentes. "Meu modelo favorito continua sendo Claude Opus 4.5," Miller admitiu, "mas meu trabalho complexo no ChatGPT receberá um bom impulso incremental."

Fonte ==> Cyberseo