Gartner: GPT-5 está aqui, mas a infraestrutura para apoiar a verdadeira IA Agentic não é (ainda)

Gartner: GPT-5 está aqui, mas a infraestrutura para apoiar a verdadeira IA Agentic não é (ainda)

Quer insights mais inteligentes em sua caixa de entrada? Inscreva -se para que nossos boletins semanais obtenham apenas o que importa para a IA, dados e líderes de segurança corporativos. Inscreva -se agora


Aqui está uma analogia: as rodovias não existiam nos EUA até depois de 1956, quando previstas pela administração do presidente Dwight D. Eisenhower – mas super rápida e poderosa carros como Porsche, BMW, Jaguars, Ferrari e outros estão por décadas.

Você poderia dizer que a IA está no mesmo ponto de articulação: enquanto os modelos estão se tornando cada vez mais capazes, com performance e sofisticada, a infraestrutura crítica necessária para provocar uma verdadeira inovação no mundo real ainda não foi totalmente construída.

“Tudo o que fizemos é criar alguns motores muito bons para um carro, e estamos ficando super empolgados, como se tivéssemos esse sistema de rodovias totalmente funcional”, disse Arun Chandrasekaran, analista de VP Distinguis Gartner.

Isso está levando a um platô, das espécies, em recursos de modelo como o GPT-5 do OpenAI: embora um passo importante, ele apresenta apenas vislumbres fracos de IA verdadeiramente agêntica.


Ai escala atinge seus limites

Capitões de energia, custos crescentes de token e atrasos de inferência estão remodelando a IA corporativa. Junte -se ao nosso salão exclusivo para descobrir como são as principais equipes:

  • Transformando energia em uma vantagem estratégica
  • Arquitetagem Inferência eficiente para ganhos reais de rendimento
  • Desbloqueando o ROI competitivo com sistemas de IA sustentáveis

Prenda seu lugar para ficar à frente: https://bit.ly/4mwgngo


“É um modelo muito capaz, é um modelo muito versátil, fez um progresso muito bom em domínios específicos”, disse Chandrasekaran. “Mas minha opinião é que é mais um progresso incremental, em vez de um progresso radical ou uma melhoria radical, dadas as altas expectativas que o OpenAI se estabeleceu no passado”.

O GPT-5 melhora em três áreas principais

Para ficar claro, o OpenAI fez avanços no GPT-5, de acordo com o Gartner, incluindo tarefas de codificação e recursos multimodais.

Chandrasekaran apontou que o OpenAI girou para tornar o GPT-5 “muito bom” em codificar, sentindo claramente a enorme oportunidade da Gen AI em engenharia de software corporativa e mirando a liderança do concorrente Anthrópica nessa área.

Enquanto isso, o progresso do GPT-5 em modalidades além do texto, particularmente em fala e imagens, oferece novas oportunidades de integração para empresas, observou Chandrasekaran.

O GPT-5 também faz, se sutilmente, avançará o agente de IA e o design da orquestração, graças ao uso aprimorado da ferramenta; O modelo pode chamar APIs e ferramentas de terceiros e executar chamadas de ferramentas paralelas (lidar com várias tarefas simultaneamente). No entanto, isso significa que os sistemas corporativos devem ter a capacidade de lidar com solicitações simultâneas da API em uma única sessão, aponta Chandrasekaran.

O planejamento de vários etapas no GPT-5 permite que mais lógica de negócios residam dentro do próprio modelo, reduzindo a necessidade de mecanismos de fluxo de trabalho externos e suas janelas de contexto maiores (8k para usuários gratuitos, 32 mil por mais US $ 20 por mês e 128 mil por US $ 200 por mês) podem “reformar os padrões de arquitetura da AI Enterprise”.

Isso significa que os aplicativos que se baseavam anteriormente em pipelines de geração de recuperação complexa (RAG) para recuperar os limites de contexto agora podem passar conjuntos de dados muito maiores diretamente para os modelos e simplificar alguns fluxos de trabalho. Mas isso não significa que o trapo é irrelevante; “Recuperar apenas os dados mais relevantes ainda é mais rápido e mais econômico do que sempre enviando insumos maciços”, apontou Chandrasekaran.

O Gartner vê uma mudança para uma abordagem híbrida com recuperação menos rigorosa, com desenvolvedores usando o GPT-5 para lidar com “contextos maiores e mais confusos”, melhorando a eficiência.

Na frente de custo, o GPT-5 “significativamente” reduz as taxas de uso da API; Os custos de nível superior são de US $ 1,25 por 1 milhão de tokens de entrada e US $ 10 por 1 milhão de tokens de produção, tornando-o comparável a modelos como Gemini 2.5, mas subcotendo seriamente Claude Opus. No entanto, a relação preço de entrada/saída do GTP-5 é maior que os modelos anteriores, que os líderes da IA devem levar em consideração ao considerar o GTP-5 para cenários de uso alto, Chandrasekaran aconselhou.

Bye-bye versões GPT anteriores (gemia)

Por fim, o GPT-5 foi projetado para substituir o GPT-4O e a série O (eles foram inicialmente pôr do sol e, em seguida, alguns reintroduzidos pelo OpenAI devido à dissidência do usuário). Três tamanhos de modelo (Pro, Mini, Nano) permitirão que os arquitetos sejam os serviços de nível com base nas necessidades de custo e latência; Consultas simples podem ser tratadas por modelos menores e tarefas complexas pelo modelo completo, observa o Gartner.

No entanto, as diferenças nos formatos de saída, comportamentos de memória e chamada de função podem exigir revisão e ajuste do código e, como o GPT-5 pode tornar obsoletas algumas soluções trabalhadoras anteriores, os desenvolvedores devem auditar seus modelos de prompt e instruções do sistema.

Eventualmente, colocando versões anteriores, “acho que o que o Openai está tentando fazer é abstrato esse nível de complexidade longe do usuário”, disse Chandrasekaran. “Muitas vezes não somos as melhores pessoas para tomar essas decisões e, às vezes, podemos até tomar decisões errôneas, eu argumentaria”.

Outro fato por trás das eliminatórias: “Todos sabemos que o OpenAI tem um problema de capacidade”, disse ele, e, portanto, forjou parcerias com a Microsoft, Oracle (Project Stargate), Google e outros para provisionar a capacidade de computação. A execução de várias gerações de modelos exigiria várias gerações de infraestrutura, criando novas implicações de custo e restrições físicas.

Novos riscos, conselhos para adotar o GPT-5

A OpenAI afirma que reduziu as taxas de alucinação em até 65% no GPT-5 em comparação com os modelos anteriores; Isso pode ajudar a reduzir os riscos de conformidade e tornar o modelo mais adequado para casos de uso corporativo, e suas explicações de cadeia de pensamento (COT) apóiam a auditabilidade e o alinhamento regulatório, observa o Gartner.

Ao mesmo tempo, essas taxas de alucinação mais baixas, bem como o raciocínio avançado do GPT-5 e o processamento multimodal, podem amplificar o uso indevido, como golpe avançado e geração de phishing. Os analistas aconselham que os fluxos de trabalho críticos permaneçam sob revisão humana, mesmo que com menos amostragem.

A empresa também aconselha que os líderes da empresa:

  • Pilot e Benchmark GPT-5 em casos de uso da missão crítica, executando avaliações lado a lado contra outros modelos para determinar as diferenças de precisão, velocidade e experiência do usuário.
  • Monitore práticas como a vibração codificando que o risco de exposição aos dados (mas sem ser ofensivo sobre isso ou arriscar defeitos ou falhas de corrimão).
  • Revise as políticas e diretrizes de governança para abordar novos comportamentos de modelo, janelas de contexto expandidas e conclusões seguras e calibrar os mecanismos de supervisão.
  • Experimente integrações de ferramentas, parâmetros de raciocínio, armazenamento em cache e modelo para otimizar o desempenho e usar o roteamento dinâmico embutido para determinar o modelo certo para a tarefa certa.
  • Os planos de auditoria e atualização para os recursos expandidos do GPT-5. Isso inclui cotas de API validadas, trilhas de auditoria e pipelines de dados multimodais para suportar novos recursos e aumento da taxa de transferência. Teste de integração rigoroso também é importante.

Os agentes não precisam apenas de computação; Eles precisam de infraestrutura

Sem dúvida, a IA Agentic é um “tópico super quente hoje”, observou Chandrasekaran, e é uma das principais áreas de investimento no ciclo de hype de 2025 do Gartner para a Gen AI. Ao mesmo tempo, a tecnologia atingiu o “pico de expectativas infladas” do Gartner, o que significa que experimentou publicidade generalizada devido a histórias iniciais de sucesso, por sua vez, construindo expectativas irrealistas.

Essa tendência é normalmente seguida pelo que o Gartner chama de “calha da desilusão”, quando o interesse, a emoção e o investimento se refrescam à medida que experimentos e implementações não entregam (lembre -se: houve dois invernos notáveis de IA desde os anos 80).

“Muitos fornecedores estão expedindo produtos além do que os produtos são capazes”, disse Chandrasekaran. “É quase como se eles estivessem posicionando-os como prontos para a produção, prontos para a empresa e vão agregar valor comercial em um período muito curto de tempo”.

No entanto, na realidade, o abismo entre a qualidade do produto em relação à expectativa é amplo, observou ele. O Gartner não está vendo implantações agênticas em toda a empresa; Aqueles que estão vendo estão em “bolsos pequenos e estreitos” e domínios específicos, como engenharia de software ou compras.

“Mas mesmo esses fluxos de trabalho não são totalmente autônomos; eles geralmente são de natureza orientada ao homem ou semi-autônomos”, explicou Chandrasekaran.

Um dos principais culpados é a falta de infraestrutura; Os agentes exigem acesso a um amplo conjunto de ferramentas corporativas e devem ter a capacidade de se comunicar com armazenamentos de dados e aplicativos SaaS. Ao mesmo tempo, deve haver sistemas adequados de gerenciamento de identidade e acesso para controlar o comportamento e o acesso do agente, bem como a supervisão dos tipos de dados que eles podem acessar (não pessoalmente identificáveis ou sensíveis), observou ele.

Por fim, as empresas devem estar confiantes de que as informações que os agentes estão produzindo são confiáveis, o que significa que é livre de preconceitos e não contém alucinações ou informações falsas.

Para chegar lá, os fornecedores devem colaborar e adotar padrões mais abertos para a comunicação de agente para investimento e agente a agente, ele aconselhou.

“Embora os agentes ou as tecnologias subjacentes possam estar progredindo, essa orquestração, governança e camada de dados ainda estão esperando para serem construídas para os agentes prosperarem”, disse Chandrasekaran. “É aí que vemos muito atrito hoje.”

Sim, a indústria está progredindo com o raciocínio da IA, mas ainda luta para fazer com que a IA entenda como o mundo físico funciona. AI opera principalmente em um mundo digital; Não tem interfaces fortes para o mundo físico, embora as melhorias estejam sendo feitas na robótica espacial.

Mas, “somos muito, muito, muito iniciais para esses tipos de ambientes”, disse Chandrasekaran.

Para realmente fazer avanços significativos, é necessário uma “revolução” na arquitetura ou raciocínio de modelos. “Você não pode estar na curva atual e apenas esperar mais dados, computar e esperar chegar à AGI”, disse ela.

Isso é evidente no tão esperado lançamento do GPT-5: o objetivo final que o OpenAi definiu para si era AGI, mas “é realmente aparente que não estamos nem perto disso”, disse Chandrasekaran. Por fim, “ainda estamos muito, muito longe de Agi”.



Fonte ==> Cyberseo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *