A fabricante chinesa de eletrônicos e automóveis Xiaomi surpreendeu hoje a comunidade global de IA com o lançamento do MiMo-V2-Pro, um novo modelo básico de 1 trilhão de parâmetros com benchmarks que se aproximam dos gigantes de IA dos EUA OpenAI e Anthropic, mas com cerca de um sétimo ou sexto do custo quando acessado por meio de API proprietária – e, mais importante, enviando menos de 256.000 tokens de informações de um lado para outro.
Liderado por Fuli Luo, um veterano do projeto disruptivo DeepSeek R1, o lançamento representa o que Luo caracteriza como um "emboscada silenciosa" na fronteira global. Além disso, Luo afirmou em um post X que a empresa planeja abrir o código-fonte de uma variante do modelo deste último lançamento, " quando os modelos são estáveis o suficiente para merecê-lo."
Ao focar no "espaço de ação" de inteligência – passando da geração de código para a operação autônoma de digital "garras"—Xiaomi está tentando ultrapassar totalmente o paradigma conversacional.
Antes desta incursão na IA de fronteira, a Xiaomi, com sede em Pequim, estabeleceu-se como um titã da "A Internet das Coisas" e hardware de consumo.
Globalmente reconhecida como o terceiro maior fabricante mundial de smartphones, a Xiaomi passou o início da década de 2020 a executar uma entrada de alto risco no setor automóvel. Os seus veículos eléctricos (EV), como o SU7 e o recentemente lançado SUV YU7, transformaram a empresa numa potência verticalmente integrada, capaz de fundir hardware, software e, agora, raciocínio avançado.
Este pedigree em engenharia do mundo físico informa a arquitetura do MiMo-V2-Pro; foi construído para ser o "cérebro" de sistemas complexos, quer esses sistemas estejam gerenciando cadeias de suprimentos globais ou navegando nas intrincadas estruturas de um agente de codificação autônomo.
Tecnologia: A arquitetura da agência
O desafio central do "Era do Agente" está mantendo um raciocínio de alta fidelidade sobre grandes extensões de dados sem incorrer em custos proibitivos. "imposto de inteligência" em latência ou custo. O MiMo-V2-Pro aborda isso por meio de uma arquitetura esparsa: embora abrigue parâmetros totais de 1T, apenas 42B estão ativos durante qualquer passagem de avanço único, tornando-o aproximadamente três vezes o tamanho de seu antecessor, MiMo-V2-Flash.
A eficiência do modelo está enraizada em um mecanismo evoluído de Atenção Híbrida. Os transformadores padrão normalmente enfrentam um aumento quadrático nos requisitos de computação à medida que o contexto cresce; MiMo-V2-Pro utiliza uma proporção híbrida de 7:1 (aumentada de 5:1 na versão Flash) para gerenciar sua enorme janela de contexto de 1 milhão de tokens. Esta escolha arquitetônica permite que o modelo mantenha uma profunda "memória" de tarefas de longa duração sem a degradação de desempenho normalmente vista em modelos de fronteira.
A analogia: pense no modelo não como um estudante lendo um livro página por página, mas como um pesquisador especialista em uma vasta biblioteca. A proporção de 7:1 permite que o modelo "desnatar" 85% dos dados para contexto, aplicando atenção de alta densidade aos 15% mais relevantes para a tarefa em questão.
Isso é combinado com uma camada leve de Multi-Token Prediction (MTP), que permite ao modelo antecipar e gerar vários tokens simultaneamente, reduzindo drasticamente a latência necessária para o "pensamento" fases dos fluxos de trabalho de agente. Segundo Luo, estas decisões estruturais foram tomadas com meses de antecedência, especificamente para proporcionar uma "vantagem estrutural" pela velocidade inesperada com que a indústria mudou para agentes.
Produto e benchmarking: uma verificação da realidade de terceiros
Os dados internos da Xiaomi mostram um modelo que se destaca em "mundo real" tarefas sobre benchmarks sintéticos. No GDPval-AA, um benchmark que mede o desempenho em tarefas de trabalho do mundo real, o MiMo-V2-Pro alcançou um Elo de 1426, colocando-o à frente dos principais pares chineses como GLM-5 (1406) e Kimi K2.5 (1283).
Embora ainda siga o caminho ocidental "esforço máximo" modelos como Claude Sonnet 4.6 (1633) em Elo bruto, representa o desempenho mais alto registrado para um modelo de origem chinesa nesta categoria.
A organização de benchmarking terceirizada Artificial Analysis verificou essas afirmações, colocando o MiMo-V2-Pro em 10º lugar em seu Índice de Inteligência global com uma pontuação de 49. Isso o coloca no mesmo nível do Codex GPT-5.2 e à frente do Grok 4.20 Beta. Estes resultados sugerem que a Xiaomi construiu com sucesso um modelo capaz de raciocínio de alto nível necessário para tarefas de engenharia e produção.
As principais métricas da Análise Artificial destacam um salto significativo em relação à versão anterior de pesos abertos, MiMo-V2-Flash (que obteve 41 pontos):
-
Taxa de alucinação: O modelo Pro reduziu as taxas de alucinação para 30%, uma melhoria acentuada em relação aos 48% do modelo Flash.
-
Índice de onisciência: Ele marcou +5, colocando-o à frente do GLM-5 (+2) e do Kimi K2.5 (-8).
-
Eficiência do token: Para executar todo o Índice de Inteligência, o MiMo-V2-Pro exigiu apenas 77 milhões de tokens de saída, significativamente menos que o GLM-5 (109 milhões) ou o Kimi K2.5 (89 milhões), indicando um processo de raciocínio mais conciso e eficiente.
Os próprios gráficos da Xiaomi enfatizam ainda mais sua "Agente Geral" e "Agente de codificação" capacidades. No ClawEval, uma referência para andaimes de agentes, o modelo obteve pontuação de 61,5, aproximando-se do desempenho de Claude Opus 4,6 (66,3) e superando significativamente o GPT-5,2 (50,0). Em ambientes específicos de codificação como Terminal-Bench 2.0, alcançou 86,7, sugerindo alta confiabilidade ao executar comandos em um ambiente de terminal ativo.
Como as empresas devem avaliar o uso do MiMo-V2-Pro
Para as personas delineadas nas organizações contemporâneas de IA – da infraestrutura à segurança – o MiMo-V2-Pro representa uma mudança de paradigma no "Preço-Qualidade" curva.
Os tomadores de decisão de infraestrutura considerarão o MiMo-V2-Pro um candidato atraente para a fronteira Pareto de inteligência versus custo. A Artificial Analysis relatou que a execução de seu índice custou apenas US$ 348 para o MiMo-V2-Pro, em comparação com US$ 2.304 para o GPT-5.2 e US$ 2.486 para o Claude Opus 4.6.
Para organizações que gerenciam clusters de GPU ou compras, a capacidade de acessar as 10 principais informações globais por aproximadamente 1/7 do custo dos operadores históricos ocidentais é um incentivo poderoso para testes em escala de produção.
Os tomadores de decisão de dados podem aproveitar a janela de contexto de 1 milhão para arquiteturas prontas para RAG, permitindo-lhes alimentar bases de código empresariais inteiras ou conjuntos de documentação em um único prompt, sem a fragmentação exigida por modelos de contexto menores.
Um tomador de decisão de sistemas/orquestração deve avaliar o MiMo-V2-Pro como principal "cérebro" para coordenação multiagente. Como o modelo é otimizado para OpenClaw e Claude Code, ele pode lidar com o planejamento de longo prazo e o uso preciso de ferramentas sem a constante intervenção humana que assola os modelos anteriores.
Sua alta classificação no GDPval-AA sugere que ele é particularmente adequado para o fluxo de trabalho e a camada de orquestração necessária para dimensionar a IA em toda a empresa. Ele permite a criação de sistemas que podem ir além da simples automação para a solução de problemas complexos e em várias etapas.
Contudo, os decisores de segurança devem ter cautela. O muito "agente" A natureza que torna o modelo poderoso – sua capacidade de usar terminais e manipular arquivos – aumenta a área de superfície para injeção imediata e acesso não autorizado ao modelo.
Embora a sua baixa taxa de alucinações (30%) seja uma vantagem defensiva, a falta de pesos públicos (ao contrário da versão Flash) significa que as equipas de segurança interna não podem realizar o trabalho profundo. "nível de modelo" auditorias às vezes são necessárias para implantações altamente confidenciais. Qualquer implementação empresarial deve ser acompanhada por protocolos robustos de monitorização e auditabilidade.
Preço, disponibilidade e o caminho a seguir
A Xiaomi fixou o preço do MiMo-V2-Pro para dominar o mercado de desenvolvedores. O preço é escalonado com base no uso do contexto, com taxas competitivas de armazenamento em cache para dar suporte a tarefas de raciocínio de alta frequência.
-
MiMo-V2-Pro (até 256K): US$ 1 por 1 milhão de tokens de entrada e US$ 3 por 1 milhão de tokens de saída
-
MiMo-V2-Pro (256K-1M): US$ 2 por 1 milhão de tokens de entrada e US$ 6 por 1 milhão de tokens de saída
-
Leitura de cache: US$ 0,20 por 1 milhão de tokens para o nível inferior e US$ 0,40 para o nível superior
-
Escrita em cache: Temporariamente gratuito ($0)
Veja como ele se compara a outros modelos de fronteira líderes em todo o mundo:
|
Modelo |
Entrada |
Saída |
Custo total |
Fonte |
|
Grok 4.1 Rápido |
US$ 0,20 |
US$ 0,50 |
US$ 0,70 |
xAI |
|
MiniMax M2.7 |
US$ 0,30 |
US$ 1,20 |
US$ 1,50 |
MiniMax |
|
Gêmeos 3 Flash |
US$ 0,50 |
US$ 3,00 |
US$ 3,50 |
|
|
Kimi-K2.5 |
US$ 0,60 |
US$ 3,00 |
US$ 3,60 |
Tiro lunar |
|
MiMo-V2-Pro (≤256K) |
US$ 1,00 |
US$ 3,00 |
US$ 4,00 |
Xiaomi MiMo |
|
GLM-5-Turbo |
US$ 0,96 |
US$ 3,20 |
US$ 4,16 |
OpenRouter |
|
GLM-5 |
US$ 1,00 |
US$ 3,20 |
US$ 4,20 |
Z.ai |
|
Claude Haiku 4.5 |
US$ 1,00 |
US$ 5,00 |
US$ 6,00 |
Antrópico |
|
Qwen3-Max |
US$ 1,20 |
US$ 6,00 |
US$ 7,20 |
Nuvem Alibaba |
|
Gêmeos 3 Pró |
US$ 2,00 |
US$ 12,00 |
US$ 14,00 |
|
|
GPT-5.2 |
US$ 1,75 |
US$ 14,00 |
US$ 15,75 |
OpenAI |
|
GPT-5.4 |
US$ 2,50 |
US$ 15,00 |
US$ 17,50 |
OpenAI |
|
Soneto de Claude 4.5 |
US$ 3,00 |
US$ 15,00 |
US$ 18,00 |
Antrópico |
|
Fechar Trabalho 4.6 |
US$ 5,00 |
US$ 25,00 |
US$ 30,00 |
Antrópico |
|
GPT-5.4 Pró |
US$ 30,00 |
US$ 180,00 |
US$ 210,00 |
OpenAI |
Esse posicionamento agressivo foi projetado para incentivar os fluxos de aplicativos de alta intensidade que definem a próxima geração de software. O modelo está atualmente disponível apenas através da API original da Xiaomi, sem suporte atual para imagem ou entrada multimodal – uma omissão notável em uma era de "Omni" modelos, embora a Xiaomi tenha lançado um MiMo-V2-Omni separado para essas necessidades.
O "Caçador Alfa" período no OpenRouter provou que o mercado tem um grande apetite por esta combinação específica de eficiência e raciocínio. A filosofia de Fuli Luo – que a velocidade da pesquisa é alimentada por um "amor genuíno pelo mundo para o qual você está construindo"—resultou num modelo que ocupa o 2º lugar na China e o 8º a nível mundial nos índices de inteligência estabelecidos.
Quer continue a ser um "quieto" emboscar ou se tornar a base para um realinhamento global do poder da IA depende da rapidez com que os desenvolvedores adotam o "espaço de ação" sobre o "janela de bate-papo". Por enquanto, a Xiaomi mudou as traves: a questão não é mais apenas "pode falar?" mas "pode agir?"
Fonte ==> Cyberseo