Kilo lança KiloClaw, permitindo que qualquer pessoa implante agentes OpenClaw hospedados em produção em 60 segundos

Kilo lança KiloClaw, permitindo que qualquer pessoa implante agentes OpenClaw hospedados em produção em 60 segundos

No cenário em rápida evolução da inteligência artificial, a distância entre a ideia de um desenvolvedor e um agente funcional tem sido historicamente medida em horas de configuração, conflitos de dependência e dores de cabeça induzidas por terminais.

Esse ponto de atrito mudou hoje. Kilo, a startup de infraestrutura de IA apoiada pelo cofundador do GitLab, Sid Sijbrandij, anunciou a disponibilidade geral do KiloClaw, um serviço totalmente gerenciado projetado para implantar um agente OpenClaw pronto para produção em menos de 60 segundos.

Ao eliminar as barreiras “SSH, Docker e YAML” que protegem os agentes de IA de ponta, Kilo aposta que a próxima fase do desenvolvimento de software – muitas vezes chamada "codificação de vibração"—será definido não apenas pela qualidade de um modelo, mas pela confiabilidade da infraestrutura que o hospeda.

Tecnologia: reengenharia do sandbox agente

OpenClaw emergiu como um fenômeno viral, acumulando mais de 161.000 estrelas no GitHub, oferecendo uma capacidade que falta a muitas ferramentas proprietárias: a capacidade de realmente executar tarefas – controlar navegadores, gerenciar arquivos e conectar-se a mais de 50 plataformas de bate-papo, como Telegram e Signal.

No entanto, como observou o cofundador e CEO da Kilo, Scott Breitenother, em uma entrevista exclusiva ao VentureBeat, "O OpenClaw em si não é a parte difícil… fazê-lo funcionar é".

A arquitetura técnica do KiloClaw é diferente da "Mac Mini em uma mesa" modelo no qual muitos dos primeiros adotantes confiaram. Em vez de exigir que os usuários provisionem seu próprio hardware ou servidores virtuais privados (VPS), o KiloClaw é executado em uma arquitetura de máquina virtual (VM) multilocatário desenvolvida pela Fly.io, uma startup remota de Chicago que oferece uma nuvem pública focada no desenvolvedor. Essa configuração fornece um nível de isolamento e segurança que é difícil de ser replicado por desenvolvedores individuais.

"O que estamos fazendo é tornar o KiloClaw a maneira mais segura de arranhar," Breitenother explicou durante a entrevista. "Temos uma máquina virtual que é uma instância hospedada do OpenClaw e estamos cuidando de toda a segurança de rede, sandbox e proxies que uma empresa exigiria. Estamos essencialmente executando OpenClaw hospedado e multilocatário".

Para garantir a segurança, o KiloClaw utiliza dois proxies distintos localizados fora da VM para gerenciar o tráfego e proteger a instância da Internet aberta. Isto evita o comum "erro do usuário" expor acidentalmente as chaves de API de um agente ou deixar uma instância local vulnerável a ataques externos. "Será melhor do que (uma configuração local) em todos os sentidos," Breitenother afirmou. "Se você mesmo configurasse, provavelmente perderia uma configuração e acabaria com ela acidentalmente na Internet ou expondo uma chave de API".

Produto: O ‘traje mecânico’ e o acidente das 3 da manhã

O principal problema para os usuários do OpenClaw é o “travamento das 3 da manhã” – a tendência de processos Node.js hospedados localmente morrerem silenciosamente durante a noite, sem monitoramento de integridade ou recursos de reinicialização automática. O KiloClaw resolve isso com monitoramento de processos integrado e um sistema nativo da nuvem "sempre ligado" estado.

Ao contrário dos fluxos de trabalho padrão do Kilo Code, que iniciam uma sessão de terminal apenas quando um desenvolvedor inicia um comando, o KiloClaw é persistente. "KiloClaw está apenas correndo e ouvindo," disse Breitenother. "Está sempre ligado, aguardando sua mensagem do WhatsApp ou do Slack. Tem que estar sempre ligado. Esse é um paradigma diferente: infraestrutura sempre ativa para interagir".

Essa persistência permite um conjunto de "affordances de agência" que Kilo chama de "exoesqueleto para a mente":

  • Automações programadas: Os usuários podem definir cron jobs para o agente realizar pesquisas, monitorar repositórios ou gerar relatórios enquanto o usuário humano estiver offline.

  • Memória persistente: Utilizando um "Banco de memória" sistema, o agente armazena o contexto em arquivos Markdown estruturados dentro do repositório, garantindo que retenha o estado de um projeto mesmo se o modelo subjacente for trocado.

  • Comando multiplataforma: O agente pode ser acionado pelo Slack, Telegram ou terminal, mantendo um estado de execução unificado em todos os pontos de entrada.

Breitenother destacou a mudança no papel do desenvolvedor durante a entrevista: "Na verdade, transformamos nossos engenheiros em proprietários de produtos. Com o tempo que eles liberaram para escrever código, eles estão, na verdade, pensando muito mais. Eles estão definindo a estratégia para o produto".

A vantagem do “gateway”: mais de 500 modelos, sem lock-in

Um componente central da arquitetura KiloClaw é sua integração nativa com o Kilo Gateway. Embora o OpenClaw original tenha sido inicialmente vinculado aos modelos da Anthropic, o KiloClaw permite aos usuários alternar entre mais de 500 modelos diferentes de fornecedores como OpenAI, Google e MiniMax, bem como modelos de peso aberto como Qwen ou GLM.

"Seu modelo preferido hoje pode não ser o mesmo – e honestamente não deveria ser o mesmo – daqui a um mês e meio," Breitenother disse, enfatizando a velocidade da indústria. "Você pode querer modelos diferentes para tarefas diferentes. Talvez você use o Opus para algo complexo ou mude para um modelo aberto com orçamento mais restrito para trabalho de rotina".

Esta flexibilidade é apoiada pelo modelo de preços transparente do Kilo. A empresa oferece "marcação zero" em tokens de IA, cobrando dos usuários as taxas exatas de API fornecidas pelos fornecedores do modelo. Para usuários avançados, isso é gerenciado por meio do Kilo Pass, um nível de assinatura que oferece créditos de bônus (por exemplo, US$ 199/mês por US$ 278,60 em créditos) para subsidiar o trabalho de agente de alto volume.

Como começar a usar o KiloClaw agora mesmo

  • Faça login ou cadastre-se: Navegue até o aplicativo Kilo Code na web (desktop) em app.kilo.ai e faça login usando sua conta existente. Kilo suporta vários métodos de autenticação, incluindo GitHub e Google OAuth.

  • Crie sua instância: Selecione o "Garra" guia no menu de navegação lateral para acessar o painel do KiloClaw. Clique no "Criar instância" para começar a provisionar seu agente (veja a imagem acima para saber onde encontrá-lo).

  • Escolha seu modelo: Selecione um modelo de IA padrão para capacitar seu agente no menu suspenso. Os usuários podem escolher entre uma ampla gama de opções, incluindo modelos gratuitos (por enquanto) como o MiniMax.

  • Configure canais de mensagens (opcional): Durante a configuração, você pode opcionalmente conectar seu agente ao Discord, Telegram ou Slack e se comunicar com seu agente KiloClaw diretamente por meio desses canais – em vez de no site do Kilo Code. Mas para avançar mais rápido, você pode pular esta etapa e sempre poderá adicionar essas chaves de bot suportadas e configurar esses canais posteriormente nas configurações da instância.

  • Provisão e início: Clique "Criar e provisionar" para configurar sua máquina virtual. Depois que a instância for provisionada, clique em "Começar" para inicializar o agente, o que normalmente leva apenas alguns segundos

  • Verifique e acesse: Clique no "Abrir" botão para entrar na interface do OpenClaw. Por segurança, você precisará clicar "Código de acesso" para gerar um token de verificação único que valida seu dispositivo pela primeira vez.

  • Comece a codificação de vibração: Depois de verificado, você poderá começar a interagir com seu agente diretamente na interface de chat. O agente permanecerá funcionando 24 horas por dia, 7 dias por semana em uma máquina virtual dedicada, ouvindo comandos em todas as plataformas conectadas.

De acordo com Brendan O’Leary, relações com desenvolvedores da Kilo Code e ex-desenvolvedor evangelista do GitLab, os usuários que não têm certeza de qual modelo selecionar devem consultar o PinchBench, uma ferramenta de benchmarking de código aberto desenvolvida para avaliar modelos em 23 tarefas de agente do mundo real, como classificação de e-mail e geração de postagens em blogs.

Comparando a era da agência: o lançamento do PinchBench, um novo conjunto de benchmarking de código aberto especificamente para tarefas do Claw

Para ajudar os desenvolvedores a escolher entre mais de 500 modelos, a Kilo também lançou o PinchBench, um benchmark de código aberto especificamente para cargas de trabalho de agentes.

Enquanto benchmarks tradicionais, como MMLU ou HumanEval, testam prompts de bate-papo isoladamente, o PinchBench testa agentes em 23 tarefas reais de várias etapas, como gerenciamento de calendário e pesquisa de várias fontes.

O projeto foi liderado por O’Leary, que observou durante uma demonstração que o benchmark era "meio que inspirado em… outros pequenos bancos divertidos" como aqueles criados pelo desenvolvedor YouTuber Theo Browne (@t3dotgg), CEO/fundador da Ping Labs.

O’Leary explicou que embora os benchmarks existentes sejam muitas vezes altamente especializados, ele queria uma forma de "avaliar o tipo de coisas que pedimos ao OpenClaw para fazer".

Ele executou pessoalmente o benchmark "centenas e centenas de vezes contra o OpenClaw" para garantir sua precisão, e pegando uma página do livro de Browne (er, manual de vídeo?), também lançou uma série no YouTube para descobrir se KiloClaw pode lidar com várias tarefas, intitulada, apropriadamente, "Será que vai arranhar?"

Para manter altos padrões de avaliação para tarefas subjetivas, como escrever postagens em blogs, O’Leary projetou um sistema onde um alto nível de qualidade "modelo de juiz"—especificamente Claude 4.5 Opus—é usado para avaliar a saída de outros modelos. "Na verdade temos… não o modelo em teste, mas sempre o Opus… (julgar) a saída de cada um dos modelos," O’Leary afirmou, acrescentando que o modelo do juiz ainda fornece notas específicas sobre a qualidade da execução.

O benchmark permite aos usuários visualizar um gráfico de dispersão comparando "Custo para Inteligência," identificar quais modelos oferecem a maior proficiência pelo menor preço. Esta visualização específica é uma prioridade para O’Leary, que observou que é "meu gráfico favorito para observar modelos… quanto você gasta versus quanto é a taxa de sucesso".

Para quem prefere hospedar sua própria infraestrutura, O’Leary tornou o processo totalmente transparente, proporcionando um "arquivo de habilidades que as pessoas podem baixar" então eles podem "compare sua própria instância do OpenClaw" independentemente

"De qualquer forma, estamos fazendo esse trabalho para saber quais padrões devemos recomendar," Breitenother acrescentou em uma entrevista separada. "Decidimos abri-lo porque o desenvolvedor individual não deveria ter que pensar sobre qual modelo é melhor para o trabalho. Queremos dar às pessoas cada vez mais informações".

O’Leary expandiu esta filosofia, descrevendo o benchmark como sendo "é como as Olimpíadas em vários aspectos," onde as tarefas variam de "avaliado de forma muito objetiva" para aqueles que exigem uma avaliação mais matizada.

Contexto da indústria: Distinguindo-se da crescente família de ramificações OpenClaw

KiloClaw entra em um mercado cada vez mais lotado com variantes do OpenClaw. Projetos como o Nanoclaw ganharam força por serem leves, enquanto empresas como a Runlayer têm como alvo a empresa "Servidor Virtual Privado" nicho.

No entanto, Kilo distingue-se por recusar "garfo" o código. "Não é um garfo, e é isso que importa," Breitenother afirmou. "O OpenClaw se move tão rapidamente que estamos hospedando o OpenClaw (versão) real. É literalmente OpenClaw em uma máquina virtual gerenciada muito bem ajustada e configurada".

Isso garante que, à medida que o projeto principal do OpenClaw evolui, os usuários do KiloClaw recebam atualizações automaticamente, sem necessidade manual. "puxa" operações.

Esse "núcleo aberto" filosofia se estende ao licenciamento. Embora o KiloClaw seja um serviço hospedado pago, o Kilo CLI subjacente e as extensões principais permanecem licenciados pelo MIT. Isso permite a auditoria da comunidade – um recurso crítico para empresas preocupadas com a segurança.

Conclusão: rumo a um futuro agente

O lançamento do KiloClaw marca um movimento estratégico da Kilo para expandir sua base de usuários além "instável" desenvolvedores a gerentes empresariais e profissionais não técnicos. Ao oferecer um "um clique" caminho para um agente de produção, a empresa está tentando democratizar o "momentos mágicos" de IA.

De acordo com um comunicado fornecido ao VentureBeat pela Kilo antes do lançamento, nas primeiras duas semanas, mais de 3.500 desenvolvedores entraram na lista de espera. Esses primeiros adotantes foram "realmente empurrando o KiloClaw em todas as direções," usando-o para automatizar tudo, desde o gerenciamento do Discord até a manutenção do repositório.

"Nossa missão é construir a melhor plataforma de trabalho de IA completa," Breitenother concluiu. "Quer você seja um desenvolvedor, um gerente de produto ou um engenheiro de dados, queremos que todas essas personas experimentem a magia do exoesqueleto para a mente".

KiloClaw já está disponível, oferecendo 7 dias de computação gratuita para todos os novos usuários. Com milhares de desenvolvedores já tendo saído da lista de espera, a era do agente gerenciado de IA parece ter chegado – sem necessidade de Mac Mini.



Fonte ==> Cyberseo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *