OpenAI apresenta agente geral no ChatGPT para executar tarefas em aplicativos e códigos
A OpenAI iniciou a disponibilização de um novo agente de uso geral integrado ao ChatGPT, capaz de assumir diversas tarefas realizadas em computadores. Batizada de ChatGPT agent, a ferramenta promete gerenciar agendas, criar apresentações editáveis, executar códigos e navegar por aplicativos conectados, tudo a partir de comandos em linguagem natural.
Segundo a empresa, o lançamento reúne competências de produtos anteriores. O recurso incorpora a habilidade do Operator de interagir com páginas da web por meio de cliques simulados e aproveita a capacidade do Deep Research de compilar informações de dezenas de sites em relatórios resumidos. Dessa forma, o software passa a executar ações práticas, não mais apenas responder perguntas.
O agente chega nesta quinta-feira aos assinantes dos planos Pro, Plus e Team. Para ativá-lo, basta selecionar o modo “agent” no menu suspenso de ferramentas do ChatGPT. A partir desse ponto, o usuário pode ditar instruções em português ou outro idioma e delegar as etapas seguintes ao modelo.
Além dos recursos nativos, o ChatGPT agent possui acesso a connectors, peças que ligam serviços externos como Gmail e GitHub. A integração permite buscar e organizar informações relevantes nos aplicativos do próprio usuário antes de formular a resposta ou executar ações, como enviar e-mails, localizar trechos de código ou atualizar repositórios.
Outro diferencial é o terminal embarcado. O agente pode compilar e rodar scripts, consultar APIs específicas e retornar resultados dentro da mesma conversa. De acordo com a OpenAI, essa combinação garante maior autonomia para concluir etapas de programação ou análise de dados sem intervenção manual.
Nos testes internos divulgados pela companhia, o modelo atingiu 41,6% no Humanity’s Last Exam (HLE) usando o critério pass@1. A avaliação reúne milhares de questões em mais de cem disciplinas e serve como referência para comparar diferentes arquiteturas de IA. O desempenho do agente praticamente duplica as marcas obtidas pelos modelos o3 e o4-mini, anteriores na linha da empresa.
Em matemática avançada, o sistema também elevou o patamar. No FrontierMath, benchmark considerado um dos mais rigorosos do segmento, o resultado foi de 27,4% quando a ferramenta teve acesso ao terminal para execução de código. O recorde anterior pertencente ao o4-mini era de 6,3%, segundo a mesma métrica.
O lançamento insere a OpenAI em uma disputa acirrada dentro do Vale do Silício. Gigantes como Google e novos competidores, a exemplo da Perplexity, anunciaram diversos agentes nos últimos anos, mas versões iniciais enfrentaram limitações diante de tarefas complexas. Ao declarar que seu agente consegue combinar múltiplos recursos e entregar resultados práticos, a empresa procura demonstrar avanço rumo à visão de assistentes totalmente autônomos.
A organização afirma ter desenvolvido o produto com atenção específica à segurança, já que habilidades ampliadas também podem aumentar riscos caso sejam usadas de forma mal-intencionada. Medidas concretas não foram detalhadas, mas a companhia menciona salvaguardas internas para restringir comandos potencialmente nocivos.
Embora os números de benchmarks indiquem progresso, a eficiência real do ChatGPT agent dependerá de uso contínuo em condições variadas. Clientes empresariais e individuais poderão validar se a ferramenta cumpre o papel de aliviar rotinas operacionais, como preparação de reuniões, busca de referências técnicas ou automação de processos simples de programação.
A OpenAI não divulgou planos para levar o recurso aos assinantes do plano gratuito nem forneceu cronograma para expansão a outras plataformas. Por enquanto, o agente representa a investida mais abrangente da companhia em transformar o ChatGPT em um sistema capaz de agir em nome do usuário, aproveitando dados locais, serviços integrados e capacidade de computação em uma mesma interface.

