OpenAI Lança Operator: Agente de IA que Executa Tarefas Autonomamente com Supervisionamento do Usuário

A OpenAI lançou recentemente o Operator, uma prévia de pesquisa de seu primeiro agente de IA de uso geral, projetado para realizar tarefas de forma autônoma, como agendar viagens, fazer reservas e compras online. Este inovador agente está inicialmente disponível para usuários nos EUA, no plano de assinatura Pro do ChatGPT de $200, com planos de expansão para os níveis Plus, Team e Enterprise no futuro. Para mais informações sobre planos e disponibilidade, visite OpenAI.
Como o Operator Funciona
O Operator utiliza o modelo Computer-Using Agent (CUA) da OpenAI, que combina capacidades avançadas de raciocínio e visão para interagir com sites como um humano, sem depender de APIs voltadas para desenvolvedores. O CUA pode navegar por menus, preencher formulários e clicar em botões, mas sempre busca a confirmação do usuário antes de concluir as ações. Para entender mais sobre o CUA, acesse este site sobre visão por computador.
Capacidades e Limitações
O Operator consegue lidar com tarefas rotineiras, como fazer reservas em restaurantes ou reservar passagens aéreas. No entanto, se ficar preso ou precisar de informações sensíveis, ele devolve o controle ao usuário. Atualmente, o Operator enfrenta dificuldades com interfaces web complexas, CAPTCHAs e certas tarefas sensíveis, como enviar e-mails ou excluir eventos de calendário. A OpenAI implementou salvaguardas, como monitoramento de atividade suspeita e pausa na execução quando necessário, para mitigar riscos de uso indevido, como golpes de phishing e prompts maliciosos. Para mais detalhes sobre segurança na IA, consulte Cyber Security.
Colaborações e Medidas de Segurança
O Operator colabora com empresas como DoorDash, eBay, Instacart e Uber para garantir conformidade com os acordos de termos de serviço. O compromisso com a segurança do usuário é reforçado pela necessidade de supervisão em tarefas sensíveis, como transações bancárias, e pela evitação de inserção automatizada de detalhes de cartão de crédito. Essa abordagem cautelosa reflete os potenciais riscos de segurança dessa tecnologia, alinhando-se à estratégia mais ampla da OpenAI de demonstrar como agentes de IA poderiam transformar o uso da internet. Saiba mais sobre a visão da OpenAI em seu blog oficial.
Avaliação de Desempenho de IA
Enquanto o Operator é um passo significativo em direção a agentes de IA autônomos, a comunidade de IA continua a avaliar o desempenho de IA por meio de diversos desafios. Um desses desafios envolve a simulação de uma bola quicando dentro de uma forma rotativa, que testa a capacidade dos modelos de gerenciar detecção de colisão e sistemas de coordenadas. Esta avaliação destaca as dificuldades em desenvolver métricas padronizadas para avaliar modelos de IA, algo fundamental para o avanço da tecnologia. Para uma visão mais aprofundada sobre benchmarks de IA, confira AI Benchmarks.
Futuras Desenvolvimentos
A OpenAI planeja disponibilizar as habilidades mais amplas do CUA no futuro por meio de uma API que outros desenvolvedores podem usar para criar seus próprios aplicativos. Essa integração pode ainda mais aprimorar as capacidades do Operator e expandir seus casos de uso. Além disso, a OpenAI está explorando maneiras de vincular agentes de IA às identidades digitais dos usuários, garantindo que as interações sejam verificadas e confiáveis. Liderada pela World (anteriormente Worldcoin), essa abordagem visa provar a “humanidade” das personas online e verificar agentes de IA atuando em nome de indivíduos reais. Para mais informações sobre a Worldcoin, visite Worldcoin.
# Exemplo de uma tarefa simples de automação web usando o Operator
import time
# Inicializar o Operator
operator = Operator()
# Navegar para um site
operator.navigate("https://example.com")
# Preencher um formulário
operator.fill_form({
"name": "John Doe",
"email": "john.doe@example.com"
})
# Clicar em um botão
operator.click_button("Submit")
# Esperar alguns segundos
time.sleep(2)
# Confirmar a ação
if operator.confirm_action():
print("Ação confirmada")
else:
print("Ação não confirmada")
Este trecho de código demonstra uma tarefa básica de automação web usando o Operator, destacando sua capacidade de interagir com sites e executar ações de forma autônoma. No entanto, é crucial notar que o Operator requer supervisão do usuário para tarefas sensíveis e pode ter dificuldades com interfaces web complexas. Para um entendimento mais técnico sobre automação, você pode querer explorar recursos em Mozilla Developer Network.
Autor
flpchapola@hotmail.com
Posts relacionados

OpenAI Quer Adquirir Chrome e Revolucionar Navegação com Experiência Centrada em Inteligência Artificial
Em uma movimentação recente no caso antitruste em andamento contra o Google, a OpenAI manifestou interesse em adquirir o navegador Chrome, caso...
Leia tudo
“Descubra o Momento Ideal para Contratar uma Assessoria de Carreira e Transforme Sua Trajetória Profissional!”
Contratar uma assessoria de carreira é uma decisão estratégica que pode impulsionar significativamente a sua trajetória profissional. Seja em momentos de transição,...
Leia tudo
Novidades Lovable 2025: Controle, Flexibilidade e Estabilidade para Desenvolvimento Ágil de Produtos Digitais
Desbrave os passos à frente no mundo da inovação tecnológica com a Lovable em 2025. Projetada para otimizar o desenvolvimento de produtos...
Leia tudo
Novidades do Supabase: Integração de IA, Nova UI e Funcionalidades Aprimoradas para Desenvolvedores!
Descubra as Últimas Novidades do Supabase: Transformando o Desenvolvimento Open Source No mundo em constante evolução do desenvolvimento de software, manter-se atualizado...

Cursor: Editor de Código com IA Agora Tem Abas de Chat, Modos Customizados e Indexação Acelerada
O Cursor, um inovador editor de código integrado com inteligência artificial, recentemente incrementou suas funcionalidades, permitindo que desenvolvedores melhorem drasticamente seu fluxo...

10 anos de conselhos sobre programação: princípios essenciais para desenvolvedores
## 10 anos de conselhos sobre programação em 60 segundos: princípios essenciais ### **Domine o Debugger** O debugger é sua maior aliada...
Leia tudo