OpenAI Lança Operator: Agente de IA que Executa Tarefas Autonomamente com Supervisionamento do Usuário

Sem categoria

30/01/2025
0

A OpenAI lançou recentemente o Operator, uma prévia de pesquisa de seu primeiro agente de IA de uso geral, projetado para realizar tarefas de forma autônoma, como agendar viagens, fazer reservas e compras online. Este inovador agente está inicialmente disponível para usuários nos EUA, no plano de assinatura Pro do ChatGPT de $200, com planos de expansão para os níveis Plus, Team e Enterprise no futuro. Para mais informações sobre planos e disponibilidade, visite OpenAI.

Como o Operator Funciona

O Operator utiliza o modelo Computer-Using Agent (CUA) da OpenAI, que combina capacidades avançadas de raciocínio e visão para interagir com sites como um humano, sem depender de APIs voltadas para desenvolvedores. O CUA pode navegar por menus, preencher formulários e clicar em botões, mas sempre busca a confirmação do usuário antes de concluir as ações. Para entender mais sobre o CUA, acesse este site sobre visão por computador.

Capacidades e Limitações

O Operator consegue lidar com tarefas rotineiras, como fazer reservas em restaurantes ou reservar passagens aéreas. No entanto, se ficar preso ou precisar de informações sensíveis, ele devolve o controle ao usuário. Atualmente, o Operator enfrenta dificuldades com interfaces web complexas, CAPTCHAs e certas tarefas sensíveis, como enviar e-mails ou excluir eventos de calendário. A OpenAI implementou salvaguardas, como monitoramento de atividade suspeita e pausa na execução quando necessário, para mitigar riscos de uso indevido, como golpes de phishing e prompts maliciosos. Para mais detalhes sobre segurança na IA, consulte Cyber Security.

Colaborações e Medidas de Segurança

O Operator colabora com empresas como DoorDash, eBay, Instacart e Uber para garantir conformidade com os acordos de termos de serviço. O compromisso com a segurança do usuário é reforçado pela necessidade de supervisão em tarefas sensíveis, como transações bancárias, e pela evitação de inserção automatizada de detalhes de cartão de crédito. Essa abordagem cautelosa reflete os potenciais riscos de segurança dessa tecnologia, alinhando-se à estratégia mais ampla da OpenAI de demonstrar como agentes de IA poderiam transformar o uso da internet. Saiba mais sobre a visão da OpenAI em seu blog oficial.

Avaliação de Desempenho de IA

Enquanto o Operator é um passo significativo em direção a agentes de IA autônomos, a comunidade de IA continua a avaliar o desempenho de IA por meio de diversos desafios. Um desses desafios envolve a simulação de uma bola quicando dentro de uma forma rotativa, que testa a capacidade dos modelos de gerenciar detecção de colisão e sistemas de coordenadas. Esta avaliação destaca as dificuldades em desenvolver métricas padronizadas para avaliar modelos de IA, algo fundamental para o avanço da tecnologia. Para uma visão mais aprofundada sobre benchmarks de IA, confira AI Benchmarks.

Futuras Desenvolvimentos

A OpenAI planeja disponibilizar as habilidades mais amplas do CUA no futuro por meio de uma API que outros desenvolvedores podem usar para criar seus próprios aplicativos. Essa integração pode ainda mais aprimorar as capacidades do Operator e expandir seus casos de uso. Além disso, a OpenAI está explorando maneiras de vincular agentes de IA às identidades digitais dos usuários, garantindo que as interações sejam verificadas e confiáveis. Liderada pela World (anteriormente Worldcoin), essa abordagem visa provar a “humanidade” das personas online e verificar agentes de IA atuando em nome de indivíduos reais. Para mais informações sobre a Worldcoin, visite Worldcoin.





























# Exemplo de uma tarefa simples de automação web usando o Operator
import time

# Inicializar o Operator
operator = Operator()

# Navegar para um site
operator.navigate("https://example.com")

# Preencher um formulário
operator.fill_form({
    "name": "John Doe",
    "email": "john.doe@example.com"
})

# Clicar em um botão
operator.click_button("Submit")

# Esperar alguns segundos
time.sleep(2)

# Confirmar a ação
if operator.confirm_action():
    print("Ação confirmada")
else:
    print("Ação não confirmada")

Este trecho de código demonstra uma tarefa básica de automação web usando o Operator, destacando sua capacidade de interagir com sites e executar ações de forma autônoma. No entanto, é crucial notar que o Operator requer supervisão do usuário para tarefas sensíveis e pode ter dificuldades com interfaces web complexas. Para um entendimento mais técnico sobre automação, você pode querer explorar recursos em Mozilla Developer Network.