OpenAI Expande Modo de Voz Avançado do ChatGPT para a Web, Melhorando Conversas Naturais

Sem categoria

05/12/2024
0

Expansão do Modo de Voz Avançado do ChatGPT para Navegadores

A OpenAI está levando o Modo de Voz Avançado do ChatGPT para a web, permitindo que os usuários tenham conversas naturais e em tempo real diretamente de seus navegadores. Este recurso, que até recentemente estava disponível apenas em iOS e Android desde setembro, agora está sendo ampliado para clientes pagantes do ChatGPT, incluindo assinantes dos planos Plus, Enterprise, Teams e Edu. Você pode conferir mais detalhes sobre essas opções através deste link.

O Modo de Voz Avançado utiliza as capacidades de áudio do GPT-4 da OpenAI, tornando as conversas mais dinâmicas e realistas. Além da conversação básica, o ChatGPT agora consegue entender sinais não-verbais, como a velocidade da fala, e responder com emoção, melhorando ainda mais a interação. Para iniciar um chat por voz, os usuários precisam apenas clicar no ícone de Voz na parte inferior da janela de prompt, permitir o acesso ao microfone e seguir para uma tela com uma orbe azul. A OpenAI oferece nove vozes distintas de saída, como “Arbor”, descrita como “descontraída e versátil”, e “Ember”, conhecida por ser “confiante e otimista”.

Google Gemini: Um Chatbot com Memória

O chatbot Gemini do Google introduziu uma função de memória, permitindo reter e lembrar informações pessoais, como suas preferências, detalhes de trabalho e comidas favoritas. Semelhante ao ChatGPT da OpenAI, essa funcionalidade melhora o contexto das conversas. Por exemplo, se você informar ao Gemini suas culinárias prediletas, ele pode adaptar as recomendações de restaurantes com base em suas preferências nas futuras interações. Conheça mais sobre essa inovação no blog oficial do Google.

Atualmente, o recurso de memória está disponível exclusivamente no cliente web para assinantes do plano Google One AI Premium de US$ 20 por mês. Ainda não está disponível nos aplicativos do Gemini para iOS e Android, apenas no cliente web. Na interface do Gemini, o Google fornece alguns exemplos de memórias úteis potencialmente primárias, como “Use linguagem simples e evite jargões”, “Só posso escrever código em JavaScript” e “Ao planejar viagens, inclua o custo por dia”. A empresa observa que o recurso, que atualmente suporta apenas prompts em inglês, pode ser desligado a qualquer momento, mas as memórias são armazenadas até serem excluídas manualmente.

Principais Diferenças entre ChatGPT e Gemini

Embora tanto o ChatGPT quanto o Gemini sejam soluções de IA generativa líderes do mercado, eles servem a propósitos diferentes e atendem a necessidades distintas dos usuários. Visite este comparativo para uma análise mais detalhada.

ChatGPT:
- Maturidade e Capacidades Avançadas: O ChatGPT é a ferramenta mais madura e avançada, especialmente quando opta por planos pagos que incluem acesso a capacidades mais poderosas do GPT-4.
- Facilidade de Uso: O ChatGPT é mais fácil de usar em múltiplos canais e oferece uma combinação diversificada de recursos estabelecidos e recém-desenvolvidos.
Gemini:
- Acessibilidade e Transparência: O Gemini é uma alternativa acessível ao ChatGPT, gerando conteúdo informativo e conversacional de alta qualidade para usuários empresariais e recreativos. Ele proporciona uma IA mais transparente e responsável, conecta-se diretamente à internet e às extensões do Google em todos os planos, e oferece um sistema mais eficaz para gestão da qualidade do conteúdo.
- Casos de Uso: O Gemini é mais adequado para usuários que desejam suporte para tarefas conversacionais e criativas, bem como aqueles que precisam de fácil acesso à internet ou suporte para produtos do Google Workspace.

Em resumo, a expansão do Modo de Voz Avançado do ChatGPT para a web aprimora a interação do usuário com o chatbot, enquanto o Google Gemini introduz uma função de memória que personaliza as conversas com base nas preferências do usuário. Esses avanços destacam as capacidades em evolução da IA generativa em melhorar a experiência e interação dos usuários.

Deixe um comentário Cancelar resposta

Autor

Posts relacionados

Sem categoria

DSPy na prática: programação declarativa com LLMs

23/01/2026
0

O DSPy transforma a forma como lidamos com prompts ao permitir a definição de assinaturas em Python para otimização automática de LLMs....

Sem categoria

Quando programar vira prompt: o fim da era do código

15/01/2026
0

A programação evoluiu com a IA, transformando-se de escrita manual de código para um processo de orquestração de prompts. Isso levanta questões...

Sem categoria

Quando programar vira prompt: o fim da era do código

15/01/2026
0

A programação evoluiu com a IA, transformando-se de escrita manual de código para um processo de orquestração de prompts. Isso levanta questões...

Sem categoria

Como o Cursor transformou meu fluxo de desenvolvimento

12/01/2026
0

O Cursor uniu editor, agentes e automações: planos rastreáveis (.cursor/plans/), Rules & Skills, cloud agents em cursor.com/agents, Debug Mode e comandos (/pr,...