OpenAI Expande Modo de Voz Avançado do ChatGPT para a Web, Melhorando Conversas Naturais

Expansão do Modo de Voz Avançado do ChatGPT para Navegadores
A OpenAI está levando o Modo de Voz Avançado do ChatGPT para a web, permitindo que os usuários tenham conversas naturais e em tempo real diretamente de seus navegadores. Este recurso, que até recentemente estava disponível apenas em iOS e Android desde setembro, agora está sendo ampliado para clientes pagantes do ChatGPT, incluindo assinantes dos planos Plus, Enterprise, Teams e Edu. Você pode conferir mais detalhes sobre essas opções através deste link.
O Modo de Voz Avançado utiliza as capacidades de áudio do GPT-4 da OpenAI, tornando as conversas mais dinâmicas e realistas. Além da conversação básica, o ChatGPT agora consegue entender sinais não-verbais, como a velocidade da fala, e responder com emoção, melhorando ainda mais a interação. Para iniciar um chat por voz, os usuários precisam apenas clicar no ícone de Voz na parte inferior da janela de prompt, permitir o acesso ao microfone e seguir para uma tela com uma orbe azul. A OpenAI oferece nove vozes distintas de saída, como “Arbor”, descrita como “descontraída e versátil”, e “Ember”, conhecida por ser “confiante e otimista”.
Google Gemini: Um Chatbot com Memória
O chatbot Gemini do Google introduziu uma função de memória, permitindo reter e lembrar informações pessoais, como suas preferências, detalhes de trabalho e comidas favoritas. Semelhante ao ChatGPT da OpenAI, essa funcionalidade melhora o contexto das conversas. Por exemplo, se você informar ao Gemini suas culinárias prediletas, ele pode adaptar as recomendações de restaurantes com base em suas preferências nas futuras interações. Conheça mais sobre essa inovação no blog oficial do Google.
Atualmente, o recurso de memória está disponível exclusivamente no cliente web para assinantes do plano Google One AI Premium de US$ 20 por mês. Ainda não está disponível nos aplicativos do Gemini para iOS e Android, apenas no cliente web. Na interface do Gemini, o Google fornece alguns exemplos de memórias úteis potencialmente primárias, como “Use linguagem simples e evite jargões”, “Só posso escrever código em JavaScript” e “Ao planejar viagens, inclua o custo por dia”. A empresa observa que o recurso, que atualmente suporta apenas prompts em inglês, pode ser desligado a qualquer momento, mas as memórias são armazenadas até serem excluídas manualmente.
Principais Diferenças entre ChatGPT e Gemini
Embora tanto o ChatGPT quanto o Gemini sejam soluções de IA generativa líderes do mercado, eles servem a propósitos diferentes e atendem a necessidades distintas dos usuários. Visite este comparativo para uma análise mais detalhada.
- ChatGPT:
- Maturidade e Capacidades Avançadas: O ChatGPT é a ferramenta mais madura e avançada, especialmente quando opta por planos pagos que incluem acesso a capacidades mais poderosas do GPT-4.
- Facilidade de Uso: O ChatGPT é mais fácil de usar em múltiplos canais e oferece uma combinação diversificada de recursos estabelecidos e recém-desenvolvidos.
- Gemini:
- Acessibilidade e Transparência: O Gemini é uma alternativa acessível ao ChatGPT, gerando conteúdo informativo e conversacional de alta qualidade para usuários empresariais e recreativos. Ele proporciona uma IA mais transparente e responsável, conecta-se diretamente à internet e às extensões do Google em todos os planos, e oferece um sistema mais eficaz para gestão da qualidade do conteúdo.
- Casos de Uso: O Gemini é mais adequado para usuários que desejam suporte para tarefas conversacionais e criativas, bem como aqueles que precisam de fácil acesso à internet ou suporte para produtos do Google Workspace.
Em resumo, a expansão do Modo de Voz Avançado do ChatGPT para a web aprimora a interação do usuário com o chatbot, enquanto o Google Gemini introduz uma função de memória que personaliza as conversas com base nas preferências do usuário. Esses avanços destacam as capacidades em evolução da IA generativa em melhorar a experiência e interação dos usuários.
Autor
flpchapola@hotmail.com
Posts relacionados

Engenharia de Contexto: Explorando o Futuro d Vibe CODING
Quando comecei a pensar sobre a engenharia de contexto, um termo que inventamos recentemente, percebi que o que estamos construindo aqui é...
Leia tudo
A Revolução Ágil: Por que Precisamos Retornar aos Princípios Originais
## A Revolução Ágil: Recuperando a Autonomia do Desenvolvimento No início dos anos 2000, a comunicação entre áreas técnicas e negócios era...
Leia tudo
5 Técnicas Modernas de Visualização com Heatmaps em Pesquisa Científica
## 5 Técnicas Modernas de Visualização com Heatmaps em Pesquisa Científica Heatmaps são representações bidimensionais que utilizam cores para traduzir dados complexos...
Leia tudo
Vibecoding Cursor Bolt Lovable Replit AI: Explorando o Processo Criativo com Ryo Lu, Head de Design da Cursor
Quando penso em vibecoding cursor bolt lovable replit ai, a primeira pessoa que me vem à mente é Ryo Lu, o Head...
Leia tudo
OpenAI vs Gemini vs Claude: Qual IA cria o MELHOR MVP para SaaS? Teste REAL no LOVABLE com Vibecoding, Cursor, Bolt e Replit AI
Olá, pessoal! Aqui é o Felipe Vieira, designer e desenvolvedor senior com mais de 16 anos de experiência, e hoje vamos mergulhar...
Leia tudo
MAXMODE GRÁTIS no Cursor: O que mudaram e até onde dá pra usar sem pagar a mais? | vibecoding cursor bolt lovable replit ai
Se você é desenvolvedor front-end ou trabalha com programação há algum tempo, provavelmente já ouviu falar do Cursor — uma ferramenta que...
Leia tudo