OpenAI Expande Modo de Voz Avançado do ChatGPT para a Web, Melhorando Conversas Naturais

Expansão do Modo de Voz Avançado do ChatGPT para Navegadores
A OpenAI está levando o Modo de Voz Avançado do ChatGPT para a web, permitindo que os usuários tenham conversas naturais e em tempo real diretamente de seus navegadores. Este recurso, que até recentemente estava disponível apenas em iOS e Android desde setembro, agora está sendo ampliado para clientes pagantes do ChatGPT, incluindo assinantes dos planos Plus, Enterprise, Teams e Edu. Você pode conferir mais detalhes sobre essas opções através deste link.
O Modo de Voz Avançado utiliza as capacidades de áudio do GPT-4 da OpenAI, tornando as conversas mais dinâmicas e realistas. Além da conversação básica, o ChatGPT agora consegue entender sinais não-verbais, como a velocidade da fala, e responder com emoção, melhorando ainda mais a interação. Para iniciar um chat por voz, os usuários precisam apenas clicar no ícone de Voz na parte inferior da janela de prompt, permitir o acesso ao microfone e seguir para uma tela com uma orbe azul. A OpenAI oferece nove vozes distintas de saída, como “Arbor”, descrita como “descontraída e versátil”, e “Ember”, conhecida por ser “confiante e otimista”.
Google Gemini: Um Chatbot com Memória
O chatbot Gemini do Google introduziu uma função de memória, permitindo reter e lembrar informações pessoais, como suas preferências, detalhes de trabalho e comidas favoritas. Semelhante ao ChatGPT da OpenAI, essa funcionalidade melhora o contexto das conversas. Por exemplo, se você informar ao Gemini suas culinárias prediletas, ele pode adaptar as recomendações de restaurantes com base em suas preferências nas futuras interações. Conheça mais sobre essa inovação no blog oficial do Google.
Atualmente, o recurso de memória está disponível exclusivamente no cliente web para assinantes do plano Google One AI Premium de US$ 20 por mês. Ainda não está disponível nos aplicativos do Gemini para iOS e Android, apenas no cliente web. Na interface do Gemini, o Google fornece alguns exemplos de memórias úteis potencialmente primárias, como “Use linguagem simples e evite jargões”, “Só posso escrever código em JavaScript” e “Ao planejar viagens, inclua o custo por dia”. A empresa observa que o recurso, que atualmente suporta apenas prompts em inglês, pode ser desligado a qualquer momento, mas as memórias são armazenadas até serem excluídas manualmente.
Principais Diferenças entre ChatGPT e Gemini
Embora tanto o ChatGPT quanto o Gemini sejam soluções de IA generativa líderes do mercado, eles servem a propósitos diferentes e atendem a necessidades distintas dos usuários. Visite este comparativo para uma análise mais detalhada.
- ChatGPT:
- Maturidade e Capacidades Avançadas: O ChatGPT é a ferramenta mais madura e avançada, especialmente quando opta por planos pagos que incluem acesso a capacidades mais poderosas do GPT-4.
- Facilidade de Uso: O ChatGPT é mais fácil de usar em múltiplos canais e oferece uma combinação diversificada de recursos estabelecidos e recém-desenvolvidos.
- Gemini:
- Acessibilidade e Transparência: O Gemini é uma alternativa acessível ao ChatGPT, gerando conteúdo informativo e conversacional de alta qualidade para usuários empresariais e recreativos. Ele proporciona uma IA mais transparente e responsável, conecta-se diretamente à internet e às extensões do Google em todos os planos, e oferece um sistema mais eficaz para gestão da qualidade do conteúdo.
- Casos de Uso: O Gemini é mais adequado para usuários que desejam suporte para tarefas conversacionais e criativas, bem como aqueles que precisam de fácil acesso à internet ou suporte para produtos do Google Workspace.
Em resumo, a expansão do Modo de Voz Avançado do ChatGPT para a web aprimora a interação do usuário com o chatbot, enquanto o Google Gemini introduz uma função de memória que personaliza as conversas com base nas preferências do usuário. Esses avanços destacam as capacidades em evolução da IA generativa em melhorar a experiência e interação dos usuários.
Autor
flpchapola@hotmail.com
Posts relacionados

Por Que Construir Multi-Agent LLMs Pode Ser Uma Cilada (E Como Focar no Essencial Para Agentes de IA)
No hype dos Multi-Agent LLMs, menos é mais. O segredo está em engenharia de contexto e princípios básicos, não em botar um...
- Agentes de IA
- AI development
- Codificação
- Colaboração de Agentes
- Customização de Agentes
- Desenvolvimento
- Desenvolvimento Web
- Engenharia de Contexto em IA
- Ferramentas de Desenvolvimento de IA
- Frameworks de Agente de IA
- Git
- Grandes Modelos de Linguagem
- IA
- IA para Resolução de Tarefas Complexas
- Inovação
- LLM
- LLM Frameworks
- Multi-Agent LLMs
- pesquisa
- produtividade
- Sistemas Multi-Agentes
- Soluções
- Tecnologia

Por Que Construir Multi-Agent LLMs Pode Ser Uma Cilada (E Como Focar no Essencial Para Agentes de IA)
No hype dos Multi-Agent LLMs, menos é mais. O segredo está em engenharia de contexto e princípios básicos, não em botar um...
- Agentes de IA
- AI development
- Codificação
- Colaboração de Agentes
- Customização de Agentes
- Desenvolvimento
- Desenvolvimento Web
- Engenharia de Contexto em IA
- Ferramentas de Desenvolvimento de IA
- Frameworks de Agente de IA
- Git
- Grandes Modelos de Linguagem
- IA
- IA para Resolução de Tarefas Complexas
- Inovação
- LLM
- LLM Frameworks
- Multi-Agent LLMs
- pesquisa
- produtividade
- Sistemas Multi-Agentes
- Soluções
- Tecnologia

Desbloqueie a Automação do Canva: Como Conectar o Canva ao n8n e Preencher Modelos Instantaneamente!
Olá, amigos! Sou o Local Buzz AI e hoje vou mostrar como conectar o Canva ao n8n, uma ferramenta poderosa que permite...
Leia tudo
“Menos é Mais: O Desafio de um Engenheiro de Software em Perseguir a Assertividade”
Imagine-se no meio de um labirinto, onde cada passo revela um novo desafio e uma nova oportunidade. Essa é a realidade de...
Leia tudo
Máquina Darwin-Gödel da Sakana AI Evolui ao Reescrever Seu Código e Aumenta Desempenho em 50%
No mundo da inteligência artificial, a Sakana AI tem se destacado com inovações que desafiam limites, principalmente através da Darwin-Gödel Machine (DGM). Recentemente,...

“Rumo ao Salário de +15k: A Maratona do Programador de Sucesso!”
Como Alcançar um Salário de Mais de R$15 Mil no Mercado de Programação Imagine receber um salário superior a R$ 15 mil...
Leia tudo