Última atualização: 1º de setembro de 2025
Obter ótimos resultados geralmente depende de escolher as configurações corretas do motor. Use esta checklist ao configurar um assistente:
1. Escolha um Modo
| Modo | Por que escolher? | Observações |
| Dualplex (Beta) | Troca rápida de turnos + vozes premium/clonadas | Recomendado como padrão. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime. |
| Speech-to-Speech (Multimodal) | Troca de turnos mais rápida e fluxo mais natural | Modelo recomendado: GPT‑5 Realtime. |
| Pipeline | Controle máximo sobre voz e respostas longas | Modelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa do Transcriber abaixo. |
Quer saber mais sobre as diferenças entre os modos? Leia o Guia de modos do assistente.
Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do cliente.
2. Escolha um Transcritor (apenas Pipeline)
| Transcritor | Precisão | Latência | Mais indicado para |
| Azure | ⭐⭐⭐⭐ | ⏱️⏱️⏱️ (mais lento) | Quando você precisa da maior fidelidade na transcrição. |
| Gladia | ⭐⭐⭐ | ⏱️ (mais rápido) | Bom desempenho geral para a maioria dos idiomas. |
| Deepgram | ⭐⭐⭐ | ⏱️ (mais rápido) | Outra opção sólida — teste qual funciona melhor para seu idioma e configuração de áudio. |
Dica: Diferentes idiomas, sotaques ou ruído de fundo podem impactar cada engine de forma diferente. Faça um teste rápido A/B e mantenha o que tiver o melhor desempenho.
3. Selecione um Modelo LLM
| Modelo | Pontos fortes | Compromissos |
| GPT-5 Mini | Raciocínio equilibrado com baixa latência | Pode ser mais lento que modelos em tempo real para trocas rápidas de turnos. |
| GPT-5 Realtime | Projetado para trocas de voz ultra-baixa latência | Melhor para Speech-to-Speech e Dualplex. |
| GPT-4o | Raciocínio forte e compreensão multimodal | Maior latência. |
| Gemini Flash 2.0 / 2.5 | Ultra-rápido para trocas de voz em Dualplex/Multimodal | Excelente para minimizar a latência percebida. |
Se a velocidade for crítica, use GPT‑5 Realtime (ideal para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ideal com Dualplex). Para raciocínio mais complexo, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.
4. Cancelamento de Ruído
Se os clientes estiverem no viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ligado. Se o volume da chamada estiver baixo ou algumas palavras forem “cortadas”, desligue-o para que o transcritor receba a forma de onda completa.
Se o seu assistente não estiver ouvindo você claramente, tente desligar o cancelamento de ruído.
5. Temporizadores de Conversa
| Parâmetro | Recomendado | Por quê |
| Reengajamento | ≈ 30 s | Dá tempo suficiente para os clientes pensarem. Valores menores podem parecer insistentes. |
| Duração máxima de silêncio | ≈ 60 s | Evita desligamentos prematuros, mas ainda encerra chamadas realmente silenciosas. |
Teste diferentes valores em chamadas reais — valores muito baixos podem interromper, valores muito altos deixam lacunas constrangedoras.
6. Mensagem Inicial
| Modo | Como é usado | Melhor prática |
| Pipeline | Lido exatamente como escrito (convertido por TTS) | Escreva a saudação literalmente: “Olá, aqui é o Alex da …”. |
| Dualplex | Lido exatamente como escrito (renderizado via ElevenLabs TTS) | Escreva a saudação literalmente e selecione sua voz clonada. |
| Speech-to-Speech | Interpretado como prompt pelo modelo | Inclua instruções como “Cumprimente o cliente e diga …” ou anteponha say exactly: para garantir saída literal. |
7. Som ambiente
Ativado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.
Se o assistente não estiver ouvindo você claramente, tente desligar o som ambiente ou reduzir o volume.
8. Controles de Endpointing
Controle quando seu assistente começa a falar usando o controle deslizante de sensibilidade de endpointing na parte inferior das configurações do assistente.
| Configuração | Efeito | Quando usar |
| Sensibilidade baixa | Assistente responde mais rápido após o cliente parar de falar | Para conversas rápidas e dinâmicas |
| Sensibilidade alta | Assistente espera mais antes de responder | Quando os clientes dão respostas mais longas e detalhadas |
Dica profissional: Se o assistente interromper o cliente no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua-a.
9. Depuração usando o transcript da chamada
Se você estiver enfrentando problemas com seu assistente, pode usar o transcript da chamada para depurar o problema.
- Acesse a página de Histórico de Chamadas.
- Clique na última chamada que você testou.
- O transcript da chamada será exibido, incluindo chamadas de função e seus parâmetros.
10. Ainda tem dúvidas?
Se tiver alguma pergunta, entre em contato com nossa equipe de suporte pelo widget de chat dentro do aplicativo.
Teste diferentes configurações em chamadas reais — o equilíbrio ideal depende do fluxo da conversa e dos padrões de comportamento dos clientes.
Precisa de uma lista completa de todos os botões e controles deslizantes? Veja a referência completa de Configurações do Assistente.