Skip to main content
Última atualização: 1º de setembro de 2025 Obter ótimos resultados geralmente depende de escolher as configurações corretas do motor. Use esta checklist ao configurar um assistente:

1. Escolha um Modo

ModoPor que escolher?Observações
Dualplex (Beta)Troca rápida de turnos + vozes premium/clonadasRecomendado como padrão. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime.
Speech-to-Speech (Multimodal)Troca de turnos mais rápida e fluxo mais naturalModelo recomendado: GPT‑5 Realtime.
PipelineControle máximo sobre voz e respostas longasModelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa do Transcriber abaixo.
Quer saber mais sobre as diferenças entre os modos? Leia o Guia de modos do assistente.
Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do cliente.

2. Escolha um Transcritor (apenas Pipeline)

TranscritorPrecisãoLatênciaMais indicado para
Azure⭐⭐⭐⭐⏱️⏱️⏱️ (mais lento)Quando você precisa da maior fidelidade na transcrição.
Gladia⭐⭐⭐⏱️ (mais rápido)Bom desempenho geral para a maioria dos idiomas.
Deepgram⭐⭐⭐⏱️ (mais rápido)Outra opção sólida — teste qual funciona melhor para seu idioma e configuração de áudio.
Dica: Diferentes idiomas, sotaques ou ruído de fundo podem impactar cada engine de forma diferente. Faça um teste rápido A/B e mantenha o que tiver o melhor desempenho.

3. Selecione um Modelo LLM

ModeloPontos fortesCompromissos
GPT-5 MiniRaciocínio equilibrado com baixa latênciaPode ser mais lento que modelos em tempo real para trocas rápidas de turnos.
GPT-5 RealtimeProjetado para trocas de voz ultra-baixa latênciaMelhor para Speech-to-Speech e Dualplex.
GPT-4oRaciocínio forte e compreensão multimodalMaior latência.
Gemini Flash 2.0 / 2.5Ultra-rápido para trocas de voz em Dualplex/MultimodalExcelente para minimizar a latência percebida.
Se a velocidade for crítica, use GPT‑5 Realtime (ideal para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ideal com Dualplex). Para raciocínio mais complexo, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.

4. Cancelamento de Ruído

Se os clientes estiverem no viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ligado. Se o volume da chamada estiver baixo ou algumas palavras forem “cortadas”, desligue-o para que o transcritor receba a forma de onda completa.
Se o seu assistente não estiver ouvindo você claramente, tente desligar o cancelamento de ruído.

5. Temporizadores de Conversa

ParâmetroRecomendadoPor quê
Reengajamento≈ 30 sDá tempo suficiente para os clientes pensarem. Valores menores podem parecer insistentes.
Duração máxima de silêncio≈ 60 sEvita desligamentos prematuros, mas ainda encerra chamadas realmente silenciosas.
Teste diferentes valores em chamadas reais — valores muito baixos podem interromper, valores muito altos deixam lacunas constrangedoras.

6. Mensagem Inicial

ModoComo é usadoMelhor prática
PipelineLido exatamente como escrito (convertido por TTS)Escreva a saudação literalmente: “Olá, aqui é o Alex da …”.
DualplexLido exatamente como escrito (renderizado via ElevenLabs TTS)Escreva a saudação literalmente e selecione sua voz clonada.
Speech-to-SpeechInterpretado como prompt pelo modeloInclua instruções como “Cumprimente o cliente e diga …” ou anteponha say exactly: para garantir saída literal.

7. Som ambiente

Ativado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.
Se o assistente não estiver ouvindo você claramente, tente desligar o som ambiente ou reduzir o volume.

8. Controles de Endpointing

Controle quando seu assistente começa a falar usando o controle deslizante de sensibilidade de endpointing na parte inferior das configurações do assistente.
ConfiguraçãoEfeitoQuando usar
Sensibilidade baixaAssistente responde mais rápido após o cliente parar de falarPara conversas rápidas e dinâmicas
Sensibilidade altaAssistente espera mais antes de responderQuando os clientes dão respostas mais longas e detalhadas
Dica profissional: Se o assistente interromper o cliente no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua-a.

9. Depuração usando o transcript da chamada

Se você estiver enfrentando problemas com seu assistente, pode usar o transcript da chamada para depurar o problema.
  • Acesse a página de Histórico de Chamadas.
  • Clique na última chamada que você testou.
  • O transcript da chamada será exibido, incluindo chamadas de função e seus parâmetros.

10. Ainda tem dúvidas?

Se tiver alguma pergunta, entre em contato com nossa equipe de suporte pelo widget de chat dentro do aplicativo.
Teste diferentes configurações em chamadas reais — o equilíbrio ideal depende do fluxo da conversa e dos padrões de comportamento dos clientes.

Precisa de uma lista completa de todos os botões e controles deslizantes? Veja a referência completa de Configurações do Assistente.