Boas Práticas do Assistente

Última atualização: 1º de setembro de 2025 Obter ótimos resultados geralmente depende de escolher as configurações corretas do motor. Use esta checklist ao configurar um assistente:

1. Escolha um Modo

Modo	Por que escolher?	Observações
Dualplex (Beta)	Troca rápida de turnos + vozes premium/clonadas	Recomendado como padrão. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime.
Speech-to-Speech (Multimodal)	Troca de turnos mais rápida e fluxo mais natural	Modelo recomendado: GPT‑5 Realtime.
Pipeline	Controle máximo sobre voz e respostas longas	Modelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa do Transcriber abaixo.

Quer saber mais sobre as diferenças entre os modos? Leia o Guia de modos do assistente.

Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do cliente.

2. Escolha um Transcritor (apenas Pipeline)

Transcritor	Precisão	Latência	Mais indicado para
Azure	⭐⭐⭐⭐	⏱️⏱️⏱️ (mais lento)	Quando você precisa da maior fidelidade na transcrição.
Gladia	⭐⭐⭐	⏱️ (mais rápido)	Bom desempenho geral para a maioria dos idiomas.
Deepgram	⭐⭐⭐	⏱️ (mais rápido)	Outra opção sólida — teste qual funciona melhor para seu idioma e configuração de áudio.

Dica: Diferentes idiomas, sotaques ou ruído de fundo podem impactar cada engine de forma diferente. Faça um teste rápido A/B e mantenha o que tiver o melhor desempenho.

3. Selecione um Modelo LLM

Modelo	Pontos fortes	Compromissos
GPT-5 Mini	Raciocínio equilibrado com baixa latência	Pode ser mais lento que modelos em tempo real para trocas rápidas de turnos.
GPT-5 Realtime	Projetado para trocas de voz ultra-baixa latência	Melhor para Speech-to-Speech e Dualplex.
GPT-4o	Raciocínio forte e compreensão multimodal	Maior latência.
Gemini Flash 2.0 / 2.5	Ultra-rápido para trocas de voz em Dualplex/Multimodal	Excelente para minimizar a latência percebida.

Se a velocidade for crítica, use GPT‑5 Realtime (ideal para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ideal com Dualplex). Para raciocínio mais complexo, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.

4. Cancelamento de Ruído

Se os clientes estiverem no viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ligado. Se o volume da chamada estiver baixo ou algumas palavras forem “cortadas”, desligue-o para que o transcritor receba a forma de onda completa.

Se o seu assistente não estiver ouvindo você claramente, tente desligar o cancelamento de ruído.

5. Temporizadores de Conversa

Parâmetro	Recomendado	Por quê
Reengajamento	≈ 30 s	Dá tempo suficiente para os clientes pensarem. Valores menores podem parecer insistentes.
Duração máxima de silêncio	≈ 60 s	Evita desligamentos prematuros, mas ainda encerra chamadas realmente silenciosas.

Teste diferentes valores em chamadas reais — valores muito baixos podem interromper, valores muito altos deixam lacunas constrangedoras.

6. Mensagem Inicial

Modo	Como é usado	Melhor prática
Pipeline	Lido exatamente como escrito (convertido por TTS)	Escreva a saudação literalmente: “Olá, aqui é o Alex da …”.
Dualplex	Lido exatamente como escrito (renderizado via ElevenLabs TTS)	Escreva a saudação literalmente e selecione sua voz clonada.
Speech-to-Speech	Interpretado como prompt pelo modelo	Inclua instruções como “Cumprimente o cliente e diga …” ou anteponha `say exactly:` para garantir saída literal.

7. Som ambiente

Ativado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.

Se o assistente não estiver ouvindo você claramente, tente desligar o som ambiente ou reduzir o volume.

8. Controles de Endpointing

Controle quando seu assistente começa a falar usando o controle deslizante de sensibilidade de endpointing na parte inferior das configurações do assistente.

Configuração	Efeito	Quando usar
Sensibilidade baixa	Assistente responde mais rápido após o cliente parar de falar	Para conversas rápidas e dinâmicas
Sensibilidade alta	Assistente espera mais antes de responder	Quando os clientes dão respostas mais longas e detalhadas

Dica profissional: Se o assistente interromper o cliente no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua-a.

9. Depuração usando o transcript da chamada

Se você estiver enfrentando problemas com seu assistente, pode usar o transcript da chamada para depurar o problema.

Acesse a página de Histórico de Chamadas.
Clique na última chamada que você testou.
O transcript da chamada será exibido, incluindo chamadas de função e seus parâmetros.

10. Ainda tem dúvidas?

Se tiver alguma pergunta, entre em contato com nossa equipe de suporte pelo widget de chat dentro do aplicativo.

Teste diferentes configurações em chamadas reais — o equilíbrio ideal depende do fluxo da conversa e dos padrões de comportamento dos clientes.

Precisa de uma lista completa de todos os botões e controles deslizantes? Veja a referência completa de Configurações do Assistente.

Modos de Assistentes Prompts do Sistema

Introdução

Primeiros Passos

Visão Geral dos Assistentes de IA

Campanhas

Leads

Painéis personalizados

Conversas

Números de Telefone

Chamada de Entrada

Chamada de Saída

WhatsApp Business

Prompting de IA e Design de Conversa

Automações e Integrações

Custos e Preços

Provisionamento de Números

Solução de Problemas e Perguntas Frequentes

Boas Práticas do Assistente

1. Escolha um Modo

2. Escolha um Transcritor (apenas Pipeline)

3. Selecione um Modelo LLM

4. Cancelamento de Ruído

5. Temporizadores de Conversa

6. Mensagem Inicial

7. Som ambiente

8. Controles de Endpointing

9. Depuração usando o transcript da chamada

10. Ainda tem dúvidas?

​1. Escolha um Modo

​2. Escolha um Transcritor (apenas Pipeline)

​3. Selecione um Modelo LLM

​4. Cancelamento de Ruído

​5. Temporizadores de Conversa

​6. Mensagem Inicial

​7. Som ambiente

​8. Controles de Endpointing

​9. Depuração usando o transcript da chamada

​10. Ainda tem dúvidas?

1. Escolha um Modo

2. Escolha um Transcritor (apenas Pipeline)

3. Selecione um Modelo LLM

4. Cancelamento de Ruído

5. Temporizadores de Conversa

6. Mensagem Inicial

7. Som ambiente

8. Controles de Endpointing

9. Depuração usando o transcript da chamada

10. Ainda tem dúvidas?