Para medir se a IA do WhatsApp da clínica está funcionando, acompanhe três métricas que o fornecedor tem obrigação de reportar: taxa de resolução autônoma (percentual de conversas que a IA encerrou sem chamar humano, referência de mercado: 28% a 40% no setor de saúde), taxa de escalada com motivo (distinguindo escalada saudável de falha de compreensão) e tempo médio de primeira resposta (deve ficar abaixo de 15 segundos). NPS, taxa de ocupação e absenteísmo medem atendimento humano, não a IA.
A IA da clínica responde. Todo mundo vê isso. Mas entre responder e resolver existe uma distância que poucos donos de clínica medem.
Se você colocou uma IA no WhatsApp da clínica, provavelmente sabe dizer que ela está "funcionando". As mensagens chegam, a IA responde, o paciente segue a conversa. Até aqui, parece que está tudo certo.
O problema é que "responder" e "resolver" são coisas completamente diferentes. Uma IA pode responder 100% das mensagens e ainda assim estar repassando tudo pra secretária resolver. Nesse cenário, você tem uma intermediária cara disfarçada de solução.
E a maioria dos indicadores que a gente já conhece de gestão de clínica não ajuda aqui. NPS mede a percepção do paciente sobre a clínica como um todo. Taxa de ocupação mede agenda. Absenteísmo mede falta. Nenhum desses números consegue te dizer se a IA está, de fato, trabalhando.
Medir a IA com os indicadores do atendimento humano é como avaliar um carro novo pelo retrovisor do antigo.
Eu construí sistemas de IA que atendem no WhatsApp. E uma das primeiras coisas que aprendi é que a métrica mais perigosa de todas é a ausência de métrica. Quando ninguém mede, todo mundo assume que está funcionando. Até que um dia o dono descobre que a IA estava só empurrando conversa pra frente enquanto a secretária resolvia tudo por trás.
As métricas que vou mostrar aqui não são as mesmas dos artigos que ensinam gestão de clínica. São métricas específicas de IA de atendimento. O tipo de número que o seu fornecedor tem obrigação de entregar, e que a maioria dos donos de clínica nunca pediu.

A IA está resolvendo ou está repassando?
Essa é a primeira pergunta. E a métrica que responde ela tem um nome técnico: taxa de resolução autônoma, que no mercado de tecnologia é chamada de containment rate. Basicamente, é o percentual de conversas que a IA finalizou sem precisar chamar nenhum humano.
A conta é simples: conversas que a IA resolveu sozinha, divididas pelo total de conversas, vezes cem.
Se a IA atendeu 200 conversas no mês e em 120 delas o paciente conseguiu o que queria sem falar com ninguém da equipe, a taxa de resolução autônoma é de 60%.
Agora, o que é uma boa taxa de resolução autônoma? Essa pergunta importa muito, e poucos fornecedores respondem com clareza.
De acordo com levantamento da Gartner Customer Service Survey (2025), compilado pelo Stealth Agents, a taxa média de resolução autônoma na área de saúde fica entre 28% e 40%. No varejo e e-commerce, onde as demandas são mais simples e padronizadas, chega a 55% a 68%. Isso não é culpa da IA. É a natureza do setor: saúde envolve contextos mais sensíveis, e é natural que mais conversas precisem de humano.
Taxa de resolução autônoma por setor
40-52 %
- Saúde: 28-40
- Varejo e e-commerce: 55-68
- Tecnologia: 52-65
- Financeiro: 40-52
Gartner Customer Service Survey, 2025
Isso quer dizer que uma IA de WhatsApp na sua clínica que resolve 35% das conversas sozinha já está dentro do esperado para o setor de saúde. Se resolve 50%, está acima da média. Se resolve menos de 20%, algo precisa de atenção.
Mas cuidado com um detalhe que muda tudo: a definição de "resolveu". Alguns fornecedores contam como resolvida toda conversa em que o paciente não reclamou. Isso infla o número. A definição séria é: o paciente conseguiu o que procurava (agendar, confirmar, tirar uma dúvida) sem que a conversa tenha sido transferida pra um humano em nenhum momento.
Se o fornecedor não separa 'resolveu sozinha' de 'o paciente desistiu', o número que ele te mostra não vale nada.
Quando a escalada é sinal de saúde, e quando é sinal de falha
Aqui entra um dos conceitos mais mal-interpretados em IA de atendimento. A escalada da IA para um humano nem sempre é ruim. Em muitos casos é exatamente o que deveria acontecer.
Quando um paciente manda uma mensagem dizendo que está com dor forte e quer encaixe de emergência, a IA deveria reconhecer que isso não é uma tarefa pra ela e transferir imediatamente. Quando alguém faz uma reclamação sobre cobrança, a IA deveria passar pra quem pode resolver. Isso é a IA sabendo seus limites. E saber o limite é inteligência, não falha.
A escalada é sinal de problema quando acontece nas tarefas simples. Se a IA não consegue confirmar um agendamento que já existe na agenda, ou se ela trava diante de uma pergunta sobre horário de funcionamento, algo está errado na configuração, na base de informações, ou no próprio modelo de IA.
IA que escala quando deveria resolver é problema de engenharia. IA que resolve quando deveria escalar é problema de governança.
Na prática, como separar as duas coisas? Olhando a composição da escalada, não só o percentual bruto. O fornecedor precisa te dizer não apenas quantas conversas foram escaladas, mas por que foram escaladas. E aqui entram três categorias que eu uso quando avalio qualquer sistema:
Escalada por limite temático: a IA reconheceu que o assunto está fora do escopo dela. Exemplo: paciente perguntando sobre resultado de exame, reclamação formal, pedido de receita. Isso é saudável. É a IA respeitando a fronteira.
Escalada por falha de compreensão: o paciente fez uma pergunta comum e a IA não entendeu. Exemplo: "quero remarcar pra semana que vem" e a IA pede pra repetir, manda pra humano, ou dá uma resposta genérica. Isso é falha.
Escalada por abandono do paciente: o paciente parou de responder no meio da conversa com a IA, e o sistema joga a conversa pra fila humana. Isso pode indicar que a IA está confundindo o paciente, respondendo devagar, ou simplesmente não gerando confiança suficiente pra ele continuar.

Segundo dados compilados pelo Stealth Agents a partir de pesquisas da Gartner e Forrester (2025), IAs baseadas em inteligência artificial, e não em regras fixas ("digite 1 pra agendar"), apresentam taxa de abandono de 22%. Em sistemas baseados em árvore de decisão, esse número sobe pra 41%.
Taxa de abandono do paciente durante a conversa
Antes: 41% de abandono com bot de árvore de decisão / Depois: 22% de abandono com IA conversacional
Forrester Customer Experience Index, 2025
Se o paciente desiste no meio da conversa em 4 de cada 10 interações, a IA não está funcionando. Está espantando.
Tempo de primeira resposta: por que importa mais do que parece
Aqui tem um dado que devia estar na parede de toda clínica que usa IA no WhatsApp.
Um estudo conduzido pelo MIT em parceria com a InsideSales.com analisou mais de 15.000 leads em diferentes setores. A conclusão: responder em até 5 minutos aumenta em 21 vezes a chance de qualificar o contato, comparado com uma resposta em 30 minutos. E o primeiro a responder fecha 78% dos negócios.
Mais chance de qualificar o lead quando a resposta vem em até 5 minutos
21x
InsideSales/MIT, Lead Response Management Study
Agora traduz isso pro WhatsApp da clínica. O paciente mandou mensagem perguntando sobre disponibilidade. Se a IA responde em 8 segundos, você está dentro da janela. Se o WhatsApp fica sem resposta por 2 horas porque a recepcionista está em atendimento presencial, aquele paciente provavelmente já mandou a mesma mensagem pra outra clínica.
Quando o assunto é resposta rápida, a IA não precisa ser perfeita. Precisa existir.
E aqui vai uma distinção que poucos fazem: tempo de primeira resposta da IA é diferente de tempo de resolução. O primeiro mede a velocidade com que a IA acusa que recebeu e começou a atender. O segundo mede quanto tempo levou pra resolver o problema inteiro.
Os dois importam, mas o primeiro tem peso desproporcional. Por quê? Porque a percepção do paciente se forma nos primeiros segundos. Um estudo publicado pela Harvard Business Review auditou 2.241 empresas e encontrou que o tempo médio de primeira resposta era de 42 horas. 23% das empresas simplesmente nunca respondiam.
A IA elimina essa variável. Se ela está funcionando, o tempo de primeira resposta é próximo de zero. Mas o ponto de atenção é: o fornecedor mede isso? Ele te mostra esse número? Se não mostra, pode ser porque não é tão baixo quanto deveria.
Se a sua clínica já tem uma IA no WhatsApp e você quer entender o custo real dessa operação, vale olhar as camadas que normalmente ficam escondidas no contrato.

O que o fornecedor tem obrigação de reportar
Quando você contrata uma IA de atendimento, está contratando trabalho. E trabalho se mede. O fornecedor que não te entrega números claros está pedindo pra você confiar sem ver.
Aqui está o que, no mínimo, deveria chegar até você de forma periódica:
1. Taxa de resolução autônoma (mensal) Quantas conversas a IA resolveu sem chamar humano. É a métrica mãe. Sem ela, você não sabe se a IA trabalha ou só responde.
2. Taxa de escalada, com motivo Quantas conversas foram pra um humano, e por quê. Limite temático? Falha? Abandono? O número sem o contexto não serve.
3. Tempo médio de primeira resposta Em segundos, não em "rápido" ou "imediato". O ideal é abaixo de 15 segundos. Se passa de 1 minuto, algo está errado na estrutura técnica do fornecedor.
4. Volume de conversas por período Quantas conversas a IA atendeu por dia, semana e mês. Serve pra você entender sazonalidade e picos.
5. Taxa de abandono durante a conversa Percentual de pacientes que pararam de responder antes de resolver o que precisavam. Se esse número cresce, a IA está perdendo a confiança do paciente.
O fornecedor que vende IA e não reporta taxa de resolução autônoma está te vendendo promessa, não resultado.
Esses cinco indicadores já te dão uma radiografia real. Nenhum deles exige que você entenda de tecnologia. Todos são números que qualquer dono de clínica consegue ler e interpretar. E todos são dados que a operação da IA já gera naturalmente, porque toda conversa de WhatsApp via conexão oficial (a API, que é o canal autorizado pelo próprio WhatsApp) fica registrada.
Se o fornecedor diz que 'não tem como puxar esses dados', ele ou está usando uma conexão amadora ou está escolhendo não te mostrar.
A questão da proteção dos dados nessas conversas merece atenção separada, e vale a leitura pra quem quer entender como a LGPD se aplica a esse cenário.
Como calcular o ROI da IA usando os dados que você já tem
Você não precisa de um sistema de relatórios sofisticado pra ter uma noção clara do retorno sobre o investimento (o que a IA está gerando comparado ao que você paga por ela). Precisa de quatro números que, se o fornecedor te entrega as métricas listadas acima, você já tem.
Custo da hora da sua equipe de atendimento. Some salário, encargos e benefícios da pessoa (ou pessoas) que atende WhatsApp, e divida pelas horas trabalhadas no mês. Esse é o custo por hora humana de atendimento.
Tempo médio que um humano leva pra resolver uma conversa. Se a sua recepcionista gasta, em média, 6 minutos por conversa no WhatsApp (entre ler, responder, checar agenda, confirmar), você tem 10 conversas por hora por atendente.
Número de conversas resolvidas pela IA sem humano. Esse é o dado da taxa de resolução autônoma, traduzido em volume absoluto.
Custo mensal da IA. O que você paga pro fornecedor.
A conta é direta: conversas resolvidas pela IA, multiplicadas pelo custo que cada uma custaria se fosse feita por humano, menos o custo da IA. O resultado é o que a IA está economizando (ou não) por mês.
Diferença de custo por conversa resolvida
- Custo por conversa humana: R$ 3,80 a R$ 7,50
- Custo por conversa via IA: R$ 0,15 a R$ 0,30
IBM Institute for Business Value e Gartner Customer Service Benchmark, 2025
Esses valores de referência internacional (IBM e Gartner, 2025) mostram que o custo por interação resolvida por IA fica entre 10 e 25 vezes menor que o custo de uma interação humana. Em reais, os valores variam conforme o salário da equipe e o volume de conversas, mas a proporção se mantém.
O ROI da IA não aparece no faturamento. Aparece no tempo que a sua equipe recupera pra fazer o que a IA não faz.
Se a conta não fecha, você tem três cenários possíveis: a IA está resolvendo pouco (taxa de resolução baixa), a IA é cara demais pro volume da clínica, ou a equipe continua fazendo o mesmo trabalho porque ninguém redistribuiu as tarefas. As três têm solução, e as três exigem que você tenha os números na mão.

O que olhar nos registros de conversa pra entender se a IA entende o paciente
Essa parte é pra quem quer ir além dos números e entender a qualidade das conversas. Os registros de conversa da IA (os logs, como o fornecedor costuma chamar) são ouro bruto se você souber o que procurar.
Peça ao fornecedor acesso a amostras de conversas reais (obviamente respeitando a privacidade do paciente). E procure por três padrões:
Primeiro: o paciente precisou repetir a mesma informação? Se em uma conversa o paciente diz "quero agendar pra terça" e duas mensagens depois a IA pergunta "em que dia você gostaria de agendar?", a compreensão está falhando. Repetição é o sintoma mais visível de uma IA que não entende o contexto.
Segundo: a IA fez perguntas desnecessárias? Se o paciente já disse o nome, a especialidade e o dia, e a IA começa a pedir confirmação de cada item um por um como se não tivesse ouvido nada, isso não é rigor. É falha de interpretação.
Terceiro: o paciente desistiu depois de quantas mensagens? Se a conversa tem 12 trocas de mensagem e o paciente para de responder na 8a, algo travou. Pode ser que a IA entrou em loop, pediu algo que o paciente não tinha, ou simplesmente não estava levando a conversa pra frente.
Uma IA que faz o paciente repetir o que já disse está consumindo a paciência que o paciente reservou pra falar com a clínica.
Nos logs, a conversa boa é curta, objetiva e termina com o paciente tendo o que veio buscar.
O bom log de conversa mostra três coisas: a IA entendeu rápido, conduziu sem rodeio, e o paciente saiu com o problema resolvido. Se a leitura dos logs te dá essa sensação em 7 de cada 10 conversas, a IA está fazendo um trabalho sólido. Se em mais da metade você sente que "o paciente foi paciente demais", é hora de pedir ajustes ao fornecedor.
A Triagi entende essa lógica porque ela nasceu de quem constrói, não de quem só revende IA pronta. Conheça a Triagi.
O checklist de cobrança pro seu fornecedor
O que levar pro próximo contato com quem fornece a IA da clínica. Parceria que funciona com dados funciona assim:
| O que pedir | Por que importa | Frequência |
|---|---|---|
| Taxa de resolução autônoma | Mostra se a IA resolve ou só repassa | Mensal |
| Taxa de escalada com motivo | Separa escalada saudável de falha | Mensal |
| Tempo médio de primeira resposta | Prova que a IA é rápida de verdade | Mensal |
| Taxa de abandono na conversa | Mostra se o paciente confia na IA | Mensal |
| Amostra de logs de conversa | Revela a qualidade da compreensão | Trimestral |
| Volume total de conversas | Permite calcular ROI | Mensal |
Se o seu fornecedor entrega esses seis itens, você está no controle. Se entrega menos de três, você está no escuro.
A IA que atende sua clínica gera dados toda vez que conversa com um paciente. Esses dados existem. A escolha do fornecedor é se ele compartilha com você ou não.
IA séria gera dado. Fornecedor sério entrega o dado. Dono esperto lê o dado.
Se você chegou até aqui e reconheceu que não recebe esses números hoje, a conversa mais importante da sua semana é com o fornecedor da IA, não com o contador. Veja como a Triagi funciona.

Comentários
marcelo f
cara isso aqui eh exatamente meu problema
Lucas Silveira · Autor
Boa, Marcelo. Se quiser um ponto de partida prático: pede pro fornecedor a taxa de resolução autônoma do último mês. Só esse número já muda a conversa.
Dra. Renata Almeida
Lucas, pergunta direta: meu fornecedor me manda um relatorio mensal com "taxa de sucesso" de 92%. Eu sempre achei estranho porque a secretaria continua resolvendo tudo por tras. Depois de ler o artigo acho que entendi, ele ta contando como sucesso toda conversa que o paciente nao reclamou, ne? Como faco pra pedir o numero certo sem parecer que to desconfiando do cara?
Lucas Silveira · Autor
Renata, esse 92% provavelmente conta qualquer conversa em que o paciente parou de escrever, mesmo que ele tenha desistido ou a secretária tenha resolvido por fora. O número real que importa é a taxa de resolução autônoma, que só conta as conversas em que a IA de fato finalizou sem ninguém da equipe encostar. Você pode pedir assim, sem criar clima: "quero ver separado quantas conversas a IA resolveu sozinha, sem a minha equipe intervir". Se o fornecedor entrega isso limpo, o número vai cair bastante em relação aos 92%, e aí você vai ter a fotografia real. Se ele não consegue separar, isso já te diz muita coisa sobre a ferramenta.
Patricia Nunes Odonto
Tenho uma clinica de odonto com 3 dentistas e a gente colocou ia no whatsapp faz uns 4 meses. No comeco parecia otimo pq parou de acumular msg sem resposta. Mas agora to com uma sensacao estranha, tipo, os pacientes sao atendidos rapido mas a quantidade de agendamentos nao subiu tanto assim Será que a ia ta respondendo mas nao ta convertendo? como eu mediria isso? pq o fornecedor so me mostra volume de mensagens respondidas
Mais lidas
A IA da sua clínica pode inventar informações para o paciente?Quanto custa IA no atendimento da clínica? As 4 camadas que não aparecem no contrato
Sua IA responde paciente no WhatsApp. Você sabe o que a LGPD diz sobre esses dados?
Chatbot para clínica ou IA de verdade? Como testar no WhatsApp