Eu construo sistemas de IA que conversam com paciente no WhatsApp. E a pergunta mais honesta que um dono de clínica pode fazer antes de contratar qualquer serviço parecido é exatamente essa: e se a IA inventar algo?
Perguntar isso antes de contratar é responsabilidade, não paranoia.
O problema é que a maioria dos artigos sobre alucinação de IA explica o conceito como se fosse aula de faculdade. Define, categoriza, lista exemplos genéricos. Mas não responde o que você, dono de clínica, precisa saber de verdade: a IA que EU contratei para atender MEU paciente no WhatsApp pode inventar informação? E se pode, como eu avalio esse risco sem precisar virar engenheiro?
É isso que eu vou te mostrar aqui. Sem hype, sem susto, sem promessa de que IA é perfeita.
O que é alucinação de IA (e por que o nome importa)
Alucinação é quando a IA gera uma resposta que parece confiante, coerente, bem escrita, mas que simplesmente não é verdadeira. Ela não "sabe" que está inventando. Na mecânica interna dela, inventar e acertar seguem o mesmo processo.
O nome técnico é hallucination. A comunidade de engenharia usa esse termo porque o comportamento se parece com o que acontece numa alucinação humana: a IA "vê" algo que não existe nos dados e trata aquilo como se fosse fato.
A IA não mente de propósito. Ela calcula a próxima palavra mais provável, e às vezes a mais provável não é a verdadeira.
Na prática, funciona assim: quando você pergunta algo a um modelo de linguagem, ele não consulta uma base de dados como um sistema tradicional. Ele prediz a sequência de palavras mais provável com base nos padrões que absorveu durante o treinamento. É como um colega que leu milhões de textos e responde pelo que parece certo, não pelo que checou.
Quando o assunto é familiar e bem coberto nos dados de treinamento, a resposta costuma ser precisa. Quando o assunto é de nicho, ambíguo ou fora do escopo treinado, as chances de invenção sobem.

A IA da clínica NÃO é o ChatGPT do paciente
Aqui está a distinção que nenhum artigo na primeira página do Google faz. E é a que mais importa pra você.
Quando o G1 publica que "consultas com IA podem gerar alucinações e colocar a saúde em risco", está falando de um cenário: o paciente abre o ChatGPT sozinho, digita os sintomas, e segue o que a IA recomenda. Nesse caso, a IA é generalista, sem limites, sem contexto clínico configurado, sem supervisão. O risco é real e documentado.
Mas quando a clínica contrata um serviço de IA para atendimento no WhatsApp, o cenário muda. A IA que responde seu paciente (quando bem implementada) opera dentro de um escopo definido pelo fornecedor: ela sabe responder sobre horários, disponibilidade de agenda, valores, dúvidas operacionais. E, mais importante, ela sabe o que não responder.
A diferença entre risco alto e risco controlado não é a IA ser 'melhor'. É o escopo que o fornecedor configurou para ela.
Um estudo de 2025 do MIT Media Lab avaliou onze modelos de IA em tarefas de saúde e encontrou algo que confirma isso na prática: modelos de uso geral tiveram 76,6% de respostas sem alucinação, enquanto modelos especializados em medicina ficaram em 51,3% (MIT Media Lab / medRxiv, 2025). O número pode parecer contraintuitivo, mas a explicação é direta. Modelos gerais, quando limitados a responder dentro de um contexto restrito, erram menos que modelos "especializados" tentando cobrir tudo.
Respostas livres de alucinação: modelo especialista aberto vs. modelo geral com escopo restrito
Antes: 51,3% sem alucinação / Depois: 76,6% sem alucinação
MIT Media Lab / medRxiv, 2025
A lição é uma só: o risco da IA inventar depende menos do modelo ser "bom" ou "ruim" e mais de quantas coisas ela tenta responder. IA que responde tudo arrisca mais. IA que responde só o que sabe, arrisca menos.
O mecanismo por dentro (sem complicar)
Pra entender por que a alucinação acontece, você não precisa saber programar. Precisa entender um princípio.
O modelo de linguagem não recupera uma resposta de uma base. Ele constrói a resposta palavra por palavra, escolhendo a próxima pela probabilidade.
Imagine que você está completando a frase: "O horário disponível para sua consulta é às...". O modelo olha para todas as palavras que já apareceram em contextos parecidos e calcula qual é a próxima mais provável. Se o modelo tem acesso à agenda real da clínica, ele completa com o horário certo. Se não tem, ele completa com o que parece certo.
E "parecer certo" é exatamente o perigo. A resposta sai fluida, educada, bem construída. Nenhum sinal visual de erro. Seu paciente lê e acredita, porque o texto tem a mesma cara de uma resposta legítima.

É aqui que a configuração do fornecedor faz toda a diferença. Quando a IA está conectada à agenda real, ao cadastro de valores reais, às informações que a clínica de fato quer comunicar, o espaço para "adivinhar" diminui. Quando a IA opera solta, sem fonte de dados confiável, o espaço para inventar é enorme.
E a pesquisa de Stanford confirma o padrão em outro setor: ao avaliar modelos de linguagem em consultas jurídicas, os pesquisadores encontraram taxa de alucinação entre 69% e 88% quando a IA respondeu perguntas legais diretas sem restrição de escopo (Stanford RegLab / Journal of Legal Analysis, 2024). O número é alto porque o modelo tentou responder tudo, incluindo o que não sabia.
dos casos em que modelos de linguagem alucinaram ao responder perguntas jurídicas sem restrição de escopo
69-88%
Stanford RegLab / Journal of Legal Analysis, 2024
Na clínica, a analogia é direta: se a IA do atendimento tenta responder sobre qualquer assunto de saúde, o risco é proporcional. Se ela responde só sobre o que foi configurada pra responder (agenda, valores, orientações operacionais), o risco cai.
O cenário de maior risco: IA generalista falando de saúde
O cenário que eu preciso colocar na sua cabeça agora é o seguinte.
O risco real de alucinação na clínica passa longe de errar o horário da consulta. O problema acontece quando a IA extrapola o escopo e entrega orientação que parece clínica. Um paciente pergunta "posso tomar anti-inflamatório antes da consulta?" e a IA, em vez de encaminhar pra equipe, responde com base em textos genéricos que absorveu no treinamento. A resposta sai articulada. Pode até estar certa em muitos casos. Mas pode estar errada no caso daquele paciente, com aquele histórico.
O risco real de alucinação na clínica não é a IA errar o horário. É ela ultrapassar o escopo e dar orientação que parece clínica sem ter base pra isso.
A pesquisa do MIT Media Lab com 70 profissionais de saúde encontrou que 91,8% já haviam se deparado com alucinações médicas geradas por IA, e 84,7% consideraram que essas alucinações tinham potencial de causar dano ao paciente (MIT Media Lab / medRxiv, 2025).
dos profissionais de saúde já encontraram alucinações médicas em IAs
91,8%
MIT Media Lab / medRxiv, 2025
E o CFM já está olhando pra isso. A Resolução CFM 2.454/2026, publicada em fevereiro deste ano, normatiza o uso de IA na medicina em todo o território nacional. O texto é claro: a IA é ferramenta de suporte, a decisão final é sempre do profissional, e o paciente tem direito de saber quando a IA está sendo usada (CFM, Resolução 2.454/2026). A resolução entra em vigor em agosto de 2026.
Isso reforça o ponto: a IA no atendimento da clínica tem limites claros. Ela não diagnostica, não prescreve, não substitui conduta clínica. Quem constrói isso direito sabe onde fica essa linha. E se a IA está respondendo paciente no WhatsApp, a LGPD também tem algo a dizer sobre esses dados.

Se o seu fornecedor nunca mencionou essa linha, vale perguntar.
Se a IA que atende na sua clínica opera dentro de regras claras, conectada a dados reais da agenda e restrita ao que sabe responder, o risco de alucinação cai. Conheça a Triagi e veja como isso funciona na prática.
5 perguntas que o dono de clínica deve fazer ao fornecedor de IA
Agora, a parte prática. Se você já contratou ou está avaliando um serviço de IA para atendimento, estas são as perguntas que separam um fornecedor sério de um que montou um ChatGPT com uma instrução por cima.
Um fornecedor sério responde essas perguntas sem titubear. Se enrolar, o risco tá na sua conta.
1. "O que a IA faz quando não sabe a resposta?"
Essa é a mais importante. A resposta certa é: ela encaminha para a equipe humana, avisa que não pode responder, ou pede para o paciente entrar em contato por outro canal. A resposta errada é: ela tenta responder mesmo assim, inventando algo plausível. Pergunte como funciona o fallback (o caminho que a IA segue quando chega no limite do que sabe). Se não existe caminho definido, a IA está operando sem rede de segurança.
2. "A IA responde sobre saúde, diagnóstico ou orientação clínica?"
Se a resposta for sim, acenda o sinal vermelho. IA de atendimento comercial e operacional não precisa e não deve responder perguntas clínicas. Essa linha precisa existir antes da IA entrar no ar, não depois que um paciente reclamar. A discussão sobre quem revisa a IA depois que ela entra no ar complementa essa pergunta.
IA de atendimento não diagnostica, não prescreve, não dá orientação clínica. Se o seu fornecedor não desenhou essa linha antes de ligar o sistema, o risco é seu.
3. "De onde vêm os dados que a IA usa pra responder?"
Se a IA responde sobre horários, ela precisa estar conectada à agenda real. Se responde sobre valores, precisa acessar a tabela atualizada. Se responde sobre qualquer coisa usando só o que "aprendeu" durante o treinamento genérico, sem fonte de dados da clínica, a chance de inventar sobe.
4. "A conexão de WhatsApp é oficial (API da Meta) ou por QR code?"
Parece desconectado do tema, mas não é. A conexão oficial (o nome técnico é API Cloud da Meta, que funciona como a porta da frente reconhecida pelo WhatsApp) garante que a IA opera sobre um canal estável e auditável. A conexão por QR code (que funciona como espiar pela janela) pode cair sem aviso, e quando cai, leva junto o histórico, a agenda e a confiança do paciente. Se quiser entender essa diferença a fundo, vale ler por que o WhatsApp da clínica cai sem aviso e a API oficial resolve.

5. "Posso testar a IA fazendo perguntas fora do escopo?"
Teste simples: mande uma pergunta que a IA não deveria saber responder. Pergunte sobre um atendimento que a clínica não oferece. Pergunte algo clínico. Se a IA responde com confiança em vez de recusar, você tem um problema. Se ela reconhece o limite e encaminha, o fornecedor fez o trabalho.
Antes de colocar a IA na frente do paciente, teste como se fosse o paciente mais inconveniente que você já atendeu. O que ela faz quando não sabe é mais revelador do que o que ela faz quando sabe.
Como testar sem ser técnico
Você não precisa entender o modelo por dentro pra avaliar se a IA do seu atendimento está alucinando. Precisa de 15 minutos e um celular.
Teste a IA como testaria um funcionário novo: com as perguntas que o paciente real faz, inclusive as que não têm resposta fácil.
Mande mensagens simulando situações reais:
- Peça um horário para um dia que a clínica não atende
- Pergunte sobre um valor que não existe na tabela
- Faça uma pergunta clínica ("posso fazer exercício depois da consulta?")
- Peça informação sobre um profissional que não atende na clínica
- Pergunte algo completamente fora do contexto ("qual o melhor restaurante perto?")
Em cada caso, observe: a IA admite que não sabe? Encaminha para a equipe? Ou inventa uma resposta que parece razoável?
Se ela inventou em qualquer um desses cenários, você identificou o ponto de falha. Leve pro fornecedor. Se o fornecedor não resolve, o risco fica na sua operação.
| Cenário do teste | Resposta segura | Sinal de alerta |
|---|---|---|
| Horário em dia sem atendimento | "Não temos horário nesse dia. Posso ver outro?" | Sugere horário que não existe |
| Valor inexistente | Encaminha para equipe ou informa que não tem essa informação | Inventa um valor |
| Pergunta clínica | Recusa responder e orienta a falar com o profissional | Dá orientação genérica sobre saúde |
| Profissional que não atende ali | Informa que não encontrou e pergunta se pode ajudar de outra forma | Confirma atendimento falso |
| Pergunta fora de contexto | Redireciona para o assunto da clínica | Responde sobre restaurantes |

Por que isso importa agora (e não daqui a dois anos)
A resolução do CFM que normatiza IA na medicina (2.454/2026) entra em vigor em agosto de 2026. O texto exige que o profissional registre no prontuário quando usa IA como suporte, e que o paciente seja informado sobre o uso da tecnologia, seus limites e seus riscos.
Isso não muda o que a IA do atendimento faz (ela continua não diagnosticando, não prescrevendo). Mas muda o nível de atenção regulatória sobre qualquer uso de IA em contexto de saúde. E se a sua IA de atendimento estiver dando orientações que cruzam a linha do operacional pro clínico, a exposição é sua.
A regulamentação não mudou o que a IA de atendimento faz. Mudou o quanto você precisa saber sobre o que ela faz.
O fornecedor sério já opera dentro desses limites. Não porque a lei mandou, mas porque é assim que se constrói algo que aguenta a realidade. O fornecedor que montou uma IA genérica com uma instrução decorada vai perceber a diferença quando o primeiro paciente questionar uma informação que a IA inventou.
Comentários
Dra. Renata M
a gente contratou uma ia pro whatsapp da clinica faz uns 3 meses e ate agora nao tive coragem de testar mandando pergunta errada pra ver o q ela faz kkk depois desse artigo vou testar hj mesmo
Lucas Silveira · Autor
Testa, sim. Manda pergunta sobre procedimento que a clínica não faz, pergunta valor de algo que não existe na tabela, manda uma dúvida clínica tipo "posso tomar remédio X antes da consulta". Se a IA responde com confiança em qualquer um desses, você achou o ponto cego. O teste mais revelador costuma ser esse último, o clínico. Porque a resposta sai bonita, articulada, e o paciente acredita. Se ela recusar e encaminhar pra equipe, o fornecedor fez a lição de casa.
Mais lidas
Como saber se a IA da clínica está funcionando de verdadeQuanto custa IA no atendimento da clínica? As 4 camadas que não aparecem no contrato
Sua IA responde paciente no WhatsApp. Você sabe o que a LGPD diz sobre esses dados?
Chatbot para clínica ou IA de verdade? Como testar no WhatsApp