Blog / Produto & Design

Por que humanizar uma IA é uma decisão estratégica

Camila, assistente de IA da Capim — mulher jovem de óculos segurando um celular, sobre fundo degradê de verde-limão para azul

Data

Tempo de leitura

9 minutos

Compartilhe

Foto de Bruno RodilhaFoto de Larissa Corte

Autores

Bruno Rodilha e Larissa Corte · Produto & Design · Capim


Humanizar uma IA não é um exercício cosmético: é uma decisão estratégica que afeta diretamente a adoção do produto. Foi o que aprendemos construindo a identidade da Camila, a assistente de agendamento da Capim. Desde o lançamento da identidade, 113 novas clínicas se conectaram ao produto — e a ativação, que antes dependia de 3 dias de suporte manual, virou uma experiência autônoma de 35 a 40 minutos. Este post conta o processo: da pesquisa com usuários à personagem, da voz ao fluxo híbrido no WhatsApp.

O problema: interesse sem ativação

Em agosto de 2025, descobrimos que o sucesso de uma solução de IA vai muito além da sua capacidade de dar respostas rápidas. A inteligência de um agente precisa ser percebida a partir de sua identidade, logo no primeiro contato. Afinal, a primeira impressão é o que fica.

Naquele mês, estávamos acompanhando a fase beta do assistente de agendamento da Capim, que tinha como objetivo atender pacientes via WhatsApp e agendar consultas. Estávamos confiantes em liberar o acesso ao produto para um grupo maior de usuários, pois já tínhamos realizado testes internos e colocado para operar em algumas clínicas parceiras.

Após algumas semanas com o assistente disponível para um número maior de usuários, percebemos que uma parcela significativa das clínicas demonstrava interesse no produto, mas não concluía a ativação. Nossa preocupação deixou de ser se o assistente funcionava e passou a ser por que os usuários desistiam antes mesmo de experimentá-lo.

Para entender o que estava acontecendo, conduzimos entrevistas com 12 usuários que haviam passado pelo fluxo de ativação do assistente. As conversas trouxeram dois tipos de barreira:

  1. Fricção operacional O processo de conexão exigia dois dispositivos, mas essa exigência não era comunicada previamente. Ao se deparar com ela de forma inesperada, muitos usuários simplesmente abandonavam o fluxo.

  2. Distância emocional Os usuários tinham pouco entendimento sobre como funcionava uma ferramenta de IA, a linguagem do produto era técnica demais e essa distância gerava falta de confiança no assistente.

Para que as clínicas pudessem finalmente utilizar o produto, para melhorar sua rotina de agendamentos, precisávamos consertar o fluxo de ativação, tornando-o mais intuitivo, e criar uma identidade que gerasse proximidade e confiança.

Construindo a identidade

Atributos de personalidade

O assistente de agendamento não poderia mais existir apenas como um balão de fala dentro do WhatsApp. Ele precisava habitar o mesmo mundo dos nossos usuários. Gerenciar agendamentos em uma clínica odontológica é, na maior parte dos casos, uma atividade desempenhada por uma pessoa, e foi a partir daí que começamos a construir a identidade do assistente: aproximando-nos de quem realmente faz esse trabalho, as recepcionistas e secretárias das clínicas.

Antes de pensar nos aspectos visuais, estudamos como essas profissionais se comunicavam com os pacientes. Fizemos isso por meio de conversas como cliente oculto e da análise de trechos de atendimentos humanos registrados junto às clínicas beta. A partir dessas observações, definimos os atributos que deveriam guiar a identidade do assistente:

  • Personalidade dinâmica, segura e prestativa.
  • Comunicação simples, clara e empática.
  • Tom de voz humano, direto e próximo.

Com os atributos definidos, partimos para o naming. Foram criadas seis opções, reduzidas a três finalistas após alinhamento com os stakeholders. As três opções foram então enviadas para as clínicas beta via WhatsApp, em uma iniciativa que, além de coletar preferências, criou um senso de pertencimento ao processo. Com 25 votos, o nome escolhido foi Camila.

Enquete de naming enviada às clínicas beta no WhatsApp: "Qual nome do nosso Assistente IA merece seu voto?", com as opções Camila, Caio e Maiara.

Aspectos visuais

Com os atributos definidos, era preciso materializá-los visualmente. Para que os usuários pudessem se aproximar da Camila, decidimos criar uma personagem: uma mulher jovem, com traços que combinassem características de múltiplos fenótipos. A juventude traduzia a personalidade dinâmica e prestativa que queríamos transmitir, enquanto a diversidade de traços era uma escolha deliberada para que ela pudesse ser reconhecida pela diversidade do público brasileiro.

O desenvolvimento visual também foi um laboratório de experimentação com ferramentas de IA. Usamos o AI Studio com Nano Banana para gerar e refinar alternativas a partir de três linguagens visuais distintas:

  • Cartoon: mais simpática e acessível
  • Techie: moderna e objetiva
  • Fotorrealista: com foco em acolhimento e proximidade

Versão Cartoon

Três variações da Camila em estilo cartoon 3D, atendendo em cenários de clínica odontológica.

Versão Techie

Três variações da Camila em estilo techie — visual 3D moderno, com blazer verde, em ambiente de clínica.

Versão Fotorrealista (escolhida)

Três variações fotorrealistas da Camila, a versão escolhida: retrato sorrindo, corpo inteiro na recepção da clínica e pose segurando o celular.

Após validação com o restante do time de produto, escolhemos seguir com a versão fotorrealista. Queríamos reduzir a percepção de tecnologia distante e reforçar a sensação de proximidade com o usuário, e a abordagem fotorrealista era a que melhor traduzia essa intenção, tanto pelo apelo ao nosso público quanto pela qualidade superior das imagens geradas. Naquele momento, o AI Studio entregava resultados mais consistentes para linguagens fotográficas do que para estilos mais gráficos.

Para garantir consistência na geração de novas poses, construímos um agente especialista em prompts (o DUCA), responsável por transformar as diretrizes visuais e de personalidade da Camila em instruções estruturadas e reproduzíveis.

Após diversas iterações, com ajustes de enquadramento, iluminação e padronização de termos, o processo gerou um banco com mais de 20 variações da personagem, acompanhado de prompts documentados e materiais reutilizáveis por outros times. A identidade visual deixou de ser apenas uma escolha estética e passou a ser um ativo escalável.

Identidade conversacional

A principal manifestação da Camila no mundo se dá por meio de conversas com dentistas e pacientes. Por isso, a construção de sua identidade conversacional exigia a mesma atenção dedicada à sua aparência. Traduzimos seus atributos de personalidade e suas características visuais em guias de conversação, para que sua voz fosse tão reconhecível quanto seu rosto.

Além do tom amigável, que era uma premissa desde o início, buscamos estruturar sua comunicação em cinco princípios:

  • Primeira pessoa: criar uma sensação de presença e responsabilidade, como em “Eu vou te ajudar a conectar sua clínica.”
  • Antecipação de dúvidas: especialmente em etapas críticas do fluxo, para reduzir a ansiedade do usuário antes que ela surgisse.
  • Linguagem simples: evitar termos técnicos como “autenticação” ou “integração”, que criam distância em vez de proximidade.
  • Orientação progressiva: apresentar uma etapa por vez, reduzindo a sobrecarga cognitiva.
  • Postura de apoio: substituir mensagens frias e impessoais por respostas empáticas.

Redesenhando a experiência

Fluxo conversacional híbrido

O primeiro contato com a Camila acontece por meio de uma conversa via WhatsApp, durante o fluxo de ativação. É nesse momento que o usuário precisa contextualizar a assistente sobre a clínica e conceder os acessos necessários para que ela possa operar.

Esse fluxo precisava equilibrar duas necessidades aparentemente opostas. De um lado, conduzir o usuário com segurança pelas etapas mais complexas, e do outro, deixar espaço para uma conversa mais natural. Para isso, combinamos momentos com mensagens predefinidas, onde o controle era maior e o risco de abandono mais alto, com momentos de maior liberdade, nos quais a LLM generativa poderia engajar com contextos mais abertos e variados.

Diagrama do fluxo conversacional híbrido da Camila, alternando etapas de mensagens predefinidas com momentos de conversa aberta conduzida pela LLM.

Fluxo definindo os momentos das mensagens predefinidas e das conversas abertas com a LLM.

Para tornar a inserção de dados mais fluida, integramos recursos do Flows da Meta à conversa. Com isso, padrões interativos como seletores e formulários passaram a fazer parte do fluxo de forma natural, permitindo que o usuário concluísse todo o processo sem sair do WhatsApp, combinando diálogo e interface em uma experiência contínua.

Duas telas do WhatsApp Flows: formulário "Funcionalidades" perguntando o que a Camila pode solicitar no cadastro do paciente, e "Funcionamento da clínica" com os dias de atendimento.

Essa estrutura híbrida refletia a identidade que construímos para a Camila e, ao mesmo tempo, tornava o fluxo mais eficaz. A assistente conseguia seguir um roteiro sem parecer um robô, e o usuário interagia em um ambiente já familiar, sem precisar aprender nada novo para começar.

Vídeos para gerar identificação

Colocamos para rodar nossa primeira versão do fluxo, agora com identidade visual e personalidade, combinando mensagens predefinidas com diálogos abertos. No entanto, após os primeiros usuários passarem por ele, percebemos que a comunicação escrita não era suficiente para gerar conexão emocional nem para esclarecer pontos importantes da jornada.

Para resolver isso, decidimos produzir vídeos a partir do material visual da Camila. Esses breves clipes foram inseridos ao longo do fluxo, tanto para apresentar o produto quanto para apoiar o usuário em momentos críticos, como o de conexão do WhatsApp usando dois dispositivos.

Para dar movimento à Camila, geramos os clipes com o Veo 3, usando as imagens criadas anteriormente como ponto de partida. Organizamos essas imagens em um storyboard e, a partir dele, roteirizamos cada sequência diretamente no prompt, descrevendo transições, iluminação e movimentos de câmera.

Como o Veo 3 impõe limitações na duração dos clipes gerados, exportamos o material para um editor de vídeo, onde unimos as sequências e fizemos a mixagem dos áudios. O resultado foi um conjunto de vídeos que apresentavam a Camila em movimento, mantendo a consistência visual construída ao longo de todo o processo.

Tela do Google Flow mostrando o prompt usado para roteirizar as cenas da Camila no Veo 3.

Processo de criação dos vídeos usando o Veo 3.

O que aprendemos

O resultado foi uma mudança imediata na percepção de valor: desde o lançamento da identidade, 113 novas clínicas se conectaram ao produto, consolidando uma base de 245 clínicas ativas.

Mais do que volume, essa nova identidade destravou a escalabilidade que buscávamos. O redesenho do fluxo, agora conduzido por uma presença humana e acolhedora, permitiu que o que antes era um processo de suporte manual de 3 dias se transformasse em uma experiência autônoma de 35 a 40 minutos.

O processo nos ensinou que humanizar uma solução de IA não é um exercício cosmético. É uma decisão estratégica que afeta diretamente a adoção do produto. Três princípios guiaram esse trabalho e podem ser úteis para outros times que enfrentam desafios parecidos:

  • Identidade precede funcionalidade: de nada adianta um assistente tecnicamente capaz se o usuário não consegue estabelecer uma relação de confiança com ele antes de ativá-lo.
  • Consistência transforma identidade em credibilidade: nome, aparência, voz e comportamento precisam contar a mesma história.
  • O usuário quer ser conduzido, não surpreendido: antecipar dúvidas, simplificar etapas e reduzir fricção são formas de respeito, não apenas de usabilidade.

A Camila continua evoluindo. Mas o que ficou desse processo é a certeza de que, para uma IA ser percebida como inteligente, ela precisa primeiro ser percebida como presente.

Continue lendo