Quando você exporta um chat do WhatsApp com mídia, o zip pode conter fotos, vídeos e notas de voz. A maioria das pessoas assume que tudo é enviado.
ThreadRecap não funciona assim.
Fotos e vídeos nunca saem do seu dispositivo. Não os enviamos. Não os processamos. Eles são ignorados.
Enviamos apenas o necessário para produzir um recap útil. Você pode ler mais em nossa política de privacidade. Aqui está o que é enviado:
Texto do chat da exportação.
Notas de voz (áudio) se você optar por incluir mídia e deseja transcrição.
Tudo o mais fica local.
Entender exatamente por que essa arquitetura foi escolhida — e o que significa na prática — requer uma análise mais detalhada de como as exportações do WhatsApp são estruturadas, como ThreadRecap as processa, e qual é a diferença técnica entre ignorar um arquivo e simplesmente não armazená-lo depois.
O que está dentro de um zip de exportação do WhatsApp?
Notas de voz (comumente `.opus`, às vezes `.m4a`).
ThreadRecap lê o zip localmente no seu navegador, extrai o texto do chat, identifica arquivos de notas de voz e ignora fotos e vídeos.
Como o WhatsApp nomeia e organiza mídia dentro do zip
O WhatsApp usa convenções de nomenclatura previsíveis dentro de seus ZIPs de exportação. Fotos são normalmente nomeadas com um prefixo de carimbo de data/hora como `IMG-20240601-WA0001.jpg`, vídeos seguem um padrão semelhante com prefixos `VID-`, e notas de voz usam prefixos `PTT-` com extensões `.opus` ou `.m4a`. GIFs exportados de chats do WhatsApp aparecem como arquivos `.mp4`. Adesivos são geralmente pequenas imagens `.webp`. A etapa de análise local do ThreadRecap lê esses nomes de arquivo e extensões para categorizar cada arquivo no ZIP antes de qualquer outra coisa acontecer. Arquivos nas categorias de foto e vídeo nunca são lidos além de seus metadados; seu conteúdo binário não é tocado.
A diferença entre "exportar com mídia" e "exportar sem mídia"
WhatsApp oferece duas opções de exportação: com mídia e sem mídia. Quando você exporta sem mídia, o ZIP contém apenas o arquivo `_chat.txt`. Referências embutidas de mídia nesse arquivo leem como `<Media omitted>`. Quando você exporta com mídia, fotos, vídeos, notas de voz e documentos são agrupados junto com a transcrição. ThreadRecap lida com ambos os casos. Se você exportar sem mídia, apenas o texto do chat é processado e nenhum áudio ou upload de mídia ocorre. Se você exportar com mídia, ThreadRecap ainda assim apenas envia o texto do chat e qualquer arquivo de áudio de nota de voz que encontrar; a presença de fotos e vídeos no ZIP não muda essa limitação.
O que ThreadRecap envia (e por quê)
ThreadRecap envia apenas:
1) Texto do chat
Porque resumos, decisões e itens de ação vêm da linha do tempo da conversa.
O arquivo `_chat.txt` é um log em texto simples. Contém carimbos de data/hora, nomes de remetentes e conteúdo de mensagens. Esta é a entrada primária para o recap da IA. Sem isso, não há conversa para resumir. O arquivo é tipicamente pequeno — um chat com milhares de mensagens raramente excede alguns megabytes de texto simples — então o tempo de upload é negligenciável comparado ao tamanho total do ZIP quando a mídia está incluída.
2) Apenas notas de voz (áudio)
Porque as notas de voz geralmente contêm as informações mais importantes, e a transcrição requer enviar áudio para um modelo de fala para texto.
WhatsApp exporta notas de voz em formato `.opus` e às vezes `.m4a`. ThreadRecap envia esses arquivos para o Whisper da OpenAI para transcrição. Whisper alcança aproximadamente 95% de precisão em áudio claro, o que é alto o suficiente para que a transcrição seja uma entrada confiável para o recap em vez de uma fonte de ruído. Uma vez transcrita, a saída de texto é mesclada na linha do tempo do chat no carimbo de data/hora correto, então o recap trata conteúdo falado com o mesmo peso que mensagens digitadas. O arquivo de áudio em si não é armazenado após a transcrição.
Se não houver notas de voz, nenhum áudio é enviado.
O que ThreadRecap nunca envia
ThreadRecap não envia:
Fotos.
Vídeos.
GIFs.
Adesivos.
Miniaturas.
Qualquer outra mídia não-áudio.
Mesmo que esses arquivos existam no seu zip exportado, eles permanecem no seu dispositivo.
Por que ignorar arquivos localmente é uma garantia mais forte do que deletá-los no servidor
Algumas ferramentas descrevem sua proteção de privacidade em termos do que deletam após processamento. Essa formulação ainda requer que o arquivo viaje pela rede e chegue a um servidor. A abordagem do ThreadRecap é categoricamente diferente: fotos e vídeos são identificados durante a etapa de desempacotamento local do ZIP e nunca são colocados na fila de upload. Eles não entram no pipeline em nenhum ponto. Não há deleção no servidor porque não há chegada no servidor. Para um usuário preocupado com privacidade na exportação do WhatsApp, essa distinção é significativa: um arquivo que nunca sai do seu dispositivo não pode ser interceptado, registrado ou retido por engano.
Por que isso importa
1) Menor superfície de risco
Fotos e vídeos podem incluir rostos, localizações, cenas privadas, telas e documentos. Não enviá-los reduz drasticamente a exposição.
Para ser concreto sobre o escopo: um chat do WhatsApp exportado com um ano de mídia pode conter centenas de fotos abrangendo eventos pessoais, capturas de tela compartilhadas, imagens de localização e documentos fotografados em um telefone. Cada um deles carrega metadados e conteúdo visual não relacionados ao resumo de conversa que você está tentando gerar. Manter tudo isso local não é apenas uma preferência de privacidade — é a decisão arquiteturalmente correta para uma ferramenta cujo único objetivo é resumir texto de conversa e áudio falado.
Na prática, uma única foto de alta resolução de um smartphone moderno tem entre 3 MB e 8 MB. Um clipe de vídeo de um minuto pode facilmente ser 50 MB ou mais. Um chat com um ano de mídia compartilhada entre um grupo pode conter gigabytes de arquivos. Em contraste, o arquivo `_chat.txt` para o mesmo período é quase sempre menor que 5 MB, e notas de voz são tipicamente pequenos arquivos de 30 segundos a alguns minutos. Pular uploads de fotos e vídeo reduz tanto a superfície de risco de privacidade quanto o tamanho de upload de forma que se compõe rapidamente à medida que as exportações de chat em grupo crescem.
3) Melhor confiança
A maioria das ferramentas vagamente diz "respeitamos privacidade". O verdadeiro construtor de confiança é uma restrição técnica difícil: não envie o que não precisa.
O modelo de privacidade do analisador de chat do WhatsApp do ThreadRecap é construído sobre essa restrição. A pergunta "fotos do WhatsApp são enviados?" tem uma resposta binária aqui: não, porque o código que processa o ZIP nunca lê seu conteúdo. Privacidade de vídeo do WhatsApp e privacidade de transcrição de notas de voz do WhatsApp são tratadas diferentemente uma da outra porque o caso de uso é diferente: vídeos não podem contribuir para um recap baseado em texto, então são ignorados; notas de voz podem, então são transcritas. A distinção é funcional, não arbitrária.
Como o fluxo funciona (modelo mental simples)
Você envia o zip do WhatsApp no seu navegador.
O zip é desempacotado localmente.
O texto do chat é analisado localmente.
Fotos e vídeos são ignorados localmente.
Apenas o texto do chat e notas de voz são enviados para análise.
Transcrições (se houver) são mescladas na linha do tempo do chat.
A IA gera o recap.
A linha chave: fotos e vídeos não entram no pipeline.
O que acontece durante o desempacotamento local
Quando você seleciona seu arquivo ZIP na interface do ThreadRecap, as APIs nativas de leitura de arquivo do navegador são usadas para descomprimir e inspecionar o arquivo sem enviar nada para um servidor. Este é o mesmo mecanismo que alimenta editores de arquivo local e aplicativos web offline. A etapa de desempacotamento lê nomes de arquivo e tamanhos, categoriza cada arquivo e constrói duas listas: arquivos a enviar (texto do chat, notas de voz) e arquivos a ignorar (todo o resto). Apenas a primeira lista é tocada novamente. Essa abordagem local-first significa que mesmo se sua conexão de rede estivesse sendo monitorada, um observador veria apenas o texto do chat e áudio de nota de voz em trânsito — nunca as fotos ou vídeos.
O que os modelos de IA recebem
A IA que gera seu recap — seja um modelo da OpenAI ou Claude — recebe o texto do chat analisado e qualquer transcrição de nota de voz produzida pelo Whisper. Ele não recebe nomes de arquivo de fotos, miniaturas de vídeo ou qualquer outro sinal derivado de seus arquivos de mídia. O recap é gerado inteiramente da camada de texto da sua conversa.
Perguntas frequentes
Se eu exportar com mídia, minhas fotos são enviadas?
Não. Fotos permanecem no seu dispositivo e são ignoradas.
Se eu exportar com mídia, meus vídeos são enviados?
Não. Vídeos permanecem no seu dispositivo e são ignorados.
E quanto a documentos e anexos?
No MVP, apenas texto de chat e notas de voz são usados. Outros anexos são ignorados.
Por que as notas de voz são enviadas?
Porque a transcrição requer enviar áudio para um modelo de fala para texto. Sem notas de voz, o recap frequentemente perde decisões e compromissos que foram falados.
Posso executar ThreadRecap sem enviar nenhuma mídia?
Sim. Exporte sem mídia e apenas o texto do chat é usado.
Bloco de CTA
Quer um recap sem enviar mídia sensível? Exporte seu chat do WhatsApp, envie o zip e gere um resumo estruturado. Fotos e vídeos nunca saem do seu dispositivo. Apenas o texto do chat e notas de voz são usados.