Anatomia de uma exportação de chat do WhatsApp: cada arquivo, o que contém, o que fazer com ele | ThreadRecap
Quando você toca em "Exportar chat" no WhatsApp e escolhe incluir mídia, o aplicativo oferece um único arquivo ZIP. A maioria das pessoas abre, vê uma enxurrada de nomes de arquivo desconhecidos e fecha novamente. É uma pena, porque cada tipo de arquivo nesse arquivo representa uma camada distinta de informação: o registro escrito, a palavra falada, o contexto visual e os documentos compartilhados. Este guia percorre todos os tipos de arquivo que você provavelmente encontrará, explica o que cada um contém e mostra quais partes o ThreadRecap pode transformar em output estruturado.
_chat.txt: o registro de conversa
O centro de qualquer exportação é o `_chat.txt`. É um arquivo de texto simples onde cada mensagem ocupa uma ou mais linhas no formato:
```
[DD/MM/YYYY, HH:MM:SS] Nome do Remetente: corpo da mensagem
```
Algumas coisas valem a pena saber sobre este arquivo:
Timestamps refletem a hora local do dispositivo no momento do envio. Se os participantes estão em fusos horários diferentes, o registro misturará offsets, a menos que o WhatsApp os normalize na exportação (o comportamento varia conforme a versão da plataforma).
Referências de mídia aparecem como placeholders inline, por exemplo `IMG-20240315-WA0002.jpg (arquivo anexado)`, em vez de dados incorporados. O arquivo real fica separadamente no ZIP.
Eventos do sistema, como chamadas perdidas, mudanças de membros do grupo e notificações de criptografia, aparecem como linhas com timestamp e sem nome de remetente.
Edições e exclusões de mensagens podem aparecer como `<Esta mensagem foi editada>` ou `<Esta mensagem foi deletada>`, dependendo da versão do WhatsApp que produziu a exportação.
Para fins de análise, `_chat.txt` é a espinha dorsal. Cada output do ThreadRecap, desde recaps de reuniões até linhas do tempo de conflitos, é ancorado aos timestamps e atribuição neste arquivo.
Qual o tamanho máximo do _chat.txt?
Um chat de grupo movimentado com um ano de duração pode facilmente produzir dezenas de milhares de linhas. O ThreadRecap processa exportações contendo 60 mil ou mais mensagens, então até os canais de equipe mais ativos ou grupos familiares de longa duração ficam dentro da capacidade.
.opus e .m4a: notas de voz
As notas de voz são o conteúdo mais denso em informações em qualquer chat do WhatsApp, e também o mais negligenciado em revisões manuais. O WhatsApp as codifica de forma diferente dependendo da plataforma:
Plataforma
Container
Codec típico
Android
.opus
Opus
iOS
.m4a
AAC
Ambos os formatos são áudio comprimido. Os nomes de arquivo seguem a convenção de nomenclatura de mídia do WhatsApp: `PTT-YYYYMMDD-WA000X.opus` ou `PTT-YYYYMMDD-WA000X.m4a`, onde PTT significa push-to-talk.
O ThreadRecap transcreve cada nota de voz em uma exportação usando tecnologia de transcrição avançada, visando alta precisão em áudio claro. As transcrições são vinculadas ao tempo das mensagens de chat circundantes, para que você possa ler uma conversa como um thread contínuo em vez de alternar entre players de texto e áudio.
Ruído de fundo, sobreposição de falantes, sotaques pesados e clipes muito curtos (menos de dois segundos) são os principais fatores que reduzem a qualidade da transcrição. O Whisper funciona com áudio multilíngue, então mudar de idioma no meio da conversa não quebra o pipeline, embora a precisão varie conforme o idioma.
.jpg, .png, .mp4: mídia compartilhada
Imagens e vídeos em uma exportação do WhatsApp seguem o padrão de nomenclatura `IMG-YYYYMMDD-WA000X.jpg` ou `VID-YYYYMMDD-WA000X.mp4`. O componente de data reflete quando o arquivo foi criado ou enviado, e o índice ao final distingue múltiplos arquivos do mesmo dia.
Esses arquivos carregam mais metadados do que é visível à primeira vista. Os dados EXIF incorporados em arquivos `.jpg` e `.png` podem incluir coordenadas GPS, modelo do dispositivo e o timestamp original de captura, informações que podem ser significativas em contextos de disputa ou conformidade.
ThreadRecap não processa fotos, vídeos ou documentos. Eles são referenciados em `_chat.txt` pelo nome do arquivo, que o ThreadRecap registra na linha do tempo de conversa, mas os próprios arquivos nunca são enviados. Esta é uma barreira de privacidade deliberada coberta com mais detalhes na seção abaixo.
.pdf, .vcf, .docx: documentos e contatos
Documentos (.pdf, .docx e outros formatos)
Qualquer arquivo compartilhado como anexo no WhatsApp, incluindo PDFs, documentos do Word, planilhas e apresentações, aparece no ZIP de exportação com seu nome de arquivo original. Esses arquivos são referenciados em `_chat.txt` da mesma forma que as imagens: como uma linha placeholder indicando o nome do arquivo e a frase "arquivo anexado".
O ThreadRecap não faz upload ou analisa anexos de documentos. Sua presença na linha do tempo é anotada, mas seu conteúdo não é extraído.
Cartões de contato (.vcf)
Quando um usuário do WhatsApp compartilha um contato, a exportação inclui um arquivo `.vcf` (formato vCard). vCard é um formato padrão para informações de contato, contendo campos como nome, número de telefone, endereço de email e organização. O nome do arquivo é tipicamente o nome de exibição do contato com extensão `.vcf`.
Os cartões de contato não são processados pelo ThreadRecap. Como documentos e mídia, eles permanecem em seu dispositivo.
O que ThreadRecap lê versus ignora por padrão
A tabela abaixo resume a barreira de processamento claramente:
Tipo de arquivo
ThreadRecap processa?
Onde permanece
`_chat.txt`
Sim, completamente
Criptografado em sua conta
`.opus` / `.m4a` (notas de voz)
Sim, transcrito via Whisper
Criptografado em sua conta
`.jpg` / `.png` (imagens)
Não
Apenas em seu dispositivo
`.mp4` / `.mov` (vídeo)
Não
Apenas em seu dispositivo
`.pdf` / `.docx` (documentos)
Não
Apenas em seu dispositivo
`.vcf` (cartões de contato)
Não
Apenas em seu dispositivo
Os outputs que o ThreadRecap gera a partir dos dados processados incluem:
Meeting Recap: um resumo estruturado do que foi discutido e acordado
Action Items: tarefas extraídas com responsável e prazo quando informado
Decisions: decisões explícitas ou implícitas registradas com contexto
Conflict Resolution: uma linha do tempo de trocas disputadas com declarações atribuídas
Relationship Insights: análise de padrão de comunicação entre participantes
Todos estes são fundamentados no texto e conteúdo de voz transcrito. Nada é inferido de imagens ou documentos.
Por que fotos e vídeos nunca deixam seu dispositivo
Esta não é uma limitação, é uma escolha de design enraizada na sensibilidade dos arquivos de mídia.
Fotos e vídeos compartilhados em chats pessoais ou profissionais frequentemente contêm informações que vão muito além da imagem em si: dados de localização, rostos, documentos fotografados em mesas e timestamps vinculados a eventos específicos. Fazer upload deste material para qualquer serviço em nuvem, mesmo um criptografado, cria exposição que muitos usuários, e muitas equipes jurídicas e de conformidade, não se sentem confortáveis com isso.
A arquitetura do ThreadRecap mantém uma barreira rígida aqui. O fluxo de trabalho de exportação e upload significa que você é proprietário do arquivo ZIP antes de qualquer coisa ser enviada. Quando você faz upload para ThreadRecap via /upload, apenas `_chat.txt` e áudio de notas de voz cruzam a rede. Tudo mais permanece no ZIP em seu dispositivo.
O texto do chat e áudio de notas de voz são armazenados criptografados em sua conta. Você pode deletá-los a qualquer momento através do painel. Não há período de retenção que substitua sua escolha.
A natureza estruturada do `_chat.txt` torna as exportações do WhatsApp úteis em contextos jurídicos, de RH e de conformidade. Cada mensagem carrega um timestamp e uma atribuição de remetente que é difícil de alterar sem prejudicar o registro ao redor. As transcrições de notas de voz adicionam uma camada de evidência falada que frequentemente está ausente em registros apenas de mensagens.
Os formatos de output prontos para evidência do ThreadRecap apresentam este material como um registro cronológico e atribuído com separação clara entre o que foi escrito e o que foi falado. Se você está se preparando para uma disputa, uma investigação interna ou uma revisão regulatória, o relatório estruturado oferece um ponto de partida que é muito mais fácil de navegar do que um arquivo de texto bruto com milhares de linhas.
Uma nota sobre admissibilidade: a exportação bruta e o output estruturado do ThreadRecap podem apoiar trabalho jurídico, mas a admissibilidade formal depende da jurisdição e dos procedimentos de autenticação. Sempre consulte um profissional jurídico qualificado antes de confiar em qualquer exportação de chat em procedimentos.
Entendendo o quadro completo
Um ZIP de exportação do WhatsApp não é apenas um backup. É um arquivo em camadas onde cada tipo de arquivo captura uma dimensão diferente da comunicação: o registro escrito em `_chat.txt`, a palavra falada em áudio de notas de voz, o contexto visual em imagens e vídeo, e os materiais compartilhados em documentos e cartões de contato.
O ThreadRecap funciona com as camadas que podem ser analisadas em escala sem comprometer a privacidade das camadas que não podem. Se você quer entender o que sua exportação contém antes de fazer qualquer coisa com ela, o detalhamento de arquivo acima é seu mapa. Se você está pronto para transformá-lo em output estruturado, a página /upload é o próximo passo.