Como abrir o arquivo _chat.txt de uma exportação do WhatsApp | ThreadRecap
Quando você exporta uma conversa do WhatsApp, o resultado é um arquivo chamado `_chat.txt` dentro de um arquivo ZIP junto com qualquer mídia que você escolheu incluir. Abrir parece trivial, mas um grupo de chat ativo pode produzir um arquivo com dezenas de milhares de linhas, sinais de codificação mista e marcadores de anexo crípticos que tornam a leitura bruta lenta e propensa a erros. Este guia explica exatamente o que há dentro desse arquivo, o que pode dar errado quando você o abre e quando faz mais sentido deixar uma ferramenta fazer a leitura para você.
O que _chat.txt realmente contém
O WhatsApp armazena logs de chat em formato de texto simples. Cada linha que representa uma mensagem do usuário segue o mesmo padrão de três partes:
```
[DD/MM/YYYY, HH:MM:SS] Nome do remetente: corpo da mensagem
```
A seção entre colchetes é o carimbo de data/hora, formatado de acordo com a localidade do dispositivo no momento da exportação, portanto você pode ver `MM/DD/YYYY` em dispositivos com localidade dos EUA. Após o colchete de fechamento vem um espaço, o nome de exibição do remetente como aparecia em seus contatos no momento da exportação, dois-pontos e o texto da mensagem.
Além das mensagens do usuário, o arquivo contém dois outros tipos de linha:
Linhas de evento de sistema. Essas linhas registram alterações de grupo, como um participante entrando, saindo ou um nome de grupo sendo atualizado. Elas carregam um carimbo de data/hora, mas nenhum nome de remetente, e a redação é gerada pelo WhatsApp.
Continuações de mensagens de múltiplas linhas. Se um remetente digitou uma mensagem com quebras de linha, as linhas de continuação aparecem sem um cabeçalho de carimbo de data/hora. Qualquer analisador ou leitor precisa levar isso em conta ou contará incorretamente as mensagens.
O arquivo contém todas as mensagens e carimbos de data/hora da conversa. Nada é resumido ou omitido do lado do WhatsApp, o que torna útil como um registro bruto, mas também torna difícil ler manualmente qualquer coisa mais longa do que um breve chat pessoal.
Para uma visão mais ampla do que o pacote de exportação contém além do arquivo de texto, consulte .
O WhatsApp usa codificação UTF-8 para exportações `_chat.txt`. UTF-8 pode representar todos os caracteres Unicode, portanto emoji, árabe, chinês e caracteres latinos acentuados aparecem corretamente em um editor configurado adequadamente. O problema surge com a marca de ordem de byte (BOM).
Um BOM é uma sequência de três bytes, `0xEF 0xBB 0xBF`, que pode aparecer no início muito de um arquivo UTF-8. O padrão Unicode permite seu uso, mas não o exige ou recomenda. Seu único propósito é sinalizar que a transmissão está codificada em UTF-8. Na prática, algumas versões do WhatsApp em alguns dispositivos adicionam o BOM e outras não.
Editores que não reconhecem o BOM o renderizam como um caractere visível, geralmente uma pequena caixa ou um ponto de interrogação, no topo do arquivo. Isso é cosmético, mas também pode interromper scripts ou analisadores que tentam corresponder a primeira linha a um padrão de carimbo de data/hora, porque os bytes do BOM precedem o colchete de abertura.
Correção: Abra o arquivo em VS Code, Notepad++ ou BBEdit. Cada um desses editores detecta e exibe a codificação na barra de status. No Notepad++ você pode salvar novamente como "UTF-8 without BOM" no menu Encoding. No VS Code, clique no rótulo de codificação no canto inferior direito e escolha "Save with encoding", depois selecione UTF-8.
Terminações de linha do Windows
Se a exportação foi criada em um dispositivo Android e você a abre em um Mac ou sistema Linux usando um visualizador básico, você pode ver caracteres `^M` no final das linhas ou descobrir que o arquivo inteiro aparece como uma única linha longa. Isso acontece quando o arquivo usa terminações de linha CRLF ao estilo Windows (`\r\n`) e o visualizador espera apenas LF Unix (`\n`). VS Code, BBEdit e Notepad++ normalizam as terminações de linha automaticamente e exibem qual convenção o arquivo usa na barra de status.
Marcadores de anexo e como interpretá-los
Quando você exporta um chat e escolhe não incluir mídia, o WhatsApp insere um marcador de posição no texto sempre que uma foto, vídeo, nota de voz, adesivo ou documento foi enviado. A forma mais comum é:
```
[15/03/2024, 09:41:22] Alice: <Mídia omitida>
```
Em algumas localidades de dispositivos o marcador de posição é lido de forma diferente, por exemplo como o nome do arquivo do anexo seguido por `(file attached)`. Quando a mídia é incluída na exportação, o marcador de posição é substituído pelo nome do arquivo:
O prefixo `PTT-` identifica uma nota de voz push-to-talk. Os prefixos `IMG-` e `VID-` identificam fotos e vídeos respectivamente. Os arquivos em si ficam no mesmo arquivo ZIP que `_chat.txt`.
Alguns pontos a ter em mente ao ler linhas de anexo manualmente:
Mensagens deletadas aparecem como uma linha de sistema observando que uma mensagem foi deletada, não como `<Mídia omitida>`.
Chamadas perdidas também aparecem como linhas de sistema, sem marcador de posição de mídia.
Adesivos são tratados como mídia e produzem um marcador de posição ou nome de arquivo assim como imagens.
Documentos usam o nome de arquivo original, que pode conter espaços e caracteres especiais que podem confundir um analisador ingênuo de linhas.
Se você estiver construindo uma linha do tempo de eventos a partir do arquivo bruto, trate cada linha `<Mídia omitida>` como uma lacuna no registro. O carimbo de data/hora e o remetente ainda estão presentes, portanto você sabe que algo foi enviado e por quem, mas o conteúdo está ausente.
Melhores aplicativos para ler _chat.txt em bruto
Nenhum editor é adequado para todas as situações. A escolha depende do seu sistema operacional, do tamanho do arquivo e de quanto você precisa pesquisar ou filtrar.
Visual Studio Code (Windows, macOS, Linux, gratuito)
VS Code é a escolha mais prática para fins gerais. Detecta UTF-8 com ou sem BOM, exibe terminações de linha na barra de status e lida com arquivos de várias centenas de megabytes sem reclamações. A pesquisa integrada (`Ctrl+F` / `Cmd+F`) suporta expressões regulares, o que é útil para filtrar por nome do remetente ou intervalo de datas. Instale a extensão "Rainbow CSV" se quiser destaque em estilo de coluna, embora `_chat.txt` não seja CSV, portanto o benefício é limitado.
Notepad++ (Windows, gratuito)
Notepad++ é leve e inicia mais rápido que VS Code para inspeções rápidas. Seu menu Encoding torna a remoção de BOM uma operação de um clique. A interface multidocumento é prática se você está comparando duas exportações lado a lado. O modo quebra de palavra (`View > Word wrap`) impede que mensagens longas saiam da tela.
BBEdit (macOS, nível gratuito disponível)
BBEdit manipulou confiabilmente arquivos de texto grandes por décadas. Seu painel "Text Encoding" no diálogo aberto permite forçar uma codificação específica se a detecção automática falhar. A pesquisa baseada em grep e a capacidade de abrir arquivos diretamente de um ZIP são práticas para verificações rápidas.
EmEditor (Windows, pago com nível gratuito)
EmEditor foi desenvolvido especificamente para arquivos muito grandes e pode editar arquivos maiores que 4 GB mesmo no Windows de 32 bits. Se você está lidando com uma exportação de grupo de chat multianual que cresceu de forma incomum, o EmEditor vale a pena considerar.
UltraEdit (Windows, macOS, Linux, pago)
UltraEdit foi projetado como um editor e visualizador para arquivos grandes e pode abrir, visualizar, editar e salvar arquivos de texto com mais de 4 GB. Como o EmEditor, é excessivo para a maioria dos arquivos `_chat.txt`, mas se torna relevante em escala extrema.
Para a maioria dos usuários, VS Code ou Notepad++ cobre todas as necessidades práticas.
Por que fazer upload no ThreadRecap é mais rápido do que ler manualmente
Ler `_chat.txt` manualmente funciona para uma conversa curta entre duas pessoas. Torna-se impraticável quando você tem um grupo de chat funcionando ao longo de meses, uma disputa onde você precisa localizar mensagens específicas rapidamente ou uma thread de reunião onde os itens de ação estão espalhados por centenas de linhas.
O analisador de chat do WhatsApp do ThreadRecap aceita o arquivo ZIP diretamente. Você não precisa extrair `_chat.txt` primeiro nem remover o BOM. O fluxo de upload começa no seu dispositivo: você exporta o chat no WhatsApp, que produz um ZIP que você possui antes de qualquer coisa ser transmitida. Fotos, vídeos e documentos nunca saem do seu dispositivo. O texto do chat e o áudio de notas de voz são armazenados criptografados em sua conta e você pode deletá-los a qualquer momento do painel.
Uma vez carregado, ThreadRecap produz saída estruturada que a leitura bruta não consegue igualar:
Resumo de reunião e itens de ação: decisões principais e tarefas atribuídas extraídas da thread.
Visualização da linha do tempo: toda mensagem em ordem cronológica com atribuição do remetente, pesquisável por palavra-chave ou data.
Transcrição de nota de voz: cada arquivo `PTT-` é transcrito usando OpenAI Whisper, que alcança 2,7% WER no LibriSpeech e 8-12% em áudio do mundo real. Uma nota de voz longa que levaria minutos para ser reproduzida se torna um parágrafo pesquisável de texto.
Exportação pronta para evidência: saída estruturada formatada para uso legal, de disputa ou conformidade, com carimbos de data/hora e nomes de remetentes preservados exatamente como aparecem no arquivo de origem.
Resolução de conflitos e insights de relacionamento: análise em nível de padrão em toda a thread que simplesmente não é visível ao rolar linha por linha.
ThreadRecap lida com exportações contendo 60.000+ mensagens e arquivos ZIP de até 2 GB, portanto os limites de tamanho de arquivo que podem retardar um editor de texto não são uma preocupação.
Se você está preparando uma exportação especificamente para análise, o guia sobre exportar um chat do WhatsApp para análise cobre como escolher entre incluir e excluir mídia e o que cada escolha significa para a saída que você obtém.
Quando a leitura bruta ainda faz sentido
Há casos em que abrir `_chat.txt` diretamente é a abordagem correta. Se você precisa verificar um único carimbo de data/hora, verificar um nome de remetente específico como foi registrado no momento da exportação ou confirmar que uma exportação foi concluída sem truncamento, um editor de texto oferece uma visão não mediada dos dados de origem. Para qualquer coisa que exija referência cruzada, pesquisa ou resumo em mais de algumas dezenas de mensagens, a abordagem manual é mais lenta e propensa a erros do que análise estruturada.
O arquivo `_chat.txt` é um registro confiável e portátil de uma conversa do WhatsApp, mas seu valor depende de ser capaz de lê-lo corretamente. Escolher um editor que lida apropriadamente com BOM UTF-8 e terminações de linha remove o atrito mais comum. Entender marcadores de anexo evita mal-leitura de lacunas no registro. E para qualquer tarefa além de uma verificação rápida, ferramentas de análise estruturada economizam tempo significativo enquanto mantêm a evidência subjacente intacta.
Como abrir o arquivo _chat.txt de uma exportação do WhatsApp
Aprenda como abrir _chat.txt de uma exportação do WhatsApp, corrigir problemas de codificação e quebras de linha, decodificar marcadores de anexos e escolher o editor de texto certo para arquivos grandes.
3 de mai. de 20267 min de leitura
Pronto para analisar seu chat do WhatsApp?
Envie sua exportação e receba resumos, insights e transcrições de áudio em minutos.