Anatomía de una exportación de chat de WhatsApp: cada archivo, qué contiene, qué hacer con él | ThreadRecap
Cuando tocas "Exportar chat" en WhatsApp y eliges incluir multimedia, la aplicación te entrega un único archivo ZIP. La mayoría de las personas lo abren, ven un muro de nombres de archivo desconocidos y lo cierran nuevamente. Eso es una pena, porque cada tipo de archivo en ese archivo representa una capa diferente de información: el registro escrito, la palabra hablada, el contexto visual y los documentos compartidos. Esta guía te lleva a través de cada archivo que probablemente encuentres, explica qué contiene y te muestra qué partes ThreadRecap puede convertir en resultados estructurados.
_chat.txt: el registro de conversación
El centro de cualquier exportación es `_chat.txt`. Es un archivo de texto sin formato donde cada mensaje ocupa una o más líneas en el formato:
```
[DD/MM/YYYY, HH:MM:SS] Nombre del remitente: cuerpo del mensaje
```
Hay algunas cosas que vale la pena saber sobre este archivo:
Las marcas de tiempo reflejan la hora local del dispositivo en el momento del envío. Si los participantes están en diferentes zonas horarias, el registro mezclará desplazamientos a menos que WhatsApp los normalice en la exportación (el comportamiento varía según la versión de la plataforma).
Las referencias de multimedia aparecen como marcadores de posición en línea, por ejemplo `IMG-20240315-WA0002.jpg (archivo adjunto)`, en lugar de datos incrustados. El archivo real se encuentra en el ZIP.
Los eventos del sistema como llamadas perdidas, cambios de membresía de grupo y avisos de cifrado aparecen como líneas con marca de tiempo sin nombre de remitente.
Las ediciones y eliminaciones de mensajes pueden aparecer como `<Este mensaje fue editado>` o `<Este mensaje fue eliminado>`, dependiendo de la versión de WhatsApp que produjo la exportación.
Para fines de análisis, `_chat.txt` es la columna vertebral. Cada resultado de ThreadRecap, desde recapitulaciones de reuniones hasta líneas de tiempo de conflictos, está anclado a las marcas de tiempo y atribuciones en este archivo.
¿Cuán grande puede ser _chat.txt?
Un chat grupal activo que se ejecuta durante un año puede producir fácilmente decenas de miles de líneas. ThreadRecap procesa exportaciones que contienen 60,000 o más mensajes, por lo que incluso los canales de equipo más activos o grupos familiares de larga duración se encuentran dentro de la capacidad.
.opus y .m4a: notas de voz
Las notas de voz son el contenido más denso en información en cualquier chat de WhatsApp y también el más pasado por alto en revisiones manuales. WhatsApp las codifica de manera diferente dependiendo de la plataforma:
Plataforma
Contenedor
Códec típico
Android
.opus
Opus
iOS
.m4a
AAC
Ambos formatos son audio comprimido. Los nombres de archivo siguen la convención de nombres de medios de WhatsApp: `PTT-YYYYMMDD-WA000X.opus` o `PTT-YYYYMMDD-WA000X.m4a`, donde PTT significa push-to-talk.
ThreadRecap transcribe cada nota de voz en una exportación utilizando tecnología de transcripción avanzada, buscando alta precisión en audio claro. Las transcripciones están vinculadas por tiempo a los mensajes de chat circundantes, para que puedas leer una conversación como un hilo continuo en lugar de cambiar entre reproductores de texto y audio.
El ruido de fondo, los hablantes superpuestos, acentos fuertes y clips muy cortos (menos de dos segundos) son los principales factores que reducen la calidad de la transcripción. Whisper maneja audio multilingüe, por lo que cambiar idiomas a mitad de la conversación no rompe el proceso, aunque la precisión varía según el idioma.
.jpg, .png, .mp4: multimedia compartida
Las imágenes y videos en una exportación de WhatsApp siguen el patrón de nombres `IMG-YYYYMMDD-WA000X.jpg` o `VID-YYYYMMDD-WA000X.mp4`. El componente de fecha refleja cuándo se creó o envió el archivo, y el índice final distingue múltiples archivos del mismo día.
Estos archivos contienen más metadatos de lo que es visible a primera vista. Los datos EXIF incrustados en archivos `.jpg` y `.png` pueden incluir coordenadas GPS, modelo de dispositivo y la marca de tiempo de captura original, información que puede ser significativa en contextos de disputa o cumplimiento normativo.
ThreadRecap no procesa fotos, videos o documentos. Se hace referencia a ellos en `_chat.txt` por nombre de archivo, que ThreadRecap registra en la línea de tiempo de la conversación, pero los archivos en sí nunca se cargan. Este es un límite de privacidad deliberado cubierto con más detalle en la sección a continuación.
.pdf, .vcf, .docx: documentos y contactos
Documentos (.pdf, .docx y otros formatos)
Cualquier archivo compartido como adjunto en WhatsApp, incluidos PDFs, documentos de Word, hojas de cálculo y presentaciones, aparece en el ZIP de exportación bajo su nombre de archivo original. Se hace referencia a estos archivos en `_chat.txt` de la misma manera que a las imágenes: como una línea de marcador de posición que indica el nombre de archivo y la frase "archivo adjunto".
ThreadRecap no carga ni analiza adjuntos de documentos. Su presencia en la línea de tiempo se anota, pero sus contenidos no se extraen.
Tarjetas de contacto (.vcf)
Cuando un usuario de WhatsApp comparte un contacto, la exportación incluye un archivo `.vcf` (formato vCard). vCard es un formato estándar para información de contacto, que contiene campos como nombre, número de teléfono, dirección de correo electrónico y organización. El nombre de archivo es típicamente el nombre de visualización del contacto con una extensión `.vcf`.
Las tarjetas de contacto no se procesan con ThreadRecap. Como documentos y multimedia, permanecen en tu dispositivo.
Lo que ThreadRecap lee frente a lo que ignora de manera predeterminada
La tabla a continuación resume el límite de procesamiento con claridad:
Tipo de archivo
¿ThreadRecap lo procesa?
Dónde se queda
`_chat.txt`
Sí, completamente
Encriptado en tu cuenta
`.opus` / `.m4a` (notas de voz)
Sí, transcrito vía Whisper
Encriptado en tu cuenta
`.jpg` / `.png` (imágenes)
No
Solo en tu dispositivo
`.mp4` / `.mov` (video)
No
Solo en tu dispositivo
`.pdf` / `.docx` (documentos)
No
Solo en tu dispositivo
`.vcf` (tarjetas de contacto)
No
Solo en tu dispositivo
Los resultados que ThreadRecap genera a partir de los datos procesados incluyen:
Recapitulación de reunión: un resumen estructurado de lo que se discutió y acordó
Elementos de acción: tareas extraídas con asignado y fecha límite cuando se establezcan
Decisiones: decisiones explícitas o implícitas registradas con contexto
Resolución de conflictos: una línea de tiempo de intercambios disputados con declaraciones atribuidas
Perspectivas de relación: análisis de patrones de comunicación entre participantes
Todos estos se basan en el texto y el contenido de voz transcrito. Nada se infiere de imágenes o documentos.
Por qué las fotos y videos nunca dejan tu dispositivo
Esto no es una limitación, es una opción de diseño fundamentada en la sensibilidad de los archivos multimedia.
Las fotos y videos compartidos en chats personales o profesionales a menudo contienen información que va mucho más allá de la imagen en sí: datos de ubicación, caras, documentos fotografiados en escritorios y marcas de tiempo vinculadas a eventos específicos. Cargar este material en cualquier servicio en la nube, incluso uno encriptado, crea una exposición que muchos usuarios y muchos equipos legales y de cumplimiento normativo no se sienten cómodos con.
La arquitectura de ThreadRecap mantiene un límite claro aquí. El flujo de trabajo de exportación y carga significa que eres el propietario del archivo ZIP antes de que se envíe algo. Cuando cargas en ThreadRecap a través de /upload, solo `_chat.txt` y el audio de notas de voz cruzan la red. Todo lo demás se queda en el ZIP en tu dispositivo.
El texto del chat y el audio de notas de voz se almacenan encriptados en tu cuenta. Puedes eliminarlos en cualquier momento a través del panel de control. No hay período de retención que anule tu elección.
Uso de la exportación para evidencia y cumplimiento normativo
La naturaleza estructurada de `_chat.txt` hace que las exportaciones de WhatsApp sean útiles en contextos legales, de recursos humanos y de cumplimiento normativo. Cada mensaje tiene una marca de tiempo y una atribución de remitente que es difícil de alterar sin interrumpir el registro circundante. Las transcripciones de notas de voz añaden una capa de evidencia hablada que a menudo falta en registros solo de mensajes.
Los formatos de resultado listos para evidencia de ThreadRecap presentan este material como un registro cronológico y atribuido con clara separación entre lo que se escribió y lo que se habló. Si te estás preparando para una disputa, una investigación interna o una revisión regulatoria, el informe estructurado te da un punto de partida que es mucho más fácil de navegar que un archivo de texto sin formato con miles de líneas.
Una nota sobre admisibilidad: la exportación sin formato y el resultado estructurado de ThreadRecap pueden apoyar el trabajo legal, pero la admisibilidad formal depende de la jurisdicción y los procedimientos de autenticación. Siempre consulta a un profesional legal calificado antes de confiar en ninguna exportación de chat en procedimientos.
Comprensión de la imagen completa
Un ZIP de exportación de WhatsApp no es solo una copia de seguridad. Es un archivo estratificado donde cada tipo de archivo captura una dimensión diferente de la comunicación: el registro escrito en `_chat.txt`, la palabra hablada en audio de notas de voz, el contexto visual en imágenes y video, y los materiales compartidos en documentos y tarjetas de contacto.
ThreadRecap trabaja con las capas que se pueden analizar a escala sin comprometer la privacidad de las capas que no se pueden. Si quieres entender qué contiene tu exportación antes de hacer algo con ella, el desglose de archivos anterior es tu mapa. Si estás listo para convertirlo en resultados estructurados, la página /upload es el siguiente paso.