Anatomie eines WhatsApp-Chat-Exports: jede Datei, ihr Inhalt und ihre Verwendung | ThreadRecap
Wenn Sie in WhatsApp auf „Chat exportieren" tippen und sich dafür entscheiden, Medien einzuschließen, übergibt die App Ihnen eine einzelne ZIP-Datei. Die meisten Menschen öffnen sie, sehen eine Wand mit unbekannten Dateinamen und schließen sie wieder. Das ist schade, denn jeder Dateityp in diesem Archiv repräsentiert eine eigenständige Informationsebene: die schriftliche Dokumentation, das gesprochene Wort, den visuellen Kontext und die freigegebenen Dokumente. Dieser Leitfaden führt Sie durch alle Dateitypen, die Sie wahrscheinlich finden, erklärt, was sie enthalten, und zeigt, welche Teile ThreadRecap in strukturierte Ausgaben umwandeln kann.
_chat.txt: das Gesprächsprotokoll
Das Herzstück jedes Exports ist `_chat.txt`. Es ist eine einfache Textdatei, in der jede Nachricht eine oder mehrere Zeilen im folgenden Format einnimmt:
Es gibt einige wichtige Dinge zu diesem Dateiformat zu wissen:
Zeitstempel entsprechen der lokalen Gerätezeit zum Zeitpunkt des Versendens. Wenn sich Teilnehmer in verschiedenen Zeitzonen befinden, mischt das Protokoll die Zeitversätze, es sei denn, WhatsApp normalisiert sie beim Export (das Verhalten variiert je nach Plattformversion).
Medienverweise erscheinen als Inline-Platzhalter, zum Beispiel `IMG-20240315-WA0002.jpg (Datei angehängt)`, anstatt eingebettete Daten. Die tatsächliche Datei befindet sich getrennt in der ZIP-Datei.
Systemereignisse wie verpasste Anrufe, Änderungen der Gruppenmitgliedschaft und Verschlüsselungshinweise erscheinen als Zeitstempel-Zeilen ohne Absendernamen.
Nachrichtenbearbeitungen und -löschungen können als `<Diese Nachricht wurde bearbeitet>` oder `<Diese Nachricht wurde gelöscht>` angezeigt werden, je nach WhatsApp-Version, die den Export erzeugt hat.
Für Analysezwecke ist `_chat.txt` das Rückgrat. Jede ThreadRecap-Ausgabe, von Besprechungszusammenfassungen bis zu Konflikt-Zeitleisten, basiert auf den Zeitstempeln und Zuschreibungen in dieser Datei.
Wie groß kann _chat.txt werden?
Ein aktiver Gruppenchat über ein Jahr hinweg kann leicht zehntausende Zeilen erzeugen. ThreadRecap verarbeitet Exporte mit 60.000 oder mehr Nachrichten, sodass selbst die aktivsten Team-Kanäle oder langjährig laufenden Familiengruppen innerhalb der Kapazität liegen.
.opus und .m4a: Sprachnachrichten
Sprachnachrichten sind der informationsdichteste Inhalt in jedem WhatsApp-Chat und gleichzeitig der am meisten übersehene bei manuellen Überprüfungen. WhatsApp kodiert sie je nach Plattform unterschiedlich:
Plattform
Container
Typischer Codec
Android
.opus
Opus
iOS
.m4a
AAC
Beide Formate sind komprimierte Audio. Die Dateinamen folgen der WhatsApp-Medienbenennungskonvention: `PTT-YYYYMMDD-WA000X.opus` oder `PTT-YYYYMMDD-WA000X.m4a`, wobei PTT für Push-to-Talk steht.
ThreadRecap transkribiert jede Sprachnachricht in einem Export mit fortgeschrittener Transkriptionstechnologie und strebt hohe Genauigkeit bei klarem Audio an. Die Transkripte sind zeitlich mit den umgebenden Chat-Nachrichten verknüpft, sodass Sie eine Unterhaltung als kontinuierlichen Thread lesen können, anstatt zwischen Text und Audio-Playern zu wechseln.
Hintergrundgeräusche, überlappende Sprecher, starke Akzente und sehr kurze Clips (unter zwei Sekunden) sind die Hauptfaktoren, die die Transkriptionsqualität verringern. Whisper verarbeitet mehrsprachiges Audio, sodass ein Sprachwechsel mitten im Gespräch die Pipeline nicht unterbricht, obwohl die Genauigkeit je nach Sprache variiert.
.jpg, .png, .mp4: freigegebene Medien
Bilder und Videos in einem WhatsApp-Export folgen dem Benennungsmuster `IMG-YYYYMMDD-WA000X.jpg` oder `VID-YYYYMMDD-WA000X.mp4`. Die Datumkomponente entspricht dem Zeitpunkt der Dateienerstellung oder des Versendens, und der nachfolgende Index unterscheidet mehrere Dateien vom selben Tag.
Diese Dateien enthalten mehr Metadaten als auf den ersten Blick sichtbar ist. In `.jpg`- und `.png`-Dateien eingebettete EXIF-Daten können GPS-Koordinaten, Gerätemodell und den ursprünglichen Erfassungszeitstempel enthalten – Informationen, die in Streit- oder Compliance-Kontexten erheblich sein können.
ThreadRecap verarbeitet keine Fotos, Videos oder Dokumente. Sie werden in `_chat.txt` nach Dateiname referenziert, den ThreadRecap in der Gesprächs-Timeline vermerkt, aber die Dateien selbst werden nie hochgeladen. Dies ist eine absichtliche Datenschutzgrenze, die im folgenden Abschnitt detaillierter behandelt wird.
.pdf, .vcf, .docx: Dokumente und Kontakte
Dokumente (.pdf, .docx und andere Formate)
Jede Datei, die als Anlage in WhatsApp freigegeben wird, einschließlich PDFs, Word-Dokumenten, Tabellenkalkulations- und Präsentationsdateien, erscheint in der Export-ZIP unter ihrem ursprünglichen Dateinamen. Diese Dateien werden in `_chat.txt` genauso wie Bilder referenziert: als Platzhaltzeile mit dem Dateinamen und dem Text „Datei angehängt".
ThreadRecap lädt Dokumentanlagen nicht hoch oder parst sie. Deren Vorhandensein in der Timeline wird vermerkt, aber ihr Inhalt wird nicht extrahiert.
Kontaktkarten (.vcf)
Wenn ein WhatsApp-Benutzer einen Kontakt freigibt, enthält der Export eine `.vcf`-Datei (vCard-Format). vCard ist ein Standardformat für Kontaktinformationen, das Felder wie Name, Telefonnummer, E-Mail-Adresse und Organisation enthält. Der Dateiname ist typischerweise der Anzeigename des Kontakts mit einer `.vcf`-Erweiterung.
Kontaktkarten werden von ThreadRecap nicht verarbeitet. Wie Dokumente und Medien bleiben sie auf Ihrem Gerät.
Was ThreadRecap standardmäßig liest und ignoriert
Die folgende Tabelle fasst die Verarbeitungsgrenze klar zusammen:
Dateityp
ThreadRecap verarbeitet?
Wo es bleibt
`_chat.txt`
Ja, vollständig
Verschlüsselt in Ihrem Konto
`.opus` / `.m4a` (Sprachnachrichten)
Ja, transkribiert via Whisper
Verschlüsselt in Ihrem Konto
`.jpg` / `.png` (Bilder)
Nein
Nur auf Ihrem Gerät
`.mp4` / `.mov` (Video)
Nein
Nur auf Ihrem Gerät
`.pdf` / `.docx` (Dokumente)
Nein
Nur auf Ihrem Gerät
`.vcf` (Kontaktkarten)
Nein
Nur auf Ihrem Gerät
Die Ausgaben, die ThreadRecap aus den verarbeiteten Daten generiert, umfassen:
Besprechungszusammenfassung: eine strukturierte Zusammenfassung dessen, was besprochen und vereinbart wurde
Aktionspunkte: Aufgaben, die mit Zuständigem und Fälligkeitsdatum extrahiert werden, falls angegeben
Entscheidungen: ausdrückliche oder implizite Entscheidungen mit Kontext protokolliert
Konfliktlösung: eine Zeitleiste der strittigen Austausche mit zugeordneten Aussagen
Beziehungserkenntnisse: Analysemuster der Kommunikation zwischen Teilnehmern
All diese sind in Text und transkribiertem Sprachinhalten verankert. Nichts wird aus Bildern oder Dokumenten abgeleitet.
Warum Fotos und Videos Ihr Gerät nie verlassen
Dies ist keine Einschränkung, sondern eine bewusste Designentscheidung, die in der Sensibilität von Mediendateien verwurzelt ist.
Fotos und Videos, die in persönlichen oder beruflichen Chats geteilt werden, enthalten oft Informationen, die weit über das Bild selbst hinausgehen: Standortdaten, Gesichter, auf Schreibtischen fotografierte Dokumente und Zeitstempel, die an bestimmte Ereignisse gebunden sind. Das Hochladen dieses Materials auf einen Cloud-Service, selbst wenn er verschlüsselt ist, schafft Exposition, die viele Benutzer und viele Rechts- und Compliance-Teams nicht komfortabel finden.
ThreadRecap's Architektur wahrst hier eine harte Grenze. Der Export- und Upload-Workflow bedeutet, dass Sie die ZIP-Datei besitzen, bevor etwas versendet wird. Wenn Sie zu ThreadRecap über /upload hochladen, überqueren nur `_chat.txt` und Sprachnoten-Audio das Netzwerk. Alles andere bleibt in der ZIP auf Ihrem Gerät.
Chat-Text und Sprachnoten-Audio werden verschlüsselt in Ihrem Konto gespeichert. Sie können sie jederzeit über das Dashboard löschen. Es gibt keine Aufbewahrungsfrist, die Ihre Wahl überschreibt.
Die strukturierte Natur von `_chat.txt` macht WhatsApp-Exporte in rechtlichen, HR- und Compliance-Kontexten nützlich. Jede Nachricht trägt einen Zeitstempel und eine Senderzuschreibung, die schwer zu ändern ist, ohne das umgebende Protokoll zu stören. Sprachnoten-Transkripte fügen eine Schicht gesprachener Beweise hinzu, die oft in reinen Nachrichtenprotokollen fehlt.
ThreadRecap's beweisgerechte Ausgabeformate präsentieren dieses Material als chronologisches, zugeschriebenes Protokoll mit klarer Trennung zwischen geschriebenem und gesprochenem Inhalt. Wenn Sie sich auf einen Streit, eine interne Untersuchung oder eine behördliche Überprüfung vorbereiten, gibt Ihnen der strukturierte Bericht einen Ausgangspunkt, der viel leichter zu navigieren ist als eine rohe Textdatei mit Tausenden von Zeilen.
Ein Hinweis zur Zulässigkeit: Der rohe Export und ThreadRecap's strukturierte Ausgabe können Rechtsarbeiten unterstützen, aber die formale Zulässigkeit hängt von Gerichtsbarkeit und Authentifizierungsverfahren ab. Konsultieren Sie immer einen qualifizierten Rechtsfachmann, bevor Sie sich in Verfahren auf einen Chat-Export verlassen.
Das Gesamtbild verstehen
Eine WhatsApp-Export-ZIP ist nicht nur eine Sicherung. Es ist ein geschichtetes Archiv, in dem jeder Dateityp eine andere Dimension der Kommunikation erfasst: das schriftliche Protokoll in `_chat.txt`, das gesprochene Wort in Sprachnoten-Audio, der visuelle Kontext in Bildern und Video, und die freigegebenen Materialien in Dokumenten und Kontaktkarten.
ThreadRecap arbeitet mit den Ebenen, die in großem Umfang analysiert werden können, ohne die Privatsphäre der Ebenen zu beeinträchtigen, die nicht analysiert werden können. Wenn Sie verstehen möchten, was Ihr Export enthält, bevor Sie damit etwas unternehmen, ist die obige Dateizergliederung Ihre Karte. Wenn Sie bereit sind, es in strukturierte Ausgabe umzuwandeln, ist die Seite /upload der nächste Schritt.
Für mehr Kontext zu den verschiedenen Formaten, die WhatsApp erzeugen kann, und wie sie sich vergleichen, siehe WhatsApp-Exportformate erklärt.