spectralQ
Übersicht Start Über uns FAQ Login
Teil VI · GT Studio

25Korrelation und Triangulation

Eine einzelne Trend-Kurve zeigt Bewegung — aber was sie bedeutet, erschließt sich erst im Zusammenspiel mit anderen. Mehrere Suchbegriffe gleichzeitig, Suchvolumen neben Nachrichten-Frequenz, regionale Verschiebungen neben überregionalen Signalen: Daraus entstehen Muster, die forensisch belastbar sind. Dieses Kapitel zeigt, wie das GT Studio Korrelation und Triangulation technisch unterstützt — und wie Sie beide Prinzipien produktiv einsetzen.

Was Korrelation bedeutet — und was nicht

Korrelation beschreibt den statistischen Gleichlauf zweier Zeitreihen. Steigen beide zur selben Zeit, fallen beide zusammen? Oder bewegen sie sich gegenläufig? Die Stärke dieses Zusammenhangs wird als Koeffizient zwischen -1 und +1 ausgedrückt:

  • +1 — perfekte positive Korrelation (beide Kurven identisch)
  • 0 — kein Zusammenhang
  • -1 — perfekte negative Korrelation (eine steigt, die andere fällt)

Wichtig ist, was Korrelation nicht ist:

Korrelation ist keine Kausalität. Zwei Kurven können perfekt parallel laufen, ohne dass eine die andere verursacht. Ein klassisches Beispiel: Die Zahl der Piraten ist in den letzten 200 Jahren gesunken, während die globale Temperatur gestiegen ist. Nahezu perfekte Antikorrelation — keinerlei Kausalität.

Korrelation ist keine Richtung. Zwei korrelierte Kurven sagen nichts darüber, welche zuerst kam. Dafür brauchen Sie zeitlichen Versatz (Lag-Analysen) oder Granger-Kausalität (Kapitel 26).

Korrelation ist keine Erklärung. Ein hoher Korrelationswert sagt nur: „Diese zwei Zeitreihen bewegen sich gemeinsam." Warum — das ist die eigentliche Forschungsfrage, die danach beginnt.

Hinweis — Korrelation ist ein Filter, kein Beweis. Sie hilft Ihnen, in großen Datenmengen die wenigen interessanten Paare zu finden. Was sie bedeuten, ist Ihre Ermittlungsarbeit.

Korrelation im GT Studio

In der Analyse-Ansicht können Sie mehrere Keywords gleichzeitig anzeigen lassen. Damit wird der Grundstein für Korrelationsarbeit gelegt.

Mehrere Kurven im Diagramm

Wählen Sie in der Keyword-Liste mehrere Einträge aus und öffnen Sie die Analyse. Die Kurven erscheinen übereinander in unterschiedlichen Farben — jede mit ihrem eigenen Index-Verlauf. Der Crosshair zeigt zu einem Zeitpunkt die Werte aller Kurven.

Schon die optische Überlagerung zeigt oft das Wesentliche: Laufen Kurven parallel, bilden sich gemeinsame Spitzen, gibt es zeitliche Verschiebungen?

Korrelationsmatrix

Für die quantitative Prüfung steht die Korrelationsmatrix zur Verfügung — eine Tabelle, in der jedes Keyword mit jedem anderen verglichen wird. Jede Zelle zeigt den Korrelationskoeffizienten dieses Paares.

Typische Lesart:

  • Werte über 0,7 — starke positive Korrelation
  • Werte zwischen 0,3 und 0,7 — mäßige Korrelation, vermutlich gemeinsamer Hintergrund
  • Werte unter 0,3 — schwach, oft Zufall
  • Negative Werte — gegenläufige Bewegung, oft besonders aufschlussreich

Die Matrix ist der Einstiegspunkt einer genaueren Analyse. Sie identifizieren die Paare mit hoher Korrelation — und gehen dann in die Einzelpaar-Ansicht, um zeitliche Struktur, Spike-Timing und Kontext zu prüfen.

Rolling Correlation

Eine starre Korrelationszahl über den gesamten Zeitraum kann täuschen. Oft korrelieren Zeitreihen nur in bestimmten Phasen stark — und sind dazwischen unabhängig. Die Rolling Correlation (in den Labor-Analysen verfügbar, Kapitel 26) zeigt den Korrelationskoeffizienten als eigene Kurve über die Zeit. So erkennen Sie: Wann sind die Kurven stark gekoppelt? Wann gehen sie eigene Wege?

Das ist forensisch wertvoll, weil Kopplungs-Phasen oft Ereignisfenstern entsprechen: Ein externer Impuls zieht beide Zeitreihen gleichzeitig — und verschwindet, sobald der Impuls vorbei ist.

Der Übergang zur Triangulation

Korrelation allein bleibt innerhalb einer Datenart — etwa zwischen verschiedenen Suchbegriffen. Triangulation geht weiter: Sie vergleicht Signale aus unterschiedlichen Datenquellen.

Der Begriff stammt aus der Vermessungstechnik: Um einen Punkt genau zu bestimmen, braucht man Sichtlinien aus mindestens drei Richtungen. Ein einzelner Peilstrahl reicht nicht — der kann falsch sein, verrauscht, zufällig. Drei unabhängige Sichtlinien, die sich auf denselben Punkt zulaufen, sind dagegen belastbar.

In der Ermittlungsarbeit bedeutet das: Mindestens drei unabhängige Datenquellen prüfen dasselbe Phänomen.

Hinweis — „Unabhängig" ist dabei der entscheidende Begriff. Drei Artikel, die sich gegenseitig zitieren, sind keine drei unabhängigen Quellen — sie sind eine Quelle. Der Datenforensiker im 5-Agenten-System (Kapitel 20) achtet genau auf diese Unabhängigkeit.

Triangulation im GT Studio

Das GT Studio unterstützt Triangulation durch externe Daten-Overlays. Sie können eine Trend-Kurve mit Zeitreihen aus anderen Quellen überlagern — etwa:

  • Nachrichten-Frequenz zu einem Thema
  • Wikipedia-Edits an einem relevanten Artikel
  • Kursdaten eines Unternehmens
  • Seismik-, Wetter-, Flug-Daten
  • Telegram-Nachrichten eines Kanals
  • Eigene hochgeladene CSV-Zeitreihen (etwa behördliche Statistiken)

Im Diagramm liegen diese Kurven dann gemeinsam mit dem Suchvolumen — auf derselben Zeitachse, aber mit eigenen Y-Achsen (damit Einheiten nicht durcheinander geraten).

Das visuelle Prinzip ist dasselbe wie auf dem Murder Board mit Verlaufsgraphen (Kapitel 6): Multi-Y-Achsen erlauben echte Überlagerungen, ohne dass die kleinere Skala verschwindet.

Was Sie dann prüfen:

  • Zeitliche Abfolge — welches Signal kam zuerst?
  • Ko-Occurrence — zeigen sich Spitzen gleichzeitig oder versetzt?
  • Abwesenheit — gibt es Momente, in denen eine Quelle reagiert, eine andere aber nicht?
  • Konvergenz — laufen mehrere Quellen auf ein gemeinsames Ereignis zu?

Anwendungsmuster

Muster 1 — Reaktion vs. Antizipation

Die klassische Frage: Reagieren Leute auf Nachrichten — oder ahnen sie etwas voraus?

Aufbau:

  • Trend-Kurve eines Keywords („Firma X")
  • Nachrichten-Frequenz zu derselben Firma

Liegt die Nachrichten-Kurve vor der Trend-Kurve, ist der Suchanstieg eine Reaktion. Liegt die Trend-Kurve vorne, suchten Leute bereits, bevor die Nachrichten erschienen. Das letztere Muster ist das forensisch interessante — es deutet darauf hin, dass Informationen außerhalb der Medien bereits zirkulierten.

Muster 2 — Geografische Verschiebung

Ein Keyword wird in Deutschland gesamt moderat gesucht — aber in einem einzelnen Bundesland hat das Suchvolumen eine auffällige Spitze. Was passiert dort?

Im GT Studio können Sie denselben Begriff für unterschiedliche Geo-Gebiete abrufen und die Kurven überlagern. Wenn der Peak in München war, aber nirgends sonst, lohnt der Blick auf das, was dort gerade passiert ist. Lokale Ereignisse, regionale Medien, geografisch spezifische Akteure.

Muster 3 — Kursbewegung + Suchvolumen

Aufbau:

  • Trend-Kurve eines Unternehmensnamens
  • Aktienkurs als Overlay

Wenn Suchvolumen und Kurs zeitgleich bewegen, ist das normales Marktverhalten. Wenn Suchvolumen dem Kurs vorausläuft — also Leute suchten, bevor sich der Kurs bewegte — ist das ein Signal, das eine tiefere Prüfung rechtfertigt. Insider-Verdacht ist eine mögliche, aber nicht die einzige Erklärung.

Muster 4 — Wikipedia als Frühindikator

Aufbau:

  • Trend-Kurve eines Themas
  • Wikipedia-Edit-Frequenz des zugehörigen Artikels

Wikipedia-Editoren sind oft früher dran als die allgemeine Suche. Wenn ein Artikel plötzlich intensiv bearbeitet wird, bevor ein Thema breit gesucht wird, weiß jemand etwas — und trägt es ins Wiki, bevor die Öffentlichkeit reagiert.

Muster 5 — Absence als Signal

Eines der stärksten Triangulations-Signale ist das Fehlen eines erwarteten Signals. Wenn zu einem öffentlichen Ereignis die Nachrichten-Frequenz hoch ist, das Suchvolumen aber überhaupt nicht reagiert — warum interessieren sich die Leute nicht? Ist das Ereignis ihnen egal? Ist die Berichterstattung künstlich erzeugt? Oder war das Ereignis längst bekannt?

Das Absence-Signal ist oft aufschlussreicher als ein Spike. Forensisch stärker, weil schwerer manipulierbar.

Der Konfidenz-Gewinn durch Triangulation

Der eigentliche Wert von Triangulation ist mathematisch beschreibbar. Je mehr unabhängige Quellen dasselbe Signal zeigen, desto unwahrscheinlicher wird es, dass es durch Zufall oder Manipulation entstanden ist.

Wenn eine einzelne Datenquelle einen Spike zeigt, könnte das Zufall sein (Basisrate zufälliger Spikes: sagen wir 1/20). Wenn drei unabhängige Quellen gleichzeitig einen Spike zeigen, sinkt die Zufallswahrscheinlichkeit drastisch — näherungsweise 1/8000. Vier Quellen: 1/160.000. Das ist die Logik dahinter, warum Triangulation so viel stärker ist als Einzelsignale.

In der Praxis sind die Wahrscheinlichkeiten nicht genau so multiplikativ, weil echte Unabhängigkeit schwer herzustellen ist. Aber das Prinzip gilt: Mit jeder zusätzlichen unabhängigen Quelle wird das gemeinsame Signal härter.

Hinweis — Das ist auch der Grund, warum das 5-Agenten-System in SpectralQ fest darauf besteht, mehrere Quellen zu prüfen. Nicht aus Vorsicht, sondern weil ohne Triangulation keine seriöse Aussage möglich ist.

Manipulation erkennen

Da Google Trends grundsätzlich manipulierbar ist — durch koordinierte Massen-Suchen — ist die Frage wichtig: Sieht ein Spike echt aus oder nicht?

Einige Hinweise auf möglicherweise manipulierte Daten:

Unnatürliche Form. Echte Suchspitzen haben einen typischen Verlauf: steiler Anstieg, breites Plateau, langsamer Abfall. Ein Spike, der plötzlich da ist, plötzlich wieder weg, ohne Nachwirkungen, wirkt unnatürlich.

Geografische Konzentration. Ein Keyword, das plötzlich in einer einzelnen Region massiv gesucht wird, ohne dass dort ein erkennbarer regionaler Anlass wäre, ist verdächtig. Besonders wenn die Geographie mit Botnet-Infrastrukturen korrespondiert (bestimmte Länder mit hoher Bot-Aktivität).

Fehlende Begleitsignale. Ein echtes Ereignis hinterlässt Spuren in mehreren Quellen. Ein Suchspike ohne Nachrichten, ohne Wikipedia-Aktivität, ohne Social-Media-Echo, ohne kommerzielle Reaktion — das ist möglicherweise ein isoliertes künstliches Signal.

Zu glatte Korrelation mit künstlichen Zeitmustern. Manipulation läuft oft in Stunden-Intervallen oder an runden Uhrzeiten. Wenn Spikes exakt stündlich einsetzen oder genau bei Mitternacht starten, ist das ein Hinweis auf automatisierte Aktivität.

Die Labor-Analysen (Kapitel 26) haben dafür spezialisierte Werkzeuge — etwa die Spike-Koinzidenz-Prüfung und die Change-Point-Detection.

Die KI-Analyse nutzen

In der Multi-Kurven-Analyse-Ansicht kann die KI-Analyse die Interpretation beschleunigen. Die KI beschreibt, was sie sieht — parallele Bewegungen, Zeitversätze, Auffälligkeiten, mögliche Hypothesen.

Im Follow-up-Chat stellen Sie konkrete Fragen:

  • „Welche Kurve läuft den anderen zeitlich voraus?"
  • „Gibt es eine Periode, in der die Korrelation zusammenbricht?"
  • „Passt das Muster zu einer koordinierten Kampagne oder einem organischen Verlauf?"

Die KI sieht die Zeitreihen und den Kontext — sie halluziniert weniger, wenn Sie präzise fragen.

Hinweis — Die KI-Analyse ersetzt nicht das eigene Lesen der Kurven — sie erweitert es. Oft findet sie Dinge, die das Auge übersieht. Oft übersieht sie Dinge, die das Auge sofort sieht. Die Kombination ist das Beste.

Was Sie jetzt können

  • Den Unterschied zwischen Korrelation und Kausalität sauber benennen
  • Mehrere Keywords gemeinsam im Diagramm darstellen
  • Die Korrelationsmatrix als Einstieg in tiefere Analysen nutzen
  • Das Prinzip der Triangulation verstehen und umsetzen
  • Externe Datenquellen (News, Wikipedia, Kursdaten, eigene CSVs) als Overlays einbinden
  • Typische Muster erkennen — Reaktion vs. Antizipation, geografische Verschiebung, Absence-Signale
  • Mögliche Manipulation von Trend-Daten identifizieren
  • Die KI-Analyse als Interpretationshilfe einsetzen