Methodik

Wie medienspektrum deutsche Redaktionen einordnet

Pro politischem Thema wird eine kuratierte Auswahl deutscher Redaktionen auf einer Karte mit zwei themenspezifischen Achsen verortet. Die eigentliche Klassifikation übernimmt ein KI-Modell, das jeden einzelnen Artikel auf den beiden Achsen bewertet. Menschliche Entscheidungen sitzen an zwei Stellen: bei der Wahl der Achsen und bei der Auswahl der Artikel. Der Rest – Suche, Extraktion, Wertung, Aggregation – läuft deterministisch und ist nachrechenbar.

Die Pipeline

Outlet-Registry

Eine kuratierte Auswahl deutscher Redaktionen, die zusammen das Spektrum von marxistisch-links über bürgerlich-konservativ bis rechtspopulistisch abdeckt – ergänzt um öffentlich-rechtliche und wirtschaftspublizistische Stimmen. Pro Outlet erfasst die Registry Name, Eigentümer/Verlag und Domain; editorielle Bewertungen der Outlets selbst gibt es bewusst nicht. Auswahl und Begründung pro Outlet stehen auf der Seite Medien.

Themen-Definition

Pro Thema ein Konfigurationsfile mit Slug, Titel, redaktioneller Zusammenfassung, Suchstichworten, Datumsfenster und Outlet-Liste. Das ist das einzige strukturierte Vorab-Setup; alle folgenden Schritte arbeiten auf dieser Eingabe.

Artikel beschaffen und sichten

Suche: pro Outlet eine site-Anfrage über die Serper.dev-API mit den Themen-Stichworten und dem Datumsfenster. Treffer landen als Kandidaten in der Datenbank.

Extraktion: jede URL wird geladen und mit @mozilla/readability vom Boilerplate gereinigt. Artikel, bei denen die Extraktion keinen Text liefert (typisch: Paywall, Bot-Schutz), werden automatisch verworfen.

Sichtung: Die Redaktion entscheidet pro Treffer ✓ oder ✗ und protokolliert bei Ablehnung den Grund (off-topic, opinion piece, paywall stub, duplicate, low content). Die abgelehnten Artikel und ihre Begründungen erscheinen auf der Themenseite im Abschnitt „Nicht auf der Karte“.

Achsen vorschlagen und festlegen

Für die Achsenfindung schlägt claude-haiku-4-5 drei Kandidatenpaare für die zwei Achsen vor. Jeder Kandidat enthält zwei Pole mit Label und ausformulierter Rubrik, Grenzbeispiele für Mischfälle und illustrative Zitate aus echten Korpus-Artikeln.

Die Redaktion wählt eines der drei Paare aus, schreibt es als locked_axes in die Datenbank und versieht den Lock mit einem Git-Tag. Die Achsen liegen damit fest und können nicht nachträglich angepasst werden.

Artikel bewerten

Jeder akzeptierte Artikel wird vom selben Modell (claude-haiku-4-5, Temperatur 0.3) drei Mal auf den festgesetzten Achsen bewertet. Die Antwort wird über json_schema strukturell erzwungen und enthält pro Lauf einen x- und y-Wert (jeweils 0–1), ein wörtliches Belegzitat aus dem Artikel je Achse und eine kurze Begründung.

Aus den drei Wertungen pro Artikel werden Mittelwert und Standardabweichung. Liegt die Standardabweichung auf einer Achse über 0.15, gilt der Artikel als low-confidence: die KI ist sich dann selbst nicht einig. Die Quote dieser Artikel auf Korpus-Ebene ist die wichtigste Reliabilitätskennzahl; aktuell liegt sie bei rund 5%.

Outlets verorten

Pro Outlet werden die Artikel-Mittelwerte gesammelt und zu einer Position auf der Karte aggregiert:

Outlets mit weniger als drei Artikeln erhalten keine eigene Position – mit so wenig Material wäre die Streuung größer als das Signal. Sie erscheinen unter der Karte als „Einzelbeobachtung“.
Outlets mit mehr als acht Artikeln werden deterministisch auf acht reduziert. Sonst würde ein Medium, das viel zum Thema schreibt (etwa Berliner Zeitung mit 17 Artikeln zum KTF-Urteil), künstlich präzise wirken – mehr Daten erzeugen automatisch ein engeres Konfidenzintervall, ohne dass die Position dadurch sicherer wäre. Die nicht verwendeten Artikel bleiben in der Datenbank und in den Outlet-Quellenlisten erhalten.
Über die ggf. reduzierte Stichprobe wird B = 1000 mal mit Zurücklegen gezogen; jedes Mal wird der Mittelwert von x und y berechnet.
Das 2.5%- und 97.5%-Perzentil dieser 1000 Bootstrap-Mittel sind das 95%-Konfidenzintervall pro Achse. Auf der Karte erscheint es als Halo um den Outlet-Punkt – breit bei wenigen Artikeln, schmal bei vielen.

Was die Methode nicht misst

Tonalität. Ob ein Outlet sachlich oder emotional argumentiert, fließt höchstens indirekt in die Achsenwertung ein. Eine eigene Tonalitäts-Achse wäre denkbar, ist aber nicht implementiert.
Reichweite. Wer eine Position vertritt, hat in der Aggregation gleiches Gewicht wie wer sie viral verbreitet. Reichweitendaten weisen die Redaktion auf der Seite Medien aus; sie fließen aber nicht in die Karte ein.
Zeitliche Verschiebungen während eines Themas. Eine Outlet-Position ist der Mittelwert über das gesamte Datumsfenster. Ein Outlet, das am ersten Tag eine Position vertritt und nach zwei Wochen kippt, erscheint in der Mitte – die Bewegung selbst wird bislang nicht gezeigt.

Provenienz

Jede Karte ist über vier Identifikatoren reproduzierbar: den Git-Tag des Achsen-Locks (pipeline/<slug>/axes-…), die Scoring-Run-ID (score_<16hex>), den Aggregation-Run-Tag (pipeline/<slug>/aggregate-…) und die Modell-Version (claude-haiku-4-5, Stand: 11. Mai 2026). Diese Werte erscheinen pro Thema im Abschnitt „Über diese Auswertung“ unterhalb der jeweiligen Karte.