Methodik
Wie medienspektrum deutsche Redaktionen einordnet
Pro politischem Thema wird eine kuratierte Auswahl deutscher Redaktionen auf einer Karte mit zwei themenspezifischen Achsen verordnet. Die eigentliche Klassifikation übernimmt ein KI-Modell, das jeden einzelnen Artikel auf den beiden Achsen bewertet. Menschliche Entscheidungen sitzen an zwei Stellen: bei der Wahl der Achsen und bei der Auswahl der Artikel. Der Rest – Suche, Extraktion, Wertung, Aggregation – läuft deterministisch und ist nachrechenbar.
Die Pipeline
Outlet-Registry
Themen-Definition
Artikel beschaffen und sichten
Suche: pro Outlet eine site-Anfrage über die Serper.dev-API mit den Themen-Stichworten und dem Datumsfenster. Treffer landen als Kandidaten in der Datenbank.
Extraktion: jede URL wird geladen und mit @mozilla/readability vom Boilerplate gereinigt. Artikel, bei denen die Extraktion keinen Text liefert (typisch: Paywall, Bot-Schutz), werden automatisch verworfen.
Sichtung: Die Redaktion entscheidet pro Treffer ✓ oder ✗ und protokolliert bei Ablehnung den Grund (off-topic, opinion piece, paywall stub, duplicate, low content). Die abgelehnten Artikel und ihre Begründungen erscheinen auf der Themenseite im Abschnitt „Nicht auf der Karte“.
Achsen vorschlagen und festlegen
Wir lassen claude-haiku-4-5 drei Kandidatenpaare für die zwei Achsen vorschlagen. Jeder Kandidat enthält zwei Pole mit Label und ausformulierter Rubrik, Grenzbeispiele für Mischfälle und illustrative Zitate aus echten Korpus-Artikeln.
Die Redaktion wählt eines der drei Paare aus, schreibt es als locked_axes in die Datenbank und versieht den Lock mit einem Git-Tag. Die Achsen liegen damit fest und können nicht nachträglich angepasst werden.
Artikel bewerten
Jeder akzeptierte Artikel wird vom selben Modell (claude-haiku-4-5, Temperatur 0.3) drei Mal auf den festgesetzten Achsen bewertet. Die Antwort wird über json_schema strukturell erzwungen und enthält pro Lauf einen x- und y-Wert (jeweils 0–1), ein wörtliches Belegzitat aus dem Artikel je Achse und eine kurze Begründung.
Aus den drei Wertungen pro Artikel berechnen wir Mittelwert und Standardabweichung. Liegt die Standardabweichung auf einer Achse über 0.15, gilt der Artikel als low-confidence: die KI ist sich dann selbst nicht einig. Die Quote dieser Artikel auf Korpus-Ebene ist unsere wichtigste Reliabilitätskennzahl; aktuell liegt sie bei rund 5%.
Outlets verorten
Pro Outlet sammeln wir die Artikel-Mittelwerte und aggregieren sie zu einer Position auf der Karte:
- Outlets mit weniger als drei Artikeln erhalten keine eigene Position – mit so wenig Material wäre die Streuung größer als das Signal. Sie erscheinen unter der Karte als „Einzelbeobachtung“.
- Outlets mit mehr als acht Artikeln werden deterministisch auf acht reduziert. Sonst würde ein Medium, das viel zum Thema schreibt (etwa Berliner Zeitung mit 17 Artikeln zum KTF-Urteil), künstlich präzise wirken – mehr Daten erzeugen automatisch ein engeres Konfidenzintervall, ohne dass die Position dadurch sicherer wäre. Die nicht verwendeten Artikel bleiben in der Datenbank und in den Outlet-Quellenlisten erhalten.
- Über die ggf. reduzierte Stichprobe ziehen wir B = 1000 mal mit Zurücklegen und berechnen jedes Mal Mittelwert von x und y.
- Das 2.5%- und 97.5%-Perzentil dieser 1000 Bootstrap-Mittel sind das 95%-Konfidenzintervall pro Achse. Auf der Karte erscheint es als Halo um den Outlet-Punkt – breit bei wenigen Artikeln, schmal bei vielen.
Was wir nicht messen
- Tonalität. Ob ein Outlet sachlich oder emotional argumentiert, fließt höchstens indirekt in die Achsenwertung ein. Eine eigene Tonalitäts-Achse wäre denkbar, ist aber nicht implementiert.
- Reichweite. Wer eine Position vertritt, hat in der Aggregation gleiches Gewicht wie wer sie viral verbreitet. Reichweitendaten weisen wir auf der Seite Medien aus, fließen aber nicht in die Karte ein.
- Zeitliche Verschiebungen während eines Themas. Eine Outlet-Position ist der Mittelwert über das gesamte Datumsfenster. Ein Outlet, das am ersten Tag eine Position vertritt und nach zwei Wochen kippt, erscheint in der Mitte – die Bewegung selbst zeigen wir (noch) nicht.
Provenienz
Jede Karte ist über vier Identifikatoren reproduzierbar: den Git-Tag des Achsen-Locks (pipeline/<slug>/axes-…), die Scoring-Run-ID (score_<16hex>), den Aggregation-Run-Tag (pipeline/<slug>/aggregate-…) und die Modell-Version (claude-haiku-4-5, Stand: 11. Mai 2026). Diese Werte erscheinen pro Thema im Abschnitt „Über diese Auswertung“ unterhalb der jeweiligen Karte.