medienspektrum

Methodik

Wie medienspektrum deutsche Redaktionen einordnet

Pro politischem Thema wird eine kuratierte Auswahl deutscher Redaktionen auf einer Karte mit zwei themenspezifischen Achsen verordnet. Die eigentliche Klassifikation übernimmt ein KI-Modell, das jeden einzelnen Artikel auf den beiden Achsen bewertet. Menschliche Entscheidungen sitzen an zwei Stellen: bei der Wahl der Achsen und bei der Auswahl der Artikel. Der Rest – Suche, Extraktion, Wertung, Aggregation – läuft deterministisch und ist nachrechenbar.

Die Pipeline

Outlet-Registry

Eine kuratierte Auswahl deutscher Redaktionen, die zusammen das Spektrum von marxistisch-links über bürgerlich-konservativ bis rechtspopulistisch abdeckt – ergänzt um öffentlich-rechtliche und wirtschaftspublizistische Stimmen. Pro Outlet erfasst die Registry Name, Eigentümer/Verlag und Domain; editorielle Bewertungen der Outlets selbst gibt es bewusst nicht. Auswahl und Begründung pro Outlet stehen auf der Seite Medien.

Themen-Definition

Pro Thema ein Konfigurationsfile mit Slug, Titel, redaktioneller Zusammenfassung, Suchstichworten, Datumsfenster und Outlet-Liste. Das ist das einzige strukturierte Vorab-Setup; alle folgenden Schritte arbeiten auf dieser Eingabe.

Artikel beschaffen und sichten

Suche: pro Outlet eine site-Anfrage über die Serper.dev-API mit den Themen-Stichworten und dem Datumsfenster. Treffer landen als Kandidaten in der Datenbank.

Extraktion: jede URL wird geladen und mit @mozilla/readability vom Boilerplate gereinigt. Artikel, bei denen die Extraktion keinen Text liefert (typisch: Paywall, Bot-Schutz), werden automatisch verworfen.

Sichtung: Die Redaktion entscheidet pro Treffer ✓ oder ✗ und protokolliert bei Ablehnung den Grund (off-topic, opinion piece, paywall stub, duplicate, low content). Die abgelehnten Artikel und ihre Begründungen erscheinen auf der Themenseite im Abschnitt „Nicht auf der Karte“.

Achsen vorschlagen und festlegen

Wir lassen claude-haiku-4-5 drei Kandidatenpaare für die zwei Achsen vorschlagen. Jeder Kandidat enthält zwei Pole mit Label und ausformulierter Rubrik, Grenzbeispiele für Mischfälle und illustrative Zitate aus echten Korpus-Artikeln.

Die Redaktion wählt eines der drei Paare aus, schreibt es als locked_axes in die Datenbank und versieht den Lock mit einem Git-Tag. Die Achsen liegen damit fest und können nicht nachträglich angepasst werden.

Artikel bewerten

Jeder akzeptierte Artikel wird vom selben Modell (claude-haiku-4-5, Temperatur 0.3) drei Mal auf den festgesetzten Achsen bewertet. Die Antwort wird über json_schema strukturell erzwungen und enthält pro Lauf einen x- und y-Wert (jeweils 0–1), ein wörtliches Belegzitat aus dem Artikel je Achse und eine kurze Begründung.

Aus den drei Wertungen pro Artikel berechnen wir Mittelwert und Standardabweichung. Liegt die Standardabweichung auf einer Achse über 0.15, gilt der Artikel als low-confidence: die KI ist sich dann selbst nicht einig. Die Quote dieser Artikel auf Korpus-Ebene ist unsere wichtigste Reliabilitätskennzahl; aktuell liegt sie bei rund 5%.

Outlets verorten

Pro Outlet sammeln wir die Artikel-Mittelwerte und aggregieren sie zu einer Position auf der Karte:

  1. Outlets mit weniger als drei Artikeln erhalten keine eigene Position – mit so wenig Material wäre die Streuung größer als das Signal. Sie erscheinen unter der Karte als „Einzelbeobachtung“.
  2. Outlets mit mehr als acht Artikeln werden deterministisch auf acht reduziert. Sonst würde ein Medium, das viel zum Thema schreibt (etwa Berliner Zeitung mit 17 Artikeln zum KTF-Urteil), künstlich präzise wirken – mehr Daten erzeugen automatisch ein engeres Konfidenzintervall, ohne dass die Position dadurch sicherer wäre. Die nicht verwendeten Artikel bleiben in der Datenbank und in den Outlet-Quellenlisten erhalten.
  3. Über die ggf. reduzierte Stichprobe ziehen wir B = 1000 mal mit Zurücklegen und berechnen jedes Mal Mittelwert von x und y.
  4. Das 2.5%- und 97.5%-Perzentil dieser 1000 Bootstrap-Mittel sind das 95%-Konfidenzintervall pro Achse. Auf der Karte erscheint es als Halo um den Outlet-Punkt – breit bei wenigen Artikeln, schmal bei vielen.

Was wir nicht messen

Provenienz

Jede Karte ist über vier Identifikatoren reproduzierbar: den Git-Tag des Achsen-Locks (pipeline/<slug>/axes-…), die Scoring-Run-ID (score_<16hex>), den Aggregation-Run-Tag (pipeline/<slug>/aggregate-…) und die Modell-Version (claude-haiku-4-5, Stand: 11. Mai 2026). Diese Werte erscheinen pro Thema im Abschnitt „Über diese Auswertung“ unterhalb der jeweiligen Karte.