Methodologie

Wie Klyptra Medien-Bias misst.

Diese Seite legt jede methodische Entscheidung offen. Jede Schicht ist wissenschaftlich verankert, jeder Befund mit Verbatim-Beleg nachvollziehbar — auch und gerade für Leser, die unseren Ergebnissen zunächst misstrauen.

Die Skala

0 ist nicht null. 10 ist nicht perfekt.

Die sechs Dimensionen und die 0–10-Skala sind Klyptras Operationalisierung der Media Bias Taxonomy (Spinde et al. 2023) — kein direkter Bestandteil von BABE, das binär (biased/neutral) annotiert. Die Skala wird gegen BABE-artige Experten-Benchmarks kalibriert. Die fünf Bänder sind nicht gleich breit: Nachrichtenagentur-Berichterstattung (dpa, AFP, Reuters) trifft typischerweise 8–9 — ein Wert von 10 wäre nur noch reine Faktenlistung ohne jede narrative Auswahl, praktisch unerreichbar. Nach unten existiert dagegen weiter Raum: das Propaganda-Band (0–2.9) ist mit drei Punkten Breite das größte.

9 – 10
1 Punkt
sehr_objektiv
Quasi-neutrale Berichterstattung. Keine wertenden Adjektive, balancierte Quellen, Spekulation klar als solche markiert. Nachrichtenagentur-Niveau (dpa, AFP, Reuters).
7 – 8.9
2 Punkte
objektiv
Solide journalistische Standards. Vereinzelte Wertungen erkennbar, aber transparent als Meinung gekennzeichnet. Mehrere Perspektiven vertreten.
5 – 6.9
2 Punkte
moderat_biased
Klar erkennbare redaktionelle Linie. Wortwahl mit Tendenz, einseitige Quellenwahl, aber keine systematische Verzerrung.
3 – 4.9
2 Punkte
stark_biased
Konsistente einseitige Darstellung. Loaded Words ohne Kennzeichnung, Auslassen entlastender Fakten, emotionale Aufladung.
0 – 2.9
3 Punkte
propaganda
Tatsachen werden verzerrt, Gegenseite nicht oder nur als Strohmann zitiert, Sensations-Framing dominiert. Breitestes Band — nach unten existiert mehr Raum als nach oben.

Die Labels in dieser Tabelle sind exakt die Strings, die der Analyzer im JSON-Output und im Permalink-UI ausgibt — kein UI-Mapping dazwischen.

Die sechs Dimensionen — vertieft

Was jede Dimension misst und woher sie kommt.

Framing

Media Bias Taxonomy (Spinde et al. 2023) · Framing-Bias

Welche Perspektive wird zur narrativen Norm erklärt? Wer ist Subjekt, wer Objekt?

Operationalisierung

  • Aktiv-/Passiv-Konstruktionen mit politischer Asymmetrie
  • Reihenfolge der genannten Akteure
  • Implizite Schuldzuweisung durch Verb-Wahl

Wortwahl

Media Bias Taxonomy (Spinde et al. 2023) · Lexical Bias

Welche Wörter tragen Wertungen ohne sie zu markieren? Loaded Language im engeren Sinn.

Operationalisierung

  • Verbatim-Identifikation wertender Begriffe
  • Vergleich mit neutralen Synonymen
  • Dichte pro 1000 Wörter

Quellenvielfalt

Media Bias Taxonomy (Spinde et al. 2023) · Selection/Coverage

Wie viele Stimmen kommen direkt zu Wort, wie politisch breit ist das Spektrum?

Operationalisierung

  • Anzahl direkt zitierter Personen / Institutionen
  • Politische Verortung der Zitierten
  • Verhältnis Original- zu Sekundärquellen

Im Buch (Spinde 2025, Kap. 2) ist Quellen-/Selection-Bias ein reporting-level-Konstrukt, das streng artikelübergreifend misst. Klyptra approximiert es am Einzeltext — die vollständige Cross-Outlet-Analyse liegt auf Tier-2 (nicht im Score).

Fakt / Meinung

Media Bias Taxonomy (Spinde et al. 2023) · Epistemological Bias

Wird Bewertung sprachlich von Beobachtung getrennt — oder als Faktum verkauft?

Operationalisierung

  • Markierung von Kommentaren („meint“, „so X“)
  • Prognosen vs. Tatsachen
  • Konjunktiv-Disziplin

Eigene Dimension, weil die deutsche Nachrichten-Sprache Bewertung und Beobachtung syntaktisch besonders eng verschränkt (Substantivierung, Modalverben, Konjunktiv I/II) — die englische BABE-Annotation deckt das nur indirekt ab.

Vollständigkeit

Media Bias Taxonomy (Spinde et al. 2023) · Spin/Omission

Was wird ausgelassen? Welche relevanten Hintergründe oder Gegenpositionen fehlen?

Operationalisierung

  • Erkennbar fehlende Gegenpositionen zu zentralen Behauptungen
  • Einseitige Faktenauswahl (Cherry-Picking)
  • Kontextlücken, die die Einordnung verzerren

Auslassungs-/Spin-Bias ist im Buch teils reporting-level (was über mehrere Artikel hinweg fehlt). Klyptra bewertet die im Einzeltext erkennbaren Lücken; die artikelübergreifende Ebene ist Tier-2.

Emotionale Balance

Media Bias Taxonomy (Spinde et al. 2023) · Phrasing/Sentiment

Wie stark wird emotional aufgeladen? Sensations- oder Empörungs-Sprache?

Operationalisierung

  • Ausrufezeichen-Dichte in Headline und Lead
  • Eskalations-Vokabular („Skandal“, „Beben“, „Wahnsinn“)
  • Adjektiv-Intensität

27 Sub-Kategorien

Unter jeder Dimension liegt ein konkretes Muster.

Die sechs Dimensionen sind die Top-Level-Achsen. Darunter führt Klyptra 27 spezifische Bias-Muster nach der BiasScanner-Taxonomie (Menzner & Leidner 2024). Pro Artikel werden 0–N Muster identifiziert — jedes mit Verbatim-Beleg, Position im Text und Stärke-Einschätzung.

Sub-Kategorien sind qualitative Marker, keine numerischen Sub-Scores. Wenn die Top-Dimension etwa „Vollständigkeit“ niedrig bewertet ist, zeigt der Sub-Layer welches konkrete Muster den Befund trägt — z.B. Cherry-Picking oder Whataboutism.

Wortwahl

word_choice
4 Muster

Lexikalische Ebene — Wörter, die werten, ohne die Wertung als solche zu markieren.

  • Wortwahl-Bias

    Word Choice Bias

    Beispiel„Migrant“ wird durchgängig als „Eindringling“ bezeichnet.

  • Emotionaler Sensationalismus

    Emotional Sensationalism

    Beispiel„Albtraum-Szenario“, „Schock-Diagnose“, „Untergangs-Stimmung“ als Routine-Vokabel.

  • Diskriminierungs-Bias

    Discrimination Bias

    BeispielGeneralisierung über Gruppen („typisch für …-Migranten“), Herkunfts-Erwähnung ohne Relevanz.

  • Schmutzkampagne / Lobeshymne

    Smear / Praise Bias

    Beispiel„skandalöser Versuch“ für die eine Partei vs. „mutige Initiative“ für die andere — bei gleichartiger Handlung.

Framing

framing
6 Muster

Narrative Konstrukte — wie ein Sachverhalt erzählerisch gerahmt wird, unabhängig von einzelnen Wörtern.

  • Strohmann

    Straw Man

    Beispiel„Die Linke will, dass alle Migranten sofort ein Haus bekommen.“ Eine Karikatur der Gegenposition wird angegriffen.

  • Falsche Dichotomie

    False Dichotomy

    Beispiel„Entweder wir senken Steuern — oder das Land geht unter.“ Zwei Optionen suggeriert, wo viele existieren.

  • Falsche Analogie

    False Analogy

    Beispiel„Wie damals 1933 …“ für eine aktuelle politische Debatte mit losem Bezug.

  • Suggestivfragen

    Insinuative Questioning

    Beispiel„Warum schweigt der Kanzler zu den Vorwürfen?“ — ohne dass die Vorwürfe selbst belegt sind.

  • Verschobener Maßstab

    Moving Goalposts

    Beispiel„Erwartet waren 5 % Wachstum, jetzt sind es 8 % — also Misserfolg.“ Maßstab nach Resultat angepasst.

  • Intergruppen-Bias

    In-Group / Out-Group Bias

    BeispielKonsequente „wir Deutschen“ vs. „die“ — kollektive Schuld- oder Tugend-Zuweisung.

Quellenvielfalt

source_diversity
3 Muster

Quellen-Qualität — wer kommt zu Wort, wie wird zitiert, sind die Stimmen einordbar.

  • Quellen-Auswahl-Bias

    Source Selection Bias

    BeispielNur die Pressestelle einer Partei wird zitiert, die Gegenseite gar nicht oder nur paraphrasiert.

  • Externe Validierung

    External Validation Bias

    BeispielEin Lobby-Vertreter wird als „unabhängiger Experte“ eingeführt, ohne Interessenslage zu nennen.

  • Unklare Zuschreibung

    Vague Attribution

    Beispiel„Kreise berichten …“, „Insider zufolge …“ tragen das zentrale Argument des Stücks.

Fakt-Meinung-Trennung

fact_opinion_separation
5 Muster

Sprachliche Disziplin — wird Bewertung als Bewertung markiert oder als Faktum verkauft.

  • Meinungsstark

    Opinionated Bias

    Beispiel„Die katastrophale Politik der Regierung …“ — wertendes Adjektiv im Nachrichten-Modus.

  • Spekulation

    Speculation Bias

    Beispiel„Das wird zweifellos in einem Desaster enden.“ Prognose ohne Konjunktiv, ohne Quelle.

  • Unbewiesene Behauptung

    Unsubstantiated Claims

    Beispiel„Millionen sind betroffen“ — Zahl ohne Beleg, ohne Quelle, ohne Methode.

  • Projektion

    Projection Bias

    Beispiel„Es geht ihnen nur um Macht.“ Motiv-Zuschreibung als Tatsachenbehauptung.

  • Zirkelschluss

    Circular Reasoning

    Beispiel„Es ist illegal, weil es gegen das Gesetz verstößt.“ Begründung wiederholt die Behauptung.

Vollständigkeit

completeness
4 Muster

Was fehlt — relevante Kontexte, Gegenargumente, Belege, die nicht erwähnt werden.

  • Rosinenpickerei

    Cherry-Picking

    BeispielEine Studie wird zitiert, drei methodisch vergleichbare Studien mit gegenteiligem Ergebnis nicht.

  • Anekdotische Evidenz

    Anecdotal Evidence

    Beispiel„Frau M. aus Hamburg sagt …“ trägt einen Trend-Befund, statistische Daten fehlen.

  • Whataboutism

    Whataboutism

    BeispielKonsequente Ablenkung vom Hauptvorwurf auf das Verhalten anderer Akteure.

  • Falsche Ausgewogenheit

    False Balance

    BeispielKlimaforscher und Klimaleugner werden als gleichwertige Stimmen präsentiert — obwohl die Evidenzbasis asymmetrisch ist.

Emotionale Balance

emotional_balance
5 Muster

Affektive Aufladung — wie stark und in welche Richtung der Text emotional färbt.

  • Ad Hominem

    Ad Hominem

    Beispiel„Der inkompetente Minister …“ — Person attackiert statt Argument widerlegt.

  • Kausales Missverständnis

    Causal Misunderstanding

    Beispiel„Seit X regiert, sinkt Y — also schuld X.“ Korrelation als Kausalität, ohne Mechanismus.

  • Verallgemeinerung

    Generalization

    Beispiel„Alle Politiker lügen“, „die Medien“ als monolithischer Akteur.

  • Kommerzieller Bias

    Commercial Bias

    BeispielProduktbericht ohne Distanz, redaktioneller Inhalt nicht von Werbung getrennt.

  • Politischer Bias

    Political Bias

    BeispielKonsistente Lager-Tendenz über Faktenauswahl, Wortwahl und Quellen hinweg.

Jeder Sub-Befund durchläuft dasselbe Verbatim-Gate wie die Top-Level-Analyse: Befunde ohne im Originaltext belegbares Zitat werden verworfen. Im JSON-Export einer Analyse findet sich der Layer als sub_categories[] mit parent_dimension, verbatim_quote, char_offset und bias_strength.

Akteurs-Analyse — PFA-light

Wer wird wie ins Licht gerückt?

Person-Oriented Framing Analysis (Felix Hamborg 2023) extrahiert pro Artikel die benannten Akteure und beschreibt, wie über sie geredet wird. Das ist konkreter als jeder holistische Score — und macht systematische Asymmetrien zwischen Akteuren sichtbar.

Pro Akteur

Jede identifizierte Person (Politiker, Wissenschaftler, Bürger, …) bekommt vier Felder:

  • mentions_count

    Wie oft tritt der Akteur auf — über alle Bezeichnungen hinweg (siehe Coreference).

  • sentiment_score

    Aggregierte Tonalität gegenüber dem Akteur auf der Skala −1 (negativ) bis +1 (positiv).

  • framing_devices

    Bis zu fünf wiederkehrende Stilmittel pro Akteur — z.B. „Schuld-Zuschreibung“, „Held-Narrativ“, „Opfer-Inszenierung“.

  • representative_quotes

    Drei bis fünf Verbatim-Zitate, die das Framing tragen — Verbatim-Gate stellt sicher, dass jedes Zitat 1:1 im Text steht.

Cross-Person-Analyse

Aus den Einzel-Akteuren wird eine Verteilungs-Beobachtung errechnet — ob der Artikel die Personen sprachlich vergleichbar behandelt oder nicht.

sentiment_disparity

Differenz zwischen dem positivsten und negativsten Akteur-Sentiment im Artikel — berechnet über alle Akteure mit mentions_count ≥ 2.

disparity = max(sentiments) − min(sentiments)

balance_assessment

Qualitative Einordnung der Disparität: ausgewogen / leicht_asymmetrisch / stark_asymmetrisch. Bei < 2 Akteuren mit hinreichend Mentions liefert das Feld nicht_anwendbar — statt einen Wert zu erfinden.

Aggregation aus Modellen

cross_person_analysis wird nicht vom Sprachmodell übernommen, sondern deterministisch neu berechnet aus den gefilterten Akteur-Daten. Damit ist die Disparitäts-Kennzahl immer konsistent mit den ausgewiesenen Sentiment-Werten — auch wenn das Modell intern abweichend zusammenfassen würde.

Coreference-Dokumentation

Dieselbe Person, drei Namen.

Politische Texte referenzieren dieselbe Entität auf mehreren Wegen — mit Namen, mit Rolle, mit Pronomen. Klyptra dokumentiert diese Querverweise explizit, damit Mention-Counts und Akteurs-Sentiment nicht durch reine Synonymie verzerrt werden.

Was passiert

Pro Artikel wird eine Liste coreference_documentation.entities[] ausgewiesen. Jede Entity hat einen canonical_name und eine Liste aller im Text gefundenen all_mentions[].

mention_count wird anschließend deterministisch als Summe nicht-überlappender Substring-Treffer aller Mentions im Text neu berechnet — nicht vom Sprachmodell übernommen.

Beispiel

In einem Bericht zur Ukraine-Politik:

canonical_name

Wolodymyr Selenskyj

all_mentions

  • „Selenskyj“
  • „der ukrainische Präsident“
  • „der Staatschef in Kiew“

mention_count

7

Ohne diese Auflösung würde der Akteur in drei verschiedenen Buckets landen — und die Sentiment-Aggregation in der PFA-Schicht würde verzerrt.

Pipeline

Vom eingereichten Text zum belegten Ergebnis.

Jeder Schritt ist isoliert testbar und protokolliert. Wer ein Ergebnis hinterfragt, kann die Kette bis zur einzelnen Belegstelle im Text zurückverfolgen.

01

Eingabe

Eingereichter Text

Der zu prüfende Artikel-Text wird direkt eingereicht (Einfügen oder Datei) — optional mit Titel und Quellen-Label. Klyptra analysiert genau diesen Text, nicht das Medium dahinter.

200–50 000 ZeichenTitel optionalQuelle optional
02

Ensemble-Analyse

3 Modelle parallel

Drei Sprachmodelle bewerten denselben Text unabhängig auf alle sechs Dimensionen und extrahieren parallel die Detail-Schichten: Sub-Kategorien-Befunde, Akteurs-Mentions mit Sentiment und Coreference-Cluster. Eine Chain-of-Verification (5 Kontroll-Fragen) reduziert Halluzinationen.

gpt-5.4-minimistral-large-2512deepseek-v4-flash
03

Aggregation

Median + Übereinstimmung

Numerische Scores: Median über die drei Modelle. Labels: Mehrheitsentscheid. Die Spannweite der Einzelurteile wird je Dimension als Modell-Übereinstimmung ausgewiesen — sie bleibt sichtbar, statt im Mittelwert zu verschwinden.

MedianMajority VoteÜbereinstimmungs-Ausweis
04

Verbatim-Gate & Markup

Belege wörtlich geprüft

Jeder Befund muss ein Zitat tragen, das exakt im Originaltext steht — sonst wird der Beleg verworfen (die Einschätzung bleibt als modellbasiert markiert). Verifizierte Belege werden mit Zeichen-Offset im Text hervorgehoben. Ergebnis ist ein Permalink mit 30 Tagen TTL.

exakter String-Matchchar_offset-MarkupPermalink 30 Tage

Ein Analyzer, zwei Verwendungen

Derselbe Analyzer-Code läuft in zwei Kontexten:

  • On-Demand (über /analyse): die eigentliche Analyse eines eingereichten Textes — mit Permalink, 30 Tage TTL.
  • Referenz-Korpus (intern): ein laufend mitanalysierter Korpus dient ausschließlich der Kalibrierung der Skala. Er erzeugt keine öffentlichen Outlet-Profile und fließt nicht in einzelne Nutzer-Analysen ein.

Ensemble

Drei Modelle, weil keines allein vertrauenswürdig ist.

Sprachmodelle haben eigene, modell-spezifische Verzerrungen. Klyptra wählt drei Modelle aus drei verschiedenen Pre-Training-Pipelines, damit blinde Flecken eines einzelnen Modells durch die anderen sichtbar werden. Aggregiert wird per Median (numerisch) und Majority Vote (Labels) — alle Modelle haben gleiches Gewicht, keines wird bevorzugt.

GPT-5.4 mini

OpenAI (USA)

Schlanke, latenzarme Variante der GPT-5.4-Reihe — trägt die On-Demand-Analyse, ohne die Score-Konsistenz der großen Modelle aufzugeben.

Mistral Large 2512

Mistral AI (Frankreich / EU)

Europäische Pre-Training-Pipeline eines unabhängigen Anbieters — bringt eine andere Trainingsgrundlage als die US-Modelle ein.

DeepSeek V4 Flash

DeepSeek (China)

Drittes, davon unabhängiges Pre-Training-Korpus — weicht dieses Modell vom Konsens ab, wird die Streuung als Modell-Übereinstimmung sichtbar.

Aggregation

Numerische Scores

Median über alle 3 Modelle. Robust gegen Ausreißer eines einzelnen Modells.

Kategorische Labels

Majority Vote. Bei 1:1:1-Split fällt das Label zurück auf den median-nahen Score.

Modell-Übereinstimmung

Die Spannweite der drei Urteile wird je Dimension als hohe, mittlere oder geringe Übereinstimmung ausgewiesen — getrennt von der Konfidenz des Modells.

Wissenschaftliche Grundlagen

Peer-reviewed Fundament, eine Methodik.

Klyptra ist keine Eigenkonstruktion. Jede methodische Schicht referenziert eine peer-reviewed Quelle mit DOI. Die Differenzierung gegenüber BiasScanner (unserem direkten Vorgänger) liegt im Drei-Modell-Ensemble, der deutschen Sprach-Spezialisierung, dem Verbatim-Gate und dem PFA-Layer.

Konzept & 6 Dimensionen

Spinde et al. (2023) — Media Bias Taxonomy

Die sechs Dimensionen operationalisieren die Bias-Typen der Media Bias Taxonomy. BABE (Spinde et al. 2021, EMNLP-Findings) dient als experten-annotierter Validierungs-Benchmark (binär biased/neutral) und IRR-Maßstab — die 0–10-Skala selbst ist Klyptras Operationalisierung, nicht Teil von BABE.

Spinde et al. (2023) Media Bias Taxonomy, ACM Comput. Surv., arXiv:2312.16148 · BABE: EMNLP-Findings 2021, DOI: 10.18653/v1/2021.findings-emnlp.101 · konsolidiert in Spinde (2025), Springer, Open Access, DOI: 10.1007/978-3-658-47798-1

→ 6 Dimensionen

27 Sub-Muster

Menzner & Leidner (2024) — BiasScanner-Taxonomie

Die 27 spezifischen Bias-Kategorien werden als Sub-Layer unter die sechs Klyptra-Dimensionen eingeordnet. BiasScanner ist Klyptras direkter wissenschaftlicher Vorgänger. Nicht Teil von Spindes Arbeiten — eigenständige Grundlage.

Menzner & Leidner (2024) „Improved Models for Media Bias Detection and Subcategorization“, NLDB 2024, S. 181–196. DOI: 10.1007/978-3-031-70239-6_13

→ 27 Sub-Muster

Akteurs-Layer

Felix Hamborg (2023) — Person-Oriented Framing Analysis

PFA-light extrahiert benannte Akteure mit Mention-Counts, Sentiment und Framing-Devices. Die Cross-Person-Disparity macht systematische Asymmetrien sichtbar.

Hamborg (2023) „Revealing Media Bias in News Articles“, Springer. DOI: 10.1007/978-3-031-17693-7

→ PFA-Sektion

Grenzen

Was Klyptra nicht leistet.

Methodische Ehrlichkeit verlangt, die Schwachstellen zu benennen. Diese Liste ist nicht abschließend — Beiträge sind willkommen.

LLMs als Annotatoren

Sprachmodelle haben dokumentierte Verzerrungen (Horych et al. 2025). Ensemble + Verbatim-Pflicht reduzieren das, beseitigen es aber nicht. Klyptra ist kein Schiedsrichter — sondern ein systematischer, überprüfbarer Indikator.

Momentaufnahme eines Textes

Klyptra bewertet genau den eingereichten Text — nicht das Medium, die Redaktion oder den Autor dahinter. Ein einzelnes Ergebnis ist kein Urteil über ein Outlet; aus einer Analyse lässt sich keine generelle „Tendenz“ einer Quelle ableiten.

Sprachebene, nicht Faktentreue

Klyptra misst Sprache und Framing — nicht ob behauptete Fakten stimmen. Faktencheck ist eine separate Aufgabe (siehe Correctiv, dpa-Faktencheck).

Belege ohne wörtliche Deckung werden verworfen

Das Verbatim-Gate hält nur Zitate, die exakt im Text stehen. Paraphrasen werden nicht als Beleg ausgegeben — manche Dimensionen erscheinen daher bewusst ohne Beleg-Zitat und sind als modellbasierte Einschätzung markiert. Ehrlichkeit vor erzwungenem Beleg.

Detail-Schichten noch nicht ensemble-aggregiert

Die sechs Top-Level-Scores werden über alle drei Modelle aggregiert (Median) und mit ihrer Streuung ausgewiesen. Die Detail-Schichten (Sub-Kategorien, Akteurs-Analyse, Coreference) stammen derzeit aus einem der drei Modelle — eine echte Union/Dedupe-Aggregation über alle Modelle ist als nächste Ausbaustufe geplant. Bewusste MVP-Entscheidung, kein Bug.

Deutsche Sprach-Spezialisierung

Die drei Modelle sind primär englischsprachig vortrainiert. Idiomatik, Konjunktiv-Disziplin und Ironie-Erkennung können im Deutschen dünner ausfallen als im Englischen. Few-Shot-Beispiele kompensieren teilweise; eine systematische deutsche Ground-Truth-Evaluation ist Forschungs-Roadmap.

Genre-Bias: Kommentare als Nachrichten

Die sechs Dimensionen sind auf nachrichtliche Berichterstattung kalibriert. Kommt ein Kommentar als Eingabe, schlagen Wortwahl und Emotionale Balance erwartungsgemäß stark aus — Klyptra erkennt heute noch nicht zuverlässig, ob ein Text als Bericht oder Kommentar einzuordnen ist. Eine Genre-Erkennung als Pre-Stage ist in der Methodik-Roadmap dokumentiert.

Bias-Annotation ist konstitutiv subjektiv

Selbst trainierte Experten erreichen bei Bias-Labels nur eine Übereinstimmung von Krippendorff α ≈ 0,40 (Spinde 2025, Kap. 4) — das ist das dokumentierte Maximum der Domäne, kein Schwäche-Signal. Einen starken „Ground Truth“ gibt es nicht; Klyptras Konsistenz-Anspruch zielt auf dieses Experten-Niveau, nicht auf objektive Wahrheit.

Technisch messbar ist nicht gesellschaftlich relevant

Automatisierte Verfahren können Muster ausweisen, die statistisch greifbar, aber inhaltlich belanglos sind (Spinde 2025, Kap. 8). Ein Score ist ein systematischer Indikator, kein abschließendes Urteil über die Bedeutung eines Textes.

Der eigene Standpunkt färbt die Wahrnehmung

Leser empfinden Texte, die ihrer Position widersprechen, als verzerrter als vergleichbare Texte der eigenen Seite (Hostile-Media-Effekt). Studien zeigen, dass selbst Bias-Visualisierungen diesen Effekt nicht auflösen (Spinde 2025, Kap. 7) — ein Ergebnis wird durch die eigene Haltung gefiltert gelesen.

Politische Einordnung ist keine Bias-Aussage

Spinde (2025, Kap. 7) zeigt, dass eine politische Klassifikation die Bias-Wahrnehmung nicht erhöht — sie kommuniziert Haltung, nicht Verzerrung. Klyptras politische, wirtschaftliche und soziale Deskriptoren sind Tendenz-Indikation und fließen nicht in den Objektivitäts-Score ein.

Versions-Historie

Wann sich was geändert hat.

Jede einzelne Analyse trägt einen methodology_version-Tag. Bestehende Analysen behalten ihre Version — Methodik-Updates erzeugen keinen Score-Drift in historischen Daten.

v1.0
April 2026
6 Top-Level-Dimensionen + Verbatim-Quote-Gate + Multi-Modell-Ensemble. Wissenschaftliche Basis: Media Bias Taxonomy (Spinde et al. 2023), validiert gegen BABE (2021).
v1.1
Mai 2026
Zusätzlich: 27 Bias-Sub-Kategorien (BiasScanner), Person-Oriented Framing Analysis (PFA-light nach Felix Hamborg), Coreference-Dokumentation. Bestehende v1.0-Analysen bleiben gültig — neue Layer sind additiv.

Reproduzierbarkeit

Methodik, Daten, Prompts.

Klyptra legt seine Methodik offen: Modellversionen, Bias-Dimensionen und die zugrunde liegende Forschung sind auf dieser Seite dokumentiert. Jede Analyse trägt zudem eine Signatur (System-Prompt-Hash), die ihren exakten Methodik-Stand nachvollziehbar festhält.

Methodik

Bias-Dimensionen, Skala und Aggregationslogik sind auf dieser Seite vollständig beschrieben.

Daten

Jede Analyse ist als JSON und PDF für die Erstellerin oder den Ersteller exportierbar.

Prompts

Versionierte Prompt-Templates inkl. Few-Shot-Beispielen. Diff-Log für jede Änderung.