LLM Visibility: KI-Sichtbarkeit messen & steuern
Zuletzt aktualisiert am 31. Mai 2026 um 22:30 Uhr.LLM Visibility beschreibt, wie oft und in welchem Kontext eine Marke in Antworten von Large Language Models wie ChatGPT, Perplexity oder Gemini erscheint. Wer diese Messgröße 2026 nicht im Blick hat, verliert systematisch Reichweite, ohne es in klassischen Dashboards zu bemerken.
Warum Marken in KI-Antworten unsichtbar werden
Die Ausgangslage: Der organische Traffic sinkt seit Monaten, aber die Google-Rankings sehen stabil aus. Gleichzeitig tauchen Wettbewerber in ChatGPT-Antworten auf, wenn potenzielle Kunden nach Lösungen fragen. Laut einer Gartner-Prognose aus 2024 wird das traditionelle Suchvolumen bis 2026 um 25 % zurückgehen. Bis 2028 rechnet Gartner mit einem Rückgang des organischen Traffics um mehr als 50 %.1 Das ist kein fernes Szenario, sondern eine Entwicklung, die bereits messbar stattfindet.
McKinsey beziffert den Anteil der Konsumenten, die bereits KI-gestützte Suche nutzen, auf 50 %. Bis 2028 sollen 750 Milliarden US-Dollar Umsatz durch AI Search beeinflusst werden. Gleichzeitig tracken nur 16 % der Marken systematisch ihre KI-Sichtbarkeit.2 Die Lücke zwischen Nutzerverhalten und Markenreaktion ist enorm. LLM Visibility ist 2026 das, was Google-Rankings vor zehn Jahren waren: der zentrale Indikator dafür, ob eine Marke im digitalen Entscheidungsprozess überhaupt vorkommt.
Warum klassisches SEO-Ranking keine Garantie mehr bietet
Eine Ahrefs-Studie mit 15.000 Prompts zeigt: Nur 12 % der URLs, die von ChatGPT, Gemini und Copilot zitiert werden, erscheinen gleichzeitig in Googles Top 10 für die ursprüngliche Anfrage. 80 % der KI-Zitationen ranken in Google überhaupt nicht für den jeweiligen Prompt.3 Das bedeutet konkret: Eine Seite kann auf Position eins bei Google stehen und trotzdem in keiner einzigen KI-Antwort vorkommen.
Der Grund liegt im Funktionsprinzip der KI-Suche. Statt einer einzelnen Suchanfrage nutzen KI-Assistenten sogenanntes „Query Fan-Out". Sie zerlegen eine Nutzerfrage in mehrere Teilfragen, durchsuchen verschiedene Quellen parallel und fusionieren die Ergebnisse. Dabei greifen sie auf ein deutlich breiteres Quellenspektrum zurück als der klassische Google-Index. Wer ausschließlich SEO-Rankings misst, hat einen blinden Fleck in der Markenwahrnehmung. Die KI-Sichtbarkeit messen zu können, ist keine optionale Erweiterung des Reportings, sondern eine Grundvoraussetzung für fundierte Marketing-Entscheidungen.
Was die zentralen Begriffe rund um KI-Sichtbarkeit bedeuten
LLM Visibility ist die Messgröße dafür, wie oft und in welchem Kontext eine Marke in Antworten von Large Language Models erscheint. Erfasst werden Nennungen über ChatGPT, Perplexity, Gemini, Claude und Copilot hinweg. Die Metrik unterscheidet sich grundlegend von klassischer SEO Visibility, weil sie nicht auf Rankings basiert, sondern auf tatsächlichen Zitationen in generierten Antworten.
Share of Voice in AI bezeichnet den prozentualen Anteil der eigenen Markennennungen im Verhältnis zu allen Markennennungen innerhalb einer definierten Kategorie über KI-Plattformen hinweg. Wenn in einer Produktkategorie zehn Marken genannt werden und die eigene Marke in 30 % aller Antworten vorkommt, beträgt der Share of Voice 30 %. Diese Kennzahl macht Wettbewerbsvergleiche möglich, die über einzelne Plattformen hinausgehen.
Generative Search Analytics umfasst die systematische Auswertung von Zitationen, Sentiment und Kontext in generativen Suchergebnissen. Anders als bei klassischen Web-Analytics geht es nicht um Klicks und Impressions, sondern um die Frage: In welchem Zusammenhang wird die Marke genannt, und wie wird sie bewertet?4
Wie AI Reputation Management und plattformspezifisches Monitoring zusammenhängen
AI Reputation Management beschreibt die aktive Steuerung der Markenwahrnehmung in KI-generierten Antworten. Das geschieht durch gezielte Content-Optimierung, Quellenarbeit und den Aufbau konsistenter Entity-Signale. Wenn ein LLM eine Marke in negativem Kontext nennt oder gar nicht erwähnt, lässt sich das durch systematische Maßnahmen beeinflussen.
ChatGPT Brand Monitoring und Perplexity Tracking sind plattformspezifische Varianten des übergreifenden AI Mention Tracking. Sie erfassen, wie eine Marke in den Antworten einer bestimmten KI-Anwendung dargestellt wird. Da jedes Modell unterschiedliche Quellen und Gewichtungen nutzt, können die Ergebnisse zwischen Plattformen erheblich variieren. Ein Beispiel: Eine B2B-Marke kann in Perplexity-Antworten regelmäßig zitiert werden, in ChatGPT aber vollständig fehlen, weil die Trainings- und Retrieval-Quellen unterschiedlich sind.
Wie KI-Modelle entscheiden, welche Marke genannt wird
Ein Large Language Model funktioniert wie ein Journalist, der aus hunderten Quellen eine Empfehlung destilliert. Wer in keiner dieser Quellen vorkommt, wird nicht zitiert. Das klingt simpel, hat aber weitreichende Konsequenzen für die Content-Strategie.
Technisch läuft der Prozess in drei Schritten ab. Erstens: Query Fan-Out. Das Modell zerlegt eine Nutzerfrage in mehrere Teilfragen und durchsucht verschiedene Quellen parallel. Zweitens: Reciprocal Rank Fusion. Die Ergebnisse aus verschiedenen Quellen werden zusammengeführt und nach Relevanz gewichtet. Drittens: Entity Recognition. Das Modell identifiziert Marken, Produkte und Organisationen als eigenständige Entitäten und ordnet ihnen Attribute zu.
Laut McKinsey machen eigene Websites nur 5 bis 10 % der Quellen aus, die AI Search referenziert.2 Die restlichen 90 bis 95 % stammen aus Drittquellen: Fachmedien, Foren, Bewertungsportale, Affiliate-Seiten, User Generated Content. Eine Ahrefs-Analyse von 75.000 Marken bestätigt: Web Brand Mentions sind der am stärksten korrelierende Faktor (Korrelationskoeffizient 0,664) für Zitationen in AI Overviews.5 Wer nur die eigene Website optimiert, beeinflusst weniger als ein Zehntel der Quellen, die über die KI-Wahrnehmung entscheiden.
Welche Metriken AI Brand Tracking konkret liefert
Die Mention Rate erfasst, wie oft eine Marke in KI-Antworten genannt wird, bezogen auf ein definiertes Set an Prompts. Wenn 100 relevante Fragen gestellt werden und die Marke in 23 Antworten erscheint, beträgt die Mention Rate 23 %. Die Citation Rate geht einen Schritt weiter: Sie misst, wie oft das Modell auf eigene Inhalte verlinkt oder sie als Quelle benennt.
Der Sentiment Score zeigt, in welchem Kontext die Marke genannt wird. Positiv, negativ oder neutral. Ein Beispiel: Eine Marke kann eine hohe Mention Rate haben, aber überwiegend in Warnungen oder negativen Vergleichen auftauchen. Ohne Sentiment-Analyse bleibt das unsichtbar. Der Competitor Share of Voice setzt die eigene Mention Rate ins Verhältnis zum Wettbewerb. Und die Prompt Coverage zeigt, bei welchen Fragestellungen die Marke erscheint und bei welchen nicht. Gerade die Lücken sind strategisch wertvoll: Sie zeigen, wo Content fehlt oder wo Wettbewerber dominieren.
In fünf Schritten zum systematischen AI Mention Tracking
Schritt 1: Relevante Prompts definieren. Was fragen potenzielle Kunden in ChatGPT, Perplexity oder Gemini, wenn sie nach Lösungen in Ihrer Kategorie suchen? Sammeln Sie 50 bis 100 Prompts gemeinsam mit dem Marketing-Team und dem Vertrieb. Zeitaufwand: ein bis zwei Tage. Beispiel: Ein Hersteller von Industrieventilen sammelt Fragen wie „Welcher Hersteller bietet die zuverlässigsten Absperrventile für Hochdruckanwendungen?" oder „Vergleich Marke A vs. Marke B für chemische Prozesse".
Schritt 2: Tool auswählen. Dedizierte Plattformen für AI Brand Tracking sind Otterly.ai (trackt Mentions über ChatGPT, Perplexity und Google AI Overviews6), Profound (deckt acht KI-Engines ab, inklusive Claude und Copilot7) sowie Ahrefs Brand Radar und SE Ranking Visible. Planen Sie eine Woche für die Evaluation ein. Entscheidungskriterien: Anzahl der abgedeckten LLMs, Frequenz der Messungen, Wettbewerber-Benchmarking und Exportmöglichkeiten.
Schritt 3: Baseline messen. Erfassen Sie die aktuelle Mention Rate, den Share of Voice und das Sentiment über alle relevanten LLMs. Dieser initiale Messzeitraum sollte zwei bis vier Wochen umfassen, um Schwankungen auszugleichen. Ohne Baseline lässt sich kein Fortschritt belegen.
Schritt 4: Content-Lücken identifizieren. Wo fehlt die Marke? Bei welchen Prompts dominieren Wettbewerber? Welche Drittquellen zitieren die Konkurrenz, aber nicht Sie? Diese Analyse leitet sich direkt aus den Monitoring-Daten ab und bildet die Grundlage für gezielte Maßnahmen.
Schritt 5: GEO-Maßnahmen priorisieren. Generative Engine Optimization (GEO) umfasst drei Hebel: Drittquellen stärken (Fachmedien, Foren, Bewertungsportale systematisch bespielen), eigene Inhalte LLM-optimieren (klare Entitäten, strukturierte Daten, zitierfähige Aussagen) und Entity-Signale ausbauen (konsistente Markeninformationen über alle digitalen Touchpoints). Quartalsweise Review der Ergebnisse.
Vertiefende Informationen zur Generative Engine Optimization finden Sie in unserem Beitrag zur GEO-Strategie für B2B-Marken.Fünf Fehler, die Marketing-Teams bei der KI-Sichtbarkeit machen
Fehler 1: Nur Google-Rankings tracken und AI Search ignorieren. Viele Teams verlassen sich auf bestehende SEO-Dashboards und übersehen, dass KI-Antworten ein eigenständiger Kanal mit eigener Logik sind. Die Alternative: Paralleles Monitoring mit dedizierten AI SEO Tools wie Otterly oder Profound, die speziell für die Erfassung von Brand Mentions in AI entwickelt wurden.
Fehler 2: Die eigene Website als einzige Quelle optimieren. Da 90 bis 95 % der KI-Quellen extern sind, reicht Onsite-Optimierung nicht aus. Die Alternative: Drittquellen systematisch bespielen. Fachartikel in Branchenmedien platzieren, in relevanten Foren präsent sein, Bewertungsportale aktiv pflegen. Ein Edge Case: Für regulierte Branchen (Pharma, Medizintechnik) sind Fachpublikationen und offizielle Datenbanken die primären Drittquellen, nicht Foren.
Fehler 3: Einmalige Messung statt kontinuierlichem Tracking. KI-Modelle werden regelmäßig aktualisiert, Quellen ändern sich, Wettbewerber optimieren. Eine Momentaufnahme veraltet innerhalb weniger Wochen. Die Alternative: Monatliches Reporting als festen Bestandteil des Marketing-Reportings etablieren, idealerweise mit automatisierten Alerts bei signifikanten Veränderungen.
Fehler 4: Sentiment ignorieren. Eine hohe Mention Rate ist wertlos, wenn die Marke überwiegend in negativem Kontext erscheint. Die Alternative: Nicht nur Häufigkeit, sondern Kontext und Tonalität der Nennungen auswerten. Tools wie Profound liefern Sentiment-Scores auf Prompt-Ebene.
Fehler 5: Kein Wettbewerbs-Benchmarking. Absolute Zahlen ohne Vergleichswerte sind schwer interpretierbar. Ob 25 % Mention Rate gut oder schlecht ist, hängt davon ab, wo der Wettbewerb steht. Die Alternative: Share of Voice in AI immer relativ zum Wettbewerb messen und quartalsweise Veränderungen dokumentieren.
Wie KI-Sichtbarkeit zum festen Bestandteil des Marketing-Reportings wird
Der logische nächste Schritt: LLM Visibility als KPI neben SEO Visibility, Social Share of Voice und PR-Metriken integrieren. Das erfordert keine neue Reporting-Infrastruktur, sondern eine Erweiterung bestehender Dashboards um die Daten aus dem AI Mention Tracking. Konkret bedeutet das: monatliche Erfassung der Mention Rate, des Sentiment Scores und des Competitor Share of Voice, quartalsweise Ableitung von Maßnahmen.
Quartals-OKRs mit konkreten Zielen machen den Fortschritt steuerbar. Ein Beispiel: „+10 Share-of-Voice-Punkte in Q3 durch gezielte Platzierung in drei Fachmedien und Optimierung der Entity-Signale auf der Website." Solche Ziele sind messbar, terminiert und direkt an Maßnahmen gekoppelt.
Marken, die ihre KI-Sichtbarkeit heute nicht systematisch erfassen, treffen morgen Entscheidungen auf Basis unvollständiger Daten. Die Frage ist nicht, ob AI Search relevant wird, sondern wie schnell das eigene Reporting diese Realität abbildet.
Die Perspektive geht über Sichtbarkeit hinaus: AI Agents werden künftig eigenständig Kaufentscheidungen vorbereiten und in manchen Fällen autonom treffen. Wer in der KI-Wahrnehmung nicht präsent ist, verliert nicht nur Reichweite, sondern direkt Umsatz. Die Grundlage dafür, in diesem neuen Entscheidungsumfeld stattzufinden, wird jetzt gelegt: durch konsistentes AI Brand Tracking, durch den Aufbau starker Entity-Signale und durch eine Content-Strategie, die Drittquellen ebenso ernst nimmt wie die eigene Website.
Wenn Sie tiefer in die operative Umsetzung einsteigen möchten, empfehlen wir unsere Beiträge zu Content-Optimierung für KI-Modelle und Entity-Building für B2B-Marken.1 Gartner Research (2024): Search Engine Volume Will Drop 25% by 2026 Due to AI Chatbots and Other Virtual Agents. URL: https://www.gartner.com/en/newsroom/press-releases/2024-02-19-gartner-predicts-search-engine-volume-will-drop-25-percent-by-2026-due-to-ai-chatbots-and-other-virtual-agents (Zugriff am 28.05.2026).
2 McKinsey & Company (2025): New Front Door to the Internet: Winning in the Age of AI Search. Autoren: Elizabeth Silliman, Julien Boudet, Kelsey Robinson / McKinsey Growth, Marketing & Sales Practice. URL: https://www.mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/new-front-door-to-the-internet-winning-in-the-age-of-ai-search (Zugriff am 28.05.2026).
3 Ahrefs (2025): Only 12% of AI Cited URLs Rank in Google's Top 10 for the Original Prompt. Autoren: Louise Linehan, Xibeijia Guan. URL: https://ahrefs.com/blog/ai-search-overlap/ (Zugriff am 28.05.2026).
4 EMARKETER / Insider Intelligence (2026): Generative Engine Optimization in 2026. URL: https://www.emarketer.com/content/generative-engine-optimization-2026 (Zugriff am 28.05.2026).
5 Ahrefs (2025): An Analysis of AI Overview Brand Visibility Factors (75K Brands). Autor: Ahrefs Data Science Team. URL: https://ahrefs.com/blog/ai-overview-brand-correlation/ (Zugriff am 28.05.2026).
6 Otterly.ai (2025/2026): AI Search Monitoring Platform. URL: https://otterly.ai/ (Zugriff am 28.05.2026).
7 Discovered Labs (2025): Profound vs Peec vs Otterly: Which AI Visibility Platform Should You Buy? URL: https://discoveredlabs.com/blog/profound-vs-peec-vs-otterly-which-ai-visibility-platform-should-you-buy (Zugriff am 28.05.2026).
Gerrit Grunert
Gerrit Grunert ist Gründer und CEO von Crispy Content®. 2019 veröffentlichter er das bei Springer Gabler erschienene Standard-Werk "Methodisches Content Marketing" sowie die Online-Kurs-Serie "Making Content". Privat ist Gerrit ein leidenschaftlicher Gitarren-Sammler, liest gern Bücher von Stefan Zweig und hört Musik von vorgestern.