Folge 21: Technische Onpage-GEO (Teil 2) – Discovery und Datenstrukturierung

In der ersten Folge zur technischen Onpage-GEO haben wir uns intensiv mit dem Thema Crawling beschäftigt. Jetzt gehen wir einen Schritt weiter und beleuchten die beiden weiteren zentralen Bereiche: Discovery und Datenstrukturierung.

Während Crawling sicherstellt, dass KI-Systeme überhaupt auf Inhalte zugreifen können, geht es bei Discovery darum, die wichtigsten Inhalte gezielt zu priorisieren. Die Datenstrukturierung wiederum macht Informationen maschinenlesbar – eine Grundvoraussetzung dafür, dass KI-Systeme Inhalte korrekt verstehen und verarbeiten können.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen

Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren

Inhaltsverzeichnis

Rückblick: Die Ziele der technischen Onpage-GEO

Bevor wir in die Details von Discovery und Datenstrukturierung eintauchen, ein kurzer Rückblick auf die übergeordneten Ziele der technischen Onpage-GEO:

Prüfung der technischen Voraussetzungen

Bevor Optimierungsmaßnahmen greifen können, müssen die technischen Grundlagen stimmen. Gibt es Hindernisse, die KI-Systeme daran hindern, Inhalte zu erfassen?

Sicherstellung der Crawling- und Discovery-Fähigkeiten

KI-Systeme müssen Inhalte nicht nur finden (Crawling), sondern auch verstehen können. Strukturierte Daten und semantisches HTML sind hier entscheidend.

Identifikation weiterer technischer Optimierungspotenziale

Über die Basics hinaus gibt es zahlreiche technische Stellschrauben, die die Sichtbarkeit in KI-Systemen beeinflussen – von interner Verlinkung bis zu Shopping-Feeds.

Die drei Bereiche der technischen Onpage-GEO

Die technische Onpage-GEO lässt sich in drei zentrale Bereiche unterteilen:

Crawling

Bereich 1

Wie stellen wir sicher, dass alle für GEO relevanten Inhalte einer Webseite durchsucht und gefunden werden können?

Status: Behandelt in Folge 20

Discovery

Bereich 2

Wie stellen wir sicher, dass wichtige Inhalte präferiert behandelt und als solche erkannt werden?

Status: Heute – Teil 1

Datenstrukturierung

Bereich 3

Wie stellen wir sicher, dass alle relevanten Inhalte maschinenlesbar sind?

Status: Heute – Teil 2

Bereich 2: Discovery – Inhalte gezielt priorisieren

Discovery geht über das reine Auffinden von Inhalten hinaus. Es geht darum, KI-Systemen zu signalisieren, welche Inhalte besonders relevant sind und bevorzugt behandelt werden sollten. Die zentrale Frage lautet: Durch welche Maßnahmen können KI-Bots fokussiert auf relevante Inhalte aufmerksam gemacht werden?

Interne Verlinkung und Seitenarchitektur

Die interne Verlinkung ist eines der mächtigsten Werkzeuge für Discovery. Sie vermittelt KI-Systemen, welche Inhalte im Kontext zueinander stehen und wie relevant einzelne Seiten sind.

Klickwege

Kurze Klickwege signalisieren Wichtigkeit. Inhalte, die mit wenigen Klicks von der Startseite erreichbar sind, werden als relevanter eingestuft.

Navigation

Eine klare, hierarchische Navigation hilft KI-Systemen, die Struktur und thematische Organisation der Website zu verstehen.

Crawling

Gut verlinkte Inhalte werden häufiger gecrawlt. Die interne Verlinkung beeinflusst also direkt die Crawling-Effizienz.

Relevanz

Thematische Nähe durch Verlinkung zeigt KI-Systemen, welche Inhalte zusammengehören und in welchem Kontext sie stehen.

Pillar-Seiten als strukturierendes Element

Ein bewährtes Konzept für die Strukturierung von Inhalten sind Pillar-Seiten. Dabei wird ein Kernthema auf einer zentralen Seite behandelt, von der aus zu spezifischeren Unterthemen verlinkt wird.

Vorteile von Pillar-Seiten:

Klare thematische Hierarchie
Kurze Klickwege zu verwandten Inhalten
Kontextuelle Verlinkung zwischen Unterthemen
Signalisierung von Expertise in einem Themenbereich

User Signals als indirekte GEO-Faktoren

Klassische User Signals wie Klickraten oder Verweildauer spielen auch für GEO eine Rolle – allerdings primär indirekt. Sie beeinflussen vor allem die SEO-Performance, die wiederum Auswirkungen auf GEO hat.

SEO-Relevanz

Bei Retrieval-Augmented Generation (RAG) greifen KI-Systeme auf Suchmaschinen-Indizes zu. Seiten mit guten User Signals ranken besser und werden häufiger als Quelle genutzt.

Nutzer:innen-Engagement

Aktive Communities, positive Bewertungen und rege Diskussionen (z.B. auf Reddit) sind hochgradig relevant für KI-Systeme. User-generated Content signalisiert Vertrauen und Relevanz.

GEO-eigene Metriken

Klicks auf Links, Copy-Paste-Aktionen oder Folgefragen zeigen, wie hilfreich eine KI-generierte Antwort war. Diese Metriken werden zunehmend wichtiger für die Bewertung von Quellen.

Zusammenfassungen für Mensch und Maschine

KI-generierte Zusammenfassungen am Anfang längerer Artikel bieten einen doppelten Nutzen:

Für Menschen: Schneller Überblick, ob der Artikel relevant ist
Für KI-Systeme: Kompakte, gut strukturierte Information, die leicht zitiert werden kann

Solche Zusammenfassungen erhöhen die Wahrscheinlichkeit, dass Inhalte in KI-Antworten aufgegriffen werden.

Discovery – Die wichtigsten Maßnahmen im Überblick

Strukturierte Seitenarchitektur

Nutze Pillar-Seiten und hierarchische Ordnerstrukturen, um thematische Zusammenhänge klar zu kommunizieren.

Kurze Klickwege

Wichtige Inhalte sollten von vielen Seiten verlinkt werden und mit wenigen Klicks erreichbar sein.

User Signals optimieren

Verweildauer, Engagement und Community-Aktivität beeinflussen indirekt die GEO-Performance.

Zusammenfassungen integrieren

Kompakte Zusammenfassungen am Artikelanfang helfen sowohl Menschen als auch KI-Systemen.

Bereich 3: Datenstrukturierung – Inhalte maschinenlesbar machen

Selbst die besten Inhalte nützen wenig, wenn KI-Systeme sie nicht korrekt interpretieren können. Datenstrukturierung macht Informationen maschinenlesbar und schafft eine eindeutige Bedeutungsebene.

Strukturierte Daten (Schema.org)

Strukturierte Daten sind ein gemeinsamer Standard, den Suchmaschinenbetreiber geschaffen haben. Sie ermöglichen es, Informationen so aufzubereiten, dass sie eine eindeutige, maschinenlesbare Bedeutungsebene haben.

Warum sind strukturierte Daten für GEO relevant?

Mit strukturierten Daten können Unternehmen, Produkte, Artikel oder Personen so ausgezeichnet werden, dass KI-Systeme deren Eigenschaften und Zusammenhänge zuverlässig erkennen. Ein Unternehmensname ist nicht einfach nur Text, sondern wird als „Organization“ mit zugehörigen Eigenschaften wie Adresse, Kontaktdaten und Social-Media-Profilen verstanden.

Implementierung strukturierter Daten

Schritt 1

Typen und Eigenschaften wählen

Welche Schema-Typen sind für die Website relevant? Publisher benötigen andere Typen als E-Commerce-Unternehmen.

Schritt 2

JSON-LD erstellen

Das bevorzugte Format ist JSON-LD. Es wird von Google empfohlen und ist am einfachsten zu implementieren.

Schritt 3

Markup validieren

Tools wie schema.org oder der Rich Results Test von Google helfen bei der Validierung.

Schritt 4

Markup einbinden

Das validierte Markup wird in den HTML-Code der Website eingebunden.

Schritt 5

Implementierung testen

Nach der Implementierung muss geprüft werden, ob die strukturierten Daten korrekt ausgelesen werden.

Wichtige Schema.org-Typen für GEO

Article, NewsArticle, BlogPosting

Für redaktionelle Inhalte sind Article, NewsArticle oder BlogPosting die relevanten Typen. Sie ermöglichen die Auszeichnung von Autor:innen, Veröffentlichungsdatum und Bildern.

Author, Person

Die Auszeichnung von Autor:innen schafft Vertrauen und Transparenz. KI-Systeme können so die Urheberschaft klar zuordnen.

Product + Offers

Für E-Commerce-Websites essenziell. Produktdaten können mit Preisen, Verfügbarkeit und Händlerinformationen angereichert werden.

Product + Review / AggregateRating

Bewertungen sind ein starkes Vertrauenssignal. Produkte mit positiven Bewertungen werden von KI-Systemen bevorzugt.

Organization

Unternehmensinformationen wie Name, Adresse, Kontaktdaten und Social-Media-Profile können strukturiert hinterlegt werden.

sameAs

Die sameAs-Eigenschaft verknüpft verschiedene Online-Präsenzen (Website, LinkedIn, Twitter etc.) miteinander und stärkt die Entitätserkennung.

Semantisches HTML

HTML ist eine Auszeichnungssprache (Markup Language), die Inhalten Kontext gibt. Während generische Tags wie <div> keine spezifische Bedeutung haben, definieren semantische Tags die Struktur und Bedeutung von Inhalten.

Was ist semantisches HTML?

Semantisches HTML verwendet Tags, um die Bedeutung und Struktur von Inhalten zu beschreiben, anstatt nur deren Aussehen zu definieren. Ein <table>-Tag signalisiert eindeutig, dass es sich um eine Tabelle handelt. Ein <article>-Tag kennzeichnet einen eigenständigen Inhalt.

Die Analogie: Grundrissplan eines Hauses

Ein Grundrissplan zeigt die Räume eines Hauses, aber nicht deren Funktion. Erst wenn man die Räume beschriftet (Küche, Bad, Schlafzimmer), wird klar, was wo ist. Semantisches HTML funktioniert genauso: Es gibt Kontext und macht Strukturen maschinenlesbar.

Wichtige semantische HTML-Elemente

Überschriftenhierarchie

Überschriften (H1-H6) strukturieren Inhalte hierarchisch. KI-Systeme nutzen sie, um die Gliederung und Wichtigkeit von Abschnitten zu verstehen. Wichtig: Keine Ebenen überspringen.

Listen

Listen (<ul>, <ol>) signalisieren, dass Informationen zusammengehören und in einer bestimmten Reihenfolge oder Gruppierung präsentiert werden.

Tabellen

Tabellen (<table>) sollten als solche ausgezeichnet werden, nicht als <div>-Konstrukte. Nur so können KI-Systeme die Zusammenhänge zwischen Zeilen und Spalten verstehen.

Struktur-Tags

Tags wie <article>, <section>, <footer> oder <nav> strukturieren die Seite semantisch und helfen KI-Systemen, Haupt- von Nebeninhalten zu unterscheiden.

Praxisbeispiel: Tabellen richtig auszeichnen

Ein häufiger Fehler: Tabellen werden mit <div>-Tags erstellt und per CSS formatiert. Für Menschen sieht das Ergebnis wie eine Tabelle aus, für KI-Systeme ist es eine unstrukturierte Ansammlung von Elementen.

Die Lösung: Tabellen als <table> auszeichnen. Dadurch wird die Bedeutungsebene klar, und KI-Systeme können die Daten korrekt interpretieren.

Exkurs: Shopping-Feeds und KI-Systeme

Produktdatenfeeds sind maschinenlesbare Informationen, die bereits heute für Organic Shopping und bezahlte Anzeigen genutzt werden. Mit dem Launch von ChatGPT Shopping und Googles UCP-Protokoll gewinnen sie auch für GEO massiv an Bedeutung.

KI-Systeme werden zunehmend zu persönlichen Kaufberatern. Optimierte Produktdatenfeeds sind der Schlüssel, um in diesen neuen Shopping-Integrationen sichtbar zu sein. Dieses Thema werden wir in einer separaten Folge vertiefen.

Datenstrukturierung – Die wichtigsten Maßnahmen im Überblick

Strukturierte Daten verwenden

Nutze Schema.org-Markup (idealerweise JSON-LD), um Informationen für KI-Systeme und Suchmaschinen eindeutig zu machen.

HTML optimieren

Verwende semantische Tags statt generischer <div>-Elemente. Überschriften, Listen, Tabellen und Struktur-Tags machen Inhalte maschinenlesbar.

Shopping-Feeds optimieren

Für E-Commerce-Unternehmen sind optimierte Shopping-Feeds entscheidend, um in KI-gestützten Shopping-Integrationen sichtbar zu sein.

Fazit: Discovery und Datenstrukturierung als Fundament für GEO-Erfolg

Die technische Onpage-GEO umfasst weit mehr als nur Crawling. Discovery und Datenstrukturierung sind entscheidende Hebel, um KI-Systemen zu signalisieren, welche Inhalte wichtig sind und wie sie zu interpretieren sind.

Die wichtigsten Erkenntnisse:

Discovery: Interne Verlinkung, Seitenarchitektur und User Signals steuern, welche Inhalte priorisiert werden
Datenstrukturierung: Strukturierte Daten und semantisches HTML machen Inhalte maschinenlesbar
Ganzheitlicher Ansatz: Alle drei Bereiche (Crawling, Discovery, Datenstrukturierung) müssen zusammenspielen

Mit diesem Wissen können technische Grundlagen geschaffen werden, die KI-Systemen ermöglichen, Inhalte optimal zu erfassen, zu verstehen und zu nutzen. In den kommenden Folgen werden wir diese technischen Grundlagen mit Content- und Offpage-Strategien verknüpfen.