Folge 21: Technische Onpage-GEO (Teil 2) – Discovery und Datenstrukturierung
In der ersten Folge zur technischen Onpage-GEO haben wir uns intensiv mit dem Thema Crawling beschäftigt. Jetzt gehen wir einen Schritt weiter und beleuchten die beiden weiteren zentralen Bereiche: Discovery und Datenstrukturierung.
Während Crawling sicherstellt, dass KI-Systeme überhaupt auf Inhalte zugreifen können, geht es bei Discovery darum, die wichtigsten Inhalte gezielt zu priorisieren. Die Datenstrukturierung wiederum macht Informationen maschinenlesbar – eine Grundvoraussetzung dafür, dass KI-Systeme Inhalte korrekt verstehen und verarbeiten können.
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenInhaltsverzeichnis
ToggleRückblick: Die Ziele der technischen Onpage-GEO
Bevor wir in die Details von Discovery und Datenstrukturierung eintauchen, ein kurzer Rückblick auf die übergeordneten Ziele der technischen Onpage-GEO:
Bevor Optimierungsmaßnahmen greifen können, müssen die technischen Grundlagen stimmen. Gibt es Hindernisse, die KI-Systeme daran hindern, Inhalte zu erfassen?
KI-Systeme müssen Inhalte nicht nur finden (Crawling), sondern auch verstehen können. Strukturierte Daten und semantisches HTML sind hier entscheidend.
Über die Basics hinaus gibt es zahlreiche technische Stellschrauben, die die Sichtbarkeit in KI-Systemen beeinflussen – von interner Verlinkung bis zu Shopping-Feeds.
Die drei Bereiche der technischen Onpage-GEO
Die technische Onpage-GEO lässt sich in drei zentrale Bereiche unterteilen:
Crawling
Wie stellen wir sicher, dass alle für GEO relevanten Inhalte einer Webseite durchsucht und gefunden werden können?
Status: Behandelt in Folge 20
Discovery
Wie stellen wir sicher, dass wichtige Inhalte präferiert behandelt und als solche erkannt werden?
Status: Heute – Teil 1
Datenstrukturierung
Wie stellen wir sicher, dass alle relevanten Inhalte maschinenlesbar sind?
Status: Heute – Teil 2
Bereich 2: Discovery – Inhalte gezielt priorisieren
Discovery geht über das reine Auffinden von Inhalten hinaus. Es geht darum, KI-Systemen zu signalisieren, welche Inhalte besonders relevant sind und bevorzugt behandelt werden sollten. Die zentrale Frage lautet: Durch welche Maßnahmen können KI-Bots fokussiert auf relevante Inhalte aufmerksam gemacht werden?
Interne Verlinkung und Seitenarchitektur
Die interne Verlinkung ist eines der mächtigsten Werkzeuge für Discovery. Sie vermittelt KI-Systemen, welche Inhalte im Kontext zueinander stehen und wie relevant einzelne Seiten sind.
Kurze Klickwege signalisieren Wichtigkeit. Inhalte, die mit wenigen Klicks von der Startseite erreichbar sind, werden als relevanter eingestuft.
Eine klare, hierarchische Navigation hilft KI-Systemen, die Struktur und thematische Organisation der Website zu verstehen.
Gut verlinkte Inhalte werden häufiger gecrawlt. Die interne Verlinkung beeinflusst also direkt die Crawling-Effizienz.
Thematische Nähe durch Verlinkung zeigt KI-Systemen, welche Inhalte zusammengehören und in welchem Kontext sie stehen.
Pillar-Seiten als strukturierendes Element
Ein bewährtes Konzept für die Strukturierung von Inhalten sind Pillar-Seiten. Dabei wird ein Kernthema auf einer zentralen Seite behandelt, von der aus zu spezifischeren Unterthemen verlinkt wird.
Vorteile von Pillar-Seiten:
- Klare thematische Hierarchie
- Kurze Klickwege zu verwandten Inhalten
- Kontextuelle Verlinkung zwischen Unterthemen
- Signalisierung von Expertise in einem Themenbereich
User Signals als indirekte GEO-Faktoren
Klassische User Signals wie Klickraten oder Verweildauer spielen auch für GEO eine Rolle – allerdings primär indirekt. Sie beeinflussen vor allem die SEO-Performance, die wiederum Auswirkungen auf GEO hat.
SEO-Relevanz
Bei Retrieval-Augmented Generation (RAG) greifen KI-Systeme auf Suchmaschinen-Indizes zu. Seiten mit guten User Signals ranken besser und werden häufiger als Quelle genutzt.
Nutzer:innen-Engagement
Aktive Communities, positive Bewertungen und rege Diskussionen (z.B. auf Reddit) sind hochgradig relevant für KI-Systeme. User-generated Content signalisiert Vertrauen und Relevanz.
GEO-eigene Metriken
Klicks auf Links, Copy-Paste-Aktionen oder Folgefragen zeigen, wie hilfreich eine KI-generierte Antwort war. Diese Metriken werden zunehmend wichtiger für die Bewertung von Quellen.
Zusammenfassungen für Mensch und Maschine
KI-generierte Zusammenfassungen am Anfang längerer Artikel bieten einen doppelten Nutzen:
- Für Menschen: Schneller Überblick, ob der Artikel relevant ist
- Für KI-Systeme: Kompakte, gut strukturierte Information, die leicht zitiert werden kann
Solche Zusammenfassungen erhöhen die Wahrscheinlichkeit, dass Inhalte in KI-Antworten aufgegriffen werden.
Discovery – Die wichtigsten Maßnahmen im Überblick
Nutze Pillar-Seiten und hierarchische Ordnerstrukturen, um thematische Zusammenhänge klar zu kommunizieren.
Wichtige Inhalte sollten von vielen Seiten verlinkt werden und mit wenigen Klicks erreichbar sein.
Verweildauer, Engagement und Community-Aktivität beeinflussen indirekt die GEO-Performance.
Kompakte Zusammenfassungen am Artikelanfang helfen sowohl Menschen als auch KI-Systemen.
Bereich 3: Datenstrukturierung – Inhalte maschinenlesbar machen
Selbst die besten Inhalte nützen wenig, wenn KI-Systeme sie nicht korrekt interpretieren können. Datenstrukturierung macht Informationen maschinenlesbar und schafft eine eindeutige Bedeutungsebene.
Strukturierte Daten (Schema.org)
Strukturierte Daten sind ein gemeinsamer Standard, den Suchmaschinenbetreiber geschaffen haben. Sie ermöglichen es, Informationen so aufzubereiten, dass sie eine eindeutige, maschinenlesbare Bedeutungsebene haben.
Warum sind strukturierte Daten für GEO relevant?
Mit strukturierten Daten können Unternehmen, Produkte, Artikel oder Personen so ausgezeichnet werden, dass KI-Systeme deren Eigenschaften und Zusammenhänge zuverlässig erkennen. Ein Unternehmensname ist nicht einfach nur Text, sondern wird als „Organization“ mit zugehörigen Eigenschaften wie Adresse, Kontaktdaten und Social-Media-Profilen verstanden.
Implementierung strukturierter Daten
Typen und Eigenschaften wählen
Welche Schema-Typen sind für die Website relevant? Publisher benötigen andere Typen als E-Commerce-Unternehmen.
JSON-LD erstellen
Das bevorzugte Format ist JSON-LD. Es wird von Google empfohlen und ist am einfachsten zu implementieren.
Markup validieren
Tools wie schema.org oder der Rich Results Test von Google helfen bei der Validierung.
Markup einbinden
Das validierte Markup wird in den HTML-Code der Website eingebunden.
Implementierung testen
Nach der Implementierung muss geprüft werden, ob die strukturierten Daten korrekt ausgelesen werden.
Wichtige Schema.org-Typen für GEO
Für redaktionelle Inhalte sind Article, NewsArticle oder BlogPosting die relevanten Typen. Sie ermöglichen die Auszeichnung von Autor:innen, Veröffentlichungsdatum und Bildern.
Die Auszeichnung von Autor:innen schafft Vertrauen und Transparenz. KI-Systeme können so die Urheberschaft klar zuordnen.
Für E-Commerce-Websites essenziell. Produktdaten können mit Preisen, Verfügbarkeit und Händlerinformationen angereichert werden.
Bewertungen sind ein starkes Vertrauenssignal. Produkte mit positiven Bewertungen werden von KI-Systemen bevorzugt.
Unternehmensinformationen wie Name, Adresse, Kontaktdaten und Social-Media-Profile können strukturiert hinterlegt werden.
Die sameAs-Eigenschaft verknüpft verschiedene Online-Präsenzen (Website, LinkedIn, Twitter etc.) miteinander und stärkt die Entitätserkennung.
Semantisches HTML
HTML ist eine Auszeichnungssprache (Markup Language), die Inhalten Kontext gibt. Während generische Tags wie <div> keine spezifische Bedeutung haben, definieren semantische Tags die Struktur und Bedeutung von Inhalten.
Was ist semantisches HTML?
Semantisches HTML verwendet Tags, um die Bedeutung und Struktur von Inhalten zu beschreiben, anstatt nur deren Aussehen zu definieren. Ein <table>-Tag signalisiert eindeutig, dass es sich um eine Tabelle handelt. Ein <article>-Tag kennzeichnet einen eigenständigen Inhalt.
Die Analogie: Grundrissplan eines Hauses
Ein Grundrissplan zeigt die Räume eines Hauses, aber nicht deren Funktion. Erst wenn man die Räume beschriftet (Küche, Bad, Schlafzimmer), wird klar, was wo ist. Semantisches HTML funktioniert genauso: Es gibt Kontext und macht Strukturen maschinenlesbar.
Wichtige semantische HTML-Elemente
Überschriften (H1-H6) strukturieren Inhalte hierarchisch. KI-Systeme nutzen sie, um die Gliederung und Wichtigkeit von Abschnitten zu verstehen. Wichtig: Keine Ebenen überspringen.
Listen (<ul>, <ol>) signalisieren, dass Informationen zusammengehören und in einer bestimmten Reihenfolge oder Gruppierung präsentiert werden.
Tabellen (<table>) sollten als solche ausgezeichnet werden, nicht als <div>-Konstrukte. Nur so können KI-Systeme die Zusammenhänge zwischen Zeilen und Spalten verstehen.
Tags wie <article>, <section>, <footer> oder <nav> strukturieren die Seite semantisch und helfen KI-Systemen, Haupt- von Nebeninhalten zu unterscheiden.
Praxisbeispiel: Tabellen richtig auszeichnen
Ein häufiger Fehler: Tabellen werden mit <div>-Tags erstellt und per CSS formatiert. Für Menschen sieht das Ergebnis wie eine Tabelle aus, für KI-Systeme ist es eine unstrukturierte Ansammlung von Elementen.
Die Lösung: Tabellen als <table> auszeichnen. Dadurch wird die Bedeutungsebene klar, und KI-Systeme können die Daten korrekt interpretieren.
Exkurs: Shopping-Feeds und KI-Systeme
Produktdatenfeeds sind maschinenlesbare Informationen, die bereits heute für Organic Shopping und bezahlte Anzeigen genutzt werden. Mit dem Launch von ChatGPT Shopping und Googles UCP-Protokoll gewinnen sie auch für GEO massiv an Bedeutung.
KI-Systeme werden zunehmend zu persönlichen Kaufberatern. Optimierte Produktdatenfeeds sind der Schlüssel, um in diesen neuen Shopping-Integrationen sichtbar zu sein. Dieses Thema werden wir in einer separaten Folge vertiefen.
Datenstrukturierung – Die wichtigsten Maßnahmen im Überblick
Nutze Schema.org-Markup (idealerweise JSON-LD), um Informationen für KI-Systeme und Suchmaschinen eindeutig zu machen.
Verwende semantische Tags statt generischer <div>-Elemente. Überschriften, Listen, Tabellen und Struktur-Tags machen Inhalte maschinenlesbar.
Für E-Commerce-Unternehmen sind optimierte Shopping-Feeds entscheidend, um in KI-gestützten Shopping-Integrationen sichtbar zu sein.
Fazit: Discovery und Datenstrukturierung als Fundament für GEO-Erfolg
Die technische Onpage-GEO umfasst weit mehr als nur Crawling. Discovery und Datenstrukturierung sind entscheidende Hebel, um KI-Systemen zu signalisieren, welche Inhalte wichtig sind und wie sie zu interpretieren sind.
Die wichtigsten Erkenntnisse:
- Discovery: Interne Verlinkung, Seitenarchitektur und User Signals steuern, welche Inhalte priorisiert werden
- Datenstrukturierung: Strukturierte Daten und semantisches HTML machen Inhalte maschinenlesbar
- Ganzheitlicher Ansatz: Alle drei Bereiche (Crawling, Discovery, Datenstrukturierung) müssen zusammenspielen
Mit diesem Wissen können technische Grundlagen geschaffen werden, die KI-Systemen ermöglichen, Inhalte optimal zu erfassen, zu verstehen und zu nutzen. In den kommenden Folgen werden wir diese technischen Grundlagen mit Content- und Offpage-Strategien verknüpfen.