Von der PDF zur KI-Quelle in wenigen Tagen
Viele Unternehmen besitzen wertvolles Expertenwissen – versteckt in PDF-Dateien. Wir haben eine technische Montageanleitung von GESCO in eine interaktive Hyper-Funktions-Webseite verwandelt. Das Ergebnis: bessere Nutzerführung, ein vernetzter Wissensraum und überraschend schnelle Sichtbarkeit in Gemini.
Warum immer noch PDF???
Manche Projekte beginnen mit einer einfachen Frage. In diesem Fall lautete sie: Warum liegen wertvolle technische Informationen eigentlich noch immer in PDF-Dateien, obwohl moderne Suchmaschinen und KI-Systeme ganz anders arbeiten?
Ausgangspunkt dieses Laborversuchs war die ursprüngliche PDF-Einbauanleitung für die Bullaugen-Ausführung B der GESCO-metall GmbH. Die Anleitung enthielt alle notwendigen Informationen für die fachgerechte Montage, war jedoch – wie viele technische PDFs – weitgehend isoliert von den übrigen Inhalten der Website.
Die ursprüngliche Dokumentation kann heute noch als Referenz betrachtet werden: PDF-Einbauanleitung PD 401.2 für Bullaugen Ausführung B.
Das eigentliche Problem lag nicht im Inhalt
Die technische Qualität der PDF war nie das Problem. Die Anleitung war korrekt, vollständig und für Fachpersonal verständlich. Das eigentliche Problem bestand darin, dass die Informationen für Suchmaschinen und KI-Systeme nur schwer in größere Zusammenhänge eingeordnet werden konnten.
Ein PDF besitzt in der Regel keine sinnvolle interne Verlinkung, keine semantische Einordnung in Themencluster, keine Deep Links auf einzelne Bereiche und nur eingeschränkte Möglichkeiten zur Kontextbildung.
Anders formuliert: Das Wissen war vorhanden, aber es war in einem Dokument eingeschlossen.
Aus einer Anleitung wurde eine eigenständige Wissensseite
Anstatt die PDF lediglich als HTML umzuschreiben, entstand ein deutlich umfangreicherer Ansatz. Die Anleitung wurde in eine eigenständige Fachseite überführt:
Interaktive Einbauanleitung für Bullaugen Ausführung B
Dabei wurden die Inhalte nicht nur übertragen, sondern vollständig neu strukturiert. Die einzelnen Montageschritte erhielten eine klare Gliederung, technische Informationen wurden kontextualisiert und die Anleitung wurde direkt in das bestehende Themencluster der Edelstahl-Bullaugen integriert.
Die Geburt einer Hyper-Funktions-Webseite
Mit der Umstellung entstand keine gewöhnliche Produktseite und auch kein klassischer Ratgeber. Vielmehr entwickelte sich eine Art Hyper-Funktions-Webseite.
Die technische Zeichnung wurde interaktiv nutzbar gemacht. Montagepunkte lassen sich direkt auswählen und führen den Nutzer zu den entsprechenden Arbeitsschritten. Die Anleitung reagiert auf Benutzerinteraktionen und verbindet technische Grafik, Text, Erläuterungen und Navigation zu einer einzigen Anwendung.
Aus einem statischen Dokument wurde damit eine interaktive Wissensoberfläche.
Interne Verlinkungen als Wissensnetzwerk
Besonderes Augenmerk lag auf der internen Vernetzung der Inhalte. Die neue Anleitung wurde nicht isoliert veröffentlicht, sondern systematisch mit verwandten Themen verbunden.
Verlinkt wurden unter anderem:
- Bullaugen aus Edelstahl in fünf Ausführungen
- Verglasungsmöglichkeiten für Bullaugen
- Preisanfrage für Edelstahl-Bullaugen
Zusätzlich wurden die einzelnen Ausführungen A bis E miteinander verbunden. Dadurch entstand ein thematisch geschlossenes Wissensnetz, das sowohl Besuchern als auch Suchmaschinen deutlich mehr Kontext liefert als eine einzelne PDF-Datei.
Schema.org, Metadaten und Deep Links
Parallel zum eigentlichen Inhalt wurden strukturierte Daten, semantische Überschriften, Deep Links und technische Zusatzinformationen integriert.
Jeder Abschnitt erhielt eine klare Aufgabe innerhalb des Themenclusters. Die Inhalte konnten dadurch nicht nur gelesen, sondern auch maschinell interpretiert werden.
Aus SEO-Sicht entstand eine optimierte Fachseite. Aus Sicht moderner KI-Systeme entstand dagegen eine klar strukturierte Wissensquelle mit nachvollziehbaren Beziehungen zwischen Produkten, Einbauvarianten, technischen Anforderungen und ergänzenden Informationen.
Das überraschende Ergebnis
Die eigentliche Überraschung folgte bereits wenige Tage nach der Veröffentlichung.
Nur etwa drei Tage nach der Umwandlung der PDF-Inhalte in die neue Struktur konnten die Inhalte bereits in Gemini nachvollzogen werden.
Ob dafür die HTML-Struktur, die interne Verlinkung, die Deep Links, die strukturierten Daten oder das Zusammenspiel aller Maßnahmen verantwortlich waren, lässt sich nicht eindeutig nachweisen.
Feststellbar war jedoch, dass die Informationen deutlich schneller Teil eines maschinell nutzbaren Wissensraums wurden als zuvor in ihrer ursprünglichen PDF-Form.
Die eigentliche Erkenntnis dieses Experiments
Dieses Projekt zeigt, dass viele Unternehmen bereits über wertvolles Expertenwissen verfügen. Oft befindet sich dieses Wissen jedoch in PDF-Dateien, technischen Dokumentationen oder Bedienungsanleitungen und bleibt dadurch weitgehend isoliert.
Der größte Hebel liegt nicht zwangsläufig darin, neue Inhalte zu produzieren. Häufig genügt es, bestehendes Wissen aus Dokumentensilos zu befreien, sinnvoll zu strukturieren und intelligent miteinander zu verknüpfen.
Im Fall der Bullaugen-Ausführung B entstand dadurch aus einer klassischen Montageanleitung eine interaktive Wissensquelle, die Menschen, Suchmaschinen und KI-Systeme gleichermaßen nutzen können.
Fazit: Das Wissen war schon da
Die wichtigste Erkenntnis dieses Laborversuchs lautet: Das Fachwissen musste nicht neu erfunden werden.
Neu geschaffen wurden Struktur, Kontext, Verbindungen und Zugänglichkeit.
Aus einer einzelnen PDF-Datei wurde ein vernetzter Wissensbaustein innerhalb eines größeren Themenclusters. Und möglicherweise liegt genau darin einer der wichtigsten Unterschiede zwischen klassischer Dokumentation und der Wissensarchitektur, auf der zukünftige KI-Systeme arbeiten werden.