Haben Sie sich schon einmal gefragt, woher Google und andere Suchmaschinen eigentlich die ganzen Antworten auf Ihre Fragen haben?

Beim Thema Suchmaschinen treffen sich Mathematik und Germanistik, denn aus dem ganzen „Kauderwelsch“, aus dem eine Webseite besteht, muss eine Suchmaschine den Inhalt herausfiltern, der für die Menschen interessant ist. Und nicht nur das. Dieser Inhalt muss in Beziehung gesetzt werden zu dem anderen Inhalt auf der Internetseite und dann noch zu dem Inhalt anderer Inhalte mit ähnlichem oder gleichen Thema. Allein schon die Definition, was wichtig oder unwichtig ist, was ähnlich oder gleich ist und die Bezüge zueinander, ist ein komplizierter Algorithmus und ein gut gehütetes Geheimnis der Suchmaschinenbetreiber.

Ohne es an dieser Stelle allzu kompliziert machen zu wollen, sei nur kurz erklärt, wie eine Suchmaschine funktioniert.

Eine Suchmaschine ist im Grunde genommen nichts anderes als ein Software-Programm (auch Robot, Crawler oder Spider genannt), von sehr cleveren Programmieren entwickelt. Jede Suchmaschine funktioniert nach ähnlichen Prinzipien:

1. Der Robot (Software-Programm) besucht eine Webseite und folgt den Links darin
2. Die Webseite wird gescannt und eingelesen, Seite für Seite.
3. Die Texte und HTML Elemente werden in untereinander verbundenen Datenbanken gespeichert
4. Die Datenbank bzw. Texte werden nach bestimmten Kriterien gewichtet und indexiert (sortiert)

Inhalte, Inhalte, Inhalte

Gefunden wird Ihre Seite durch den Robot dadurch, das eine andere Internetseite auf Sie zeigt, indem diese auf Ihre Seite verlinkt. Man kann seine Seite auch direkt bei den Suchmaschinen anmelden und kommt dann quasi auf die „Tanzkarte“ des Robots, doch schon fehlt Ihnen ein wichtiges Internetkriterium, nämlich die Relevanz der Seite durch Empfehlung.

Grundsätzlich wird Text (englisch: Content) gesucht und in der Datenbank der Suchmaschine gespeichert. Dabei werden aber nicht alle HTML Elemente berücksichtigt. Zum Beispiel Java Script interessiert eine Suchmaschine überhaupt nicht. Auch Flash Filme und Java Applets kann eine Suchmaschine (noch nicht) vollständig lesen . Darum ist der Text nach dem <body> Tag sehr wichtig. Findet eine Suchmaschine nur Grafiken und praktisch keinen Text, stehen Sie auf verlorenem Posten. Darum basiert gute Suchmaschinen-Optimierung auf dem Grundprinzip: Eine Suchmaschine benötigt Text, viel Text und guten Text. Weitere Elemente sind Meta Tags. Sie geben der Suchmaschine Anhaltspunkte, was auf der Seite zu finden ist. Da Meta Tags aber einfach manipulierbar sind und in der Vergangenheit übertrieben manipuliert worden sind, verzichten die meisten Robots auf das Einlesen der meisten Tags. Welche Elemente eingelesen werden und vor allem, welches Gewicht die Elemente schlussendlich bei der Indexierung erhalten, das ist ein Geheimnis und keine Suchmaschine verrät alle Details. Bei einer Suchmaschinen Optimierung darf kein Element vernachlässigt werden.

Fiese Methoden

Wie bereits erwähnt, ist nicht im Detail bekannt, welche Suchmaschine welche Elemente einliest bzw. gewichtet. Dies aus gutem Grunde. Viele unseriöse Firmen versuchen, die Suchmaschinen zu überlisten. Dazu ist jedes Mittel recht. Die Suchmaschinen werden mit wertlosem Inhalt (Spamming) überflutet oder mit speziell für Suchmaschinen erstellte Seiten getäuscht (Cloaking). Die Suchmaschinen Spammer verwenden sinnlose Doorwaypages und erstellen tausende von Seiten, die sich gegenseitig verlinken. Suchmaschinen haben aber die meisten Tricks erkannt und reagieren konsequent und drastisch abstrafend auf Täuschungsversuche.

Die Welt ist ein Katalog

Eine Suchmaschine speichert Text / Content in mehreren Datenbanken, damit Sie innerhalb weniger Augenblicke von irgendeinem Rechenzentrum auf der Welt Ihre Antwort bekommen. Wichtig zu wissen: Wenn Sie eine Suchabfrage machen, dann werden die Webseiten nicht ‚live‘ durchsucht, sondern es werden lediglich gespeicherte Elemente aus den Datenbankbeständen gelesen. Und das auch nicht so, wie der Text dort auf Ihrer Seite steht, sondern in einer Form, die sich die Suchmaschine selbst aufgrund der gefundenden Ergebnisse zusammengestellt hat. Das ist der Dokumentenindex, in dem verschiedene Elemente einer Seite eindeutige Schlüssel bekommen und so eine Art von maschinenlesbarer Katalog erstellt wird. Und bei jeder Suchabfrage wird dieser Katalog durchgeackert, um anhand eines eindeutigen Schlüssels genau die richtige Seiten für Ihre Suchanfragen ausgeben zu können. Und…vielleicht ahnen Sie es schon…damit Ihre Suchanfrage von der Suchmaschine überhaupt verstanden werden kann, wird die übrigens auch solange bearbeitet und aufgedröselt, bis die Maschine den Sinn der Frage herausgearbeitet hat. Was ist der Wortstamm, die Endung, ein Füllwort? Suchen Sie eine Bank zum Sitzen oder ein Geldinstitut? Aber das ist ein anderes Thema…