Zum Inhalt springen

SEO Analyse » SEO Lexikon » v » Volltext Suchmaschine

Volltext Suchmaschine Begriffserklärung und Definition

Volltext SuchmaschineEine Volltext Suchmaschine bietet die Möglichkeit einen bestimmten Bereich oder das gesamte Internet nach Dokumenten bzw. Ressourcen zu durchsuchen, die Stichwörter, Wörter oder Phrasen der Suchanfrage enthalten und diese in einem Listing auszugeben. Moderne Suchmaschinen bieten neben der Volltextsuche auch die Suche nach Bildern zu einem bestimmten Stichwort an, ebenso wie Videos oder den Bestand vorhandener Bücher zu einer Suchanfrage.

Wie Suchmaschinen arbeiten

Web-Suchmaschinen arbeiten, indem sie Informationen vieler Web-Seiten abrufen. Eie automatisierter Web-Browser, folgt jedem Link auf einer Webseite. Diese Seiten werden von einem Web-Crawler (auch Spider genannt) abgerufen. Der Inhaber der Webseite kann durch eine robots.txt den Bereich einer Webseite, der von einem Crawler erfasst wird, begrenzen. Die Inhalte der einzelnen Seiten werden dann analysiert, um festzustellen, wie sie indiziert werden sollen. So werden zum Beispiel Wörter aus den Titeln, dem Inhalt, Überschriften oder spezielle Felder wie Meta-Tags extrahiert. Daten über Web-Seiten werden in einer Index-Datenbank für die Verwendung in späteren Abfragen gespeichert.
Eine Abfrage von einem Benutzer kann aus einem einzelnen Wort bestehen. Der Index hilft ihm, die Informationen zu einer Abfrage so schnell wie möglich zu finden. Einige Suchmaschinen speichern alle Quellseiten oder auch nur einen Teil. Dieser Vorgang wird als Caching bezeichnet und trägt zur Verbesserung der Performance bei. Außerdem werden Informationen über die Web-Seiten gespeichert. Andere Suchmaschinen speichern jedes Wort, das sie auf einer Seite finden.
Diese Seite im Cache enthält immer die eigentlichen Informationen. Dies ist besonders dann sehr sinnvoll, wenn der Inhalt einer Seite öfter aktualisiert wird und sich so die Inhalte zum jeweiligen Suchbegriff verändern und der Inhalt nicht mehr die aktuellen Suchbegriffe enthält. Dieses Problem wird als eine leichte Form des sogenannten linkrot (Linkkorruption) bezeichnet. Durch das Caching wird die Benutzerfreundlichkeit erhöht. Außerdem erfüllt es die Erwartung der Benutzer nach einer gewissen Kontinuität der gelisteten Suchergebnisse. Dadurch erhöht sich die Wahrscheinlichkeit, dass im Listing zurückgegebene Seiten relevante Ergebnisse liefern.
Wenn ein Benutzer eine Anfrage an eine Suchmaschine richtet, indem er zum Beispiel ein bestimmtes Schlüsselwort eingibt, prüft der Engine zunächst seinen Index und bietet eine Liste der passenden Webseites nach diesen Kriterien und eine kurze Zusammenfassung der Inhalte, also den Titel des Dokuments und einige Zeilen Text. Der Index enthält die Daten und die Methode, nach der diese gespeichert wurden. Außerdem lässt sich das Suchergebnis nach dem Alter der gesuchten Webseites weiter eingrenzen.
Die meisten Suchmaschinen unterstützen die Verwendung der Booleschen (logischen) Operatoren AND, OR und NOT zur Spezifizierung der Suchanfrage. Boolesche Operatoren sind für wörtliche Suche wichtig und bieten dem Benutzer die Möglichkeit Suchergebnisse zu verfeinern und die Bedingungen der Suche zu erweitern. Der Engine erfasst die Wörter oder Sätze, die der Eingabe entsprechen. Einige Suchmaschinen bieten auch die Möglichkeit die Nähe der Suchwörter zueinander zu berücksichtigen, was einer sogenannten Fuzzy-Abfrage entspricht. Es ist auch konzeptbasierte Suche, die durch die Verwendung statistischer Analysen der Seiten zustande kommt. Auch die Häufigkeit bestimmter Anfragen beeinflusst das Ergebnis. Ausgaben können allerdings immer nur so präzise sein, wie die Anfrage, auf der sie beruhen. Neben der Suche nach Stichworten lassen einige Suchmaschinen auch die Eingabe ganzer Fragen zu, wie man sie zum Beispiel an einen Gesprächspartner stellen würde.
Der Nutzen einer Volltext Suchmaschine hängt von der Relevanz der Suchergebnisse ab, die auf eine Anfrage hin zurückgegeben werden. Natürlich gibt es Millionen Webseites, die einen bestimmten Satz oder ein bestimmtes Wort beinhalten. Dennoch sind einige dieser Seiten, relevanter, populärer oder maßgeblicher als andere. Deshalb verwenden die meisten Suchmaschinen verschiedene Methoden, um die Relevanz einer Site zu ermitteln. Welche Methoden das im Einzelnen sind, ist von Suchmaschine zu Suchmaschine verschieden. Auch haben sich die Methoden zur Ermittlung der Relevanz im Lauf der Zeit verändert. Einige Suchmaschinen arbeiten nach einem System von vordefinierten hierarchisch geordneten Stichworten, das von den Machern der Suchmaschine programmiert worden ist. Die anderen arbeiten nach einem invertierten Index, der durch die Analyse von Texten lokal erzeugt wird.
Die meisten Suchmaschinen sind kommerzieller Art und finanzieren sich durch Werbeeinnahmen. Werbetreibende können ihre Anzeigen gegen eine Gebühr neben den Suchergebnissen anzeigen lassen, wobei die Häufigkeit der Anzeige und der Rang von der Höhe der Gebühr abhängt. Diese wiederum wird durch die Häufigkeit und Relevanz eines Suchwortes bestimmt. Jedes Mal, wenn ein Nutzer auf eine der Anzeigen klickt, verdienen die Suchmaschinenbetreiber Geld.

Kritik

Obwohl Suchmaschinen darauf programmiert sind, Webseites nach Popularität, Relevanz und Rang anzuzeigen, konnte durch empirische Daten verschiedener Studien belegt werden, dass es bei den bereitgestellten Informationen zu politischen, wirtschaftlichen und sozialen Verzerrungen der Ergebnisse kommt. Diese sind hauptsächlich eine unmittelbare Folge der wirtschaftlichen und kommerziellen Prozesse. Wenn zum Beispiel Unternehmen besonders intensiv auf einer bestimmten Suchmaschine werben, dann verbessert sich so auch das Ranking. Außerdem kommt es vor, dass bestimmte Suchergebnisse aufgrund rechtlicher Bestimmungen oder sonstiger Gründe aus dem Index entfernt werden müssen, weil die Inhalte gegen Gesetze des jeweiligen Landes verstoßen. Aber auch das Benutzerverhalten kann sich auf die Ergebnisse auswirken. Außerdem schließen bestimmte Suchmaschinenbetreiber Inhalte bestimmter Art bewusst aus ihrem Index aus. Das sogenannte Bombing (automatisierte häufige Anfragen) ist einer von zahlreichen Techniken, die das Ranking bestimmter Webseites positiv beeinflussen sollen. Andere Techniken wie Link-Building werden inzwischen von einigen Suchmaschinen zuverlässig erfasst

Zusammenfassung

Ein Volltext-Suchmaschine durchforstet das Internet nach Dokumenten, die bestimmte Keywords, Wörter oder Phrasen enthalten. Der Prozess wird durch einen Web-Crawler unterstützt, der Internetseiten analysiert und Informationen für eine Index-Datenbank sammelt. Zusätzlich zur Volltextsuche ermöglichen moderne Suchmaschinen die Suche nach Bildern, Videos und Büchern.

Suchmaschinen nutzen Index-Datenbanken und Caching für eine effiziente Abfrageverarbeitung. Durch den Einsatz von Caching wird die Performance verbessert und die Benutzerfreundlichkeit erhöht. Boolesche Operatoren wie AND, OR und NOT sowie konzeptbasierte Suche und Fuzzy-Abfragen werden oft unterstützt, um die Suchergebnisse zu verfeinern.

Die Relevanz der Suchergebnisse hängt von verschiedenen Faktoren ab, darunter die Popularität und Relevanz der Webseiten. Suchmaschinen verwenden unterschiedliche Methoden, um diese Relevanz zu bewerten. Sie können auch die Möglichkeit bieten, Anzeigen neben den Suchergebnissen zu schalten, die dann die Finanzierung der Suchmaschine unterstützen.

Kritik an Suchmaschinen bezieht sich häufig auf politische, wirtschaftliche und soziale Verzerrungen in den Suchergebnissen. Diese können durch kommerzielle Interessen, rechtliche Einschränkungen oder das Verhalten der Benutzer beeinflusst werden. Verschiedene SEO-Techniken wie Link-Building und Bombing können ebenfalls das Ranking bestimmter Webseiten beeinflussen.

Häufige Fragen und Antworten

Was ist eine Volltext-Suchmaschine?

Eine Volltext Suchmaschine bietet die Möglichkeit, das Internet nach Dokumenten oder Ressourcen zu durchsuchen, die bestimmte Stichwörter, Wörter oder Phrasen enthalten. Dabei werden die Suchergebnisse in einem Listing angezeigt. Moderne Suchmaschinen bieten nicht nur Volltextsuche, sondern auch die Suche nach Bildern, Videos oder Büchern an.

Wie funktioniert eine Volltext-Suchmaschine?

Eine Volltext-Suchmaschine durchsucht das Internet mithilfe eines Web-Crawlers nach Informationen von Webseiten. Die Inhalte werden analysiert, um festzustellen, wie sie indiziert werden sollen. Dabei werden zum Beispiel Wörter aus den Titeln, dem Inhalt, Überschriften oder Meta-Tags extrahiert. Die Daten werden in einer Index-Datenbank gespeichert und für spätere Suchanfragen verwendet.

Welche Rolle spielt der Index in einer Volltext-Suchmaschine?

Der Index in einer Volltext-Suchmaschine speichert die Daten und die Methode, wie sie indiziert wurden. Wenn ein Benutzer eine Suchanfrage stellt, durchsucht die Suchmaschine den Index, um passende Webseiten zu finden und das Ergebnis schnell zu liefern. Der Index hilft auch dabei, die Suchergebnisse nach dem Alter der Webseiten zu filtern.

Wie beeinflusst die Relevanz das Ranking in einer Volltext-Suchmaschine?

Die Relevanz einer Webseite spielt eine wichtige Rolle im Ranking einer Volltext-Suchmaschine. Suchmaschinen verwenden verschiedene Methoden, um die Relevanz zu bewerten. Dazu gehören Faktoren wie Popularität, Qualität der Inhalte und Verlinkungen von anderen Webseiten. Relevante Webseiten werden in der Regel höher im Ranking angezeigt.

Was sind mögliche Kritikpunkte an Volltext-Suchmaschinen?

Volltext-Suchmaschinen sind nicht frei von Kritik. Einige mögliche Kritikpunkte sind:

  • Verzerrungen in den Suchergebnissen aufgrund von wirtschaftlichen und kommerziellen Interessen.
  • Entfernung von bestimmten Suchergebnissen aufgrund rechtlicher Restriktionen.
  • Einfluss des Benutzerverhaltens auf die Suche.
  • Ausschluss bestimmter Inhalte durch Suchmaschinenbetreiber.
  • Manipulation des Rankings durch SEO-Techniken wie Link-Building oder Bombing.

Bildnachweis: iStock.com/anyaberkut


Zurück zur Hauptseite: v
Alle Marken, Warenzeichen, Unternehmens- und Produkt-Bezeichnungen sind mit, aber auch ohne definitive Kennzeichnung, Eigentum des Inhabers der Rechte. Alle aufgeführten Elemente dienen lediglich der informativen Beschreibung.