100% unverbindliche Anfrage

Bitte wählen Sie:

Volltext Suche Begriffserklärung und Definition

volltext-sucheDigitale Medien haben gegenüber analogen Medien den Vorteil, dass sich Suchvorgänge automatisieren lassen. Bei Texten und Dateien übernimmt diese Aufgabe der Volltext Suche (Indizierung) eine Suchfunktion. Sie ist Bestandteil von Datenbrowsern, Datenbanken, Textprogrammen und Webseites. Mit ihrer Hilfe und den möglichen Suchstrategien lassen sich über eine Volltextsuche in kurzer Zeit Texte finden, die das Suchwort oder mehrere Suchwörter enthalten, was das Auffinden von Informationen beschleunigt und erleichtert und auch deren Auswertung. Mithilfe einer Volltextsuche lassen sich beträchtliche Datenmengen auswerten. Suchvorgänge, die früher langwierig und aufwendig waren, lassen sich heute innerhalb weniger Sekunden durchführen. In Zusammenhang mit Datenbanken lassen sich dank der Structured Query Language (SQL) auch komplexe Abfragen durchführen, indem Einträge aus verschiedenen Spalten und mehreren Tabellen zu Datensätzen mit der gewünschten Information zusammengefasst werden.

Problematik und Lösungen

Beim Umgang mit einer kleinen Anzahl von Dokumenten, ist kann die Volltext-Suchmaschine den Inhalt der Dokumente mit jeder Abfrage direkt scannen. Diese Strategie heiß auch serielles Scannen und wird heute noch von rudimentären Tools zum Beispiel in Texteditoren eingesetzt. Diese Strategie ist rechenintensiv und nimmt bei großen Text- oder Datenmengen viel Zeit in Anspruch.
Wenn die Anzahl der Dokumente sehr groß ist oder die Zahl der Suchanfragen beträchtlich, wird die Volltext Suche in zwei Schritte unterteilt: Indizierung und Suche. Bei der Indizierung werden die Texte gescannt und eine Liste (Index) wird erstellt. Beim Ausführen der Anfrage wird der Index referenziert, was die Suche beschleunigt, da sich die Suche auf den Index beschränkt und nicht auf die Originaldokumente.
Der Indexer erstellt einen Eintrag für jeden gefundenen Begriff oder jedes Wort in einem Dokument und merkt sich dessen relative Position innerhalb des jeweiligen Dokuments. Bei mehreren Begriffen kann der Indexer auch Stoppwörter (Pronomen, Konjunktionen) ignorieren, die die Suche auf diese Weise noch einmal vereinfachen. Einige Indexer arbeiten auch sprachspezifisch und stellen neben den Treffern auch Listen mit Synonymen oder Abwandlungen des oder der Suchwörter auf.
Bei der Rückgabe wird die Menge der relevanten Ergebnisse von der Suche zurückgegeben. Hier ist die Genauigkeit zunächst das Maß für die Qualität des Suchergebnisses. Als Rückgabe (Recall) wird der Quotient der relevanten Suchergebnisse durch die Menge aller Suchergebnisse bezeichnet. Je mehr sich dieses Verhältnis dem Wert eins nähert, desto präziser wurde die Suche ausgeführt. Dieser Wert misst die Präzision einer Suche.
Bei einer Volltext Suche mit geringer Präzision kann es passieren, dass relevante Suchergebnisse nicht in der Menge der zurückgegebenen Suchergebnisse enthalten sind. Hier können Relevanzprobleme entstehen, weil zum einen nicht alle betreffenden Textstellen erfasst werden und zum anderen auch in den gefundenen Dokumenten das Verhältnis von relevanten und irrelevanten Ergebnissen unverhältnismäßig ist.
Für dieses Problem kann es mehrere Gründe geben. Zum einen ist die natürliche Sprache oft mehrdeutig. Außerdem kann das Ignorieren von Stopp-Wörtern bei mehreren Begriffen zu falschen Kombinationen führen und die Präzision verringern. Aber auch die Wahl ungeeigneter Suchwörter führt zu einer geringeren Präzision. Verbessern lässt sich das Ergebnis durch ein geeignetes Tagging der Suche. Das heißt, es werden zum Beispiel nur Überschriften durchsucht oder nur Paragraphs. Auch die Auswahl und Kombination der Suchwörter beeinflusst das Ergebnis entscheidend, sodass eine erfolgreiche Suche auch immer vom Nutzer der Anwendung abhängt. Eine maximale Präzision wird dann erreicht, wenn die Zahl der Treffer sinkt und die Genauigkeit steigt, bis der Wert 1 erreicht ist. Dann sind die relevanten Suchergebnisse und die Gesamtzahl aller Treffer identisch.
Bei der freien Textsuche ist es allerdings wahrscheinlich, dass sich unter den Treffern viele Dokumente befinden, die für die Fragestellung bzw. Suchanfrage nicht relevant sind. Solche Dokumente werden auch als falsche positive (false positives) bezeichnet, weil sie das gesuchte Wort zwar enthalten, aber keine relevante Information enthalten. Mit sogenannten Clustering Techniken lässt sich der Anteil der false positives reduzieren. Durch die Verknüpfung mehrerer Begriffe ist es möglich, die Mehrdeutigkeiten der natürlichen Sprache zu reduzieren oder völlig eindeutige Anfragen zu formulieren, wobei hier auch auf grammatische Eigenheiten geachtet werden sollte.
Außerdem bieten erweiterte Suchfunktionen auch die Möglichkeit weitere Kriterien in die Suche miteinzubeziehen, zum Beispiel Kategorien oder Erstellungszeiträume und anderes mehr. Solche erweiterten Suchfunktionen gehen nahtlos in die Möglichkeit über, Datenbanken mittels SQL und entsprechend strukturierten Anfragen auszuwerten.

Verbesserte Anfragen

Durch das Bereitstellen einer Reihe von Werkzeugen und verschiedene Strategien lässt sich die Volltext Suche weiter verbessern. Zum einen konnten Suchanfragen im Internet durch das beständige Verbessern der Suchalgorithmen immer mehr verbessert werden. Außerdem lässt sich das Auffinden von Dokumenten oder Ressourcen durch das Angeben sogenannter Schlüsselwörter (Keywords) im Kopf (Head) eines Dokuments verbessern. Auf diese Weise lassen sich auch Synonyme und Beschreibungen einbauen, besonders hilfreich, wenn eines der Keywords oder Synonyme im Text selbst nicht enthalten ist.
Einige Suchmaschinen ermöglichen es ihren Benutzern, die Suche auf einen bestimmten Bereich der Dokumente zu begrenzen. Außerdem lassen sich mehrere Suchwörter mit unterschiedlichen Operatoren verbinden (und, oder). Hier ist aber zu beachten, dass sich ein Anstieg der Präzision auch negativ auf die Relevanz bzw. Vollständigkeit der erfassten Dokumente auswirken kann.
Durch eine Phrasensuche können bestimmte Sätze ermittelt werden. Durch eine Konkordanzsuche können alle Wörter ermittelt werden die in Zusammenhang mit dem gesuchten Wort auftreten, was dann bei einer weiteren Suche die Präzision und die Relevanz einer Volltextsuche erhöhen kann. Auch eine Umkreissuche, bei der zwei nicht zusammenhängende Begriffe auf einmal ermittelt werden, kann den Sucherfolg steigern. Durch reguläre Ausdrücke (regular expressions) entsteht eine sehr leistungsstarke Abfragesyntax, die ein hohes Maß an Präzision ermöglicht.
Bei einer sogenannten Fuzzy-Suche (Fuzzy = unscharfe Logik) geht es um die Ermittlung möglicher Variationen im Umfeld von Begriffen. Bei einer Wildcard-Suche wird mit Platzhaltern (*) gearbeitet, um phonetischen Varianten zu ermitteln. Dank solcher verbesserter Techniken und Strategien liefert eine moderne Volltext Suche bei richtiger Anwendung ein hohes Maß an Präzision und Relevanz. Je nach Programm und Dokumenten-Typ lassen sich so auch große Textmengen schnell auswerten. Auch eine Mehrfachsuche innerhalb des Indexes kann durch schrittweise Annäherung schließlich die präzise Zahl der relevanten Dokumente zu einer Suchanfrage liefern.



Zurück zur Hauptseite: v

Sie haben Fragen?

Kostenlose, unverbindliche Erstberatung:

Anrufer aus Deutschland:
Tel. 0771 - 1589439
Internationale Beratung:
Tel. +49771 - 1589439
Anfrage per Email:
buero@seo-analyse.com

» zum Anfrage-Formular

Onpage Optimierung

Suchmaschinenoptimierung im Quelltext

Wir schaffen für Ihre Webseite oder Ihren Shop eine optimale Onpage-Basis für weiterführende Optimierungsmaßnahmen.

Offpage Optimierung

Offpage Suchmaschinenoptimierung

Natürlicher Linkaufbau gemäß den Regeln der Suchmaschinen - wir bieten ihn!

SEO Beratung

SEO Beratung

Unsere Spezialisten beraten Sie gerne hinsichtlich Ihrer akuten oder strategischen Fragen.

Ranking Monitoring

Ranking Optimierung

Bei uns Standard: qualifiziertes Monitoring Ihrer Google Platzierungen.

Suchmaschinenoptimierung für Google

Google Suchmaschinenoptimierung

Wir kombinieren Google Optimierung mit ganzheitlicher Suchmaschinenoptimierung.

SEO Strategie

SEO Strategie

Praxisbewährte Strategien, die auf Zahlen und Fakten basieren.

SEO Tools

SEO Tools

Immer im Bild: professionelle SEO Tools informieren Sie über den Status Quo.