Infos Home | Impressum | Original Artikel & Autoren Liste


Suchmaschine

Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z.B. dem World Wide Web gespeichert sind. Nach Eingabe einer Suchanfrage - bestehend aus Schlagwörtern und der Art ihrer logischen Verknüpfung - liefert eine S. eine Liste von Verweisen auf relevante Dokumente oder Webseiten, meist dargestellt mit Titel und einem kurzen Auszug des jeweiligen Dokuments.

In der Regel erfolgt die Datenbeschaffung automatisch durch Webcrawler und Indexierung. Wird die Datenakquisition manuell mittels Anmeldung oder durch Lektoren vorgenommen, handelt es sich um einen Katalog bzw. ein Directory. In solchen Verzeichnissen wie beispielsweise Yahoo und dem Open Directory Project sind die Dokumente hierarchisch in einem Inhaltsverzeichnis nach Themen organisiert.

Die zur Suche nötige Datenbasis gewinnen Suchmaschinen meist durch automatisierten Abruf und Indexierung einer großen Anzahl von Webseiten sowie Verfolgung der darin enthaltenen Verweise, d.h. Links, oder im Fall von Metasuchmaschinen (z.B. MetaGer) durch Rückgriff auf mehrere andere Suchmaschinen.

Die Darstellung der Suchergebnisse geschieht sortiert nach Relevanz (Ranking), wofür jede Suchmaschine ihre eigenen, geheimen Kriterien heranzieht. Das können z.B. Häufigkeit und Stellung der Suchbegriffe im jeweiligen gefundenen Dokument, die Einstufung und Anzahl der zitierten Seiten, sowie die Häufigkeit von Verweisen anderer Dokumente auf das im Suchergebnis enthaltene Dokument sein.

Manche Suchmaschinen sortieren Suchergebnisse nicht nur nach Relevanz für die Suchanfrage sondern lassen gegen Bezahlung auch Einflussnahme auf ihre Ausgabe zu.

Eine der ersten Suchmaschinen war Lycos, die 1994 als Universitätsprojekt gestartet ist. Vorher gab es schon andere, z.B. Archie oder Veronica, die aber nicht mit einer graphischen Web-Oberfläche ausgestattet waren.

Herausforderungen für Suchmaschinen:

Siehe auch (Themen die noch nicht ausreichend im Artikel behandelt werden): PageRank-Algorithmus, Hubs und Authorities, Webcrawler, Google-Bombe, Linkfarm, Web Impact Faktor, Information-Retrieval, Vektorraum-Retrieval, Data Mining, Stemming, Semantic Web, AltaVista, Google, Open Archives Initiative, Deep Web


Der Ursprungsartikel stammt von der deutschsprachigen Wiki pedia (siehe oben: "Original Artikel & Autoren Liste").
Der Text steht unter der GNU Freie Dokumentation Lizenz.