http://www.mediaculture-online.de

Autor: Babiak, Ulrich.

Titel: Effektive Suche im Internet. Suchstrategien, Methoden, Quellen.

Quelle: Ulrich Babiak: Effektive Suche im Internet. Suchstrategien, Methoden, Quellen. Köln, 3., aktualisierte und überarb. Aufl., 1999. S. 9-217.

Verlag: O´Reilly Verlag.

Die Veröffentlichung erfolgt mit freundlicher Genehmigung des Verlags.



Ulrich Babiak

Effektive Suche im Internet
Suchstrategien, Methoden, Quellen

Inhaltsverzeichnis

Vorwort 8

Das Internet als Informationsquelle ... 8

Für wen ist dieses Buch geschrieben? 8

Der Aufbau des Buches 9

Ein kurzes Vorwort zur dritten Auflage 11

Was ist neu? 11

Online-Ergänzungen zu diesem Buch 12

Ein Dankeschön ... 12

1. Was findet man eigentlich im Internet? 13

1.1 Was kann ich vom Internet erwarten? 13

1.2 Warum ist das Suchen und Finden so kompliziert? 15

1.3 Wer wird »Anbieter« und warum? 16

Privatpersonen, ihre Homepages und Diskussionsbeiträge 17

Firmen 19

Universitäten und Forschungseinrichtungen 20

Bibliotheken und Archive 22

Offizielles: Regierungen, Parteien, Organisationen 24

Medien und Medienkonzerne 25

... und der ganze Rest 27

1.4 Ist das alles kostenlos? 27

2. Mehr als WWW: wichtige Internetdienste 29

Ein kleiner Exkurs: Was ist eigentlich ein »Internetdienst«? 30

2.1 Das World Wide Web 30

2.2 E-Mail 33

2.3 Mailinglisten und Newsletter 34

Welchen Nutzen bieten Mailinglisten? 36

2.4 Newsgruppen 37

Newsgruppen finden 39

Der Nutzen von Newsgruppen 41

Die FAQs – Frequently Asked Questions (und die Antworten darauf) 42

2.5 Telnet 43

2.6 FTP 44

2.7 Z39.50 und WAIS 45

2.8 Gopher – ein Blick in die Vergangenheit des Internet 47

3. Die verschiedenen Typen von Suchhilfen 48

Begriffsdefinitionen: URL und Website 49

3.1 Thematische Verzeichnisse (Kataloge) 50

Wann soll man thematische Verzeichnisse benutzen? 53

3.2 Suchmaschinen 53

Wann soll man Suchmaschinen benutzen? 55

3.3 Meta-Suchmaschinen 56

Wann soll man Meta-Suchmaschinen benutzen? 57

3.4 Lokale Datenbanken und lokale Volltextsuche 58

Wann soll man die lokale Volltextsuche benutzen? 59

Zusammenfassung 60

4. Die wichtigsten Suchhilfen: Suchmaschinen und thematische Verzeichnisse 61

4.1 Die wichtigsten Suchmaschinen 61

Unterschiede zwischen deutschen und internationalen Suchmaschinen 62

4.2 Suchmaschinen benutzen 63

Suchbegriff eintragen und Suchoptionen auswählen 64

Den richtigen Suchbegriff finden 64

Groß- und Kleinschreibung 65

Mehrere Suchbegriffe oder ganze Sätze eintragen 65

Anzeige der Suchergebnisse 65

Sonderfunktionen der Ergebnisanzeige nutzen 68

4.3 Die wichtigsten thematischen Verzeichnisse 69

Yahoo (http://www.yahoo.com/ bzw. http://www.yahoo.de/) 70

Die WWW Virtual Library (http://www.vlib.org/) 72

Deutsche Verzeichnisse 74

4.4 Thematische Verzeichnisse benutzen 74

Navigieren in thematischen Verzeichnissen 75

Thematische Verzeichnisse gezielt durchsuchen 75

Stichwortsuche – auch in thematischen Verzeichnissen 76

Der Unterschied zu den Suchmaschinen 76

Suchen in der richtigen Datenbank 77

5. Besprechungsdienste: Suchhilfen mit Qualitätskontrolle 78

5.1 Besprechungsdienste kommerzieller Anbieter 79

Der Webtip – der älteste deutsche Besprechungsdienst (http://www.webtip.de/) 80

»Lycos Top 5%« (http://point.lycos.com/categories) 82

Britannica (http://www.ebig.com/ bzw. http://www.eblast.com/) 84

Gib, und dir wird gegeben – die Vergabe von Logos durch Besprechungsdienste 85

5.2 Das »Argus Clearinghouse« (http://www.clearinghouse.net/) 85

6. Weitere Suchhilfen finden 88

6.1 Listen von Suchhilfen 88

6.2 Suchhilfen für Suchhilfen 89

Klug Suchen (http://www.klug-suchen.de/) 90

The Internet Sleuth (http://www.isleuth.com/) 90

Search.com (http://www.search.com/) 91

Search.de (http://www.search.de/) 92

Cusi (http://www.unix-ag.uni-siegen.de/search/) 92

Vor- und Nachteile von Meta-Suchhilfen 92

7. Hinter den Kulissen: Wie Suchmaschinen funktionieren und welche Grenzen sie haben 93

7.1 Arbeitsweise von Suchmaschinen 95

Das Einsammeln der Rohdaten 95

Analyse und Indexierung der eingehenden Daten 96

Analyse von Meta-Daten und unsichtbaren Textbestandteilen 97

Die Analyse der Suchanfrage 98

Die Sortierung der Treffer nach ihrer Relevanz 99

Berechnung der Relevanz von Suchergebnissen 100

Einbindung anderer Datenquellen 102

7.2 Was die Suchmaschinen nicht finden 104

Neu erstellte oder geänderte Dokumente 104

Geschützte Dokumente 105

Dynamische Dokumente/Datenbankgateways 105

Frames, Java und Javascript 106

Unprofessionell erstellte Dokumente 106

7.3 Welche Suchmaschine ist die richtige? 107

Andere Entscheidungskriterien 107

8. Erweiterte Techniken für die Stichwortsuche 108

8.1 Suchfunktionen und Anfragesyntax 110

8.2 Wortteile suchen 112

Maskierung mit Jokerzeichen 112

Substringsuche 113

Syntax und Beispiele für die Suche nach Wortteilen 113

8.3 Verknüpfung mehrerer Suchbegriffe: trennscharfe und unscharfe Suche, Abstandsoperatoren 115

»Unscharfe« Suche mit mehreren Begriffen 115

Syntax und Beispiele für unscharfe Suchanfragen 118

Trennscharfe Kombinationen mit den Booleschen Operatoren AND, OR und NOT 119

Syntax und Beispiele für Boolesche Anfragen 122

Der Abstandsoperator NEAR 123

Syntax und Beispiele für Abstandsoperatoren 124

8.4 Phrasensuche 124

Syntax und Beispiele für Phrasensuchen 125

8.5 Umlaute, Sonderzeichen und Kurzwörter 126

Umlaute – ein leidiges Thema 126

Sonderzeichen 127

Kurzwörter 127

8.6 Einschränkung auf Dokumentattribute 127

Syntax und Beispiele 129

Praktische Anwendung 130

8.7 Genauere Suchanfragen mit Klammern 132

Die passenden Begriffe ermitteln 133

Zusammenfassung 134

9. Recherchestrategien 135

9.1 Vorüberlegung: Was suche ich eigentlich? 135

9.2 Die richtigen Suchbegriffe verwenden 138

Je größer die Datenbank, desto spezieller der Suchbegriff 138

Je spezieller die Datenbank, desto spezieller der Suchbegriff 138

Vom Speziellen zum Allgemeinen 139

Denken Sie auch an die Sprache ... 139

9.3 Beispielrecherchen 139

Präsenz im Netz: Ist ... im Internet vertreten? 140

Raten 140

An der Quelle nachschlagen 141

Suchmaschinen benutzen 142

Informationen zu einem Themenbereich finden 144

Die Experten finden 145

Gleichgesinnte finden 146

Software finden 146

Dateien finden 146

Programme finden 148

Kommerzielle Software 150

Kommentierte Softwarelisten 151

Personen finden 153

9.4 Andere spezielle Suchhilfen 156

Suche nach aktuellen Nachrichten 157

Multimedia-Suche 159

10. Langfristige Strategien – wie man sich auf dem laufenden hält 161

10.1 Der neue Trend: Portal Sites 162

10.2 Newsgruppen lesen 165

10.3 Mailinglisten finden und abonnieren 165

Spezialverzeichnisse für Mailinglisten 165

Mailinglisten mit Suchmaschinen finden 166

10.4 Electronic Journals/E-Zines 167

Qualität elektronischer Zeitschriften 167

Bezug elektronischer Zeitschriften 168

Elektronische Zeitschriften finden 168

10.5 »Leitseiten« finden und beobachten 169

Leitseiten automatisch beobachten 170

11. Schnelle Beurteilung von Suchergebnissen 171

11.1 Was der URL verrät 171

Top-Level- und Second-Level-Domains 172

Erst Blick, dann Klick – Schlüsse aus dem Domainnamen ziehen 174

Schlüsse aus den Verzeichnis- und Dateinamen ziehen 175

Tilden-URLs und Benutzer-Homepages 175

11.2 Kommerzielle Interessen der Betreiber von Suchhilfen 176

12. Information als Ware: kommerzielle Anbieter 178

12.1 Die »klassischen« kommerziellen Datenbanken 179

Literaturdatenbanken ohne Text? 180

Text und Volltext 180

12.2 Produktion kommerzieller Datenbanken 180

12.3 Zugang zu kommerziellen Datenbanken 182

12.4 Fachliteratur online bestellen 186

Komfort hat seinen Preis 186

Document Delivery-Dienste 187

Direktbestellungen bei einer Bibliothek 189

12.5 Andere kommerzielle Dienste 190

Anhang 192

A. Suchindex – wo finde ich was? 192

B. Die wichtigsten URLs im Überblick 192

Meta-Suchmaschinen 192

Deutsche Suchmaschinen 193

Altavista (http://www.altavista.com/) 193

Thematische Verzeichnisse 193

Besprechungsdienste 193

Meta-Listen weiterer Suchhilfen 194

Spezielle Suchmaschinen/Datenbanken 194

C. Fehlermeldungen umgehen: URL-Tricks 194

Was passiert eigentlich beim Aufruf eines URL? 195

Lesen und verstehen Sie die Fehlermeldungen 196

Ist eine Verbindung mit dem Zielrechner zustandegekommen? 196

»Document not found« – und nun? 197

D. Mailinglisten abonnieren 199

E. Checkliste: Datenbank- und Suchmaschinentest 201

F. Weiterführende Informationen 203


Vorwort

Das Internet als Informationsquelle ...

... ist auf Anhieb nicht so leicht zu durchschauen. Neben Online-Chat, E-Commerce und virtuellen Welten bietet es eine unerschöpfliche Fülle an Fakten, Daten und Informationen. Täglich kommt Neues hinzu, und immer noch ist fast alles kostenlos abrufbar – wenn man es nur findet!

Dieses Buch beschreibt Wege und Werkzeuge zur effektiven Nutzung des Internet als Hilfsmittel für die Informationsbeschaffung. Manchmal genügt schon ein Tastendruck oder ein Mausklick, um den Schritt vom Freizeit-Surfen hin zur professionellen Recherche zu tun, denn im Internet steht neben der großen Informationsfülle auch eine breite Palette von leistungsfähigen Such- und Orientierungshilfen bereit.

In diesem Buch finden Sie nicht nur Beschreibungen dieser Suchhilfen und Anleitungen, wie sie benutzt werden, sondern auch wichtige Hinweise zum Aufbau allgemeiner Suchstrategien. Das Buch soll Ihnen helfen zu verstehen, wie Informationen im Internet publiziert werden und wie Sie dieses Wissen für eigene Recherchen umsetzen können. Das Verständnis der grundlegenden Suchstrategien hilft Ihnen, aus den derzeit vorhandenen Hilfsmitteln die geeigneten auszuwählen und maximalen Nutzen daraus zu ziehen.

Für wen ist dieses Buch geschrieben?

In diesem Buch werden die Grundbegriffe des Internet, sein Aufbau und seine technischen Grundlagen nicht nochmals beschrieben. Es gibt bereits genügend Literatur zu diesen Themen. Statt dessen richtet sich dieses Buch vor allem an:

In jedem Fall sollten Sie bereits ein paar Vorkenntnisse mitbringen. Ein funktionierender Internetzugang und Software für die Nutzung von WWW, Newsgruppen, E-Mail und FTP sollten ebenso vorhanden sein wie etwas Erfahrung im Umgang mit diesen Programmen.

Der Aufbau des Buches

Die ersten beiden Kapitel dieses Buches geben einen Überblick über die Vielfalt der Anbieter und der Inhalte, die Sie im Internet finden können, und über die verschiedenen Internetdienste, die neben dem WWW für diese Angebote benutzt werden. Gerade das Wissen über die Motivation der verschiedenen Anbieter ist ein wichtiger Faktor bei der Vorbereitung von Recherchen im Internet, denn ob etwas im Internet zu finden ist oder nicht, hängt heute weitgehend davon ab, ob sich jemand einen Vorteil von einer Veröffentlichung verspricht.

Im dritten Kapitel werden die verschiedenen Typen von Suchhilfen vorgestellt, die zur Informationssuche verwendet werden müssen. Die beiden wichtigsten Typen dieser Suchhilfen werden dann im vierten Kapitel besprochen: die Stichwortsuche mit Hilfe von Suchmaschinen und die Benutzung thematisch geordneter Verzeichnisse. Beide werden erläutert und miteinander verglichen, um die unterschiedlichen Einsatzgebiete dieser Techniken zu zeigen. Wer sich auch dafür interessiert, was hinter den Kulissen der Suchmaschinen passiert, findet im siebten Kapitel detailliertere Informationen zu diesem Thema.

Im fünften Kapitel geht es um Besprechungsdienste, die bei der Auswahl besonders interessanter oder wichtiger Angebote behilflich sind. Das sechste Kapitel vervollständigt das Quartett der Basiswerkzeuge, die für jede Internetrecherche benötigt werden: Es beschreibt Möglichkeiten, mit Hilfe sogenannter »Meta-Suchhilfen« weitere Hilfsmittel für besondere Zwecke zu finden.

Im achten Kapitel wird schließlich die Benutzung der zuvor besprochenen Hilfsmittel detaillierter erklärt und mit Syntaxbeispielen für besondere Feinheiten der Stichwortsuche illustriert.

Im neunten Kapitel werden die Mosaiksteine zusammengefügt: Anhand von einigen typischen Suchansätzen wird gezeigt, wie unter Verwendung aller besprochenen Suchhilfen allgemeine Suchstrategien aufgebaut werden.

Das zehnte Kapitel beschäftigt sich mit Methoden und Strategien, um das Internet nicht nur für punktuelle Anfragen zu benutzen, sondern sich auch längerfristig auf dem laufenden zu halten.

Im elften Kapitel finden Sie einige Tips, wie Sie die Informationen, die schon aus einem URL herauszulesen sind, dazu verwenden können, nach einer Recherche Ihre Suchergebnisse schnell auf ihre Brauchbarkeit zu überprüfen.

Weil das Buch sich in erster Linie mit kostenlos verfügbaren Informationsquellen beschäftigt, die manchmal für umfassende professionelle Recherchen nicht ausreichen, werden im zwölften Kapitel kostenpflichtige Informationsdienste und Datenbanken vorgestellt. Auch für die kostenpflichtige Beschaffung von gedruckter Fachliteratur werden Bezugsquellen und -methoden gezeigt.

Folgende Anhänge vervollständigen das Buch:

Ein kurzes Vorwort zur dritten Auflage

Dieses Buch war von Anfang an so konzipiert, daß es unabhängig vom tagesaktuellen Geschehen im Internet solide Basiskenntnisse über Recherchetechniken und -strategien für die Informationssuche im Netz vermittelt. Die freundliche Aufnahme des Buches und die positiven Kritiken haben gezeigt, daß das auch gelungen ist.

Leider hält die inhaltliche Qualität von Internetangeboten immer weniger mit dem immensen mengenmäßigen Wachstum mit. Für den Suchenden bedeutet das, daß beim Recherchieren nicht mehr, wie früher, hauptsächlich das Finden einer gesuchten Information problematisch ist, sondern vor allem das Aussieben verläßlicher Informationen aus einer Vielzahl ähnlicher Angebote. Ähnlich ist es auch bei den Suchmaschinen: Ihre Anzahl wächst zwar ständig, ohne jedoch einen wirklichen Zuwachs an Qualität zu bieten. Aus diesem Grund wird in dieser dritten Auflage genauer auf die Beschreibung und die Auswahl der richtigen Suchhilfen eingegangen. Die Konzeption des Buches ist im wesentlichen gleich geblieben, nur an einigen Stellen wurden kleinere Änderungen in der Struktur vorgenommen.

Was ist neu?

Wegen der wachsenden Bedeutung der Suche nach deutschsprachigen Inhalten sind die wichtigsten deutschen Suchhilfen nun gleichberechtigt neben den bereits bekannten internationalen Suchmaschinen aufgeführt und beschrieben. Anmerkungen zu regionalen Verzeichnissen wurden ergänzt.

Wichtige Grundbegriffe der Internetsuche wurden der besseren Übersicht halber in einem eigenen Kapitel den Suchbeispielen vorangestellt. Dabei ist auch ein Abschnitt zum Thema »lokale Volltextsuche« hinzugekommen (Kapitel 3).

Neu hinzugekommen ist ein Abschnitt zur Suche nach tagesaktuellen Nachrichten in Kapitel 9. Auch zum neuen Megatrend »Portal Sites« gibt es einen neuen Abschnitt in Kapitel 10. Ebenfalls neu ist der Anhang »Datenbank-Check«, der Tips zur systematischen Prüfung einer Suchmaschine oder Datenbank gibt, um schnell einen Überblick über ihre Qualität und ihren Umfang zu gewinnen.

Im übrigen sind alle Kapitel, ebenso wie die Recherche-Beispiele und Screenshots, aktualisiert und ergänzt worden.

Online-Ergänzungen zu diesem Buch

Auf der privaten Website des Autors (http://www.ausschlafen.com) finden Sie einige Ergänzungen zum Buch. Neben Errata (sofern notwendig) gibt es dort eine umfangreiche vorsortierte Liste der URLs aus diesem Buch mit vielen weiteren Suchhilfen, die aus Platzgründen hier nicht aufgenommen werden konnten.

Darüber hinaus ist ein kommentiertes Verzeichnis der Suchhilfen im Aufbau, damit nicht nur ein lapidarer Verweis auf diese Werkzeuge, sondern auch ein kurzer Kommentar und eine Bewertung ihrer Nützlichkeit abgerufen werden kann.

Ein Dankeschön ...

... an alle, die bei der Erstellung dieses Buches auf die eine oder andere Weise geholfen haben, vor allem an meine Frau Kirsten für ihre vielfältige Unterstützung, an Kerstin Grebenstein und das Team von O’Reilly Deutschland für die Geduld, die nötig war, um auch die dritte Auflage dieses Buches auf den Weg zu bringen, und an alle Betreiber von Suchdiensten und anderen Websites, die mir mit Auskünften und Hinweisen weitergeholfen haben.

1. Was findet man eigentlich im Internet?

In diesem ersten Kapitel soll es darum gehen, erst einmal einen Überblick über die scheinbar verwirrende Angebotsvielfalt zu gewinnen. Wer versteht, was, wo, wie, von wem und aus welchem Grund im Internet veröffentlicht wird, kann auch besser abschätzen, was er bei einer Suche erwarten kann. Und wer mit den richtigen Erwartungen startet, wird auch mehr Erfolg bei der Suche haben.

1.1 Was kann ich vom Internet erwarten?

Um es gleich vorwegzunehmen: im Internet finden Sie fast alles. Es gibt kaum ein Thema, das nicht an irgendeiner Stelle behandelt würde. Das soll keinesfalls heißen, daß das Internet auf magische Weise alle unsere Informationsprobleme löst. Im Internet vereinen sich aber viele Eigenschaften der bisher bekannten und benutzten Medien, und durch die neuen technischen Möglichkeiten werden sie noch wesentlich erweitert.

Hätten Sie beispielsweise erwartet, daß Sie im Internet die Auflösungen der Zaubertricks von David Copperfield finden? Oder die Fundstellen von Warentests aus verschiedenen deutschsprachigen Testzeitschriften? Oder eine Aufstellung von 120.000 Kunstwerken in französischen Museen, in der Sie nachsehen können, an welchem Ort ein Kunstwerk ausgestellt ist? Oder ein Verzeichnis, mit dessen Hilfe Sie deutsche Gesetzestexte nach Stichwörtern durchsuchen können? Oder eine Filmdatenbank, in der Sie herausfinden können, in wie vielen Filmen Humphrey Bogart und Lauren Bacall gemeinsam mitgespielt haben? Oder ein Musikverzeichnis, das es Ihnen ermöglicht, anhand eines Songtitels die zugehörige Musikgruppe und CD herauszufinden?1 Oder, oder, oder – diese Aufzählung ließe sich nahezu endlos weiterführen. Aber nur, wenn man überhaupt auf die Idee kommt, daß es solche Verzeichnisse geben könnte, kann man sie auch suchen – und finden.

Wie kommt nun diese Vielfalt zustande? Der wohl wichtigste Aspekt in diesem Zusammenhang ist die niedrige Schwelle für Anbieter, denn im Internet kann jeder Informationen ablegen und ständig weltweit verfügbar machen. Das gilt für den milliardenschweren Konzern ebenso wie für den Privatnutzer am heimischen PC. Obendrein ist die Präsenz im Internet kostengünstiger als in anderen Medien. Damit wird das Internet zum Spiegel seiner weltweit über 100 Millionen (geschätzten) Nutzer – und alles, was auch nur ein einziger dieser privaten oder institutionellen Nutzer für mitteilungswürdig hält, kann von allen anderen abgerufen werden, rund um die Welt und rund um die Uhr.

Aber das Internet ist nicht nur ein Publikations-, sondern gleichzeitig auch ein Transportmedium. Man kann es benutzen, um bereits existierende Informationssammlungen oder Datenbanken weltweit zugänglich zu machen. Weil es im Internet weltweit einheitliche Standards für die Datenübertragung und -kommunikation gibt, benötigen die potentiellen Benutzer im Regelfall neben einem Internetzugang nur einige wenige Standardprogramme. Diese Programme sind häufig bereits in die Betriebssysteme integriert, oder man erhält sie spätestens dann, wenn man bei einem Provider oder einem Onlinedienst seinen Internetzugang einrichten läßt.

Von der Möglichkeit, Informationen im Internet frei zugänglich abzulegen, haben zunächst vor allem Forschungseinrichtungen und Universitäten Gebrauch gemacht. Sie haben wertvolle wissenschaftliche Publikationen und Datenbanken für den weltweiten Zugriff freigegeben, um einen besseren Informationsaustausch zwischen Wissenschaftlern zu ermöglichen.

Heute ist die Anbindung hauseigener Datenbanken fast schon selbstverständlich geworden, wenn ein Unternehmen oder eine Institution den Schritt ins Internet tut. So wird auch der Zugang zu interessanten Ressourcen wie Produktverzeichnissen, Wissensdatenbanken, Informationsdiensten und vielen anderen, vorher nicht zugänglichen Datenbeständen möglich.

Wie man solche Dienste für die Informationsbeschaffung nutzen kann (auch wenn sie manchmal ganz anderen Zwecken dienen sollen), werden Sie in den nächsten Kapiteln erfahren.

1.2 Warum ist das Suchen und Finden so kompliziert?

Die Standards und Strukturen, auf denen das Internet basiert, sind nicht im Hinblick auf eine benutzerfreundliche und zielgerichtete Recherche entwickelt worden – ganz zu schweigen von der seinerzeit nicht abzusehenden Größe und der Wachstumsgeschwindigkeit, die das Netz heute aufweist.

Wir wollen hier nicht die hinreichend bekannten Geschichten über »Atombombensicherheit« und andere militärische Gesichtspunkte wiederholen, die beim Aufbau der Internettechnologie eine Rolle gespielt haben – Tatsache ist einfach, daß zunächst die Entwicklung von zuverlässiger Technik und Software im Vordergrund stand. Man könnte auch noch gehässigerweise hinzufügen, daß diese Arbeit ganz offensichtlich allein von Technikern und Computerexperten geleistet wurde und nicht von Spezialisten, die sich um die inhaltliche Aufbereitung gekümmert haben – aber das wäre wirklich undankbar ...

Mit dem Ergebnis dieser Entwicklung müssen wir jedenfalls leben – und mit einiger Übung geht das auch gut. Die wichtigsten Probleme bei der Informationssuche sind:

Aber keine Sorge! All diese Probleme lassen sich mit den passenden Hilfsmitteln und Strategien umgehen oder zumindest eingrenzen. Wir werden diese Strategien in den nächsten Kapiteln kennenlernen.

1.3 Wer wird »Anbieter« und warum?

Bei der Informationssuche im Internet ist es besonders wichtig, sich Gedanken darüber zu machen, ob irgend jemand irgendwo auf der Welt ein Interesse daran haben könnte, die gesuchte Information bereitzustellen, wer dieser Anbieter sein könnte und wo es ein geeignetes Plätzchen im Internet für eine Veröffentlichung der gesuchten Art geben könnte.

Der Begriff »Anbieter« ist in der Kapitelüberschrift in Anführungszeichen gesetzt, weil er hier in einer umfassenden Bedeutung gebraucht wird. Mit »Anbieter« sind nicht nur Firmen oder Institutionen gemeint, die eigene Dienste betreiben, sondern jede und jeder, die/der in irgendeiner Form Informationen beisteuert, sei es auf einer privaten Homepage, auf einer Mailingliste oder in einer Newsgruppe.

Wenn Sie wissen, welche Anbieter im Internet präsent sind und aus welchem Grund sie diesen Schritt unternehmen, wird es Ihnen leichter fallen, bei einer Suche brauchbare Einstiegspunkte zu finden. Deshalb werden in den folgenden Abschnitten einige »typische« Anbieter beschrieben. Folgende Gruppen werden Sie kennenlernen:

Privatpersonen, ihre Homepages und Diskussionsbeiträge

Auch Sie sind ein Experte. Genauso wie alle anderen Netzteilnehmer haben Sie ein Spezial- oder Interessengebiet, auf dem Sie sich besonders gut auskennen. In den verschiedenen Bereichen des Internet können Sie dieses Wissen auf vielerlei Art vorübergehend oder dauerhaft veröffentlichen. Und eben das tun viele der übrigen 100 Millionen Internetnutzer.

Sie haben keinen Gärtner im Bekanntenkreis, den Sie um Rat fragen können, weil Ihr sorgsam gehegter Farn rote Punkte hat? Aber vielleicht hat an irgendeinem anderen Ort der Welt ein Pflanzenfreund seine gesammelten Erfahrungen mit Farnen auf seiner privaten Homepage zusammengestellt! Oder es gibt eine Newsgruppe, die sich mit Gärtnerei beschäftigt und die Sie um Rat fragen können.

Die privaten Homepages und die Diskussionsbeiträge in Newsgruppen und Mailinglisten bilden einen unorganisierten, aber mächtigen Pool von vielfältigen Informationen und persönlichen Erfahrungen, von denen Sie profitieren können. Manche Forscher behaupten sogar, das Internet habe ähnliche Eigenschaften wie ein menschliches Gehirn: Informationen werden kurz- oder langfristig abgelegt, mit vorhandenen Informationen verbunden, neue Verknüpfungen entstehen (in Form von neuen Datenleitungen oder Hypertextverweisen), alte werden abgebaut. Ist das Internet also eine Art »Weltgedächtnis«?

Man muß es vielleicht nicht ganz so philosophisch betrachten. Sie können jedenfalls gerade dort die schrillsten, buntesten und vielseitigsten Facetten des Internet finden, wo sich menschliche Individuen ungebremst und ungefiltert austoben können. Alle nur denkbaren Themen, die unterschiedlichsten Blickwinkel und Ansichten gibt es zu entdecken. Allerdings – und auch das soll nicht verschwiegen werden – auch vieles, mit dem Sie im besten Fall nichts anfangen können oder was Sie im schlimmsten Fall sogar abstoßen oder verletzen könnte.

Wenn Sie das Internet noch nicht lange nutzen, werden Sie sich vielleicht fragen, was all diese Leute antreibt, die ihr Wissen unbedingt mit anderen teilen möchten. Natürlich sind die Motive vielfältig, aber zwei Dinge machen das Internet besonders reizvoll: Man bekommt zum einen Feedback – andere Menschen, auch aus weit entfernten Ländern, reagieren auf das, was man zu sagen hat. Zum anderen kann man den Profit, den man selbst aus dem Netz zieht, auf die gleiche Weise zurückgeben, indem man anderen hilft und sein Wissen mit anderen teilt. Ganz nebenbei kann man sich dabei auch als Fachmann oder Fachfrau profilieren – und das ist auch gut fürs eigene Ego.

Abbildung 1-1: Beispiel einer privaten Homepage mit nützlichem Inhalt

Firmen

Für Firmen aller Branchen ist das Internet zunächst eine ideale Plattform, um sich selbst und die eigenen Produkte zu präsentieren. Zwar ist die bloße Präsenz im Netz relativ günstig zu haben, aber um potentielle Kunden wirklich zu locken und zu halten, muß man neben der reinen Werbebotschaft noch Zusatzbonbons bieten.

Als Suchender können Sie deshalb gleich mehrfach profitieren. Zunächst können Sie natürlich Informationen über die jeweilige Firma, ihre Produkte und ggf. auch weitere Daten finden, was insbesondere bei ausländischen Firmen oder bei exotischen Produkten hilfreich ist. Aber zusätzlich können Sie eine Vielzahl kostenloser Angebote nutzen, die zu Werbezwecken entwickelt werden. Das kann Software zum Herunterladen sein, eine kostenlose »Probe« oder Demonstration des Produkts (z. B. ein Artikel aus einer Zeitschrift, eine Recherche in einer eigentlich kostenpflichtigen Datenbank oder ein Clip aus einem neuen Kinofilm). Es können auch besonders interessante Internetangebote sein, die mit dem Produkt oder der Firma selbst nichts zu tun haben und nur zu Image- oder Werbezwecken bereitgestellt werden.


Abbildung 1-2: Zusatzdienste auf einer Firmenhomepage: Datenbanken bei Quantum Software

Aber das Internet soll ja kein Zuschußgeschäft sein – Firmen, die im Netz präsent sind, wollen auch Geld verdienen und ihre Produkte verkaufen. Hier kommt wieder die Funktion des Internet als Transportmedium zum Tragen: Es erleichtert die weltweite Bereitstellung von Daten und Diensten aller Art und erlaubt es Ihnen, von zu Hause oder vom Arbeitsplatz aus auf solche Dienste zuzugreifen. Für eine gezielte Recherche nach bestimmten Informationen ist hier besonders das Angebot der Hersteller kommerzieller Informationsdienste und Datenbanken zu nennen. Früher konnten nur professionelle Informationsvermittler, Bibliotheken und Wissenschaftler solche Dienste über spezielle Netze benutzen. Heute können Sie das – gegen Bezahlung – via Internet selbst tun. Am Ende dieses Buches wird auf diese kostenpflichtigen Dienste näher eingegangen.

Universitäten und Forschungseinrichtungen

Sie sind das Urgestein des Internet – schließlich ist das Internet noch vor wenigen Jahren fast ausschließlich zum Daten- und Informationsaustausch zwischen Forschern, Wissenschaftlern und Studenten weltweit genutzt worden, und zu diesem Zweck sind ursprünglich auch die zugrundeliegenden Technologien entwickelt worden.

Noch heute bilden die wissenschaftlichen Institutionen wichtige Eckpfeiler der Verbreitung kostenlos abrufbarer Informationen, und das aus mehreren Gründen. Der wichtigste Grund ist sicher die gute technische Infrastruktur (Leitungen, Hardware, Systemverwalter und Rechenzentren mit Interneterfahrung, studentische Hilfskräfte), die an westlichen Universitäten eine Selbstverständlichkeit darstellt und meist nicht von Wissenschaftlern und Instituten selbst finanziert werden muß. Damit wird das Verbreiten von Informationen im Netz erheblich vereinfacht. Weitere Gesichtspunkte sind:

Sie können also davon ausgehen, daß insbesondere naturwissenschaftliche Themen aller Art umfassend repräsentiert sind. Angefangen bei Satellitenaufnahmen aus der Wetterbeobachtung über Tutorien zur Froschanatomie bis hin zu neuesten Ergebnissen aus der Krebsforschung oder frisch eingetroffenen Fotos ferner Planeten, die von Raumsonden aus dem All übermittelt wurden, ist die ganze Bandbreite naturwissenschaftlicher Betätigung im Netz präsent.

Aber auch die Geisteswissenschaften stehen hier nicht länger zurück. Neue Forschungsberichte aus der Psychologie sind ebenso abrufbar wie bis zu den antiken Philosophen zurückreichende historische Quellen oder literarische Werke mit abgelaufenem Copyright, zum Beispiel das Gesamtwerk von William Shakespeare.

Diese wenigen Beispiele sollten Ihnen einen Eindruck davon geben, was Sie von den wissenschaftlichen Angeboten im Internet erwarten können, und Ihnen zeigen, daß gerade die Universitäten schon eine längere Tradition in der Nutzung des Internets zu Publikationszwecken haben und mit umfangreichen Recherchemöglichkeiten auch dem Laien ihre Dienste zur Verfügung stellen.

Bibliotheken und Archive

Bibliotheken waren immer schon die Wirkungsstätten von Informationsprofis. Sie halten sich in ihren Fachdisziplinen auf dem laufenden, sichten die neueste Literatur auf diesen Gebieten, suchen das Wichtigste heraus und bereiten es für die Bibliotheksbenutzer auf. Deshalb waren die Bibliotheken bisher auch immer der Ansprechpartner Nummer eins, wenn es um die Beschaffung von Informationen ging.

Genau diese Aufgaben nehmen nun immer mehr Bibliotheken in bezug auf das Internet wahr. Dabei beschäftigen sie sich nicht mehr nur mit Informationen, die sie selbst »im Regal« haben, sondern auch mit Informationen, die im Netz abrufbar sind.

Aber natürlich haben die Bibliotheken auch einen riesigen Fundus von Literatur und Medien, die sie schon immer für ihre Nutzer bereitgestellt haben – und zwar in einem Umfang, der weit über das hinausgeht, was Sie anderswo finden können.

Diese Kombination von großen Beständen und der Kompetenz in der Beschaffung und Aufbereitung von Informationen machen die Internetangebote der deutschen und ausländischen Bibliotheken zum interessanten Anlaufpunkt für Informationssuchende. Viele Bibliotheken bieten Zugriff auf ihre Kataloge, spezielle Zusammenstellungen von gedruckter und online verfügbarer Literatur, und für eingetragene Benutzer besteht häufig die Möglichkeit, auch von der Bibliothek vorgehaltene Datenbanken via Internet abzufragen, Bücher vorzubestellen oder Aufsatzkopien per Fax oder E-Mail zu bestellen.

Besonders interessant sind kleinere Spezialbibliotheken oder Archive von wissenschaftlichen Instituten, sofern sie den Schritt ins Internet schon getan haben. Sie besitzen fachspezifische Sammlungen mit seltenen oder schwer auffindbaren Dokumenten und bieten entweder den direkten Zugriff oder weisen zumindest die Existenz solcher Literatur nach.


Abbildung 1-3: Beispielangebot einer kleinen Spezialbibliothek

Kurz und gut: die Internetangebote der in- und ausländischen Bibliotheken sind unverzichtbar, wenn es um die Suche nach gedruckter Literatur aller Art geht, aber darüber hinaus finden Sie dort auch wertvolle und von Fachleuten zusammengestellte Quellen für weitere Recherchen.

Offizielles: Regierungen, Parteien, Organisationen

Die Angebote von politischen und weltanschaulichen Organisationen sind für uns von Interesse, weil man dort »offizielle« Informationen direkt von der Quelle erhalten kann. Eine Organisation kann sich mit ihren Arbeitsschwerpunkten im Internet aktueller und umfangreicher präsentieren als z. B. in gedruckten Prospekten. Auch kleinere, weniger finanzstarke Organisationen wie Umwelt-, Menschenrechts- oder Selbsthilfegruppen können sich darstellen und Möglichkeiten zur Kontaktaufnahme bieten.

Die genannten drei Beispiele zeigen schon, daß nicht nur politische Organisationen im engeren Sinn gemeint sind, sondern auch Vereine, Verbände und Gruppierungen aller Art – von der katholischen Kirche bis zum Interessenverband der Sharewareautoren. Genau wie Regierungen haben auch sie »offizielle« Inhalte zu verbreiten, und als Suchender können Sie unter Umständen dann direkt beim Urheber fündig werden.

Abbildung 1-4: Die Homepage der Bundesregierung

Denken Sie also daran, daß Sie Gesetze, Protokolle, Urteile, Normen, technische Standards, Satzungen, offizielle Verlautbarungen, Jahresberichte und ähnliches auch direkt bei der jeweils zuständigen Organisation finden können – zum Beispiel also die Beachvolleyball-Regeln beim Sportverband, Parlamentspapiere beim Bundestag, technische Standards bei der betreuenden Organisation usw.

Medien und Medienkonzerne

Auch wenn Agenturen, Verlage, Sender und Medienkonzerne im Prinzip zu den Firmen gehören, sollen sie hier doch gesondert erwähnt werden. Schließlich bieten sie neben der reinen Selbstdarstellung noch weitere Dienste, die für das Recherchieren und das Suchen im Netz wichtig sind. Das liegt eigentlich auf der Hand, denn auch heute informieren wir uns über das, was in der Welt vorgeht, mit Hilfe der altbekannten Medien Presse, Radio und Fernsehen. Und ebenso können wir dies über das Internet tun, sowohl was aktuelle Informationen über das Internet selbst als auch über den Rest der Welt betrifft.

Gerade im Medienbereich wird zur Zeit viel experimentiert, und in dieser Phase gibt es viele nützliche Angebote, die kostenlos nutzbar sind. Dabei können insbesondere die länger bestehenden Unternehmen auf ihre Kompetenz und ihre Infrastrukturen zurückgreifen, die das Sammeln und Aufbereiten aktueller Informationen ermöglichen.

Aber auch neue, nur auf elektronischer Basis operierende Informationsdienste entstehen. Wir werden diese Angebote in den nächsten Kapiteln als Quelle tagesaktueller Informationen kennenlernen, die von anderen Anbietern im Netz so nicht zu erhalten sind.


Abbildung 1-5: Nachrichten, Zeitschriften, Fernsehsender und Entertainment: Time Warner Pathfinder

Verlage und Medienkonzerne sind aber auch unter einem ganz anderen Gesichtspunkt interessant: Sie besitzen Informationen und wollen sie vermarkten. Wie kann man Informationen besitzen? Wir wollen keine akademische Streitfrage daraus machen – nehmen wir statt dessen ein einfaches Beispiel: Sie haben in einer Quellenangabe einen interessanten Aufsatz über die Nebenwirkungen von Aspirin gefunden, der in einer medizinischen Fachzeitschrift erschienen ist, und möchten diesen Aufsatz nun lesen. Höchstwahrscheinlich wird der Verlag, der die Zeitschrift herausbringt und die Rechte an dem Aufsatz besitzt, ihn nicht kostenlos zur Verfügung stellen. Bisher hatten Sie nur die Wahl, sich die entsprechende Zeitschrift zu kaufen oder eine Kopie über eine Bibliothek beschaffen zu lassen. Viele Verlage gehen aber mittlerweile dazu über, ihre Produkte direkt oder über Zwischenhändler auch elektronisch zu »verkaufen«.

Häufig kann man solche Angebote benutzen, um zunächst einmal zu recherchieren, vielleicht sogar Probeabschnitte oder -kapitel zu lesen, bevor man tatsächlich kauft. Eine genauere Beschreibung solcher kommerziellen Dienste finden Sie weiter hinten in Kapitel 12.

... und der ganze Rest

Die bisher aufgelisteten »Kategorien« von Anbietern im Internet sind weder vollständig, noch können zwischen ihnen klare Grenzen gezogen werden. Es gibt selbstverständlich noch sehr viel mehr Anbietergruppen oder -typen im Netz, bei denen Sie Interessantes finden. Sie werden hier nicht mehr gesondert erwähnt, weil sie für den Aufbau spezieller Suchstrategien nicht unbedingt benötigt werden. Aber mit den Strategien, die wir in den nächsten Kapiteln kennenlernen werden, können Sie auch diesen »Rest« lokalisieren und benutzen.

1.4 Ist das alles kostenlos?

Vielleicht wundern Sie sich, daß bisher kaum über Geld gesprochen wurde. Die Angebote, von denen bisher die Rede war, sind zum überwiegenden Teil kostenlos abrufbar – abgesehen von den Kosten für den Internetzugang selbst. Warum ist das so?

Zunächst einmal ein klares Wort, verbunden mit einer Warnung: Informationen sind keineswegs frei, noch sind sie generell umsonst zu haben – sonst müßten auch Bücher wie dieses verschenkt oder kostenlos im Internet verbreitet werden. Wenn Sie zu einem speziellen Thema eine umfassende, vollständige und sinnvoll aufbereitete Recherche brauchen, dann müssen Sie entweder professionelle Informationsvermittler beauftragen (die es sowohl in institutioneller Form bei Bibliotheken, Firmen und Verbänden als auch in freiberuflicher Form gibt) und für diese Dienstleistung Geld bezahlen, oder Sie müssen selbst zum Informationsprofi werden, Datenbanken und Abfragesprachen kennenlernen, sich Zugang zu kommerziellen (und kostenpflichtigen!) Informationsdiensten beschaffen und vor allem unendlich viel Zeit aufwenden.

Anders ausgedrückt: Wenn Sie im Baumarkt Werkzeuge, Kabel und Schalter einkaufen, ist Ihre Elektroinstallation noch lange nicht fertig, von der fachlich korrekten und sicheren Ausführung ganz zu schweigen.

Aber das soll Sie auf gar keinen Fall abschrecken – das Internet ist nämlich das ideale Medium für Recherche-»Heimwerker«! Sie müssen sich nur im klaren darüber sein, daß Sie allein mit den derzeit angebotenen und in diesem Buch besprochenen kostenlosen Recherchehilfsmitteln unter Umständen nicht alle Aspekte einer Suchfrage abgedeckt haben. Das ist insbesondere dann wichtig, wenn es um rechtlich bindende oder geschäftlich wichtige Informationen geht. Der Autor dieses Buches würde sich jedenfalls nicht von einem Arzt behandeln lassen, der stolz behauptet, er habe sich ausschließlich im Internet über alle Risiken und Nebenwirkungen des verordneten Medikaments informiert ...

Wenn Sie aber im Wissen um diese Einschränkung das Internet als Mittel zur Basis-Informationsbeschaffung einsetzen und sich mit dem bestehenden Angebot zufriedengeben, dann haben Sie trotz allem ein mächtiges Hilfsmittel zur Verfügung.

Zurück zu den Kosten: Daß so viele wertvolle Angebote kostenlos abrufbar sind, verdanken wir mehreren glücklichen Umständen. Die Internettechnologie wurde nicht für Abrechnungszwecke entwickelt, sondern, wie bereits erwähnt, zunächst einmal mit dem Ziel der zuverlässigen Datenübertragung. Zwar wird es mit Sicherheit nicht mehr allzulange dauern, bis sich brauchbare Abrechnungssysteme flächendeckend etabliert haben, aber dennoch gibt es im Internet eine »Verkaufskultur«, die dem potentiellen Kunden möglichst entgegenkommt.

Die Anbieter erreichen dies mit Angeboten, die man vor dem Kauf ausprobieren kann, mit den bereits genannten zusätzlichen Werbebonbons, die die Kunden zum wiederholten Besuch eines WWW-Servers verleiten sollen, oder ganz einfach mit sinnvollen Serviceleistungen, die aufgrund der großen Konkurrenz im Netz laufend erweitert werden. All dies kann man auch zu Informationszwecken gebrauchen. So können Sie die Katalogdatenbank eines Online-Buchhändlers durchaus für eine Literaturrecherche verwenden, ohne unbedingt auch dort kaufen zu müssen, um nur eines von vielen Beispielen zu nennen. Wir werden noch weitere Beispiele kennenlernen.

Ein weiterer Aspekt: Im Vergleich zu anderen Medien kann man als Anbieter im Internet mit relativ geringen Kosten auftreten und dies darüber hinaus gestalterisch und technisch in Eigenregie tun (wenn man will), so daß es die ideale Publikationsplattform gerade für kleine Firmen oder Organisationen bleibt.

Zum Schluß ein Vergleich: Denken Sie an die Privatsender im Fernsehen – die meisten Programme kosten Sie nichts (außer der Bereitschaft, Werbung zu ertragen), und dennoch können Sie sie nach Belieben nutzen. Andere Programme sind nur gegen Bezahlung zu empfangen. Der gleiche Trend zeichnet sich im Internet ab: Manche Anbieter versuchen, ihre Dienste durch Sponsoren, Werbung oder den Verkauf von Waren und Dienstleistungen zu refinanzieren, andere kassieren direkt bei den Benutzern.

Welche Alternative auch gewählt wird – letztendlich liegt es im Interesse aller bisher genannten Anbietergruppen, daß ihre Dienste, Angebote und ihre reine Präsenz auch von den Nutzern wahrgenommen werden. Dies ist der beste Garant dafür, daß es auch weiterhin kostenlos nutzbare interessante Internetdienste geben wird.

2. Mehr als WWW: wichtige Internetdienste

Im Internet gibt es mehr als nur das World Wide Web – eine simple Feststellung, die aber häufig übersehen wird. Wenn in den Medien über »das Internet« berichtet wird oder wenn jemand erzählt, er sei »im Internet gewesen«, dann ist meist das WWW gemeint, obwohl es nur einer von vielen Internetdiensten ist. In diesem Kapitel werden weitere Internetdienste besprochen, die neben dem WWW für Ihre Recherchen bedeutsam sein könnten. Sie erfahren etwas über E-Mail und Mailinglisten, FTP, Telnet, die Newsgruppen sowie Z39.50 und Gopher.

Dabei geht es vor allem um den Nutzen für die Beschaffung von Informationen, nicht um eine detaillierte Beschreibung der Dienste und ihrer Funktionsweisen. Wenn Sie tiefer in diese Details einsteigen möchten, können Sie andere Bücher ergänzend zu Rate ziehen, z. B. das Buch »Internet in a Nutshell«, das eine gute Übersicht bietet. Aber Sie finden entsprechende Informationen natürlich auch in anderen Büchern oder im Internet selbst.

Ein kleiner Exkurs: Was ist eigentlich ein »Internetdienst«?

Kurz gesagt entsteht ein Internetdienst einfach aus dem Zusammenspiel von aufeinander abgestimmten Programmen, die über das Internet auf genau festgelegte Weise Daten austauschen. Ihr WWW-Browser ruft Seiten von einem WWW-Server ab: Sie benutzen den Dienst »WWW«. Ihr E-Mail-Programm empfängt und verschickt Nachrichten über einen Mailserver – dies ist der Dienst »Mail«. Das funktioniert unabhängig vom jeweils verwendeten Programm oder Betriebssystem, denn in sogenannten Protokollen ist genau festgelegt, wie die Programme miteinander zu kommunizieren haben.

Viele Softwarepakete beherrschen den Umgang mit mehreren Internetdiensten. Insbesondere die WWW-Browser vereinen die wichtigsten Dienste unter einem Dach. Sie können also mit Netscape & Co. die Dienste WWW, Mail, News und FTP nutzen, und durch sogenannte »Plug-ins« lassen sie sich modular erweitern, so daß auch neue Dienste integriert werden können.

Deshalb bemerkt man häufig gar nicht, daß man mit seinem Browser von einem Dienst zu einem anderen wechselt. Weil aber bestimmte Informationen auf einzelne Dienste beschränkt sind, sollen in den folgenden Abschnitten die Besonderheiten der wichtigsten Dienste besprochen werden.

2.1 Das World Wide Web

Das World Wide Web war und ist der Wachstumsmotor des Internets, und es ist zur Zeit auch der Wachstumsmarkt Nummer eins. Erst die bequeme Hypertextnavigation, die mit einem einfachen Mausklick ein beliebiges Dokument auf einem Rechner irgendwo auf der Welt anwählbar macht, hat das WWW und damit auch das Internet für die breite Masse der heutigen Netzteilnehmer nutzbar und attraktiv gemacht.

Was findet man also im WWW? Eines läßt sich vorab schon mit Bestimmtheit sagen: der überwiegende Teil aller kommerziellen Anwendungen – und vor allem auch der Großteil der Werbung – im Internet spielt sich im WWW ab, ganz einfach aufgrund des Zusammentreffens von hohen Nutzerzahlen und grafischen Gestaltungsmöglichkeiten.

Ansonsten gibt es im WWW keinerlei Beschränkung der angebotenen Informationen, weder geographisch noch inhaltlich. Sie finden langfristig abgelegte (und manchmal auch veraltete) ebenso wie hochaktuelle Daten, bis hin zu live übertragenen Bildern, Tönen oder Textinformationen (z. B. Börsenkurse oder Sportergebnisse).

Aber auch solche Dienste und Angebote, die nicht direkt im WWW abrufbar sind, kann man zumindest im WWW finden. Das entspricht in etwa dem Gebrauch einer Programmzeitschrift – Sie benutzen das Medium »Zeitschrift«, um ein Angebot im Medium »Fernsehen« zu finden. Ebenso sind viele Angebote, die nicht im WWW selbst liegen, im WWW zumindest beschrieben, meist auch mit Erläuterungen über Zugang und Benutzung.

Darüber hinaus gibt es, gerade weil das WWW so leicht zu benutzen ist, für viele Angebote auch spezielle WWW-Übergänge, sogenannte Gateways. Ein Gateway ist ein Programm, das den Benutzern erlaubt, über das WWW Eingaben für einen anderen Dienst abzusenden. Das Gateway nimmt diese Eingaben entgegen und bereitet sie dann für den anderen Internetdienst oder für eine interne Datenbankabfrage auf. Die Ergebnisse werden dem Benutzer dann wieder via WWW zurück übermittelt. Auf diese Weise kann man ohne zusätzliche Software andere Internetdienste in Anspruch nehmen.

Ein Beispiel: Um Beiträge in Newsgruppen (siehe weiter unten in diesem Kapitel) zu lesen oder zu schreiben, benötigt man eigentlich ein gesondertes Programm, einen sogenannten Newsreader. Statt dessen kann man aber auch direkt via WWW in den Newsgruppen stöbern, indem man ein WWW-Gateway zu den Newsgruppen verwendet. Ein solches Gateway wird in Deutschland beispielsweise von »Web.de« betrieben (http://netnews.web.de/). Hier kann man über eine benutzerfreundliche Oberfläche die vorhandenen Gruppen ansehen und einzelne Beiträge abrufen. Die Kommunikation mit dem Newsserver, der diesen Dienst eigentlich bereitstellt, wird dabei über den WWW-Server von Web.de abgewickelt.

Anstelle der in Abbildung 2-2 gezeigten Darstellung von Newsgruppen kann ein Gatewayprogramm auch jede andere programmiertechnisch machbare Leistung vollbringen, zum Beispiel eine Datenbankabfrage, die Erstellung einer Grafik, die auf Ihren Eingaben basiert, und vieles mehr. Wichtig ist nur, daß Ein- und Ausgabe über das WWW erfolgen, so daß alles mit Ihrer Standardbrowsersoftware bedienbar bleibt.

Aus diesem Grund werden heute viele Internetangebote über solche Gateways abgewikkelt: Produktverzeichnisse, Datenbanken, Bibliothekskataloge, aber auch interaktive Dienste wie Bestellannahme, Schwarze Bretter, Chat und vieles mehr können komfortabel über das WWW benutzt werden.

Mit anderen Worten: das WWW ist für die meisten Suchanfragen die erste und wichtigste Anlaufstation, und praktischerweise gibt es für das WWW auch die besten und vielfältigsten Suchhilfen, die wir in den nächsten Kapiteln kennenlernen werden.


Abbildung 2-2: Beispiel für ein WWW-Gateway: Newsgruppen im Browser ansehen

2.2 E-Mail

Auch E-Mail kann auf vielfältige Weise zur Informationsbeschaffung verwendet werden – wenn Sie kreativ damit umgehen.

Zuallererst bietet Ihnen E-Mail die Möglichkeit zur schnellen und direkten Kontaktaufnahme mit Personen rund um die Welt – im besten Falle mit Expertinnen oder Experten, die Ihnen bei Ihrer Informationssuche behilflich sein könnten. Wenn Sie im WWW, in einer Newsgruppe, einer Zeitschrift oder auch in einem Experten-Suchdienst wie »wer-weiss-was« (http://www.wer-weiss-was.de/) die E-Mail-Adresse einer Person oder einer Institution finden, können Sie natürlich versuchen, einen Kontakt herzustellen – ebenso wie Sie es mit einem Anruf oder einem Brief versuchen könnten.

Mit »Experten« sind hier nicht etwa nur Wissenschaftler gemeint. Wie schon im ersten Kapitel erwähnt, können Sie via Internet auch den Wissens- und Erfahrungsschatz vieler Privatpersonen »anzapfen«, sei es durch den Abruf ihrer WWW-Homepages oder eben mit Hilfe von E-Mail.

Vergessen Sie aber nicht, daß Sie es mit Menschen zu tun haben, und denken Sie an die üblichen Umgangsformen. Sagen Sie, wer Sie sind und woher Sie die E-Mail-Adresse des Empfängers haben; schildern Sie Ihr Anliegen präzise, und geben Sie an, zu welchem Zweck Sie die gesuchte Information benötigen. So geben Sie dem Empfänger alle notwendigen Informationen, damit er entscheiden kann, ob er Ihnen antworten möchte. Eine höflich formulierte und gut begründete Anfrage hat dabei allemal die besseren Chancen. Es ist übrigens das gute Recht jedes Empfängers einer solchen Mail, nicht zu antworten – Beschwerden sind in so einem Fall nicht angebracht.

2.3 Mailinglisten und Newsletter

Ein weiterer wichtiger Weg, sich mittels E-Mail Informationen zu beschaffen, ist die Benutzung von Mailinglisten (häufig auch Listserver oder Diskussionslisten genannt). Mailinglisten bieten Ihnen die Möglichkeit, sich einem bestehenden Kreis von (Berufs-) Kollegen oder ganz allgemein von Menschen anzuschließen, die sich über ein bestimmtes Thema austauschen. Sie können an diesen Diskussionen aktiv teilnehmen oder auch einfach nur »zuhören«, genauer gesagt, mitlesen, was andere zu diesem Thema zu sagen haben. Die Weiterleitung und der Austausch der Beiträge geschehen bei Mailinglisten, wie der Name schon sagt, über E-Mail.

Werfen wir zuerst einen kurzen Blick auf die Funktionsweise von Mailinglisten – alles, was Sie brauchen, um sie zu nutzen, ist ein E-Mail-Programm und die Möglichkeit, E-Mail via Internet zu verschicken und zu empfangen. Dabei spielt es keine Rolle, ob Sie Ihre Mail über einen Provider oder über einen Online-Dienst wie Compuserve oder T-Online versenden und empfangen.

Das Grundprinzip von Mailinglisten ist der automatisierte Versand von Nachrichten an alle eingetragenen Teilnehmer: Um alle Teilnehmer einer Liste zu erreichen, genügt eine einzige Nachricht an die Adresse der Liste.

Mailinglisten gibt es zu einer Vielzahl von Themen. Für ihre Einrichtung ist lediglich ein ans Internet angeschlossener Rechner mit Mailzugang und spezieller Listensoftware nötig. Deshalb läßt sich ihre genaue Zahl nicht ermitteln, aber Schätzungen zufolge gibt es weltweit über 90.000. Die wichtigsten Typen von Mailinglisten sind:

Auf Mailinglisten des ersten und zweiten Typs findet ein ständiger Austausch, meist nach dem Frage-Antwort-Schema, statt: Ein Teilnehmer stellt eine Frage (die zum vorgegebenen Thema der Mailingliste gehört), andere Listenteilnehmer beantworten oder kommentieren diese Frage – und alle Teilnehmer können vom Mitlesen profitieren. Daneben werden auf Mailinglisten auch solche Informationen weitergegeben, von denen der Absender annimmt, daß sie von allgemeinem Interesse für die anderen Teilnehmer sind. Abbildung 2-4 zeigt eine Übersicht mit Beiträgen aus einer soziologischen Mailingliste. Die Betreffzeilen geben einen Eindruck von den Beiträgen und dem Hin und Her von Frage und Antwort.

Die Abbildung 2-4 zeigt übrigens auch die sinnvolle Integration zweier Dienste: Während die eigentliche Mailingliste über E-Mail betrieben wird, sind die Beiträge anschließend auch gesammelt im WWW abrufbar. Solche Mailinglistenarchive sind gut geeignet, um sich einen Eindruck von einer Liste zu verschaffen und zu entscheiden, ob sie für den eigenen Gebrauch geeignet ist.


Abbildung 2-4: Beispiele für Beiträge zu einer Mailingliste

Welchen Nutzen bieten Mailinglisten?

Mailinglisten sind ein unschätzbares Hilfsmittel, wenn Sie sich über ein bestimmtes Thema, das für Sie beruflich oder privat interessant ist, auf dem laufenden halten wollen. Auch wenn Sie nicht immer die Zeit dazu haben, auf einem Gebiet ständig die neuesten Entwicklungen aktiv zu verfolgen, können Sie mit Hilfe einer geeigneten Mailingliste den Überblick über aktuelle Trends und Diskussionen behalten. Wie bei einem Zeitschriftenabonnement landen die Beiträge in Ihrer Mailbox, so daß Sie nach dem erstmaligen Subskribieren nicht nochmals aktiv werden müssen.

Außerdem können Sie über Mailinglisten Kontakte zu Kollegen oder zu Menschen mit gleichen Interessen knüpfen, die Sie sonst vielleicht niemals kennengelernt hätten. Die Kommunikation über Mailinglisten funktioniert sowohl über Ländergrenzen wie auch über Standes- oder Hierarchiebarrieren hinweg.

Im Anhang finden Sie eine Anleitung für die Anmeldung bei einer Mailingliste. Wie Sie eine passende Mailingliste finden können und welche Hilfsmittel es dafür gibt, erfahren Sie in Kapitel 10, in dem es um die langfristigen Suchstrategien geht.

2.4 Newsgruppen

Die Newsgruppen (oder Newsgroups) sind öffentliche Foren, in denen Teilnehmer aus aller Welt eine fast unendliche Vielfalt von Themen diskutieren. Sie funktionieren ähnlich wie Schwarze Bretter: Die Teilnehmer schreiben ihre Beiträge und senden sie an eine Newsgruppe ab, ganz so, als würde man einen Zettel an eine Pinnwand heften. Über das weltweite Netz von Newsservern werden die neuen Beiträge weitergereicht, so daß sie von allen Interessenten gelesen, beantwortet oder kommentiert werden können.

Der Unterschied zu den im letzten Abschnitt besprochenen Mailinglisten ergibt sich aus der Unverbindlichkeit und der relativen Anonymität in den Newsgruppen. Auch hier gilt wieder die Analogie zum Schwarzen Brett: Es gibt keinen fest umrissenen Teilnehmerstamm; wenn man sich für eine bestimmte Gruppe interessiert, ruft man die gerade vorhandenen Beiträge von seinem Newsserver (meist beim eigenen Provider) ab. Nach einer gewissen Zeit fallen ältere Beiträge heraus und werden von neuen überschrieben. Wie schnell das geht, hängt von der Konfiguration des jeweiligen Newsservers und der Häufigkeit ab, in der neue Beiträge zu einer Gruppe eingehen.

Das inhaltliche Spektrum der Newsgruppen umfaßt alle nur denkbaren Bereiche, angefangen bei wissenschaftlichen Themen über Technik-, Politik- oder Freizeitgruppen bis hin zu bizarren Themen wie zum Beispiel Diskussionen über Nasenhaar oder Vampirismus. Welcher Gegenstand auch immer besonders interessant für Sie sein mag – Sie können ziemlich sicher sein, daß es irgendwo auf der Welt Gleichgesinnte gibt. In einer passenden Newsgruppe können Sie sie finden und – wenn Sie wollen – Kontakte knüpfen.

Um in die Vielzahl der Gruppen eine gewisse Ordnung zu bringen, die eine Orientierung ermöglicht, sind die Gruppen in sogenannte Hierarchien aufgeteilt. Jede Hierarchie kann – je nach Größe – wiederum Untergruppen beinhalten. Aus dieser hierarchischen Struktur der Newsgruppen ergibt sich für jede Gruppe eine mehrteilige Bezeichnung, aus der man mit etwas Phantasie das jeweils behandelte Themengebiet ableiten kann. Die wichtigsten Kategorien finden Sie in der Tabelle 2.1.

Kategorie

Bedeutung

Beispiele für Untergruppen

alt

alternative – die »etwas anderen« Gruppen

alt.out-of-body alt.revolution

biz

business – Kommerzielle Gruppen für Werbung, Verkauf oder auch Stellenangebote

biz.jobs.offered biz.marketplace.services

comp

computer – Themen rund um den Computer

comp.databases.xbase comp.ibm.pc.hardware

misc

miscellaneous – »Verschiedenes«; Gruppen, die keiner anderen Hierarchie eindeutig zuzuordnen sind

misc.kids.health misc.activism.militia

rec

recreation – Hobby- und Freizeitthemen

rec.arts.theatre rec.collecting.coins

sci

science – Wissenschaftliche Foren

sci.med.diseases.cancer sci.physics.particle

soc

social – Kultur und Soziales

soc.culture.italian soc.feminism

de

deutschsprachige Gruppen

de.markt.arbeit cl.gentechnik.diskussion maus.rec.buecher
z- nezt.forum.verkehr

Tabelle 2-1: Newsgruppen: Kategorien und Bezeichnungen

In den international verbreiteten Gruppen ist Englisch die vorherrschende Sprache. Der Teilnehmerkreis ist prinzipiell nicht beschränkt, aber erfahrungsgemäß angloamerikanisch dominiert.

Es gibt natürlich auch deutschsprachige Newsgruppen. Ihre Bezeichnungen beginnen mit dem Kürzel de. In den Unterkategorien werden teilweise die englischen Kategorienkürzel verwendet, zum anderen Teil auch deutsche Begriffe (zum Beispiel de.alt.fotografie oder de.comp.sys.apple). Neben der de-Hierarchie werden aber auch Diskussionsforen aus deutschen Mailboxnetzen in Newsgruppen umgesetzt und über das Internet verbreitet, beispielsweise das maus-Netz oder das politisch-ökologisch orientierte CL-Netz. Dabei ergeben sich manchmal inhaltliche Überschneidungen zu den Gruppen der de-Hierarchie.

Newsgruppen finden

Analog zu der deutschsprachigen Hierarchie der de-Gruppen gibt es auch in anderen Ländern eigene Newsgruppen-Hierarchien, die standardmäßig nicht weltweit verbreitet werden. Welche Gruppen Sie lesen können, hängt davon ab, welche Gruppen Ihr Provider bezieht. Die Liste der vorhandenen Gruppen können Sie mit Ihrer Newssoftware von Ihrem Newsserver abrufen.

Leichter fällt der Einstieg in die Benutzung von Newsgruppen mit einem WWW-Gateway, das die Beiträge vieler Gruppen via WWW abrufbar macht und die Gruppenhierarchien benutzerfreundlich darstellt. Für deutsche Newsgruppen wird dieser Service von Web.de angeboten (http://netnews.web.de/ – vgl. auch Abbildung 2-2); die internationalen Newsgruppen kann man bei DejaNews (http://.dejanews.com /) lesen. Bei beiden können Sie nicht nur direkt im aktuellen Inhalt der Newsgruppen blättern, sondern auch mit einer Suchfunktion alle Beiträge durchsuchen. DejaNews hat darüber hinaus auch ein großes (durchsuchbares) Archiv älterer Beiträge.


Abbildung 2-5: Newsgruppen via WWW durchstöbern bei DejaNews und Web.de

Bei der Benutzung dieser Dienste empfiehlt es sich, zunächst mit Hilfe der Suchfunktion nach dem Thema zu suchen, das Sie interessiert. Anhand der Treffer können Sie feststellen, in welchen Newsgruppen dieses Thema vorkommt, und dann diese Gruppen durchstöbern. Wenn Sie dabei auf Newsgruppen stoßen, die Sie zukünftig regelmäßig lesen möchten, sollten Sie auf die Verwendung »echter« News-Software umsteigen. Sowohl Netscape als auch der Internet Explorer enthalten solche Software.

Falls eine Gruppe, die interessant für Sie ist, noch nicht auf Ihrem »zuständigen« lokalen Newsserver geführt wird, können Sie den Verwalter dieses Servers bitten, die Gruppe künftig zu beziehen, damit Sie sie mit Ihrer Newsreadersoftware abrufen können. Ob eine Gruppe auf Ihrem lokalen Newsserver bereitsteht, können Sie, wie bereits erwähnt, mit einem Blick in die Gesamtübersicht der vorhandenen Gruppen feststellen, die Ihre Newsreadersoftware Ihnen anzeigt.

Sie können aber auch sogenannte »öffentliche« Newsserver benutzen. Das sind Server, die nicht nur die Benutzer eines bestimmten Providers bedienen, sondern für jedermann zugänglich sind. Unter http://www.muenz.com/ finden Sie eine Datenbank öffentlicher Newsserver, die Ihnen hilft, zu einer bestimmten Gruppe einen Server zu finden, der diese führt.

Der Nutzen von Newsgruppen

Im Prinzip bieten Newsgruppen einen ähnlichen Nutzen wie Mailinglisten – man kann aktuelle Diskussionen zu einem bestimmten Thema verfolgen und sich auf dem laufenden halten. Dennoch sind Beiträge in den Newsgruppen insgesamt weniger fokussiert und verlieren sich manchmal in Diskussionen um Nichtigkeiten. Ebenso gibt es aber auch Gruppen, in denen die Teilnehmer engagiert und kompetent diskutieren. Sowohl das Niveau als auch das »Klima« und die Diskussionskultur weisen von Gruppe zu Gruppe himmelweite Unterschiede auf. An dieser Stelle kann nur dringend empfohlen werden, sich selbst einmal einen Eindruck von verschiedenen Gruppen zu verschaffen.

Unabhängig vom fachlichen Niveau sind die Newsgruppen aber ein sehr gutes Stimmungsbarometer. Sie bieten die Möglichkeit, die Sichtweisen und Erfahrungen vieler Menschen kennenzulernen. Aktuelle Vorkommnisse, Entwicklungen und auch Gerüchte werden tagesaktuell weitergegeben und kommentiert. Dies ist besonders dann von Interesse, wenn sich besondere Ereignisse in den Diskussionen widerspiegeln. Neue Therapiemethoden für Krankheiten oder umstrittene Gesetzesvorlagen werden ebenso wie viele andere aktuelle Geschehnisse oder Bekanntmachungen häufig in den Newsgruppen besprochen, bevor sie auch in anderen Internetdiensten Erwähnung finden.

Für eine gezielte Informationssuche sind die Newsgruppen nur bedingt geeignet. Vor allem die Vergänglichkeit der Beiträge sorgt dafür, daß es dem Zufall überlassen bleibt, ob eine gesuchte Information gerade dann in einer Gruppe zu finden ist, wenn Sie danach suchen. Dieser Nachteil wird teilweise durch einige der im Anschluß besprochenen Suchhilfen gemildert, die die Möglichkeit zur Recherche im Volltext fast aller Newsgruppen bieten. Einige dieser Dienste bewahren Newsgruppenbeiträge über einen längeren Zeitraum hinweg auf, meist etwa vier Wochen. Geplant sind aber auch Gesamtarchive aller bisher verfaßten Beiträge. Bei dem oben bereits erwähnten Anbieter DejaNews (http://www.dejanews.com/) ist in einem gesonderten Bereich (»complete archive«) bereits ein Zeitraum von mehreren Jahren abgedeckt.

Wenn Sie beim Durchstöbern der Newsgruppen nichts finden können, haben Sie auch jederzeit die Möglichkeit, ein Problem in einer thematisch passenden Gruppe zu schildern und andere Leser dieser Gruppe um Rat zu fragen. Dabei sind Umfang und Qualität der Ergebnisse im voraus schlecht abschätzbar und oft von Zufällen abhängig. Wenn Sie Glück haben, kann eine Frage innerhalb von wenigen Stunden beantwortet werden. Genausogut kann es aber auch passieren, daß die Frage nicht weiter beachtet wird.

Ebenso wie bei persönlichen Anfragen via E-Mail sind auch bei Anfragen in Newsgruppen bestimmte Regeln zu beachten. Die Newsgruppen sind ein System, das vom Prinzip »Geben und Nehmen« lebt. Insbesondere sind die Gruppen nicht dazu da, eigene Bemühungen durch das Nachfragen in den Gruppen zu ersetzen. Ein guter Einstieg für die aktive Benutzung der Newsgruppen ist die Lektüre der (deutschsprachigen) Gruppen de.newusers und de.newusers. questions, wo auch regelmäßig einführende Texte für Neulinge veröffentlicht werden.

Die FAQs – Frequently Asked Questions (und die Antworten darauf)

Durch die hohe Fluktuation der Leser einzelner Newsgruppen werden bestimmte Fragen immer wieder aufs neue gestellt. Weil dies auf Dauer für die Stammleser der Gruppen ermüdend ist, gibt es für viele Newsgruppen eine sogenannte »FAQ«-Liste, die regelmäßig in der Gruppe veröffentlicht wird. Die Abkürzung steht für »frequently asked questions« und bezeichnet ein Dokument, in dem die am häufigsten gestellten Fragen zusammengestellt und beantwortet werden. Die FAQ-Liste zu einer Gruppe ist damit oft eine recht brauchbare erste Einführung zum jeweiligen Thema. Eine Sammlung fast aller FAQ-Dokumente ist via FTP auf dem Server ftp.uni-paderborn.de im Verzeichnis /pub/FAQ nach Gruppennamen geordnet abrufbar ( für die Eingabe im Browser: ftp://ftp.uni-paderborn.de/pub/FAQ/).

Der Begriff FAQ wird inzwischen aber auch unabhängig von den Newsgruppen für eine grundlegende Einführung zu einem Thema oder Produkt benutzt, die in Frage-Antwort-Form verfaßt ist.

2.5 Telnet

Ein Telnet-Clientprogramm gehört bei vielen Betriebssystemen schon zum Lieferumfang, oder es ist in Programmpaketen für den Internetzugang enthalten. Wahrscheinlich besitzen Sie es also bereits.

Telnet ist dazu gedacht, über ein lokales oder globales Netzwerk Verbindung zu einem anderen Rechner aufzunehmen, um auf diesem entfernten Rechner zu arbeiten. Unter »arbeiten« versteht man dabei die Ausführung von Software auf dem entfernten Rechner. Dies heißt, daß Sie auf Ihrem Rechner lediglich ein Telnet-Programm für die Verbindungsaufnahme installiert haben und den Rechner am anderen Ende der Leitung sozusagen »fernbedienen«. Die eigentlichen Anwendungsprogramme laufen also auf dem entfernten Rechner, und Ihr PC dient lediglich als Terminal, auf dem die Bildschirmausgaben dargestellt und die Tastatureingaben entgegengenommen werden.

Auch heute noch haben viele Anbieter solche Telnet-Zugänge, vor allem für Programme und Datenbankanwendungen, die auf Großrechnerhosts laufen. Auch Mailboxsysteme oder Bibliothekskataloge kann man via Telnet erreichen. Beispielsweise ist es für eine Universitätsbibliothek, die ihren Katalog ohnehin am Campus über Textterminals für die Benutzer zugänglich macht, wesentlich einfacher und sinnvoller, einen Telnet-Zugang via Internet einzurichten als eine WWW-Schnittstelle zu schaffen.

Dienste, die nur über Telnet erreichbar sind, sind also keineswegs altmodisch. Allerdings ist es in den ersten Minuten meist etwas problematisch, sich zu orientieren. Denn was Sie nach dem Verbindungsaufbau erwartet, welche Kommandos oder Tastenkombinationen zur Bedienung unterschiedlicher Datenbanken oder Bibliothekskataloge nötig sind und wie die Benutzerführung aussieht, ist nicht einheitlich festgelegt. Es hängt vielmehr von dem Programm ab, das auf dem entfernten Rechner läuft, und deshalb müssen Sie sich jedesmal aufs neue damit vertraut machen. Gut programmierte Benutzerschnittstellen zeigen jeweils die wichtigsten Kommandos zur Auswahl an oder arbeiten menüorientiert, so daß man sich relativ schnell zurechtfinden kann.

Zum Schluß noch ein Tip: Für Recherchen in Bibliothekskatalogen oder Datenbanken sollten Sie ein Telnet-Programm verwenden, das sogenannte Logdateien führen kann, also die Bildschirmausgabe mitspeichert. So können Sie Ihre Arbeitsergebnisse in einer Datei festhalten und sie zur weiteren Bearbeitung mit einer Textverarbeitung oder einem Datenbankprogramm vorbereiten.

2.6 FTP

Ftp, das file transfer protocol, ist der Schlüssel zu den Software- und Dateiarchiven im Internet. Es gibt im Internet eine große Anzahl von Servern, die Software aller Art und für alle Hardware- und Betriebssystemplattformen zum Abruf bereitstellen. Der Zugriff ist ohne Benutzerkennung und Paßwort möglich, weshalb auch die Bezeichnung anonymous ftp verwendet wird.

Abrufbar sind entweder kostenlose Freeware- und Public-Domain-Programme oder Shareware- und Demoversionen, die zu Test- und Beurteilungszwecken heruntergeladen und ausprobiert werden können. Viele Hard- und Softwarehersteller bieten auf diesem Weg produktbegleitende Software an, zum Beispiel aktuelle Treiberversionen, Fehlerbereinigungen oder Zusatzprogramme. Daneben können Sie aber auch Texte, Bilder, Videos und Dateien aller Art über ftp beziehen – im Prinzip alles, was ein Anbieter sozusagen zur Selbstbedienung freigeben und zum Abruf bereitstellen will.

Ftp wird eher zu »Auslieferungszwecken« genutzt – man kann sich einen ftp-Server auch wie ein Warenlager vorstellen. Die Programme und Dateien werden zur Einsparung von Übertragungszeit meist in komprimierter Form bereitgestellt und müssen vom Benutzer zunächst entpackt werden. Wer Informationen interaktiv und zur sofortigen Benutzung oder Betrachtung anbieten will, wählt dafür sinnvollerweise andere Internetdienste.

Innerhalb des ftp-Dienstes gibt es keine brauchbare Erschließung der abrufbaren Inhalte. Allenfalls stehen Dateilisten mit kurzen, nur wenige Worte umfassenden Beschreibungen zur Verfügung, und selbst diese Listen sind selten vollständig. Sie benötigen deshalb eine genaue Quellenangabe, wenn Sie ftp benutzen wollen. Entweder folgen Sie einem Verweis aus einem anderen Internetdienst wie dem WWW, Gopher oder den Newsgruppen, oder Sie benutzen eine der in Kapitel 9 vorgestellten Suchhilfen, die speziell auf die Erschließung von ftp-Ressourcen spezialisiert sind.

2.7 Z39.50 und WAIS

Die amerikanische ANSI-Norm Z39.50 und ihr Ableger WAIS (Wide Area Information Server) sind für die Bereitstellung von Datenbanken über Netzwerke entwickelt worden. Damit sind vor allem Text- und Literaturdatenbanken gemeint; außerdem haben viele Bibliothekskataloge (vor allem in den USA) Z39.50-Funktionalität.

WAIS und Z39.50 sind zwei unterschiedliche Dienste. Sie sind jedoch aufeinander aufbauend entwickelt worden und haben viele Gemeinsamkeiten. Deshalb werden sie hier gemeinsam kurz besprochen. Ihre wichtigsten Eigenschaften sind:


Abbildung 2-6: So funktionieren WAIS und Z39.50

Der Grundgedanke von WAIS und Z39.50 ist der standardisierte Zugang zu einer Vielzahl von Datenbanken und Verzeichnissen weltweit. Der angestrebte Vorteil dieser Systeme ist das verteilte Management: Jeder Betreiber ist jeweils nur für die Aktualisierung und Pflege seines eigenen Systems verantwortlich. Den Benutzern steht dagegen die Gesamtheit aller Systeme zur Verfügung, als bildeten diese eine einzige große Datenbank. Bei der Entwicklung von WAIS war ursprünglich sogar ein zentrales Verzeichnis aller weltweit verfügbaren WAIS-Datenbanken vorgesehen – ein Projekt, das zwischenzeitlich eingestellt wurde.

WAIS und Z39.50 sind Client-Server-Anwendungen. Das bedeutet für die Anbieter, daß sie ihre Daten, z. B. Textdokumente oder Literaturdatenbanken, mit entsprechender Software aufbereiten und verfügbar machen müssen. Im akademischen Bereich wird häufig WAIS benutzt, weil viele kostenlose Varianten von WAIS-konformer Software verfügbar sind. WAIS wird beispielsweise verwendet, um bereits bestehende Kollektionen elektronisch gespeicherter Dokumente (Forschungsberichte, Diplomarbeiten etc.) aufzubereiten. Z39.50 wird dagegen meist benutzt, um existierende Datenbanksysteme mit einer standardisierten Schnittstelle für externe Abfragen auszustatten. Dieser Weg wird vor allem von Bibliotheken (in den USA und Großbritannien) beschritten, die ihre Systeme über Z39.50-Schnittstellen durchsuchbar machen. Bibliotheksbenutzer können so mit einem Suchvorgang in mehreren Bibliothekskatalogen gleichzeitig recherchieren.

Auf der Benutzerseite muß dafür die passende Clientsoftware installiert sein. Das macht aber nur Sinn, wenn Sie tatsächlich regelmäßig WAIS- oder Z39.50-Datenbanken benutzen, die anderweitig nicht verfügbar sind, oder wenn Sie spezielle Funktionen wie die parallele Recherche in mehreren Datenbanken verschiedener Anbieter benötigen.

Anstelle dieser Software können Sie aber auch ein WWW-Gateway benutzen, das die Z39-50-Funktionalität bereitstellt:

Die Library of Congress in Washington (die amerikanische Nationalbibliothek) betreut derzeit die Weiterentwicklung von Z39.50. Dort finden Sie auch weiterführende Informationen zu diesem Thema unter dem URL http://lcweb.loc.gov/z3950/agency/. Darüber hinaus gibt es unter http://lcweb.loc.gov/z3950 ebenfalls ein Webgateway zu diversen Bibliothekskatalogen weltweit.

2.8 Gopher – ein Blick in die Vergangenheit des Internet

Gopher soll hier nur kurz erwähnt werden, denn eigentlich ist dieser Dienst fast nur noch von historischem Interesse. Trotzdem werden Sie bei Ihren Recherchen vielleicht auch einmal auf Gopher-Server stoßen, die noch gepflegt werden. Da aber die gängigen WWW-Browser auch das Gopher-Protokoll beherrschen und somit Gopher-Daten darstellen können, fällt der Wechsel vom einen zum anderen Dienst kaum auf.

Gopher ist ein menügeführtes System zur Verbreitung vor allem textbasierter Informationen. Es ist der direkte Vorgänger des World Wide Web, denn auch in Gopher-Menüs konnten bereits Verzweigungen zu anderen Gophern eingebaut werden. So war Gopher das erste weltweit vernetzte Informationssystem im Internet, das es den Benutzern ermöglicht hat, von Server zu Server zu springen, ohne sich um genaue Adressen kümmern zu müssen.

Zwei Dinge sind bei Gopher besonders hervorzuheben. Zum einen ist es ein System, das für die Benutzung an Textterminals entwickelt wurde und daher die Informationen ohne Grafikballast bereitstellt. Zum anderen stammt Gopher noch aus der Zeit, in der das Internet ein rein akademisches Netz war. Spaß- und Kommerz-Gopher gibt es so gut wie nicht.

Viele Anbieter der ersten Stunde, vor allem Forschungseinrichtungen, betreiben ihre Gopher noch weiter. Sie können damit Benutzer ohne grafische Benutzeroberflächen weiterhin effektiv bedienen.

Wenn Sie also Gopher nutzen, können Sie im Regelfall »schlanke« Informationen ohne multimediales Drumherum erwarten. Überzeugen Sie sich aber stets von der Aktualität der Texte, denn ob ein Gopher-Server aus den vorhin genannten Gründen weiter gepflegt wird oder bereits einen aktuelleren Nachfolgedienst im WWW hat, ist nicht immer auf Anhieb erkennbar. Wenn Sie einen Ausflug in die Vergangenheit des Internets starten wollen, probieren Sie es mit dem Gopher-Server der Universität von Minnesota – dort wurde der Gopher-Dienst erfunden, und daher gibt es noch einen aktiven Gopher-Server mit Verweisen auf andere Gopher weltweit. Sie gelangen dorthin, indem Sie mit Ihrem Webbrowser den URL gopher://gopher.tc.umn.edu/ aufrufen.

3. Die verschiedenen Typen von Suchhilfen

Bisher haben wir in diesem Buch nur den allgemeinen Oberbegriff »Suchhilfe« verwendet. Dabei sind die existierenden Recherche-Hilfsmittel in ihrem Aufbau und ihrer Funktionsweise sehr vielfältig. Gerade weil das Internet schnell und unkoordiniert wächst, wächst auch der Bedarf an Orientierungshilfen. Die große Nachfrage hat eine Vielzahl verschiedener kommerzieller und auch akademischer Suchhilfen heranwachsen lassen und beschert diesen Diensten enorm hohe Zugriffszahlen bis hin zu mehreren Millionen Anfragen pro Tag.

Die beiden wichtigsten (und deshalb auch meistbenutzten) Typen von Suchhilfen, die Ihnen für Recherchen im Internet zur Verfügung stehen, sind die sogenannten Suchmaschinen und die thematischen Verzeichnisse von Internetressourcen.

Diese beiden Typen spiegeln die grundverschiedenen Ansätze wider, mit denen versucht wird, die Informationssuche im dynamischen und schnell wachsenden Medium Internet zu ermöglichen. Während die Suchmaschinen mit Hilfe automatisierter Verfahren und massiver Computerunterstützung arbeiten, wird das Problem bei der Erstellung von thematischen Verzeichnissen überwiegend »von Hand«, genauer gesagt mit der intellektuellen Leistung von Menschen, angegangen. Zunehmend wird aus Kostengründen versucht, diese intellektuelle Bearbeitung ebenfalls automatisch durch »intelligente« Systeme erledigen zu lassen – mit bisher mäßigem Erfolg. Einen Schritt weiter gehen die sogenannten Meta-Suchmaschinen, die anschließend vorgestellt werden. Sie erlauben die gleichzeitige Suche in mehreren anderen Suchmaschinen, was nicht nur die Reichweite Ihrer Recherche vergrößert, sondern auch sehr zeitsparend ist. Den Abschluß des Kapitels bilden einige Hinweise zu der oft vernachlässigten lokalen Volltextsuche, also der Suche in den Inhalten einer einzigen Website. Sofern der Betreiber einer Website eine solche Suchmöglichkeit bereitstellt, ist sie meist der schnellste Weg direkt zur gesuchten Information.

Begriffsdefinitionen: URL und Website

Diese beiden Begriffe werden uns durch das ganze Buch begleiten und sollen daher kurz erläutert werden:

Der URL (Uniform Resource Locator) ist die »Adresse« eines Web-Angebots. Kurz gesagt ist es die Zeichenkette, die Sie im Browser eingeben müssen, um ein Angebot aufzurufen – beispielsweise http://www.ausschlafen.com/. Im Anhang »URL-Tricks« finden Sie weitere Hinweise zu den Bestandteilen von URLs.

Mit Website ist die Gesamtheit des WWW-Angebots einer Firma oder Institution gemeint – sozusagen der »Raum«, in dem Sie sich bewegen, wenn Sie ein bestimmtes Angebot durchstöbern. Eine Website kann neben einzelnen »Seiten« oder Dokumenten auch Datenbanken, interaktive Foren und andere Zugaben umfassen.

3.1 Thematische Verzeichnisse (Kataloge)

Die thematischen Verzeichnisse und Kataloge sind nicht nur der beste Einstiegspunkt für Internet-Neulinge, sondern auch eine wichtige Startrampe für weitergehende Recherchen.

Zunächst eine Begriffsklärung: Gemeint sind solche Dienste, die andere Internetressourcen in einem »Katalog« zusammenfassen und sie benutzerfreundlich und anklickbar nach Themengebieten ordnen. Die englischen Begriffe hierfür sind »subject tree« oder »subject catalog«.. Hier sollen zunächst einmal solche Verzeichnisse besprochen werden, die möglichst alle Themengebiete umfassen.

Diese Abgrenzung ist wichtig, weil Zusammenstellungen zu einzelnen Themen zuhauf im Internet zu finden sind. Fast jedes Internetangebot enthält an der einen oder anderen Stelle auch Listen mit Verweisen auf andere »interessante« Dienste. Als genereller Einstiegspunkt für Recherchen sind solche Zusammenstellungen jedoch nicht sinnvoll nutzbar, denn sie gelten jeweils nur für eingeschränkte Themengebiete.

Demgegenüber sind die hier gemeinten thematischen Verzeichnisse für den Einstieg in Recherchen zu beliebigen Themen geeignet, weil ihre Betreiber den Anspruch haben, möglichst viele (im Idealfall alle) Themengebiete zu erfassen.

Manchmal wird für diese Art der Aufbereitung die Bezeichnung »Yellow Pages« verwendet – eine sehr anschauliche Analogie. In den Gelben Seiten sind die Unternehmen einer Stadt nicht alphabetisch wie im normalen Telefonbuch, sondern nach Branchen geordnet aufgeführt. So können Sie alle Unternehmen einer bestimmten Branche sofort finden, ohne ihren Namen zu kennen.

Übertragen auf die thematischen Verzeichnisse von Internetressourcen bedeutet dies, daß die Informationen dort nach Kategorien geordnet sind. Sie können sie finden, ohne sich um Titel, Bezeichnungen, URLs oder Stichwörter kümmern zu müssen. Sie müssen lediglich den URL des Verzeichnisses kennen und »blättern« von dort aus die Kategorien durch, die Sie interessieren. Im Gegensatz zu den Gelben Seiten sind aber in den Verzeichnissen, die in diesem Abschnitt besprochen werden, nicht nur Firmen und Unternehmen, sondern alle Arten von Internetanbietern enthalten.


Abbildung 3-1: Die Startseite des DINO-Verzeichnisses mit den Hauptkategorien

Ebenso wie bei den Suchmaschinen gibt es bei den thematischen Verzeichnissen viele kommerzielle Betreiber, die miteinander konkurrieren. Die Benutzung ist für Suchende und auch für die Eintragungen im allgemeinen kostenlos; die Finanzierung erfolgt hauptsächlich durch Werbung.

Die Anbieter wenden bei der Aufnahme von Einträgen in ihre Verzeichnisse unterschiedliche Konzepte an. Einige verlassen sich ausschließlich auf eigene Redaktionen, die das Internet nach interessanten und nützlichen Angeboten durchsuchen und diese in die passenden Kategorien aufnehmen. Andere erlauben auch den Betreibern von Internetangeboten, diese Angebote selbst in eine oder mehrere Kategorien einzutragen. Ergänzend zu diesen beiden Methoden wird auch versucht, mit Hilfe von Suchrobotern eine automatische Einordnung vorzunehmen.

Alle thematischen Verzeichnisse sind hierarchisch aufgebaut. Das bedeutet, daß es jeweils eine grobe Themenunterteilung mit Oberkategorien (etwa Wirtschaft, Wissenschaft, Unterhaltung, Regionales o. ä.) gibt. Diese Kategorien enthalten dann wiederum Untergruppen mit weiteren Untergliederungen. Sie bewegen sich also immer vom Allgemeinen zum Speziellen.

Wie viele hierarchische Ebenen es gibt, hängt von der Größe des Verzeichnisses und der Anzahl von Einträgen in den einzelnen Kategorien ab. Die Aufteilung in Unterrubriken erfolgt, um die einzelnen Rubriken nicht zu groß und damit zu unübersichtlich werden zu lassen. Wächst eine Kategorie zu stark an, wird sie in speziellere Untereinheiten aufgeteilt.

Sie kennen diese Methode auch von der Aufstellung von Büchern in Bibliotheken: Dort werden Bücher nach Sachgebieten aufgestellt. Wenn Sie ein Buch zu einem bestimmten Thema suchen, gehen Sie erst zu dem Regal der entsprechenden Sachgruppe, suchen dann die passende Untergruppe und können schließlich die Bücher dieser Gruppe nacheinander durchsehen, bis Sie das passende gefunden haben.

Genauso funktioniert auch die Orientierung in thematischen Internetverzeichnissen: Sie suchen sich die am besten passende Oberkategorie aus, lassen sich anzeigen, welche Unterkategorien es gibt, suchen sich davon wiederum die erfolgversprechendste aus und machen so lange weiter, bis Sie schließlich bei den Verweisen auf die Originalquellen angelangt sind.

Wann soll man thematische Verzeichnisse benutzen?

Die thematischen Verzeichnisse sind vor allem dann der geeignete Einstiegspunkt, wenn Sie nicht unbedingt eine konkrete Information suchen (für die vielleicht zunächst eine Stichwortsuche mit einer Suchmaschine in Frage käme), sondern wenn Sie sich einfach nur einen groben Überblick verschaffen wollen, was es in dem einen oder anderen Bereich für Internetangebote gibt.

Der besondere Nutzen der thematischen Verzeichnisse besteht darin, daß sie inhaltlich einander ähnliche Internetangebote gesammelt darstellen. Wenn Sie also Informationen zu einem bestimmten Thema suchen und eine dazu passende Kategorie in einem thematischen Internetverzeichnis existiert, haben Sie einen guten Ausgangspunkt mit vielen Verweisen auf Internetangebote zu diesem Thema. Wenn Sie in einem thematischen Verzeichnis einen Eintrag gefunden haben, der für Sie relevant ist, können Sie von dort aus sowohl verwandte Angebote als auch über- und untergeordnete Bereiche durchstöbern.

Auch die »Filterfunktion« von thematischen Verzeichnissen ist sehr nützlich: Für jede eingetragene Website gibt es nur einen Eintrag – thematische Verzeichnisse bieten also einen strukturierten Überblick über die Angebote im Internet.

3.2 Suchmaschinen

Es ist unmöglich, den Gesamtumfang der im Internet verfügbaren Dokumente genau festzustellen. Eine umfangreiche Studie, die im April 1998 in der Zeitschrift Science erschien, ermittelte einen Schätzwert von etwa 320 Millionen Dokumenten. In dem Jahr, das seit dieser Studie vergangen ist, ist diese Zahl mit großer Wahrscheinlichkeit schon weit über die 400-Millionen-Grenze angewachsen.

Suchmaschinen bieten Ihnen die Möglichkeit, mit einer einzigen Abfrage den Inhalt großer Teile dieser riesigen Menge im Volltext zu durchsuchen. »Volltext« bedeutet, daß jedes einzelne Wort auf den erfaßten Seiten gesucht werden kann. Allerdings muß betont werden, daß es keine Suchmaschine gibt, die auch nur annähernd alle Dokumente erfassen kann. Schätzungen zufolge ist selbst bei den größten Suchmaschinen nur eine Abdeckung von maximal 40-50 %2 zu erzielen.

Für den deutschen Sprachraum gibt es keine vergleichbaren Untersuchungen. Als Anhaltspunkt möge die Zahl von knapp über 8 Millionen Dokumenten dienen, die die größte deutsche Suchmaschine, Fireball, im Februar 1999 in ihrem Index erfaßt hat.

Das Prinzip, nach dem die Suchmaschinen arbeiten, klingt relativ einfach: Sie schicken einen oder mehrere Suchbegriffe an eine Suchmaschine und bekommen als Ergebnis eine Liste mit Verweisen auf Dokumente, in denen diese Suchbegriffe vorkommen.


Abbildung 3-2: Die Trefferliste einer deutschen Suchmaschine (hier: Lycos)

Um das zu ermöglichen, durchkämmen automatisch arbeitende Programme, sogenannte »Robots« oder »Spider«, das WWW ebenso wie einige andere Internetdienste. Sie sammeln alle erreichbaren Dokumente ein und speichern sie ganz oder auszugsweise in großen Datenbanken. Kapitel 7 beschäftigt sich ausführlicher mit der Arbeitsweise von Suchmaschinen.

Die hohen Abrufzahlen, die eine gute Suchmaschine erzielen kann, machen den Aufbau eines solchen Dienstes für die kommerzielle Nutzung interessant. Die Mehrzahl der Suchmaschinen wird daher von Firmen mit Gewinnabsicht betrieben, wobei die Nutzung selbst im allgemeinen kostenlos ist und der Gewinn durch Werbe- und Lizenzeinnahmen erzielt werden soll. Dabei ist nicht nur die Einblendung von Werbegrafiken interessant, sondern auch die gezielte Hinführung der Benutzer auf andere Dienste des Betreibers oder seiner Schwesterunternehmen.

Es gibt eine Handvoll etablierter Suchmaschinen, die sich mit großem Aufwand an Hard- und Software der Sisyphusaufgabe widmen, möglichst vollständige Datenbanken aller im Internet abrufbaren Dokumente zusammenzustellen, und zu diesem Zweck rund um die Uhr das gesamte WWW und andere Internetdienste durcharbeiten. Daneben gibt es eine wachsende Anzahl kleinerer Suchmaschinen, die entweder nur Dokumente einer Sprache, eines Fachgebietes oder eines bestimmten Internetdienstes erfassen.

Wann soll man Suchmaschinen benutzen?

Grundsätzlich eignen sich Suchmaschinen zwar für fast alle Recherchen, aber gerade weil die Menge der durchsuchten Dokumente bei Suchmaschinen so groß ist, sind insbesondere bei allgemein formulierten Suchanfragen die Treffermengen zu groß und zu ungenau. Viel besser ist es, Suchmaschinen für die Suche nach konkreten Informationen, nach Personen, Institutionen oder Produkten zu verwenden – also für die Suche nach Dingen oder Sachverhalten, die man mit einigen Stichwörtern oder Fachbegriffen präzise beschreiben kann.

Suchmaschinen bieten viele Möglichkeiten, die Suche nach bestimmten Kriterien einzugrenzen – etwa nach Datum oder Sprache, nach Ländern, nach bestimmten Dateitypen wie Bildern oder Videos oder auch nach Vorgaben wie z.B. dem Vorkommen eines Suchbegriffs im Titel eines Dokuments. Immer dann, wenn solche zusätzlichen Funktionen benötigt werden, muß eine Suchmaschine eingeschaltet werden. In den nächsten Kapiteln werden diese Zusatzfunktionen von Suchmaschinen näher erläutert.

Weil aber selbst die größten Suchmaschinen jeweils nur einen Teil aller verfügbaren Angebote erfassen können (s.o.), müßten Sie Ihre Suche in mehreren Suchmaschinen wiederholen, um sicherzugehen, daß Ihnen nichts Wichtiges entgeht. Dieses Problem läßt sich – in gewissem Umfang – durch eine besondere Art von Suchmaschinen umgehen, die im nächsten Abschnitt vorgestellt werden: die Meta-Suchmaschinen.

3.3 Meta-Suchmaschinen

Meta-Suchmaschinen funktionieren nach einem besonderen Prinzip: Sie unterhalten keine eigenen Datenbanken, sondern sie bedienen sich fleißig bei den etablierten großen Suchdiensten. Meta-Suchmaschinen nehmen Ihre Anfrage entgegen, wandeln sie in die jeweils gültige Suchsyntax anderer Suchmaschinen um und befragen dann diese Suchmaschinen. Dabei werden die Abfragen gleichzeitig an verschiedene andere Suchmaschinen abgesandt. Die nach und nach eintreffenden Antworten werden entgegengenommen und zwischengespeichert. Dies alles geschieht im Hintergrund, während Sie warten. Als Ergebnis wird Ihnen dann eine aufbereitete Liste der gesammelten Treffer präsentiert.


Abbildung 3-3: Die Suchmaschinen-Auswahl zweier Meta-Suchmaschinen

Mit der Benutzung von Meta-Suchmaschinen können Sie also einen sehr viel größeren Pool von Informationen und Dokumenten durchsuchen als mit einer einzelnen Suchmaschine. Dies geht dann allerdings auf Kosten der Genauigkeit: Die im vorigen Abschnitt erwähnten Sonderfunktionen der einzelnen Suchmaschinen, also z.B. die weitere Eingrenzung einer Recherche nach Datum, Sprache oder anderen Kriterien, stehen bei Meta-Suchmaschinen nicht zur Verfügung. Dafür müssen Sie wiederum die zugrundeliegenden Originalsuchmaschinen benutzen.

Wann soll man Meta-Suchmaschinen benutzen?

Aus dem bisher Gesagten ergibt sich auch das optimale Einsatzgebiet für Meta-Suchmaschinen: Sie sind der ideale Einstiegspunkt für eine breit angelegte Suche nach konkreten Begriffen oder Produkten, die einen möglichst großen Teil des Internets umfassen soll.

Auch für den sprichwörtlichen »Schuß ins Blaue« sind Sie bei Meta-Suchmaschinen gut aufgehoben: Wenn Sie etwas sehr seltenes oder sehr ungewöhnliches suchen, von dem Sie vielleicht gar nicht erwarten, es im Internet zu finden, können Sie mit Meta-Suchmaschinen sehr viel schneller vorankommen als bei der Verwendung mehrerer einzelner Suchmaschinen und so herausfinden, ob überhaupt irgendwo im Netz etwas zu Ihrem gesuchten Thema zu finden ist.

Seien Sie aber wählerisch bei der Benutzung von Meta-Suchmaschinen: oftmals versuchen windige Geschäftemacher mit qualitativ schlecht gemachten Diensten Benutzer anzuziehen – da eine Metasuchmaschine ja keine eigene Datenbank pflegt, ist diese Art der Trittbrettfahrerei mit relativ wenig Aufwand zu realisieren. In Tabelle 4-1 und Anhang B finden Sie seriöse Anbieter.

3.4 Lokale Datenbanken und lokale Volltextsuche

Manchmal wird eine erfolgreiche Recherche nur knapp verfehlt: Man hat bereits den Weg zur richtigen Website gefunden – vielleicht über eine Suchmaschine oder ein thematisches Verzeichnis – , aber man findet dann die gesuchte Information nicht. Das kann daran liegen, daß die Website schlampig gestaltet wurde und keine benutzerfreundlichen Navigationsfunktionen aufweist oder daß sie vielleicht einfach zu groß oder zu unübersichtlich ist.

Dabei wird oft ein wichtiges Hilfsmittel übersehen: Bei vielen Websites gibt es die Möglichkeit, alle lokalen Dokumente mit einer Suchfunktion nach Stichwörtern zu durchsuchen. Damit umgehen Sie die Probleme, die sich aus dem mehr oder weniger gelungenen Aufbau einer Site ergeben und können direkt zur gesuchten Information gelangen.

Technisch ist die lokale Volltextsuche mit den Suchmaschinen vergleichbar: Es wird eine Datenbank aller verfügbaren Dokumente angelegt und regelmäßig aktualisiert – mit dem Unterschied, daß bei der lokalen Suche eben nur die Inhalte eines Servers durchsuchbar sind. Bei größeren Institutionen oder Firmen mit komplexerer Internet-Präsenz werden häufig auch mehrere interne Server mit einer Abfrage durchsucht.


Abbildung 3-4: Lokale Volltextsuche im Datenbestand der Kölner Universität

Darüber hinaus gibt es auf vielen Websites auch noch weitere Datenbanken – oftmals sind diese sogar Hauptbestandteil eines Web-Angebots, z.B. die Waren eines Versandhauses oder die Programmdaten eines Online-Fernsehprogramms. Die Inhalte dieser Datenbanken können von den allgemeinen Suchmaschinen nicht direkt erfaßt werden und sind daher nur über die Website selbst erreichbar.

Wann soll man die lokale Volltextsuche benutzen?

Diese Frage ist mit einem Wort zu beantworten: immer! Verschwenden Sie nicht Ihre wertvolle Zeit damit, die – oftmals verwirrende oder unprofessionelle – Struktur einer Website zu enträtseln, um dort etwas zu finden. Halten Sie lieber zuerst Ausschau nach einer Möglichkeit, die Website zu durchsuchen. Falls Sie die Suchmöglichkeit nicht auf Anhieb finden, werfen Sie einen Blick auf die Einstiegsseite der Website – manchmal wird sie nur dort erwähnt.

Oftmals finden Sie auf diese Weise Informationen, die Ihnen sonst entgangen wären, denn keine Website kann so perfekt gestaltet sein, daß jeder Besucher seinen Weg allein durch die Benutzung von Auswahlmenüs und das Anklicken von Verweisen zur gesuchten Stelle findet.

Zusammenfassung

Abbildung 3-5 zeigt Ihnen am Beispiel einer Versandhaus-Website die Reichweite der bisher besprochenen Suchhilfen:


Abbildung 3-5: Reichweite von Suchmaschinen, Verzeichnissen und lokaler Suche

Die Homepage, oder genauer gesagt, die Website selbst, wird in den thematischen Verzeichnissen mit einem Eintrag erfaßt; mehr ist dort nicht zu finden. Die Suchmaschinen erfassen – im Idealfall – darüber hinaus alle abrufbaren Dokumente. Die Datenbank der Produkte wird dagegen von keiner allgemeinen Suchhilfe erfaßt.

Damit wird auch nochmals veranschaulicht, für welche Zwecke die jeweiligen Suchhilfen geeignet sind. Mit Hilfe eines thematischen Verzeichnisses können Sie die Website selbst finden. Mit einer Suchmaschine können Sie auch Verweise in tiefere Bereiche der Website finden. Wenn Sie aber ein Produkt aus dem Katalog des Versandhauses finden wollen, dann geht das weder über die Suchmaschinen noch über die thematischen Verzeichnisse – Sie können allenfalls eines dieser Hilfsmittel verwenden, um die Website des Versandhauses zu finden. Von dort aus durchsuchen Sie dann die jeweils angebotenen lokalen Datenbanken.

4. Die wichtigsten Suchhilfen: Suchmaschinen und thematische Verzeichnisse

In diesem Kapitel wird anhand von kurzen Beispielrecherchen die Benutzung der beiden wichtigsten Typen von Suchhilfen gezeigt: Suchmaschinen und thematischen Verzeichnisse. Dabei lernen Sie auch einige wichtige Suchmaschinen und Verzeichnisse kennen, die Sie zukünftig benutzen werden.

4.1 Die wichtigsten Suchmaschinen

In der Tabelle 4.1 sind die wichtigsten Suchmaschinen aufgeführt, die Sie kennen sollten. Die Auswahl der hier genannten Suchmaschinen ist so getroffen, daß möglichst viele der verschiedenen Funktionen abgedeckt werden, die die zahlreichen Suchmaschinen bieten.

Daß bei der Beurteilung der Qualität von Suchmaschinen auch persönliche Vorlieben eine Rolle spielen, wurde bereits im vorigen Kapitel erwähnt – Sie sollten also ruhig ein bißchen herumexperimentieren, bevor Sie Ihre persönlichen Favoriten herauspicken. In Kapitel 6 erfahren Sie übrigens, wo und wie Sie weitere Suchmaschinen und andere Suchhilfen finden können.

Deutsche Suchmaschinen

Internationale Suchmaschinen

MetaGer – dt. Meta-Suchmaschine

http://meta.rrzn.uni-hannover.de /

Savvy Search – int. Meta-Suchmaschine http://.savvysearch.com/

Fireball

http://www.fireball.de/

Altavista

http://www.altavista.com/

Intersearch

http://www.intersearch.de/

Hotbot

http://www.hotbot.com/

Infoseek

http://www.infoseek.de/

Northern Light

http://www.northernlight.com/


Excite

http://www.excite.com/

Tabelle 4-1: Die wichtigsten Suchmaschinen

Unterschiede zwischen deutschen und internationalen Suchmaschinen

Viele internationale Suchmaschinen haben auch deutschsprachige Websites. In der Regel sind das übersetzte und an lokale Gegebenheiten angepaßte Versionen der Originalseiten (was beim empfehlenswerten Studium der Hilfe-Seiten nützlich ist). Zunehmend gibt es auch erweiterte deutsche Inhalte mit zusätzlichen Diensten. Hinzu kommt dann jeweils die Möglichkeit, die Suche entweder auf deutschsprachige Dokumente einzuschränken oder international zu suchen.

Die Gemeinsamkeit dieser deutschsprachigen Ableger ist, daß sie trotz der deutschen Fassade für die Suche auf die gleiche Datenbank zugreifen wie das jeweilige Original; zum Teil liegen sie sogar auf den gleichen Webservern. Da aber der Fokus dieser Originalsuchmaschinen nicht speziell auf deutsche Inhalte gerichtet ist, werden viele deutsche Websites und -seiten nicht erfaßt. Andererseits sind diese internationalen Suchmaschinen wiederum um ein mehrfaches größer als die deutschen Suchmaschinen und enthalten daher auch eine große Zahl deutscher Sites. Sie können also auch die internationalen Suchmaschinen für die Suche nach deutschen Dokumenten verwenden.

Die in Tabelle 4-1 genannten deutschen Suchmaschinen erfassen deutschsprachige Inhalte in eigenen, gesondert hergestellten Datenbanken. Sie sind also für die Suche nach deutschsprachigen Inhalten besonders geeignet. Vergessen Sie aber nicht, daß keine Suchmaschine es schafft, alle Dokumente zu erfassen – verwenden Sie ggf. also auch die deutschen Ableger der internationalen Suchmaschinen. Nur so können Sie einen möglichst großen Teil der deutschsprachigen Websites bei einer Suche abdecken.

4.2 Suchmaschinen benutzen

Nun wollen wir eine erste Proberecherche machen, um die Funktionsweise von Suchmaschinen kennenzulernen. Im hier gezeigten Beispiel werden dafür die deutsche Suchmaschine Fireball und die internationale Suchmaschine Northern Light verwendet. Sie können für diese Probe aber auch andere Suchmaschinen verwenden. Wenn Sie ein bißchen Zeit übrig haben, können Sie auch gleich mehrere Suchmaschinen mit der gleichen Anfrage ausprobieren, um sich so einen ersten Eindruck von den Unterschieden zu verschaffen.

Für die Proberecherche suchen wir in der deutschen Suchmaschine Fireball nach Informationen zur Rechtschreibreform und in der internationalen Suchmaschine Northern Light nach Informationen zum Thema »raytracing«. Beides sind recht allgemeine Suchbegriffe, die relativ viele Treffer erwarten lassen – sehen wir uns einmal an, wie die Suchmaschinen die Ergebnisse aufbereiten.


Abbildung 4-1: Die Startseiten von Fireball und Northernlight

Suchbegriff eintragen und Suchoptionen auswählen

Außer dem Texteingabefeld, in das die Suchbegriffe eingetragen werden, gibt es meist noch Auswahlmöglichkeiten, die die Suche selbst oder die Ausgabe der Ergebnisse beeinflussen. Bei Fireball (vgl. Abbildung 4-1) kann beispielsweise gewählt werden, ob die eigene deutsche Datenbank durchsucht werden soll oder ob die Anfrage an Altavista weitergereicht werden soll, um anderssprachige Dokumente zu suchen. Weiterhin kann die Formatierung der Ergebnisanzeige eingestellt werden. Bei anderen Suchmaschinen gibt es ähnliche Auswahlmöglichkeiten. Wählen Sie jeweils die gewünschte Option aus.

Den richtigen Suchbegriff finden

Denken Sie bei der Auswahl der Suchbegriffe daran, daß die Datenbanken der Suchmaschinen Millionen von Dokumenten enthalten. Deshalb müssen Sie versuchen, möglichst spezifische Stichwörter zu benutzen, um nicht zu viele irrelevante Treffer zu erzielen. Allgemeine Begriffe wie »Musik«, »Tiere« oder »Kunst« sind nicht für die Suche in Suchmaschinen geeignet! Versuchen Sie statt dessen, Suchbegriffe zu finden, die genau beschreiben, was Sie suchen.

Sie sollten beispielsweise »Zwölftonmusik« anstelle von »Musik« verwenden, »Spitzmaus« statt »Tier« oder »Fluxus« statt »Kunst«. Wenn Sie mit den so erzielten Treffern nicht zufrieden sind oder nichts gefunden haben, können Sie schrittweise andere und allgemeinere Begriffe verwenden.

Noch ein Wort zur Sprache: Die in Tabelle 4-1 aufgeführten internationalen Suchmaschinen erfassen die Dokumente ohne Rücksicht auf ihre Sprache oder den geographischen Ort, an dem sie abgelegt sind. Achten Sie deshalb darauf, daß die Sprache des Suchbegriffs zur benutzten Suchmaschine bzw. zur ausgewählten Datenbank paßt.

Groß- und Kleinschreibung

Für die Groß- und Kleinschreibung von Suchbegriffen hat sich bei den meisten Suchmaschinen die gleiche Behandlung eingebürgert. Merken Sie sich folgende Faustregeln:

Klein geschriebene Suchbegriffe finden sowohl klein als auch groß geschriebene Wörter (Beispiel: Der Suchbegriff »essen« findet »essen«, »Essen«, »eSSen«).

Groß geschriebene Suchbegriffe finden nur groß geschriebene Wörter (Beispiel: Der Suchbegriff »Windows« findet nur »Windows«, nicht »windows«; der Suchbegriff »USA« findet nur »USA«, nicht »Usa« oder »usa«).

Verwenden Sie also im allgemeinen die Kleinschreibung, vor allem auch bei englischen Suchbegriffen. Bei Eigennamen, Abkürzungen und Produkten sollten Sie dagegen die Großschreibung verwenden (z. B. »Rechtschreibreform«, »Photoshop«, »ZDF«, »Bundeskanzler«).

Mehrere Suchbegriffe oder ganze Sätze eintragen

In Kapitel 7 erfahren Sie mehr über die Funktionsweise von Suchmaschinen; vorab sei jedoch bereits erwähnt, daß die Entwickler von Suchmaschinen versuchen, ihren Benutzern die Suche leicht zu machen und die eingegebenen Suchanfragen so gut wie möglich zu »verstehen«. Dazu werden die Eingaben der Benutzer nach verschiedenen Verfahren analysiert, damit ein möglichst relevantes Ergebnis erzielt wird. Sie können also bei den meisten Suchmaschinen auch einfach mehrere passende Suchbegriffe hintereinander angeben oder auch ganze Sätze eintragen. Von den in Tabelle 4-1 aufgeführten empfehlenswerten Suchmaschinen unterstützen zur Zeit nur Intersearch und Northern Light diese Möglichkeit nicht.

Anzeige der Suchergebnisse

Nach dem Absenden der Suchanfrage (durch Anklicken des »Suchen«- oder »Search«-Buttons) erhalten Sie als Ergebnis jeweils die Dokumente, in denen Ihre Suchbegriffe vorkommen. Bei deutschen Suchbegriffen sind dies also deutschsprachige Ergebnisse (oder anderssprachige Texte, in denen das gesuchte deutsche Stichwort vorkommt). Entsprechendes gilt für die Eingabe von Suchbegriffen in einer beliebigen anderen Sprache.


Abbildung 4-2: Die Trefferlisten von Fireball und Northern Light

Werfen wir nun einen Blick auf die Ergebnisse unserer Suche (vgl. Abbildung 4-2). Zwar hat jede Suchmaschine ihre eigene Darstellungsweise, aber es gibt auch viele Gemeinsamkeiten. Zunächst wird in der Regel eine Zusammenfassung angezeigt, die Ihnen sagt, wie viele Treffer gefunden wurden. Dann werden diese Treffer häppchenweise angezeigt, meist jeweils etwa zehn auf einmal. Bei manchen Suchmaschinen läßt sich die Größe dieser Teilmengen einstellen, aber keine Suchmaschine liefert alle Treffer auf einmal. Denn dabei bestünde die Gefahr, daß bei häufig vorkommenden Wörtern die Trefferliste zu lang wird, um noch in vertretbarer Zeit übertragen zu werden.

Die Treffer werden anschließend in einer numerierten Übersicht aufgelistet. Dabei wird versucht, die »besten« Treffer an den Anfang der Liste zu stellen. Gute Suchmaschinen zeigen zu jedem Treffer auch noch zusätzliche Informationen an. In Abbildung 4-2 sehen Sie, daß Fireball und Northern Light jeweils den Titel, einen kurzen Textauszug, den URL und das Datum anzeigen. Diese Informationen können (und sollten) Sie nutzen, um zu entscheiden, ob der Treffer für Sie relevant sein könnte oder nicht.

Die Suche nach Informationen über die Rechtschreibreform hat bei Fireball über 7000 Treffer erzielt, für die Suche nach »raytracing« liefert Northern Light sogar mehr als 20.000 Treffer.

Wie ist nun die große Trefferzahl zu beurteilen? Die Menge an sich ist zunächst beeindruckend, sagt aber noch nichts über die Qualität aus. Das Rechercheergebnis muß sich vielmehr daran messen lassen, inwieweit die ursprünglich gestellte Fragestellung mit der Recherche beantwortet wurde. Für unsere nur unspezifisch formulierten allgemeinen Probe-Anfragen sind auf jeden Fall schon unter den ersten angezeigten Treffern brauchbare Einstiegspunkte zu finden.

Allerdings wäre es wohl zuviel verlangt, nun alle 7000 bzw. 20.000 Treffer aufzurufen. Damit wird auch gleich eines der Hauptprobleme der Stichwortsuche deutlich: Suchmaschinen, die das ganze Internet durchsuchen, bauen riesige Datenbanken auf, die – je nach Anbieter und Zählweise – über 150 Millionen Dokumente enthalten können. Deshalb produziert sogar eine Anfrage mit einem so speziellen Stichwort wie »Rechtschreibreform« bereits eine relativ große Treffermenge.

Wenn Sie also Ihre Zeit nicht mit dem Durchsehen von Hunderten von Treffern vergeuden wollen, müssen Sie Ihre Suchanfrage so präzisieren, daß die Anzahl der Treffer auf ein vernünftiges Maß heruntergeschraubt wird. Zu diesem Zweck gibt es bei allen Suchmaschinen die Möglichkeit, Ihre Anfragen genauer zu formulieren und weitere Stichwörter oder zusätzliche Suchkriterien einzugeben.

In Kapitel 8 werden diese Möglichkeiten anhand von spezielleren Anfragen demonstriert, und wir werden einige Methoden kennenlernen, mit denen man die Trefferzahl sinnvoll eingrenzen kann.

Sonderfunktionen der Ergebnisanzeige nutzen

Neben der reinen Auflistung der Treffer bieten die meisten Suchmaschinen bei der Darstellung der Suchergebnisse zusätzliche Funktionen, die nicht auf den ersten Blick durchschaubar sind. So werden beispielsweise bei Northern Light die Suchergebnisse automatisch in zusammengehörende Gruppen einsortiert (die sogenannten »Custom Search Folders«, vgl. Abbildung 4-2), so daß Sie bestimmte Aspekte des Suchergebnisses genauer fokussieren können.


Abbildung 4-3: Sonderfunktionen der Ergebnisanzeige bei Excite und Intersearch

Intersearch zeigt hingegen in einer tabellarischen Übersicht an, an welcher Stelle im Dokument die Suchbegriffe vorkommen, und ermöglicht es so, sich auf Dokumente zu beschränken, die den Suchbegriff z.B. im Titel enthalten (vgl. Abbildung 4-3, links). Bei Excite wird Ihnen zu Ihrer Suchanfrage eine Auswahl ähnlicher Suchbegriffe angeboten, die ebenfalls relevant sein könnten, und eine weitere Sonderfunktion erlaubt es, zu einem Treffer, der Ihnen besonders interessant erscheint, ähnliche Dokumente anzeigen zu lassen (vgl. Abbildung 4-3, rechts).

Auch die anderen in Tabelle 4-1 aufgeführten Suchmaschinen bieten ähnliche Zusatzfeatures, mit deren Hilfe Sie Ihr Suchergebnis weiter verfeinern können. Halten Sie nach diesen Funktionen Ausschau, und probieren Sie sie auf jeden Fall aus. Sehen Sie sich auch die jeweiligen Hilfetexte an, um weitere Hinweise dazu zu finden.

4.3 Die wichtigsten thematischen Verzeichnisse

In Tabelle 4-2 finden Sie eine Zusammenstellung der wichtigsten thematischen Verzeichnisse. Die Benutzung dieser Verzeichnisse orientiert sich stets an dem in Kapitel 3 geschilderten Prinzip: Sie bewegen sich ausgehend von einigen allgemeinen Kategorien über speziellere Unterkategorien zum gesuchten Thema.

Internationale Verzeichnisse

Yahoo!

http://www.yahoo.com/

Alle Themengebiete, prinzipiell weltweit, aber Schwerpunkt auf angloamerikanischen Ressourcen

Looksmart

http://www.looksmart.com/

wie Yahoo

WWW Virtual Library

http://www.vlib.org/

international, vor allem wissenschaftlich orientiert, nichtkommerzieller Dienst



Deutschsprachige Verzeichnisse

DINO-Katalog

http://www.dino-online.de/ seiten.html

Verzeichnis deutscher Angebote aller Themengebiete

Yahoo Deutschland

http://www.yahoo.de/

Verzeichnis deutscher Angebote, Querverbindungen zu Yahoo USA

Web.de

http://web.de/

Verzeichnis deutscher Angebote aller Themengebiete

Gerhard

http://www.gerhard.de/

Maschinell erstelltes Verzeichnis, das vor allem wissenschaftliche Ressourcen erfaßt

Tabelle 4-2: Wichtige thematische Verzeichnisse von Internetangeboten

Ein wichtiger Hinweis vorab: Die schnell wachsende Anzahl von Websites kann von den Betreibern von manuell gepflegten thematischen Verzeichnissen nicht in angemessener Zeit erfaßt und »katalogisiert« werden. Daher sollten Sie nicht davon ausgehen, daß eines dieser Verzeichnisse auch nur annähernd vollständig ist! Verwenden Sie deshalb bei Ihren Recherchen immer mehrere Verzeichnisse.

Zwei thematische Verzeichnisse sollen an dieser Stelle etwas genauer beschrieben werden: Yahoo als das größte und populärste Angebot (das auch einen deutschen Ableger hat) und die WWW Virtual Library als nichtkommerzielle Zusammenstellung mit wissenschaftlichem Schwerpunkt. Diese Auswahl dient nur dazu, beispielhaft die Benutzung solcher Verzeichnisse zu beschreiben – die anderen in Tabelle 4-2 genannten Verzeichnisse sind von vergleichbarer Qualität und werden ebenfalls zur regelmäßigen Nutzung empfohlen.

Yahoo (http://www.yahoo.com/ bzw. http://www.yahoo.de/)

Yahoo ist das derzeit umfangreichste themenorientierte Verzeichnis von Internetquellen. Es umfaßt nach Angaben der Betreiber inzwischen über 800.000 Einträge, die nicht nur manuell, sondern teilweise auch mit Hilfe von Suchrobotern eingeordnet werden. Die Größe und die daraus resultierende Popularität von Yahoo macht es für die meisten Internetanbieter zur Pflichtaufgabe, sich hier einzutragen.

Der Aufbau ist übersichtlich: Die 14 Hauptkategorien sowie die wichtigsten Unterkategorien sind auf der Einstiegsseite auf einen Blick auszumachen. Die hierarchische Einteilung von Yahoo bietet ein recht brauchbares System von Querverweisen zwischen einzelnen Kategorien. So finden Sie zum Beispiel die Schallplattenfirmen nicht nur über die »Business«-Kategorien, sondern auch über Querverweise unter »Entertainment«/«Music«. Es gibt bei Yahoo also mehrere Wege zum gleichen Ziel, und dies erleichtert es Ihnen, solche Unterkategorien zu finden, die nicht eindeutig einer bestimmten Hierarchie zuzuordnen sind.

Eine zusätzliche praktische Form von Querverweisen bietet Yahoo Deutschland: Wenn Sie eine interessante Kategorie im deutschen Verzeichnis gefunden haben, können Sie direkt zur entsprechenden Stelle im Original-Yahoo springen. So können Sie Ihre Recherche erst in deutscher Sprache durchführen und anschließend prüfen, ob weltweit noch weitere ähnliche Ressourcen abrufbar sind.


Abbildung 4-4: Die Startseiten von Yahoo und Yahoo Deutschland mit ihren Hauptkategorien


Abbildung 4-5: Querverweis von Yahoo Deutschland zum Original-Yahoo

Neben Yahoo Deutschland unterhält Yahoo auch Ableger in anderen Ländern oder Regionen. Wenn Sie sich also mit dem Funktionsprinzip von Yahoo vertraut gemacht haben, können Sie auf die gleiche Weise spezielle Verzeichnisse für andere europäische Länder benutzen, die alle über die Yahoo-Homepage erreichbar sind.

Die WWW Virtual Library (http://www.vlib.org/)

Die WWW Virtual Library ist das älteste thematische Verzeichnis und gleichzeitig ein Sonderfall mit besonderem Aufbau und Konzept. Entstanden ist sie bei den »Erfindern« des WWW in Genf, also dort, wo die technischen Grundlagen und die ersten Programme für das WWW entwickelt wurden. In den Anfangszeiten des WWW, als es noch keine Suchmaschinen und auch wenig andere Navigationshilfen im WWW gab, wollte man eine Übersicht über alle im WWW verfügbaren Angebote zusammenstellen. Das besondere Konzept der Virtual Library ist ihr verteilter Aufbau: Die Virtual Library ist keine zentrale Datenbank, die auf einem Rechner liegt, sondern ein Knotenpunkt mit Verweisen auf Zusammenstellungen, die von Betreuern rund um die Welt auf ihren eigenen Servern gepflegt werden.

Dahinter steckt der Gedanke, daß die jeweiligen Themengebiete von Fachleuten oder Wissenschaftlern eben dieses Gebietes besser betreut werden können als von einer zentralen Redaktion. Aus der Geschichte der Virtual Library resultiert auch ihre inhaltliche Ausrichtung vor allem auf wissenschaftliche Themen.

Unter dem URL http://www.vlib.org/ ist also lediglich die Hauptübersicht über alle vorhandenen Themengebiete abrufbar – für den Einstieg in eine Recherche genügt es, wenn man diese Adresse kennt. Wie Abbildung 4-6 zeigt, kann man zwischen mehreren Darstellungen wählen: einer Yahoo-ähnlichen Übersicht, einer nach Kategorien sortierten Liste oder einer alphabetischen Liste.


Abbildung 4-6: Zwei unterschiedliche Ansichten der WWW Virtual Library: Eine Gesamtliste und eine nach Kategorien eingeteilte Auflistung

Von dieser Hauptübersicht aus kann man zu dem gewünschten Themengebiet verzweigen und landet schließlich bei einer Übersicht von Internetressourcen, die zu diesem Themengebiet gehören.

Wenn Sie also beispielsweise den Punkt »Aboriginal Studies« anwählen, verfolgen Sie damit einen Verweis auf eine Zusammenstellung, die auf einem anderen Server von einem Experten dieses Fachgebiets gepflegt wird.

Übrigens hat die Virtual Library auch eine deutschsprachige »Abteilung«: Unter dem URL http://www.rz.uni-karlsruhe.de/Outerspace/VirtualLibrary/ sind nach ähnlichem Muster Zusammenstellungen »deutscher Datenquellen« (so der Titel) zu finden, aber nur aus dem wissenschaftlich-akademischen Bereich.

Deutsche Verzeichnisse

Es gibt thematische Verzeichnisse, die sich auf die Erfassung deutscher bzw. deutschsprachiger Internetangebote spezialisiert haben. Neben dem bereits erwähnten deutschen Yahoo-Ableger (http://www.yahoo.de/) sind die größten und bekanntesten deutschen Verzeichnisse: DINO (http://www.dino-online.de/seiten.html) und Web.de (http://web.de/). Der Aufbau und die Benutzung dieser beiden Verzeichnisse entsprechen prinzipiell denen von Yahoo und sollen deshalb hier nicht mehr genauer erläutert werden.

Durch die Beschränkung auf deutsche Angebote erschließen diese Verzeichnisse den deutschsprachigen Teil viel besser und gründlicher als die internationalen Verzeichnisse mit angloamerikanischem Schwerpunkt. Das macht sie zu hervorragenden Einstiegspunkten, wenn Sie auf englische bzw. internationale Dokumente verzichten können oder wenn Sie gezielt deutschsprachige Angebote suchen.

4.4 Thematische Verzeichnisse benutzen

Um das Recherchieren in thematischen Verzeichnissen zu demonstrieren und die Unterschiede zu den Stichwortrecherchen bei Suchmaschinen zu zeigen, wiederholen wir die Suche nach Informationen zur Rechtschreibreform.

Bei diesem Thema liegt es nahe, zunächst die deutschen Verzeichnisse heranzuziehen. Für unser Beispiel werden wir Web.de verwenden, aber auch die anderen deutschen Verzeichnisse, Yahoo und DINO, bieten vergleichbare Funktionen.

Wenn Ihr Thema nicht so eindeutig »deutsch« ist, müssen Sie abwägen, welche Verzeichnisse Sie benutzen. Wenn Sie deutschsprachige Ergebnisse bevorzugen, sollten Sie mit den deutschen Verzeichnissen beginnen. Für eine umfassende Recherche zu einem Thema müssen Sie anschließend auch in den internationalen Verzeichnissen suchen.

Bei der Benutzung von thematischen Verzeichnissen gibt es zwei Alternativen: das schrittweise Verzweigen von den allgemeinen zu den speziellen Kategorien oder die direkte Stichwortsuche im Verzeichnis, die weiter unten gezeigt wird.

Navigieren in thematischen Verzeichnissen

Sieht man sich die Oberkategorien an, die Web.de anbietet (siehe Abbildung 4-8), so käme nach der ersten Methode für eine Suche wohl am ehesten die Kategorie »Wissenschaft« in Frage, um dort eventuell weiter nach »Germanistik« oder »Sprachen« zu suchen.

Aus den Kategorien in der Rubrik »Wissenschaft« passen die Geisteswissenschaften am besten zum Thema »Rechtschreibreform«. Tatsächlich ist dort schon ein passender Eintrag aufgeführt. Geht man weiter in die Unterkategorie »Germanistik«, so ist dort eine eigene Kategorie zum Thema »Rechtschreibreform« zu finden.

Thematische Verzeichnisse gezielt durchsuchen

Je größer ein Verzeichnis wird, um so schwieriger ist es, die Kategorien genau gegeneinander abzugrenzen und neue Einträge konsistent, also übereinstimmend mit den bisherigen, einzusortieren. Hinzu kommt aus der Sicht des Suchenden das zusätzliche Problem, daß es in jedem thematischen Verzeichnis eigene Kategorieeinteilungen gibt, auf die man sich jeweils neu einstellen muß.

Würden Sie beispielsweise das Internetangebot einer Sportzeitschrift eher unter »Sport« oder unter der Kategorie »Medien« vermuten? Findet man Informationen zum Personalmarketing eher in den wissenschaftlichen Kategorien bei der Betriebswirtschaft oder eher unter »Wirtschaft«? Wenn ein Thema sich nicht ganz eindeutig einer der Oberkategorien zuordnen läßt, die auf der Einstiegsseite eines thematischen Verzeichnisses angeboten werden, fällt die Wahl schwer. Sie müßten also mehrere Anläufe unternehmen, bis Sie die passende Unterkategorie gefunden haben. Und wie wäre es, wenn Redakteurin X die Sportzeitschrift A in die »Sport«-Kategorie einordnet, während Redakteur Y die Sportzeitschrift B unter »Medien« auflistet?

Stichwortsuche – auch in thematischen Verzeichnissen

Der Ausweg aus dieser Zwickmühle ist die Stichwortsuche innerhalb der Kategorien der thematischen Verzeichnisse. Mit diesem Hilfsmittel können Sie schnell feststellen, in welcher Kategorie des Verzeichnisses sich die gesuchte Information befindet. Sie geben einen Suchbegriff ein und erhalten als Ergebnis diejenigen Kategorien, in denen der Suchbegriff vorkommt. Anschließend können Sie dann in diese Kategorie verzweigen und sich ansehen, welche inhaltlich verwandten Informationen dort außerdem noch aufgeführt sind.

Die Stichwortsuche in den thematischen Verzeichnissen ist deshalb eine sehr wichtige Hilfsfunktion, um in einem solchen Verzeichnis die richtige Kategorie zu finden, in der sich die gesuchte Information verbirgt.


Abbildung 4-9: Die Stichwortsuche nach »Rechtschreibreform« in Web.de

Der Unterschied zu den Suchmaschinen

Sie haben im vorigen Abschnitt die Stichwortsuche mit Hilfe von Suchmaschinen kennengelernt. Die Stichwortsuche in thematischen Verzeichnissen unterscheidet sich davon in einem wesentlichen Punkt: Es werden nur die Einträge in dem thematischen Verzeichnis selbst durchsucht. Es ist sehr wichtig, den Unterschied zwischen diesen beiden Varianten der Stichwortsuche zu kennen, damit keine Mißverständnisse bei der Suche passieren!

In den Datenbanken von Suchmaschinen wie AltaVista oder Excite sind Dokumente aus dem gesamten Internet erfaßt, und zwar im Volltext. Eine Stichwortsuche in einem thematischen Verzeichnis wie Yahoo oder Web.de durchsucht hingegen nur die Einträge und Beschreibungen, die in Yahoo bzw. Web.de selbst erfaßt sind.

Suchen in der richtigen Datenbank

Viele Suchdienste bieten von einer Startseite aus verschiedene Suchmöglichkeiten in eigenen oder kooperierenden Datenbanken: Sie erlauben die Wahl zwischen einer Suche im gesamten Netz mit einer Suchmaschine, der Suche in einem thematischen Katalog oder in anderen Verzeichnissen, z. B. nach Besprechungen, Bildern oder Soundclips. Welches Verzeichnis tatsächlich durchsucht wird, verbirgt sich häufig hinter unscheinbaren Listboxen oder Ankreuz-Kästchen. Achten Sie also darauf, daß Sie auch wirklich in der Datenbank landen, die Sie durchsuchen wollten.

Ebenso wichtig ist es, die eingegebenen Suchbegriffe an die jeweils ausgewählte Datenbank anzupassen. Im abgebildeten Beispiel (hier Web.de) stehen sowohl die Suche in Web.de selbst als auch die Suche »im Internet«, in diesem Fall in Lycos, zur Auswahl. Hier sind Verwechslungen vorprogrammiert, so daß häufig mit unpassenden Suchbegriffen gearbeitet wird.

Wenn Sie also zum Beispiel eine Stichwortsuche in Web.de durchführen, werden »nur« die knapp 70.000 URLs mit den dazugehörigen Kurzbeschreibungen durchsucht, die in Web.de gespeichert sind. Eine Abfrage bei AltaVista führt dagegen zur Durchsuchung der gesamten Altavista-Datenbank mit über 150 Millionen Dokumenten mit ihrem gesamten Text.

Um die Stichwortsuche in einem thematischen Verzeichnis konkret zu zeigen, werden wir die Suche nach der Rechtschreibreform in Web.de mit Hilfe der Stichwortsuchfunktion wiederholen.

Auf der Einstiegsseite von Web.de gibt es zu diesem Zweck das Eingabefeld für Suchbegriffe, in das nun das Stichwort »Rechtschreibreform« eingetragen werden kann, um die Suche zu starten.

Das Suchergebnis (vgl. Abbildung 4-9) ist in zweifacher Hinsicht interessant. Es zeigt, daß der Suchbegriff tatsächlich in mehreren Kategorien vorkommt. Dadurch wird im Vergleich zu unserer vorherigen Recherche deutlich, daß allein mit dem Durchstöbern der Kategorien nicht alle Treffer auf Anhieb gefunden worden wären, denn die Treffer sind unter verschiedenen Schlagwörtern einsortiert!

Ausgehend vom Suchergebnis haben Sie nun zwei Möglichkeiten. Wenn Ihnen die erzielten Treffer vielversprechend erscheinen, können Sie direkt die angezeigten Dokumente von der Originalquelle abrufen, denn die Treffer sind als anklickbare Hyperlinks dargestellt, die auf die Quelle verweisen.

Alternativ dazu können Sie aber auch zu den jeweiligen Rubriken von Web.de springen, in denen die Treffer einsortiert sind. Dort können Sie dann nach ähnlichen oder ergänzenden Informationen suchen.

Letzteres empfiehlt sich vor allem dann, wenn beim Einstieg in eine Suche nicht eindeutig zu bestimmen ist, mit welcher Oberkategorie Sie beginnen sollen (wie im »Personalmarketing«-Beispiel, bei dem sowohl die nur, um zunächst die passende Unterkategorie für Ihre Suche ausfindig zu machen. Anschließend wechseln Sie dann in diese Kategorie und sehen sich an, was dort Wirtschafts- als auch die Wissenschaftskategorie in Frage käme). Dabei verwenden Sie die Stichwortsuche sonst noch an verwandten Ressourcen erfaßt ist.

5. Besprechungsdienste: Suchhilfen mit Qualitätskontrolle

In Kapitel 3 wurde schon erwähnt, daß man die Inhalte der im Internet verfügbaren Datenbanken (z. B. Patentdatenbanken, Bibliothekskataloge, Literaturdatenbanken) nicht direkt mit Suchmaschinen durchsuchen kann. Statt dessen muß man in einem ersten Schritt erst einmal die Einstiegsseite einer solchen Datenbank finden, um sie von dort aus zu durchsuchen. Aber wie findet man nun beispielsweise eine empfehlenswerte (oder lieber gleich die beste) Kinodatenbank? Oder wie findet man generell besonders gute Ressourcen?

Die Suchmaschinen und die thematischen Verzeichnisse, die wir bisher kennengelernt haben, helfen in diesem Punkt nur bedingt weiter. Sie streben nämlich Vollständigkeit an, möchten also ohne Rücksicht auf die Inhalte möglichst viele Dokumente oder Ressourcen aufnehmen.

Die Suchhilfen, um die es in diesem Kapitel geht, haben einen anderen Schwerpunkt. Ihnen geht es nicht um Vollständigkeit, sondern um Qualität. Sie treffen eine Auswahl aus den im Internet angebotenen Quellen, beurteilen diese und machen die Beurteilungen für Interessenten zugänglich.

Wenn Sie zu einem bestimmten Thema besonders gute oder populäre Angebote suchen (zum Beispiel also die beste Kinodatenbank, die schönsten Museumsangebote, die besten Jobbörsen etc.), sollten Sie auf jeden Fall einen dieser Besprechungsdienste zu Rate ziehen. In diesem Kapitel werden einige wichtige Beispiele vorgestellt.

5.1 Besprechungsdienste kommerzieller Anbieter

Einige Anbieter haben schon früh die Marktlücken erkannt, die die Suchmaschinen und thematischen Verzeichnisse übriglassen: Die überwiegende Mehrzahl der Internetbenutzer möchte nicht nur große unkommentierte Kataloge durchsuchen können, sondern wünscht auch Hilfestellung bei der Auswahl eines Angebots.

Genau dies leisten die hier besprochenen Anbieter. Sie recherchieren selbst im Internet, suchen interessante und brauchbare Ressourcen aus und schreiben kurze Besprechungen oder Beurteilungen. Die Besprechungen sind dann entweder nach Themen sortiert abrufbar oder können ihrerseits nach Stichwörtern durchsucht werden. Genau wie die Suchmaschinen sind diese Besprechungsdienste derzeit noch kostenlos nutzbar und werden durch Werbung finanziert oder von Medienkonzernen zu Image- oder Werbezwekken unterhalten.

Bei der Recherche in den hier beschriebenen Besprechungsdiensten können Sie also davon ausgehen, daß Sie eine »Bestenauslese« vor sich haben.3 Die Kriterien, nach denen diese Auslese vorgenommen wird, werden in der Regel von den Redaktionen dokumentiert. Die Datenbanken der Besprechungsdienste sind relativ klein und wohlgeordnet (verglichen mit den bisher besprochenen Suchhilfen). Deshalb können Sie es hier ruhig wagen, mit relativ allgemein gehaltenen Suchbegriffen zu arbeiten, wenn Sie Stichwortrecherchen durchführen (etwa »Jazz«, »Kunst«, »Medizin« bzw. entsprechende englische Begriffe). Sollten Sie dabei zu viele Treffer erzielen, können sie die Suche in einem zweiten Schritt mit spezielleren Suchbegriffen enger fassen.

Der Webtip – der älteste deutsche Besprechungsdienst (http://www.webtip.de/)

Der Webtip ist ein Service der Zeitschrift »Internet Magazin«. Im Webtip finden Sie ausschließlich Besprechungen deutscher bzw. deutschsprachiger WWW-Angebote. Sie sind sowohl thematisch geordnet abrufbar als auch nach Stichwörtern durchsuchbar.

Der Webtip hat sich zum Ziel gesetzt, »die besten fünf Prozent« der deutschen Internetangebote nachzuweisen – diese Formulierung ist wohl vom schon länger existierenden »Point Review« (jetzt »Lycos Top 5%«) geborgt, der im Anschluß noch besprochen wird.4 Dennoch finden sich auch schlecht beurteilte Dienste im Webtip – wahrscheinlich um die Kategorien aufzufüllen, bis passende gute Angebote gefunden werden.


Abbildung 5-1: Webtip, WorldsBest und Lycos Top 5%- drei Besprechungsdienste

Die Besprechungen sind in zehn Kategorien aufgeteilt. Innerhalb dieser Kategorien wird keine weitere Untergliederung vorgenommen; das wird sich sicher ändern, wenn das Verzeichnis weiter wächst. Beurteilt wird nach den Kriterien »Inhalt«, »Aufbereitung« und »Wirkung«. Sie können auswählen, nach welchem Kriterium die Rubriken bei der Anzeige sortiert werden. Wichtig ist die Anzeige des Rezensionsdatums, damit Sie wissen, wie alt eine Besprechung ist. Der Webtip aktualisiert seine Besprechungen angelich im 3-Monats-Rhythmus.


Abbildung 5-2: Eine Besprechung von Webtip

Da der Gesamtbestand des Webtip recht klein ist, sollten Sie hier bei der Stichwortsuche sehr allgemeine Suchbegriffe verwenden (»Geld«, »Kino«, »Medizin«) und sich auf jeden Fall nicht nur die einzelnen Treffer, sondern auch die gesamte Kategorie anzeigen lassen.

Unter dem Titel »Lycos WOW!« bietet Lycos Deutschland einen ähnlichen Service an (http://wow.lycos.de/), der nach eigenen Angeboten »die besten 1000« deutschen Websites aufführt.

Vergessen Sie nicht, daß hier nur deutsche Angebote erfaßt sind, und konsultieren Sie daher stets auch internationale Verzeichnisse. Zwei davon werden im Anschluß besprochen.

»Lycos Top 5%« (http://point.lycos.com/categories)

Nach einem ähnlichen Prinzip wie der Webtip arbeitet auch »Lycos Top 5%«, ein ehemals selbständiger Besprechungsdienst (»Point Reviews«), der nun unter dem Dach von Lycos USA zu finden ist. Die Einstiegsseiten von »Lycos Top 5%« fügen sich durch ihr Design nahtlos in die anderen Dienste von Lycos ein. Das macht es gerade für neue Benutzer manchmal etwas schwierig, den Überblick zu behalten. Denn die Lycos-Suchmaschine, das thematische Verzeichnis »Lycos A2Z« und die »Top 5%« erfordern zwar unterschiedliche Suchansätze, sind aber optisch leicht miteinander zu verwechseln.

Auch die »Top 5%« versuchen, eine Bestenauswahl zu treffen (wieder die besagten fünf Prozent). Sie enthalten allerdings mehrere tausend Einträge und sind damit wesentlich größer als der nur auf deutsche Ressourcen beschränkte Webtip. Die Einträge sind in 18 Ober- und etwa 200 Untergruppen aufgeteilt und lassen sich entweder durchblättern oder nach Stichwörtern durchsuchen.

Wenn man die Kategorienlisten durchblättert, kann man die Einträge nach den jeweils erzielten Beurteilungen für »Content«, »Design« und »Overall Rating« sortieren, aber auch nach dem Besprechungsdatum und alphabetisch. Die Besprechungen sind etwas ausführlicher und vor allem fundierter als beim Webtip und geben einen guten Eindruck von der besprochenen Quelle.


Abbildung 5-3: Eine Besprechung von Lycos Top 5%

Britannica (http://www.ebig.com/ bzw. http://www.eblast.com/)

Die Redaktion des renommierten Lexikons »Encyclopaedia Britannica« betreibt einen technisch und inhaltlich sehr ausgereiften Besprechungsdienst. Nach Kategorien geordnet und nach Stichwörtern durchsuchbar werden Tausende von Besprechungen angeboten. Neben der Kurzkritik selbst und der Vergabe einer 5-Sterne-Wertung gibt es auch zu jeder besprochenen Site die sogenannten »Site Statistics«, also Informationen über den Betreiber der Site, über die Popularität und Besucherzahl sowie Verweise auf verwandte Sites.


Abbildung 5-4: Besprechungen vom Olymp der Lexikographie – Britannica E-Blast

Auch die Navigation ist vorbildlich: Man kann bei einer Stichwortsuche seine Ergebnisse nachträglich umsortieren und erfährt auch, wenn die Treffer zu mehreren Kategorien gehören. Diese lassen sich dann wiederum direkt anspringen. Aus dem Pool der Britannica-Besprechungen wird noch einmal gesondert die »Best of the Web«-Liste zusammengestellt, die die Spitzenreiter der jeweiligen Kategorien enthält.

Gib, und dir wird gegeben – die Vergabe von Logos durch Besprechungsdienste

Fast alle Besprechungsdienste vergeben als »Auszeichnung« ihre Logos an die gut beurteilten Websites. Die derart geehrten Anbieter dürfen also das Logo des Besprechungsdienstes auf ihrer Homepage führen. Die meisten tun das auch mit Stolz, gilt doch eine Aufnahme in einen bekannten Reviewdienst sozusagen als Qualitätssiegel. Bestimmt haben Sie auch schon einmal eines der folgenden Logos auf einer WWW-Seite gesehen:

Doch Vorsicht: eine neutrale Stiftung Warentest für Internetdienste gibt es noch nicht, und die Logovergabe ist alles andere als uneigennützig. Das Logo des Reviewdienstes wird auf diese Weise kostenlos auf vielen besonders guten und populären Websites eingeblendet. Da es dort als anklickbarer Link auf den Besprechungsdienst fungiert, leiten diese Logos eine große Anzahl von Benutzern auf die jeweilige Homepage des Reviewdienstes um. Die daraus resultierende höhere Benutzerzahl läßt sich anschließend direkt in höhere Werbeeinnahmen ummünzen.

5.2 Das »Argus Clearinghouse« (http://www.clearinghouse.net/)

Das »Clearinghouse for Subject-Oriented Internet Resource Guides« trägt einen komplizierten Titel. Lassen Sie sich davon nicht abschrecken – es ist eine sehr wertvolle Suchhilfe! Übersetzt bedeutet der Titel etwa »Koordinationsstelle für thematische Zusammenstellungen von Internetressourcen«. Der Einfachheit halber soll es in diesem Abschnitt nur noch Clearinghouse genannt werden.

Das Clearinghouse ist aus einem Projekt der Universität Michigan hervorgegangen. Dort hatten Studenten der Bibliotheks- und Informationswissenschaft die Aufgabe, jeweils zu einzelnen Themen umfassende Internet-»Bibliographien« zusammenzustellen – also möglichst vollständige Listen von wichtigen Internetquellen für diese Gebiete. Dabei sollten alle Internetdienste gleichermaßen berücksichtigt werden – WWW, Gopher, News, Mailinglisten und andere. Diese Zusammenstellungen waren bald so populär, daß die Projektbeteiligten eine Firma gründeten, um sie weiterzuführen.

Im Clearinghouse finden Sie also zu vielen populären und auch wissenschaftlichen Themen umfassende Zusammenstellungen von Internetquellen aller Art – sozusagen vorgefertigte Komplettrecherchen, die schon jemand für Sie erledigt hat. Manche Themen sind dabei auch mehrfach vertreten, im Regelfall gibt es aber nur eine Zusammenstellung pro Thema. In der folgenden Abbildung sehen Sie die Liste von Zusammenstellungen zu geisteswissenschaftlichen Themen. Auch ein Beispiel eines solchen »Guides« ist abgebildet, hier in Form einer WWW-Seite. Es gibt aber auch Zusammenstellungen in anderen Formaten, z. B. als ASCII-Text oder Postscript-Dokument. Die Beiträge stammen nicht mehr nur von Studenten aus Michigan, sondern werden von Fachleuten rund um die Welt zusammengestellt.


Abbildung 5-5: Argus Clearinghouse: Ein Auszug aus der Rubrik der Geisteswissenschaften, ein Muster für eine Besprechung und die besprochene Zusammenstellung selbst

Das Clearinghouse ist aber mehr als eine reine Sammelstelle. Es hat auch Verwaltungs- und Kontrollfunktionen. Wie Sie in Abbildung 5-5 sehen können, werden die Beiträge von einer Redaktion auf Aktualität und Qualität geprüft, bevor sie in die Kollektion aufgenommen werden. Auch anschließend wird in regelmäßigen Abständen die Aktualität geprüft. Das Datum von Überprüfungen oder Aktualisierungen wird in den Kurzbeschreibungen vermerkt, genauso wie die »Note«, die die Redaktion vergibt.

Für die Beurteilung eingereichter Beiträge und das Schreiben neuer Zusammenstellungen sind Vorgaben und Kriterien entwickelt worden, die vom Server des Clearinghouse abgerufen werden können.

Wenn Sie also zu einem Thema ein vorgefertigtes Informationspaket benötigen, in dem Sie alle relevanten Internetressourcen zusammengestellt finden, sollten Sie auf jeden Fall an das Clearinghouse denken.

6. Weitere Suchhilfen finden

Es muß doch irgendwo im Internet ein Verzeichnis der Schweizer Telefonnummern geben. Oder ein Filmlexikon. Oder ein Anwaltsverzeichnis. Oder .... Oftmals ahnt man, daß es zur Lösung eines Informationsproblems spezielle Suchhilfen geben müßte – aber wie findet man sie?

In den meisten Fällen ist schon die Auswahl der passenden Suchhilfe entscheidend dafür, ob Ihre Recherchen erfolgreich sind. In diesem Kapitel geht es darum, wie Sie solche speziellen Suchhilfen finden können. Nach der Besprechung der Suchmaschinen, thematischen Verzeichnisse und Besprechungsdienste komplettieren diese »Suchhilfen für Suchhilfen« das Quartett aller notwendigen Basis-Hilfmittel für die Suche im Internet.

6.1 Listen von Suchhilfen

In den thematischen Verzeichnissen gibt es auch Rubriken, in denen andere Suchhilfen aufgeführt sind. Wenn Sie in diesen Rubriken nachsehen, finden Sie immer aktuelle Listen mit Verweisen zu weiteren Suchhilfen, darunter auch eine Vielzahl von Ressourcen, die in diesem Buch nicht erwähnt werden.

Solche Listen finden Sie u. a. bei:

6.2 Suchhilfen für Suchhilfen

Es gibt auch sogenannte »Meta«-Suchhilfen, also »Über«-Suchhilfen. Das sind Dienste, die sich ausschließlich mit der Erfassung anderer Suchhilfen im Netz befassen, also sozusagen Kataloge von Katalogen darstellen. Sie können dort thematisch geordnete Hilfestellungen und Links zu anderen Datenbanken und Suchmaschinen finden.

Dabei gibt es zwei unterschiedliche Typen von Meta-Suchhilfen: solche, die Ihnen nur den Weg zu anderen Suchhilfen weisen (und unter Umständen bereits die Eingabeformulare für diese Suchhilfen vorbereitet haben)5, und solche, die auch die Anfrage für Sie durchführen können – genauso wie die Meta-Suchmaschinen, die wir bereits kennengelernt haben.


Abbildung 6-1: Arbeitsweise von Meta-Suchhilfen

Sie können die Meta-Suchhilfen also entweder dazu benutzen, andere nützliche Suchdienste zu finden (um sie vielleicht in Ihre Bookmarks aufzunehmen) oder auch, um direkt eine Suche zu starten. Einige der bekanntesten Meta-Suchhilfen sollen hier kurz vorgestellt werden.

Klug Suchen (http://www.klug-suchen.de/)

»Klug Suchen« beschränkt sich auf den deutschen Sprachraum und soll daher hier zuerst genannt werden. Es bietet einen guten Überblick über deutsche Suchmaschinen und Sonderverzeichnisse – mitsamt den passenden Eingabeformularen6.

Die Einträge sind in Kategorien sortiert, können aber auch durchsucht werden. Um also beispielsweise eine Suchmaschine für die Schweiz zu finden, tragen Sie »Schweiz« als Suchbegriff ein, und »Klug Suchen« listet Ihnen eine Vielzahl von Schweizer Suchhilfen auf. Für die Suche nach deutschsprachigen Datenbanken und Suchhilfen sollte dies Ihr Startpunkt sein.


Abbildung 6-2: Klug Suchen und Internet Sleuth – zwei empfehlenswerte Meta-Suchdienste

The Internet Sleuth (http://www.isleuth.com/)

Der Internet-Spürhund (so die deutsche Übersetzung) vereint eine der größten Sammlungen von durchsuchbaren Datenbanken, Suchmaschinen und sonstigen Suchhilfen unter einem Dach. Diese Sammlung besteht aus über 2000 Einträgen, die Sie wiederum mit einer Stichwortsuche durchsuchen können. Alternativ können Sie aber auch die thematisch geordnete Liste von Internet Sleuth durchblättern und sich einen Überblick darüber verschaffen, welche Suchmöglichkeiten oder Datenbanken für welches Thema oder Fachgebiet im Internet verfügbar sind. Um also beispielsweise herauszufinden, ob es eine Datenbank mit (amerikanischen) Firmenadressen gibt, werfen Sie einen Blick in die »Business«-Rubrik des Internet Sleuth. Sleuth läßt Ihnen die Wahl, ob Sie einem Link zur Originalquelle folgen oder ob Sie die Suche direkt vom Sleuth-Server aus starten möchten.

Wenn Sie die zweite Alternative wählen, können Sie Sleuth sogar anweisen, mehrere Suchdienste wie eine Meta-Suchmaschine parallel abzufragen und Ihnen die Ergebnisse gebündelt zu liefern.

Search.com (http://www.search.com/)

Search.com ist ein Service des großen Online-Anbieters C|Net (http://www. cnet.com/), zu dem unter anderem auch die an anderer Stelle erwähnten Dienste News.com und Shareware.com gehören. Auf den ersten Blick sieht man zunächst nur eine Suchmöglichkeit in der Infoseek-Suchmaschine, aber beim Herunterscrollen taucht dann der nützliche Teil von Search.com auf.

Auch bei Search.com werden in übersichtlicher Form Eingabeformulare für verschiedene andere Suchdienste gesammelt und mit kurzen Erläuterungen dargestellt. Sie können auch hier entweder direkt von Search.com aus eine Suche starten oder einem Link auf die Server der jeweiligen Suchdienste folgen. Die Kollektion ist nicht ganz so groß wie bei Sleuth und erlaubt jeweils »nur« eine Abfrage auf einmal, aber dafür gibt es ein gutes redaktionelles Umfeld mit Tips, Beispielen und Beurteilungen zu den Suchhilfen.

Über den Menüpunkt »Find a Search« können Sie die Inhalte von Search.com nach Stichwörtern durchsuchen, der Menüpunkt »A-Z List« zeigt Ihnen alle Einträge.

Search.de (http://www.search.de/)

Dieses Verzeichnis wird vom DFN-CIS (Verein Deutsches Forschungsnetz) mit Steuermitteln betrieben und hat trotz des ähnlichen Namens nichts mit »Search. com« zu tun. Es weist ebenso wie »Klug Suchen« allgemeine und fachspezifische Suchhilfen aus dem deutschsprachigen Raum nach.

Cusi (http://www.unix-ag.uni-siegen.de/search/)

Cusi (Configurable Unified Search Engine) ist das älteste Meta-Tool für die Suche im Internet. Auf den Cusi-Seiten finden Sie in mehreren Abschnitten Eingabemenüs, die Abfragemöglichkeiten für eine Reihe anderer Suchdienste und Datenbanken zusammenfassen. Sie wählen aus, welchen Suchdienst Sie in Anspruch nehmen wollen, geben Ihre Suchbegriffe ein und schicken die Anfrage an den Cusi-Server ab. Dort wird die Anfrage in das jeweils gültige Format für den ausgewählten Suchdienst umgewandelt und an diesen weitergereicht. Die Ergebnisse werden dann direkt in Ihrem Browser angezeigt.

Die eigentliche Cusi-Homepage finden Sie unter http://web.nexor.co.uk/public/ cusi/cusi.html, aber empfehlenswerter ist die Benutzung des deutschen Cusi-Ablegers unter http://www.unix-ag.uni-siegen.de/search/. Die Erläuterungstexte sind deutsch, und darüber hinaus sind einige interessante Ergänzungen für deutsche Benutzer eingebaut worden, so zum Beispiel die Suche nach deutschen Gesetzestexten oder nach Kochrezepten in deutscher Sprache.

Vor- und Nachteile von Meta-Suchhilfen

Die Verwendung von Meta-Suchdiensten wie »Klug Suchen« hat viele Vorteile: Wenn neue Suchdienste oder Datenbanken in Betrieb gehen (was laufend geschieht), können Sie diese leicht ausfindig machen. Außerdem können Sie beim Durchsehen der angebotenen Suchdienste auch exotischere Datenbanken finden, von deren Existenz Sie sonst nichts erfahren würden – von der Volltextsuche in Bibeltexten bis hin zur Datenbank medizinischer Bilder der amerikanischen National Library of Health, um nur zwei Beispiele zu nennen.

Weil die Meta-Verzeichnisse die Suchformulare der Originaldatenbanken in ein einheitliches Layout pressen, gehen aber unter Umständen wichtige Teile der Leistungsfähigkeit der jeweiligen Datenbanken verloren – es werden nicht alle Suchoptionen angezeigt. Wenn Sie also bei Search.com, Sleuth oder Klug Suchen den Verweis auf eine interessante Datenbank gefunden haben, sollten Sie in jedem Fall den Originalserver besuchen und Ihre Abfrage von dort aus starten.

7. Hinter den Kulissen: Wie Suchmaschinen funktionieren und welche Grenzen sie haben

Nachdem nun die wichtigsten Basistechniken und Hilfsmittel für Internetrecherchen besprochen wurden, soll die Betrachtung der Funktionsweise von Suchmaschinen ein wenig vertieft werden. Wenn Sie wissen, wie die Suchmaschinen arbeiten, wie sie ihre Daten sammeln und aufbereiten, dann wissen Sie auch, was Sie von ihnen erwarten können – und was nicht.

Die Suchmaschinen müssen eine ganz beträchtliche Leistung vollbringen, um die Funktionalität zu liefern, die in den vorherigen Abschnitten geschildert wurde. Auch wenn sich die Konzepte der Betreiber beim Aufbau ihrer Datenbanken unterscheiden, haben sie doch einige Gemeinsamkeiten.

Für den Aufbau und Betrieb von Suchmaschinen wird eine umfangreiche und leistungsfähige Ausstattung an Hard- und Software benötigt – und natürlich eine Netzanbindung mit hoher Kapazität. Die großen Suchmaschinen arbeiten deshalb nicht mit einzelnen Rechnern, sondern mit Rechnernetzen, in denen die Arbeitsbelastung auf mehrere Rechner aufgeteilt wird.

Der Prozeß der Datenbankerstellung und -abfrage wird in mehrere Teilschritte zerlegt, die von getrennten Subsystemen abgearbeitet werden. Die Teilschritte sind:

In Abbildung 7-1 werden diese Funktionen zusammengefaßt.


Abbildung 7-1: Die Arbeitsweise von Suchmaschinen

7.1 Arbeitsweise von Suchmaschinen

Das Einsammeln der Rohdaten

Das Einsammeln der Dokumente wird von sogenannten »Robots« oder »Spiders« erledigt. Diese Such- und Sammelroboter machen sich die Verweisstruktur des WWW zunutze, also die Hypertextlinks, die nicht nur die Dokumente des WWW zu einem Netz mit Kreuz- und Querverweisen verbinden, sondern auch Verweise zu Dokumenten oder Diensten außerhalb des WWW enthalten.

Dabei gehen sie von Dokumenten aus, die sie bereits kennen, und verfolgen die in diesen Dokumenten enthaltenen Links zu weiteren Dokumenten. Den Inhalt der so gefundenen Dokumente untersuchen sie wiederum auf die darin enthaltenen Verweise, verfolgen auch diese – und so weiter. Sie arbeiten sich also schrittweise durch das WWW hindurch.

Wenn nun ein neuer Server ans Netz geht und ein Verweis auf die Einstiegsseite dieses neuen Servers in ein Dokument eingefügt wird, das einer Suchmaschine schon bekannt ist, ist es nur eine Frage der Zeit, bis auch diese Einstiegsseite von den Robots gefunden wird. Ausgehend von dieser Einstiegsseite und den auf ihr enthaltenen Verweisen können sie nun auch den Rest des Servers abfragen.

Weitere Ansatzpunkte finden die Robots, indem sie andere Verzeichnisse nach neuen Links durchstöbern, zum Beispiel die im vorigen Abschnitt genannten thematischen Listen, oder indem sie solche Server oder Newsgruppen durchsuchen, die speziell für die Ankündigung neuer Angebote gedacht sind.

Schließlich bieten alle Suchmaschinen auch eine Möglichkeit zur Selbstanmeldung für Betreiber von Internetangeboten. So können neue Angebote direkt vom Urheber zur Erfassung vorgemerkt werden. Weil es für jeden Betreiber einer Website von fundamentaler Wichtigkeit ist, daß seine Site möglichst viele Besucher hat, wird diese Selbstanmeldung in aller Regel sofort nach dem Start einer neuen Site vorgenommen.

Analyse und Indexierung der eingehenden Daten

Wenn die Suchrobots die zu erfassenden Dokumente eingesammelt haben, müssen diese Dokumente für die Aufnahme in die Datenbank aufbereitet werden. Dabei gibt es erhebliche Unterschiede zwischen den Suchmaschinen, wieviel Aufwand für die Analyse und Aufbereitung betrieben wird.

Die Weiterentwicklung von Technologien für die Handhabung so großer Datenmengen, die dazu noch so unstrukturiert sind wie die im WWW abrufbaren Dokumente, ist in vollem Gange. Alle Suchmaschinen ändern und erweitern ihr Leistungsspektrum ständig. Sie bauen dabei auf Methoden auf, die für Recherchen in großen Textbeständen, zum Beispiel Firmenarchiven oder Pressedokumentationen, entwickelt wurden, und passen sie an die besonderen Verhältnisse im Internet an.

Dabei werden die konkret eingesetzten Methoden bei fast allen Suchmaschinen vertraulich behandelt; veröffentlicht werden meist nur Angaben zu den Leistungsmerkmalen mit wenig detaillierten Angaben zum technischen Hintergrund. Aus diesem Grund sollen hier nur einige allgemeine Hinweise zu diesem Thema gegeben werden, damit Sie sich vorstellen können, wie die Suchmaschinen ihre Datenbanken aufbauen.

Dokumente, die neu in die Datenbank aufgenommen werden sollen, werden zunächst automatisch analysiert. Dabei erfassen übrigens nicht alle Suchmaschinen die heruntergeladenen Dokumente im Volltext (komplett mit allen enthaltenen Wörtern). Manchmal werden nur die Titel und Zwischenüberschriften sowie die ersten paar Wörter erfaßt, um die Datenbanken »schlanker« zu halten. Aus dem gleichen Grund werden häufig vorkommende Wörter wie z.B. »der«, »die«, »das«, »ein« usw. nicht mit aufgenommen, weil sie keine Relevanz besitzen.

Die Analyse der eingehenden Dokumente zielt nicht nur darauf ab, die enthaltenen Wörter zu extrahieren, sondern auch darauf, ihre Funktion und Position im Text festzuhalten und suchbar zu machen. So wird es möglich zu unterscheiden, ob ein Wort »nur« im Fließtext, im Titel, in einer Abschnittsüberschrift, im URL oder als anklickbarer Text in einem Hyperlink vorkommt. Auch andere Elemente werden von einigen Suchmaschinen mit erfaßt, zum Beispiel die Dateinamen eingefügter Bilder, Verweise auf andere Dateien, spezielle vom Autor eingefügte Stichwörter, eingebundene Java-Applets – alles, was an Informationen in einem Dokument steckt, kann von den Suchmaschinen verwendet werden, wenn sie entsprechend programmiert sind. Ebenso kann in einem weiteren Schritt auch die Sprache des Dokuments bestimmt werden, so daß bei der späteren Suche nach bestimmten Sprachen gesucht werden kann.

Die Dokumente können aber noch weiter verarbeitet werden: Excite und Infoseek verwenden aufwendige Analyseverfahren, mit deren Hilfe die Inhalte von Texten, vereinfacht gesagt, durch mathematische Formeln wiedergegeben werden können. Dieses Verfahren erlaubt es nicht nur, zu einem gegebenen Dokument mit mathematisch-statistischen Methoden ähnliche Dokumente »auszurechnen« (das sogenannte Relevanz-Feedback, siehe den Abschnitt Die Sortierung der Treffer nach ihrer Relevanz in diesem Kapitel), sondern ermöglicht sogar Suchanfragen in natürlicher Sprache. Wenn Sie genaueres über die Verfahren wissen möchten, die die einzelnen Suchmaschinen einsetzen, sollten Sie sich die jeweils vorhandenen Informationstexte der Suchmaschinenbetreiber ansehen. In diesem Buch soll die Technik hinter den Kulissen nicht weiter vertieft werden.

Es gibt aber einen Zusammenhang zwischen den eingesetzten Analyseverfahren und der Informationssuche mit Suchmaschinen: Je aufwendiger die Analyse bei der Erfassung eines Dokuments ist, desto vielfältiger sind anschließend die Möglichkeiten für die Formulierung von Suchanfragen. Genaue Anleitungen hierzu finden Sie in Kapitel 8 und 9.

Analyse von Meta-Daten und unsichtbaren Textbestandteilen

Neben den sichtbaren Bestandteilen von Dokumenten, die Sie auch zu sehen bekommen, wenn Sie eine Seite im Browser betrachten, werden mehr und mehr Dokumente mit sogenannten Meta-Daten versehen, die im Browser nicht angezeigt werden. Meta-Daten sind Informationen über ein Dokument, die getrennt vom Inhalt des Dokumentes auf festgelegte Weise angegeben werden (vgl. Abbildung 7-2). Mit dem Einfügen von Meta-Daten kann der Autor eines Dokuments die Aufgabe der Suchmaschinen erleichtern: Auf diese Weise weiß die Suchmaschine sofort, welche Textteile oder Wörter besondere Aufmerksamkeit bekommen müssen, so daß später die Sortierung der gefundenen Treffer genauer ist.


Abbildung 7-2: Angabe von Meta-Informationen im unsichtbaren Teil eines Dokuments

Als Meta-Daten werden im allgemeinen Angaben zum Autor, zum Inhalt und zu besonders relevanten Stichwörtern eingefügt. Eine Vielzahl weiterer Angaben sind möglich, allerdings gibt es noch keinen allgemein adaptierten Standard hierfür. Über den aktuellen Stand der Entwicklung können Sie sich unter http://www.w3.org/Metadata/ informieren.

Die Analyse der Suchanfrage

Studien über die Nutzung von Suchmaschinen haben ergeben, daß die überwiegende Anzahl der Anfragen viel zu allgemein gehalten ist und besondere Suchfunktionen nicht berücksichtigt. Das liegt vor allem wohl daran, daß sich die meisten Benutzer nicht die Mühe machen, die Hilfetexte der Suchmaschinen (oder Bücher wie dieses) zu lesen, aber auch daran, daß aufgrund der großen Trefferzahl, die solche Anfragen erreichen, vielen Benutzern gar nicht klar ist, daß sie nicht optimal gesucht haben.

Daher unternehmen die Entwickler von Suchmaschinen große Anstrengungen, die eingehenden Suchanfragen vor der eigentlichen Durchführung der Suche zu analysieren und ggf. automatisch zu optimieren. Das Ziel dieser Entwicklung ist es, daß zukünftig Anfragen in natürlicher Sprache eingegeben werden können und automatisch zu einem relevanten Suchergebnis führen.

Kleinere Suchmaschinen wie etwa Eule oder Lotse setzen solche Verfahren nicht ein. Bei den größeren internationalen Suchmaschinen werden unterschiedliche Methoden verwendet. So versucht beispielsweise Altavista, eine automatische Erkennung von Wortfolgen und Eigennamen durchzuführen und besonders populäre Fragen anhand einer vordefinierten Liste von Fragen herauszufischen. Excite hingegen verwendet – unter anderem – die sogenannte »concept extraction«. Dabei werden zu den eingegebenen Suchbegriffen ähnliche Anfragen und Begriffe ermittelt und in die Suche mit einbezogen.

Leider funktionieren diese Verfahren bisher nur für englische Anfragen wirklich gut, da die Analysemethoden für diese Sprache optimiert sind.

Die Sortierung der Treffer nach ihrer Relevanz

Die Ergebnisse von Suchanfragen können mitunter recht umfangreich ausfallen. Schon das Durchsehen der ersten zehn oder zwanzig Treffer kann Sie eine Menge Zeit kosten. Um diesen Prozeß abzukürzen, versuchen die meisten Suchmaschinen, die Treffer gleich so zu sortieren, daß die wichtigsten Dokumente vorn in der Liste stehen (»Ranking«). Was dabei als »wichtig« angesehen wird, hängt davon ab, inwieweit die gefundenen Dokumente mit Ihrer Suchanfrage übereinstimmen. Je größer diese Übereinstimmung ist, desto »relevanter« ist ein Treffer. Im Idealfall müssen Sie also gar nicht erst eine längere Liste von Treffern »abarbeiten«, sondern werden direkt beim ersten Dokument fündig.

Berechnung der Relevanz von Suchergebnissen

Wie wird nun die Relevanz eines Treffers berechnet? Auch hier verwenden die Suchmaschinen unterschiedliche (und im Detail nicht veröffentlichte) Verfahren, aber es gibt Übereinstimmungen bei den Kriterien, die sie anlegen. Die wichtigsten dieser Kriterien sind:

Wenn ein Suchbegriff in den Meta-Daten (s.o.) eines Dokuments vorkommt, wird dies als Anhaltspunkt für die besondere Relevanz dieses Dokuments in Hinblick auf die Suchanfrage gewertet. Solche Dokumente werden von den meisten Suchmaschinen an den Anfang der Trefferlisten gestellt.

Je mehr Suchbegriffe in einem Dokument gefunden werden, desto höher wird es eingestuft. Wenn Sie fünf Suchbegriffe eingegeben haben, dann gilt ein Dokument, in dem vier dieser fünf Begriffe vorkommen, als »relevanter« als ein Dokument, in dem eine kleinere Anzahl der Suchbegriffe vorkommt. Deshalb ist es auch nicht weiter tragisch, wenn die Gesamtzahl der Treffer durch eine hohe Zahl von Suchbegriffen stark erhöht wird. Sie müssen nämlich nicht die gesamte Trefferliste durchgehen, da die wichtigen Treffer nur am Anfang stehen.

Diese Kriterien fließen mit unterschiedlicher Gewichtung ein, wenn die Suchergebnisse und vor allem die Trefferreihenfolge berechnet werden. Dabei wird für alle Treffer ein »Score« berechnet, also eine Kennzahl, die den Grad der Relevanz eines Treffers angibt. Manche Suchmaschinen zeigen diese Zahl auch an, entweder in Prozenten oder in absoluten Zahlen. Bei der Anzeige der Treffer werden dann die Dokumente nach Punktzahl geordnet ausgegeben.


Abbildung 7-3: Excite-Trefferliste: Die berechnete Relevanz wird als Prozentwert angezeigt

Die Umrechnung von Anfragen und Treffern in abstrakte mathematische Formeln ermöglicht es auch, zu einem vorgegebenen Dokument ähnliche Dokumente »auszurechnen«. Der Fachbegriff hierfür lautet »Relevanz-Feedback«. Sie teilen der Suchmaschine mit, daß ein Dokument besonders relevant für Sie ist, und die Suchmaschine versucht daraufhin, »ähnliche« Dokumente ausfindig zu machen. Bei Excite geschieht dies, wenn Sie bei einem Treffer den Verweis »More like this« anwählen (siehe Abbildung 4-3); aber auch andere Suchmaschinen bieten ähnliche Funktionen.

Nicht alle Suchmaschinen verwenden alle hier genannten Kriterien zur Relevanz- und Ähnlichkeitsberechnung. Auch bei der Gewichtung der verwendeten Kriterien gibt es Unterschiede, denn schließlich gibt es keine objektiv »richtige« Auswahl von Treffern. Ob ein gefundenes Dokument Ihre Anforderungen genau erfüllt, können nur Sie selbst entscheiden. Die Suchmaschinen können also lediglich eine möglichst hohe Übereinstimmung zwischen Anfrage und Ergebnis anstreben, und jeder Anbieter setzt dabei auf andere Verfahren.

Wenn Sie bei verschiedenen Suchmaschinen identische Anfragen ausprobieren, werden Sie feststellen, daß die Sortierung jeweils sehr unterschiedlich ausfällt. Zum Zeitpunkt, als die vorliegende Auflage dieses Buches geschrieben wurde, wurden die ausgereiftesten Verfahren bei Excite eingesetzt. Wir werden deshalb später noch ein bißchen näher auf Excite eingehen.

Einbindung anderer Datenquellen

An dieser Stelle ist eigentlich die Hauptarbeit der Suchmaschinen erledigt – die Treffer liegen bereits sortiert vor und könnten dem Suchenden angezeigt werden. Aber halt! Zuerst wollen die Geschäftspartner und Schwesterunternehmen auch zu ihrem Recht kommen. Suchmaschinen sind keine gemeinnützigen Einrichtungen, sondern müssen finanziert werden. Daher werden die Suchergebnisse noch um weitere Einträge ergänzt, damit die Suchenden nicht auf andere, externe, Websites entwischen, sondern innerhalb des Angebots des Suchmaschinenbetreibers bleiben.

Dort sollen sie entweder die Besucherzahlen (und damit die Werbeeinnahmen) erhöhen oder auch Waren oder Dienstleistungen kaufen. Abbildung 7-4 zeigt zusammenfassend, wie schließlich eine Suchergebnisseite aussieht, die alle in diesem Abschnitt beschriebenen Verarbeitungsschritte durchlaufen hat.


Abbildung 7-4: Suchergebnis mit Zusatzdiensten angereichert

Im Beispiel sehen Sie das Ergebnis einer Suche nach dem Begriff »Basketball« in der Suchmaschine Excite. Eine so allgemein gehaltene Suchanfrage führt im allgemeinen nur zu einer unbrauchbar großen Treffermenge. Eine intelligente Suchmaschine kann mehr daraus machen:

Direkt unter dem Suchfeld finden sich mit dem Hinweis »Related Searches« (Ziff. 1) einige Alternativvorschläge für bessere Formulierungen, die anhand der Suchanfrage errechnet wurden. Die Treffer, die die »echte« Suchmaschinen-Abteilung von Excite geliefert hat, finden Sie erst ganz unten im Abschnitt »Web Results« (Ziff. 5), jeweils versehen mit der Möglichkeit, weitere ähnliche Seiten zu finden (»More like this«, Ziff. 6). Zuvor werden erst einmal diverse Excite-interne Angebote aufgeführt, etwa die Excite-Basketballberichte (Ziff. 2) oder die Excite-Sportnews (Ziff. 4). Ein Verweis zum Buchversand »Amazon«, der direkt zu einer Liste von Basketballbüchern führt, findet sich ebenfalls (Ziff. 3).

Ähnlich wie Excite versuchen auch andere Suchmaschinen, Ihnen neben den reinen Suchergebnissen zusätzlich auch noch Einstiegspunkte zu den Websites ihrer jeweiligen Geschäftspartner anzubieten. Wenn Sie dies als unzulässige Manipulation betrachten, müssen Sie sich mit etwas Übung den »Rosinenpickerblick« antrainieren und nur die Ergebnisse der internetweiten Suche anschauen. Ansonsten kann man die angereicherten Suchergebnisse als sehr brauchbare Erweiterung der Funktionalität ansehen – allerdings immer im Wissen, daß die getroffene Auswahl sich an kommerziellen Kriterien orientiert.

7.2 Was die Suchmaschinen nicht finden

Es gibt eine Reihe von Gründen, warum Suchmaschinen bestimmte Dokumente nicht »finden« und deshalb auch nicht in ihre Datenbank aufnehmen können, so daß diese Informationen mit Suchmaschinen nicht gefunden werden können.

Neu erstellte oder geänderte Dokumente

Wenn neu erstellte Dokumente veröffentlicht werden, dauert es eine Weile, bis die Suchmaschinen diese neuen Dokumente durch das Verfolgen von Verweisen »finden« – sofern überhaupt solche Verweise existieren. Wenn es also Dokumente oder ganze Server gibt, auf die von außen keine Verweise zeigen (zum Beispiel, weil sie gerade erst in Betrieb gegangen sind) und die auch nicht von ihren Betreibern bei den Suchmaschinen »angemeldet« wurden, können sie nicht von den Suchmaschinen gefunden und erfaßt werden.

Ähnliches gilt für geänderte Dokumente: Die Änderungen werden erst beim nächsten Aktualisierungszyklus der jeweiligen Suchmaschine wahrgenommen, wenn die bereits erfaßten Seiten auf Veränderungen geprüft werden. Das kann je nach Suchmaschine zwischen einer und mehreren Wochen dauern.

Geschützte Dokumente

Dokumente und Dateien, die durch Paßwörter geschützt sind, in internen Netzen hinter Firewalls liegen oder aus anderen Gründen nicht öffentlich abrufbar sind, werden von den Suchmaschinen nicht erfaßt. Darüber hinaus kann auch jeder Betreiber eines Servers festlegen, daß der gesamte Server oder einzelne Teilbereiche nicht von den Suchrobotern besucht werden sollen. Dazu muß lediglich eine Datei mit den entsprechenden »Verboten« an einem vereinbarten Platz abgelegt werden. Alle etablierten Suchmaschinen halten sich an diesen Standard und erfassen derart ausgeschlossene Bereiche nicht.

Bei manchen WWW-Servern muß man sich zunächst als Benutzer »registrieren« lassen, auch wenn sie eigentlich kostenlos nutzbar sind. Auch solche Server werden von Suchmaschinen nicht abgefragt – genauer gesagt, werden nur die Bereiche erfaßt, die ohne Registrierung oder Paßworteingabe erreichbar sind.

Dynamische Dokumente/Datenbankgateways

Dokumente, die nicht in Form von fertigen Dateien auf WWW-Servern liegen, sondern dynamisch durch CGI-Programme oder Gateways zu Datenbanken erzeugt werden, werden im allgemeinen von Suchmaschinen ebenfalls nicht erfaßt.

Stellen Sie sich zum Beispiel einen Bibliothekskatalog vor, der Recherchemöglichkeiten über ein WWW-Formular anbietet: Wenn Sie dort Suchbegriffe eingeben, erhalten Sie die Ergebnisse zwar als HTML-Dokument vom Server, aber dieses Dokument wird nur auf der Basis Ihrer Anfrage von Server und Gatewayprogramm erzeugt.

Wenn ein Suchroboter einen ganzen Katalog oder eine ganze Datenbank erfassen wollte, müßte er nicht nur das Eingabeformular »verstehen«, sondern auch jede denkbare Abfrage über ein solches Formular abschicken – eine vollkommen sinnlose Vorgehensweise.

Sie können also über Suchmaschinen die Inhalte von anderen Datenbanken im Internet nicht direkt abfragen (siehe auch das Versandhaus-Beispiel in Abbildung 3-5). Statt dessen können Sie aber mit passenden Suchstrategien solche Datenbanken, Bibliothekskataloge oder ähnliche Dienste zunächst ausfindig machen und diese dann in einem zweiten Schritt mit den jeweils vorhandenen Recherchemöglichkeiten durchsuchen.

Frames, Java und Javascript

Die Behandlung von Frames bzw. Framesets durch Suchmaschinen ist nicht einheitlich. Das Problem liegt darin, daß durch Frames die Inhalte mehrerer HTML-Dokumente gleichzeitig unter einem URL verfügbar sind – das macht es schwierig, eine Zuordnung zwischen Suchbegriffen und Treffer-URLs vorzunehmen. Im allgemeinen wird – wenn überhaupt – nur der im <noframes>-Teil enthaltene Text von Framesets zusammen mit den für das Frameset definierten Meta-Daten erfaßt. Links innerhalb von Framesets werden entweder nicht verfolgt oder zumindest nicht in dem vom Autor geplanten Zusammenhang erfaßt.

Auch mit Java oder Javascript lassen sich Suchmaschinen ausbremsen: Menü- oder Verweisfunktionen, die auf diesen Programmsprachen basieren, können meist von Suchmaschinen nicht erkannt werden, so daß nachfolgende Seiten oftmals nicht mehr erfaßt werden.

Unprofessionell erstellte Dokumente

Manchmal wird der gesamte Inhalt eines Dokuments in Form von Bildern oder Grafiken dargestellt, etwa um ein besonders schickes Layout zu erhalten. Die Folge ist, daß mangels ausreichender textlicher Informationen ein solches Dokument von Suchmaschinen nicht erfaßt werden kann. Eine inhaltliche Analyse von Grafiken kann – bisher – keine Suchmaschine leisten.

7.3 Welche Suchmaschine ist die richtige?

Keine Suchmaschine unterstützt alle möglichen Suchfunktionen. Deshalb ist das wichtigste Kriterium bei der Auswahl die Unterstützung der benötigten Funktionalität. Wenn Sie beispielsweise direkt nach einem URL suchen wollen, müssen Sie entweder Hotbot, Infoseek oder Fireball/AltaVista benutzen, weil dort diese direkte URL-Suche unterstützt wird. In Kapitel 8 werden deshalb spezielle Suchfunktionen besprochen, wobei für alle Suchfunktionen diejenigen Suchmaschinen aufgeführt sind, die sie unterstützen.

Andere Entscheidungskriterien

Müßte nicht eigentlich die Größe einer Suchmaschine entscheidend für ihre Nützlichkeit sein? Um es gleich vorwegzunehmen: Das ist nicht ganz richtig. Selbst eine kleine Suchmaschine mit nur wenigen hunderttausend Dokumenten liefert bei entsprechenden Anfragen schon mehr Treffer, als Sie in vertretbarer Zeit auf Brauchbarkeit überprüfen können.

Ohnehin läßt sich eine verläßliche »Größe« nicht bestimmen. Glaubt man dem lautstarken Selbstlob der Suchmaschinenbetreiber, sind sie jeweils die besten, größten und schnellsten. AltaVista, Hotbot und Northern Light stehen angeblich weit jenseits der 100-Millionen-Marke, aber das sind schwer kontrollierbare Selbsteinschätzungen. Auch was gezählt wird, ist nicht ganz klar. Während AltaVista, Hotbot und Excite die Dokumente im Volltext, also komplett, erfassen, gilt bei Lycos ein URL schon als erfaßt, wenn er nur in einem anderen Dokument als Hypertextlink auftaucht. Es kommt also vor allem darauf an, daß eine Suchmaschine Ihnen das liefert, was Sie suchen. Das kann entweder durch vielfältige Suchmöglichkeiten geschehen oder durch eine ausgefeilte Relevanzberechnung.

Fireball/AltaVista ist immer noch die Suchmaschine mit den flexibelsten Suchfunktionen: Die »Expertensuche« bietet die Unterstützung von Booleschen Anfragen, auch mit Klammerung, Phrasen- und Abstandssuche. Die vielfältigen Möglichkeiten zur Attributsuche (also der Suche nach Datum, URL, Titel, Hyperlinks, Dateitypen, Host- und Domainnamen) bieten Ihnen eine umfangreiche Rechercheunterstützung. Auch Hotbot bietet (im Expertenmodus) ähnliches, ist aber durch die Menüstrukturen nicht ganz so flexibel (was für Ungeübte andererseits sehr hilfreich sein kann). Die besondere Gruppierung der Suchergebnisse, kombiniert mit dem zweitgrößten Index aller Suchmaschinen, macht auch Northern Light zu einem Kandidaten für die regelmäßige Benutzung.

Excite ist dagegen bei den einstellbaren Suchoptionen weniger flexibel (obwohl zumindest Boolesche Anfragen mit Klammerung möglich sind), bietet aber statt dessen die weitaus beste Relevanzsortierung. Es ist immer wieder erstaunlich, wie gut die ersten zehn oder zwanzig Treffer selbst bei wenig ausgefeilten Suchstrategien sind.

Die vielfältigen Optionen bei Suchmaschinen wie Hotbot und AltaVista verlagern einen großen Teil der Sucharbeit auf Sie: Welche Optionen und welche Syntax Sie verwenden, bedarf einiger Überlegung und auch Erfahrung. Excite und Northern Light versuchen, Ihnen die Arbeit abzunehmen – allerdings kann das erst dann perfekt funktionieren, wenn die Programmierer wirklich soweit sind, die Fähigkeit zum »Gedankenlesen« einzubauen. Probieren Sie beide Alternativen aus (und auch die anderen Suchmaschinen), und suchen Sie sich zwei oder drei Favoriten aus. Die restlichen Suchmaschinen, die Sie dann nicht regelmäßig verwenden, können Sie im Bedarfsfall immer noch zeitsparend gleichzeitig mit Meta-Suchmaschinen abfragen.

8. Erweiterte Techniken für die Stichwortsuche

In diesem Kapitel geht es darum, wie Sie Stichwortsuchen besser durchführen können. Die Stichwortsuche findet nicht nur bei den Suchmaschinen Anwendung, sondern sie kann – wie im vierten Kapitel geschildert – auch innerhalb von thematischen Verzeichnissen hilfreich sein. Darüber hinaus gibt es bei fast allen Datenbanken und Informationsdiensten die Möglichkeit zur Stichwortsuche.

Wie komfortabel die Suchfunktionen sind, hängt jeweils von der Software ab, die serverseitig eingesetzt wird. Sie ermöglicht es Ihnen, Ihre Anfragen so zu formulieren, daß Sie möglichst nur das Gesuchte finden und nicht Hunderte oder sogar Tausende von Treffern nach relevanten Informationen durchstöbern müssen.

Die Suchmaschinen verwenden unterschiedliche Methoden, um die erfaßten Dokumente für die Suche aufzubereiten. Deshalb stehen auch bei allen Suchmaschinen jeweils andere Möglichkeiten zur Verfügung, um eine Suchanfrage einzugrenzen oder zu präzisieren. Meist müssen Sie dazu eine spezielle Anfragesyntax verwenden, die sich von Suchmaschine zu Suchmaschine unterscheidet. Außerdem wird die Funktionalität der Suchmaschinen laufend erweitert, so daß sich regelmäßig Änderungen bei der Bedienung und der Syntax ergeben, die man immer wieder aufs neue kennenlernen muß.

Auch die Anbieter von thematischen Verzeichnissen und anderen Informationsdiensten verwenden unterschiedliche Methoden für die Stichwortsuche in ihren Datenbanken – sofern sie solche Stichwortsuchen überhaupt ermöglichen.

In diesem Kapitel werden deshalb die verschiedenen Möglichkeiten für spezielle Suchanfragen zunächst allgemein besprochen. Anschließend werden jeweils Beispiele spezieller Suchanfragen für die wichtigsten aktuell verfügbaren Suchmaschinen und Verzeichnisse gezeigt. Das gibt Ihnen die Möglichkeit, die besprochenen Verfahren in der praktischen Anwendung zu sehen und auch auf neue Suchmaschinen zu übertragen, die erst nach Erscheinen dieses Buches ans Netz gegangen sind.

Alles, was in diesem Kapitel anhand von Suchmaschinen gezeigt wird, können Sie auch für die Suche in anderen Datenbanken verwenden. Beachten Sie aber folgendes: dieses Kapitel behandelt speziell die Suche in sogenannten »Volltextdatenbanken«, also in Datenbanken, die große Mengen unstrukturierter Texte enthalten. Die Suchmaschinen und auch die meisten Datenbanken der thematischen Verzeichnisse sind solche Volltextdatenbanken. Für die Recherche in besser strukturierten Datenbanken, zum Beispiel in kostenpflichtigen Literaturdatenbanken (vgl. Kapitel 12), sind einige der hier beschriebenen Verfahren nicht anwendbar. Wenn Sie solche Datenbanken verwenden wollen, sollten Sie sich die dort angebotenen Hilfetexte genau ansehen.

8.1 Suchfunktionen und Anfragesyntax

In den Hilfetexten bei AltaVista war einmal zu lesen, daß die aktuelle Softwareversion von AltaVista leider noch nicht in der Lage sei, Gedanken zu lesen. Dies sei aber fest für die nächste Version geplant. Zwar sind seither schon mehrere verbesserte Softwareversionen implementiert worden, aber mit dem Gedankenlesen will es immer noch nicht so recht klappen ...

Die scherzhafte Bemerkung zielt auf das Grundproblem bei Datenbankabfragen ab: Um gute Suchergebnisse zu erzielen, müssen Sie Ihre Frage möglichst genau formulieren. Schon bei der Kommunikation von Mensch zu Mensch ist es aber fast unmöglich, sich eindeutig auszudrücken, weil sich der Wortschatz und der Erfahrungshorizont des Fragestellers und des Befragten mehr oder weniger unterscheiden und die benutzten Wörter unterschiedlich interpretiert werden.

Noch schwieriger wird es bei der Kommunikation zwischen Mensch und Computer. Weil die heutigen Computer noch nicht (oder nicht ganz) so weit sind, Anfragen in natürlicher Sprache zu »verstehen«, müssen Sie sich wohl oder übel auf das bescheidene sprachliche Niveau der Rechner hinunterbegeben und Ihre Anfragen nach Regeln stellen, die von der jeweils verwendeten Suchsoftware diktiert werden.

Für die Eingabe von Suchanfragen gibt es bei den Suchmaschinen zwei grundsätzliche Alternativen. Manche Suchmaschinen erlauben (oder verlangen) die »freie« Eingabe mit spezieller Suchsyntax, also mit bestimmten Sonderzeichen und Suchkommandos zur Präzisierung der Suchanfrage. Die zweite Möglichkeit ist die menüunterstützte Eingabe, bei der Sie nur die Suchbegriffe in Texteingabefelder eintragen und alle weiteren Einstellungen und Präzisierungen durch Ankreuzen oder Anklicken von vorgegebenen Optionen vornehmen.


Abbildung 8-1: Freie und menügestützte Eingabe von Suchanfragen (hier Excite/Hotbot)

Bei einigen Suchmaschinen können Sie auch zwischen beiden Möglichkeiten wählen. Erfahrene Datenbankprofis schätzen die Möglichkeit der freien Eingabe, weil sie flexiblere Anfragen erlaubt. Allerdings muß man dafür die jeweils verlangte Syntax genau kennen. Die menügestützte Abfrage setzt dagegen keine Syntaxkenntnisse voraus, ist aber auf die vorgegebene Menüstruktur beschränkt.

Es ist schwierig, ständig die gültige Syntax mehrerer Suchmaschinen im Kopf zu haben, vor allem, wenn man sie nicht regelmäßig benutzt. Daher ist es empfehlenswert, sich zwei bis drei persönliche Favoriten herauszupicken und die Syntax dieser Suchmaschinen anhand der Hilfetexte genau zu studieren. Auch die Beispiele in den nächsten Abschnitten werden Ihnen dabei helfen. Wenn Sie lernen, die Funktionen einiger weniger Suchmaschinen in vollem Umfang auszunutzen, können Sie sehr viel bessere Ergebnisse erzielen als bei der oberflächlichen Benutzung vieler verschiedener Suchmaschinen.

Wenn Sie einige der folgenden Beispiele nachvollziehen, werden Sie feststellen, daß Ihnen einige Suchmaschinen einfach besser »liegen« als andere.

Mein persönlicher Favorit ist und bleibt Altavista. Zum einen bietet Altavista die flexibelsten Suchfunktionen und kurze Antwort- und Übertragungszeiten, zum anderen ist das Benutzerinterface klar und einfach. Der Favorit für die Suche im deutschsprachigen Teil des Internet ist eindeutig Fireball. Die identische Suchsprache macht die Benutzung dieses Duos leicht, und Fireball bietet nicht nur das größte, sondern auch das schnellste und komfortabelste »deutsche« Verzeichnis.

Aber vielleicht haben Sie andere Vorlieben – objektiv gesehen ist keine der Top-Suchmaschinen in allen Bereichen »besser« als alle anderen. Entscheiden Sie nach Ihrem persönlichen Eindruck, aber überprüfen Sie Ihre Entscheidung von Zeit zu Zeit, denn die Suchmaschinen werden ständig erweitert und verbessert.

8.2 Wortteile suchen

Wenn Sie nach Stichwörtern suchen, müssen Sie die vielfältigen Variationen bedenken, in denen die gesuchten Wörter auftreten können. Plural- und Beugungsformen von gesuchten Begriffen lassen eine einfache Stichwortsuche häufig ins Leere laufen. Wenn Sie beispielsweise das Wort »Schuh« suchen, werden solche Dokumente nicht gefunden, in denen die Formen »Schuhe«, »Schuhen« oder »des Schuhes« vorkommen.

Maskierung mit Jokerzeichen

Mit Maskierungsfunktionen (auch Trunkierung oder englisch »truncation« bzw. »stemming« genannt) können Sie Ihre Suchbegriffe so abkürzen, daß verschiedene Wortvariationen gefunden werden. Dies geschieht durch Einfügung von bestimmten Sonderzeichen (»Jokern« oder »Wildcards«) anstelle von Buchstaben. Am häufigsten wird der Stern als Joker verwendet; er steht meist für eine beliebige Anzahl von Zeichen. Vielleicht kennen Sie dieses Prinzip auch schon von seiner Anwendung in DOS-Befehlen, zum Beispiel bei »del *.bak« zum Löschen von Dateien mit beliebigem Namen und der Endung »bak«.

Wenn Sie also nach »Schuh*« suchen, wird jedes Wort gefunden, das mit »Schuh« anfängt und danach eine beliebige Anzahl von Zeichen enthält, beispielsweise »Schuh«, »Schuhe«, »Schuhmacher«, »Schuhsohle« und so weiter. Meist wird diese Maskierung nur am Wortende ermöglicht, denn sie wird wie im geschilderten Beispiel dazu verwendet, verschiedene Endungsformen von Wörtern abzudecken. Manche Suchmaschinen unterstützen aber auch die Maskierung am Wortanfang oder mitten im Wort (z.B. »Schu*er« für die Suche nach Schuster, Schumacher, Schuhmacher, aber auch Schulbuchverleger).

Substringsuche

Eine andere Möglichkeit, nur Teile von Wörtern zu finden, stellt die »Substringsuche« dar. Mit Substring ist eine Zeichenkette gemeint, die irgendwo im Dokument vorkommt – sei es als ganzes Wort, am Beginn, am Ende oder auch irgendwo in der Mitte eines Wortes. In deutschsprachigen Eingabeformularen taucht dafür meist der Begriff »Wortteil« auf, sofern nicht auch dort der Fachbegriff »Substring« verwendet wird.

Ein Beispiel: Die Buchstabenfolge »kette« kommt sowohl in »Diskettenlaufwerk« als auch in »Halskette« vor. »kette« ist also ein Substring der beiden Wörter. Die Substring- und die Maskierungssuche schließen einander aus; es kann immer nur eines von beiden Verfahren verwendet werden. Welche Methode eingesetzt wird, hängt von der Software des Anbieters ab. Sehen Sie dazu auch in Tabelle 8-1 nach.

Syntax und Beispiele für die Suche nach Wortteilen

Suchmaschine/ Verzeichnis

Syntax

Anmerkungen

AltaVista / Fireball

schädlings*ung findet »Schädlingsvernichtung« ebenso wie »Schädlingsberatung«

AltaVista und Fireball unterstützen auch die Maskierung in der Wortmitte.

Intersearch

biblio* findet »bibliothek«, »bibliothekarin«, »bibliophil«? ersetzt ein Zeichen, siehe Northern Light

Es wird eine Liste mit Trefferzählung verschiedener Schreibweisen angezeigt – sehr praktisch. Für Profis: Es werden reguläre Ausdrücke unterstützt.

Northern Light

* ersetzt mehrere Zeichen, % ersetzt ein Zeichen(z.B. Schmid% findet Schmid und Schmidt, aber nicht Schmidtbauer)

Die Verwendung des * als Trunkierungszeichen erfolgt wie bei den oben genannten Suchmaschinen.

Yahoo.com (Stichwortsuche)

communi

automatische Substringsuche – findet community, telecommunication ... (Achtung: Ist die Suche im Yahoo-Bestand erfolglos, wird eine web-weite Suche durchgeführt!)

Im Menü »Search Options« kann die Automatik abgeschaltet werden. Bei Yahoo.de muß der Stern als Wildcard verwendet werden!

Web.de (Stichwortsuche)

minister

automatische Substringsuche – findet »Bundesministerium«, »Ministerium«, »Landesminister« ...

Nicht abschaltbar

DINO(Stichwortsuche)

Radikal* findet »rechtsradikale«, »Linksradikalismus«, »radikalfeminismus«

Suche mit Maskierung am Wortanfang und -ende und in der Mitte möglich.

Diese Funktion ist nicht verfügbar bei Excite, Eule und Lotse.

Tabelle 8-1: Wortteile suchen mit Sonderzeichen

8.3 Verknüpfung mehrerer Suchbegriffe: trennscharfe und unscharfe Suche, Abstandsoperatoren

Bisher haben wir in allen Beispielen nur jeweils einen einzigen Suchbegriff verwendet. In der Praxis werden Sie aber stets mehrere Begriffe eingeben müssen, um das, was Sie suchen, genau zu beschreiben und um nicht zu viele Treffer zu erhalten. Für die Kombination mehrerer Suchbegriffe gibt es zwei grundverschiedene Konzepte:

Beide Konzepte werden in den nächsten Abschnitten besprochen.

»Unscharfe« Suche mit mehreren Begriffen

Für benutzerfreundliche Suchanfragen gibt es bei den meisten Suchmaschinen die Möglichkeit, einfach einige Suchbegriffe aufs Geratewohl einzutippen, ohne sich um weitere Suchkommandos oder Syntaxvorgaben zu kümmern. Die Suchmaschinen geben als Ergebnis eine Liste von Treffern aus, die alle gefundenen Dokumente nach ihrer Relevanz geordnet anzeigt.

Mit »Relevanz« ist der Grad der Übereinstimmung zwischen Anfrage und Ergebnis gemeint. Diejenigen Treffer, von denen angenommen wird, daß sie die Suchanfrage besonders genau beantworten, werden an den Anfang der Trefferliste gestellt. Wie diese Relevanz berechnet wird, können Sie übrigens im siebten Kapitel nachlesen.

Diese Methode wird deshalb als »unscharf« bezeichnet, weil zwar alle Suchbegriffe in die Berechnung des Ergebnisses einfließen, aber keinesfalls in jedem Trefferdokument alle Suchbegriffe vorkommen. Statt dessen wird versucht, eine möglichst hohe Übereinstimmung zwischen Suchanfragen und Ergebnisdokumenten herzustellen. Wie viele Dokumente dabei noch als Treffer gewertet und in welcher Reihenfolge sie sortiert werden, hängt vom jeweils verwendeten Berechnungsverfahren ab.

Stellen Sie sich die Prozedur wie einen Einkauf in einer Boutique vor: Wenn Sie einem Verkäufer nur sagen, daß Sie eine Hose suchen, bleibt ihm nichts anderes übrig, als Ihnen den Weg zum Ständer mit allen Modellen zu weisen. Wenn Sie dagegen noch wortreich beschreiben, was Sie eigentlich suchen (»schwarz«, »schick«, »leicht«, »billig«, »aus Leinen«, »pflegeleicht«, »ohne Tierversuche gefertigt« ), kann er Ihnen eine Vorauswahl präsentieren, die Ihre Kriterien berücksichtigt – auch wenn sicher nicht jede Hose alle gesuchten Eigenschaften haben wird.

Wenn Sie also Suchbegriffe für eine unscharfe Recherche auswählen, können Sie aus dem vollen schöpfen und viele Begriffe eingeben, die das gesuchte Thema beschreiben. Wichtig ist dabei vor allem eines: Bei der unscharfen Recherche kommt es nicht auf die Gesamtzahl der gefundenen Dokumente an (diese Menge wird immer größer, je mehr Suchbegriffe eingegeben werden), sondern auf die Sortierung der Treffer. Die Suchmaschinen versuchen nämlich, die Treffer nach Wichtigkeit geordnet zu sortieren, so daß die vielversprechendsten Dokumente ganz vorn stehen.

Je mehr Begriffe Sie bei der Anfrage vorgeben, um so mehr Anhaltspunkte gibt es für die Sortierung und desto wahrscheinlicher ist es, daß passende Dokumente an den Anfang der Trefferliste gestellt werden.

Sehen wir uns einmal ein Beispiel einer solchen unscharfen Anfrage bei der kleinen deutschen Suchmaschine Eule an: Für eine Suche nach statistischen Informationen zum Wachstum des Internets werden einfach ein paar passende Suchbegriffe zusammenhanglos hintereinander eingetragen.

Im Suchergebnis (siehe Abbildung 8-2) sieht man deutlich, daß Eule trotz der ungeordneten Ansammlung von Suchbegriffen in der Lage war, passende Dokumente zu finden und sie in der Trefferliste nach vorn zu sortieren, so daß sie zuerst angezeigt werden. Wenn Sie die Trefferliste weiter durchblättern (beachten Sie die Trefferzahl von über 400.000!), werden Sie feststellen, daß mehr und mehr Dokumente auftauchen, die das gesuchte Thema nur am Rande oder gar nicht behandeln.

Die Kriterien, nach denen die Relevanz oder Wichtigkeit von Treffern berechnet wird, werden im siebten Kapitel genauer beschrieben. An dieser Stelle sei aber noch einmal wiederholt, daß es bei solchen unscharfen Anfragen nicht auf die Gesamtzahl der erzielten Treffer ankommt, sondern auf die Reihenfolge – also darauf, daß die wichtigsten Treffer zuerst angezeigt werden. Im Idealfall finden Sie das Gesuchte innerhalb der ersten zehn oder zwanzig Treffer. Wenn das nicht der Fall ist, sollten Sie die Suche neu formulieren.

Wenn Sie selbst ein bißchen mit den Suchmaschinen experimentieren, werden Sie sehr schnell ein Gefühl für den Umgang mit unscharfen Suchanfragen und die Qualität der Ergebnisse bekommen. Erinnern Sie sich an das Boutiquen-Beispiel – je bessere Vorgaben Sie liefern, desto zufriedener sind Sie mit dem Ergebnis.


Abbildung 8-2: Ergebnis einer »unscharfen« Suchanfrage

Syntax und Beispiele für unscharfe Suchanfragen

Suchmaschine/ Verzeichnis

Syntaxbeispiel

Anmerkungen

Excite

wachstum des internet statistik statistisch benutzer wachstumsrate internet-statistik(Suche nach Informationen zum Wachstum des Internets)

Geben Sie Begriffe ein, die das gesuchte Thema beschreiben. Reihenfolge und Sprache spielen keine Rolle, Begriffe können mehrfach eingegeben werden.

Northern Light

internet growth statistics demographics size how big is the internet(die gleiche Suche mit englischen Suchbegriffen)

s. o.

AltaVista / Fireball

karneval* köln fastelovend sitzung (Suche nach Informationen zum Thema Karneval in Köln – mit »karneval*« werden auch »karnevalsvereine« etc. gefunden)

Achtung: Unscharfe Anfragen funktionieren nur in der »Standardsuche«, nicht in der Detailsuche/Advanced Query.

Diese Funktion ist nicht oder nur eingeschränkt verfügbar bei: Intersearch, AltaVista »Advanced Query«, Fireball Detailsuche sowie bei den thematischen Verzeichnissen.

Tabelle 8-2: Unscharfe Suche mit freier Texteingabe

Abbildung 8-3 zeigt die unscharfe Suche bei Hotbot und Lycos. Die Wortwahl im Aufklappmenü von Hotbot ist ungenau – »any of the words« bedeutet eigentlich, daß jedes eingegebene Wort zu einem Treffer führt. Ohne Relevanzsortierung wäre das Ergebnis nur eine wertlose Aneinanderreihung von Dokumenten. Tatsächlich wird aber auch hier eine Relevanzberechnung durchgeführt, in die alle eingegebenen Begriffe in »unscharfer« Weise einfließen. Die Auswahl von »all of the words« verlangt dagegen, daß tatsächlich alle Begriffe vorkommen müssen. Überzeugen Sie sich vom Unterschied, indem Sie identische Anfragen mit mehreren Begriffen sowohl mit der Option »all of the words« als auch mit »any of the words« abschicken. Bei Lycos ist es genauso: Wenn Sie die Option »eines der Wörter« auswählen, werden die Suchbegriffe unscharf gewichtet. In der erweiterten Suche (erreichbar über den Verweis »Suchoptionen«) kann man bei Lycos sogar noch verschiedene Einstellungen vornehmen, die die Relevanzberechnung beeinflussen. Aber in der Regel müssen Sie sich die Mühe nicht machen, umständlich herumzuklicken. Die Standardwerte liefern bereits gute Ergebnisse.


Abbildung 8-3: Unscharfe Suche mit Menüoptionen bei Hotbot und Lycos

Trennscharfe Kombinationen mit den Booleschen Operatoren AND, OR und NOT

Die unscharfe Suche ist sehr bequem, und die Fähigkeiten der Software, relevante Treffer herauszupicken, werden immer besser. Dennoch gibt es Fälle, in denen Sie die Entscheidung, was wichtig ist und was nicht, lieber selbst treffen möchten.

Wenn Sie Ihre Suchbegriffe nicht unscharf, sondern »fest« miteinander kombinieren wollen, können Sie dies mit Hilfe der Booleschen Operatoren AND, OR und NOT tun. Damit definieren Sie ganz genau, welche Begriffe im Suchergebnis vorkommen müssen und welche nicht. Im Gegensatz zu den unscharfen Verfahren gibt es hier immer eindeutig definierte und nachvollziehbare Ergebnismengen; Sie haben also die volle Kontrolle über die Suchergebnisse. Nur bei der Sortierung der Ergebnisse versuchen die Suchmaschinen auch hier, nach Möglichkeit die wichtigeren Treffer an den Anfang der Trefferliste zu stellen.7

Die Anwendung der Operatoren erinnert an die Mengenlehre. Jeder Suchbegriff kommt in einer bestimmten Anzahl von Dokumenten vor. Mit den Operatoren lassen sich nun die Treffermengen verschiedener Suchbegriffe nach Bedarf miteinander kombinieren: Sie können unerwünschte Treffer ausschließen oder mehrere Treffermengen zusammenfassen. In jedem Fall gibt es eine genau definierte und sozusagen »berechenbare« Menge von Treffern.

In Abbildung 8-4 sehen Sie, wie sich die Verwendung der Operatoren AND, OR und NOT auf ein Suchergebnis auswirkt. Sie sehen drei »Stapel« mit Büchern zu drei unterschiedlichen Themen: Windows, Unix und Internet. Einige der Bücher behandeln nicht ausschließlich ein Thema, sondern mehrere (Bücher, die alle drei Themen behandeln, oder in denen sowohl Unix als auch Windows vorkommt, gibt es in diesem Beispiel nicht).


Abbildung 8-4: Die Booleschen Operatoren AND, OR und NOT

OR

Mit dem OR-Operator fassen Sie die Treffermengen mehrerer Suchbegriffe zu einer größeren Gesamtmenge zusammen. Dies widerspricht auf den ersten Blick der umgangssprachlichen Verwendung von »oder«, womit meist ein »entweder – oder« gemeint ist. Die Suchmaschinen verwenden dagegen das sogenannte »inklusive« OR. Das bedeutet, daß bei zwei mit OR verknüpften Suchbegriffen A und B alle Dokumente als Treffer gelten, wenn einer der beiden oder auch beide Suchbegriffe in ihnen vorhanden sind.

In der Praxis wird der OR-Operator vor allem verwendet, um verschiedene Schreibweisen oder verschiedene Bezeichnungen für einen Gegenstand mit einer Suchanfrage zu erfassen, zum Beispiel mit Anfragen wie »hose OR Jeans OR beinkleid«, »book OR buch« oder »Goethe OR Dichterfürst«.

Im obigen Beispiel werden mit der Anfrage »windows OR internet« alle Bücher gefunden, die entweder von Windows oder vom Internet oder auch von beiden Themen handeln. Die Treffermenge ist also größer als bei der Suche nach nur einem Begriff.

Wenn Sie OR verwenden, wächst die Treffermenge mit jedem zusätzlichen Suchbegriff – ohne daß sie dabei (wie bei den »unscharfen« Verfahren) qualitativ besser würde. Vorsicht: Bei vielen Datenbanken ist OR die standardmäßig verwendete Verknüpfung, wenn mehrere Suchbegriffe eingegeben werden. Achten Sie darauf, und sehen Sie sich gegebenenfalls auch die Hilfetexte der Anbieter an, wenn nicht auf Anhieb erkennbar ist, wie die Suchbegriffe behandelt werden.

AND (+)

Mit dem AND-Operator schränken Sie Ihre Treffermenge ein, weil Sie mit AND zusätzliche, engere Kriterien zu einem Suchbegriff hinzufügen. So können Sie bessere Ergebnisse erzielen, weil Sie mit mehreren Suchbegriffen auch genauer umschreiben können, was Sie suchen. Eine Verknüpfung mit AND liefert nur diejenigen Dokumente, in denen alle verknüpften Suchbegriffe vorkommen. In der Abbildung sehen Sie, daß die Treffermenge der Frage nach »windows AND internet« nur diejenigen Bücher umfaßt, die sowohl von Windows als auch vom Internet handeln. Die Treffermenge ist also nicht nur kleiner, sondern auch genauer als bei einer Suchanfrage nach nur einem Begriff.

Weil AND-Anfragen nur dann zu einem Ergebnis führen, wenn tatsächlich alle Suchbegriffe vorkommen, kann es zu unerwünschten Effekten kommen. Denn wenn auch nur einer der Suchbegriffe überhaupt nicht vorkommt, bleibt die Gesamtmenge der Treffer damit ebenfalls leer. Im obigen Beispiel wäre eine Anfrage nach »unix AND indernet« so ein Fall: Das falsch geschriebene Wort »indernet« kommt in keinem Dokument vor, deshalb kann es auch keine Treffer geben, in denen »unix« und »indernet« gemeinsam vorkommen – die Suche hat keine Treffer.

NOT (-)

Mit NOT können Sie schließlich unerwünschte Aspekte bei einer Suche ausschließen. Bei Recherchen mit den Internet-Suchmaschinen werden Sie häufig feststellen, daß manche Suchbegriffe ungewollt Treffer produzieren, die mit dem eigentlich gesuchten Thema nichts zu tun haben. Sie sind aber trotzdem im Suchergebnis enthalten, weil die Suchbegriffe auch in anderem Zusammenhang verwendet werden.

Syntax und Beispiele für Boolesche Anfragen

Suchmaschine/ Verzeichnis

Syntax

Anmerkungen

AltaVista/Fireball8 (Standardsuche)

+tobacco +cancer +lung python -monty –programming (es gibt auch eine Programmiersprache namens Python, die mit -programming ausgeschlossen wird)

Ein vorangestelltes »+« erzwingt den Suchbegriff (entspricht »AND«), ein »-« schließt ihn aus (entspricht »NOT«). Ohne Zusatzzeichen werden alle Begriffe gesucht (unscharf!), was in etwa einem »OR« entspricht.

Excite, Infoseek, Lycos, Northern Light, Intersearch

pollenallergie OR heuschnupfen

karneval AND basel NOT mainz

Die Operatoren werden einfach zwischen den Suchbegriffen eingefügt.

AltaVista Advanced Query, Fireball Detail-Suche

python AND NOT monty (sonst wie bei den anderen Suchmaschinen)

Die Syntax ist mit Excite etc. identisch, lediglich anstelle von NOT muß es AND NOT heißen.

DINO, Lotse

köln museum

rechtschreibung OR grammatik

Begriffe werden automatisch mit AND verknüpft, OR und NOT sind auch verfügbar.

Yahoo

cologne museum

Begriffe werden automatisch mit AND verknüpft.

Tabelle 8-3: Boolesche Suche mit freier Texteingabe

Ein gern verwendetes Beispiel ist der zufällige Zusammenhang zwischen tropischen Riesenschlangen und britischen Komikern: Wenn Sie nach »python« suchen, finden Sie dabei auch viele Texte über die Komikertruppe »Monty Python«. Mit der Verknüpfung »python NOT monty« können Sie solche Effekte ausschließen.

Sie können NOT also immer dann verwenden, wenn sich unerwünschte Aspekte genau definieren lassen oder wenn Sie im Suchergebnis viele fehlerhafte Treffer vorfinden, die sich auf bestimmte Stichwörter zurückführen lassen.

Bei menügesteuerten Eingabeformularen werden die Operatoren manchmal nicht ausdrücklich genannt. Statt dessen kann man wählen, ob man alle Suchbegriffe im Ergebnis haben möchte (was einer AND-Verknüpfung entspricht) oder nur einen bzw. einige der Suchbegriffe (entsprechend einer OR-Verknüpfung).

Der Abstandsoperator NEAR

Mit dem Abstandsoperator NEAR können Sie vorgeben, daß Ihre Suchbegriffe in den Trefferdokumenten nahe beieinander stehen sollen. Diese Möglichkeit ist etwas präziser als die reine AND-Kombination. Stellen Sie sich vor, Sie suchten Informationen zu den Nebenwirkungen von Aspirin. Wenn Sie »aspirin AND nebenwirkungen« suchen, werden auch solche Dokumente gefunden, in denen eines der Wörter am Anfang des Textes vorkommt und das andere am Schluß. Mit einer Abstandssuche können Sie nun Ihre Treffer auf solche Dokumente einschränken, in denen beide Begriffe im Zusammenhang miteinander erwähnt werden und daher (wahrscheinlich) nahe beieinander stehen.

NEAR steht für »nahe bei« und bedeutet, daß die Suchbegriffe innerhalb eines gewissen Abstands zueinander stehen müssen, unabhängig in welcher Reihenfolge. Wie groß dieser Abstand sein darf, ist nicht bei allen Suchmaschinen gleich, aber die Größenordnung bewegt sich zwischen 10 und etwa 50 Wörtern.

Syntax und Beispiele für Abstandsoperatoren

Suchmaschine/ Verzeichnis

Syntax

Anmerkungen

AltaVista Advanced Query/ Fireball Detail-Suche

tobacco NEAR cancer

ISDN NEAR FAQ

Sucht im Abstand von etwa 10 Wörtern.

Lycos

Köln NEAR/10 Dom

Sucht standardmäßig im Abstand von bis zu 25 Wörtern, andere Werte können vorgegeben werden (hier: 10).

Intersearch

therapie NAHE heuschnupfen

Sucht im Abstand von etwa 100 Wörtern.

Diese Funktion ist nicht verfügbar bei Excite, Northern Light, Hotbot und allen thematischen Verzeichnissen.

Tabelle 8-4: Abstandssuche mit freier Texteingabe

8.4 Phrasensuche

Begriffe und Bezeichnungen, die aus mehreren zusammenhängenden Wörtern bestehen, können mit den bisher beschriebenen Methoden nicht zielsicher gefunden werden. Gleiches gilt für Produkt- oder Personennamen. Angenommen, Sie suchten die Website der Harald-Schmidt-Show, weil jemand Ihnen erzählt hat, es gäbe dort pädagogisch wertvolles Material. Sowohl die Namen »Harald« und »Schmidt« als auch das Wort »Show« sind aber Begriffe, die sehr häufig vorkommen. Mit einer Phrasensuche können Sie nun festlegen, daß nur solche Dokumente gefunden werden sollen, in denen diese Begriffe genau in der vorgegebenen Reihenfolge ( als »Phrase« oder Wortfolge) vorkommen.

Wenn Sie also nach der Phrase »Harald Schmidt Show« suchen, beschränken Sie Ihre Suche sehr effektiv auf solche Dokumente, die genau diese Formulierung enthalten, und alle anderen Dokumente, die die Suchbegriffe über verschiedene Stellen des Dokuments verteilt enthalten, werden ausgeschlossen. Die Phrasensuche sollten Sie daher immer dann verwenden, wenn Sie feststehende Begriffe (zum Beispiel »Auswärtiges Amt«), Namen (»Marilyn Monroe«, »New York City«) oder Produktbezeichnungen (»Hewlett Packard«, »Afri Cola«) suchen. Sie ist auch immer dann hilfreich, wenn Sie zielgenau eine WWW-Seite wiederfinden wollen, die Sie schon einmal gesehen haben und von der Sie einzelne Sätze oder Satzteile in Erinnerung haben. Benutzen Sie in so einem Fall einfach einen Satzteil als Such-Phrase.

Syntax und Beispiele für Phrasensuchen

Suchmaschine/ Verzeichnis

Syntax

Anmerkungen

AltaVista, Fireball, Intersearch, Excite, Hotbot, Lycos, Northern Light

»Kondom des Grauens»

»Hewlett Packard»

»Auswärtiges Amt»

»Harald Schmidt Show«

Die Phrasen werden mit Anführungszeichen markiert; Bindestriche etc. sind überflüssig.

WEB.de

virtuelle realität

Begriffe werden automatisch als Phrase gesucht.

Diese Funktion ist bei DINO nicht oder nur eingeschränkt verfügbar.

Tabelle 8-5: Phrasensuche mit freier Texteingabe


Abbildung 8-6: Phrasensuche mit Menüoptionen

8.5 Umlaute, Sonderzeichen und Kurzwörter

Umlaute – ein leidiges Thema

Die Umlaute und andere nationale Sonderzeichen waren noch in jüngster Vergangenheit Stolpersteine für die meist amerikanische Suchsoftware. Inzwischen werden sie fast überall unterstützt.

Dennoch werden von Autoren manchmal noch ausgeschriebene Umlaute verwendet – das ist besonders bei E-Mails und bei Beiträgen in Newsgruppen der Fall. Suchen Sie im Zweifelsfall nach beiden Schreibweisen – am günstigsten mit einer OR-Verknüpfung (z. B. Köln OR Koeln)

Sonderzeichen

Sonderzeichen wie Bindestriche, Punkte oder Pluszeichen sind im Regelfall nicht suchbar. Sie werden von den Suchmaschinen ignoriert und wie Leerzeichen behandelt. Wenn beispielsweise in einem Text das Wort »Musik-Festival« vorkommt, wird es so behandelt, als ob die Wörter »Musik« und »Festival« unverbunden nebeneinander gestanden hätten. Die einzige Möglichkeit, Wörter mit Sonderzeichen zu finden, ist die weiter oben beschriebene Phrasensuche. Im genannten Beispiel müßten Sie also als Suchbegriff »musik festival« (AltaVista, Fireball, Excite, Intersearch) eingeben. Genauso müssen Sie bei anderen Begriffen mit Sonderzeichen vorgehen, z. B. »CD-ROM«, »C++«, »Linux 2.2.09«, »Intel P600+« o. ä.

Kurzwörter

Auch Kurzwörter mit weniger als drei Buchstaben werden im allgemeinen ignoriert, weil sie nicht aussagekräftig sind (z. B. »in«, »an«, »er«) und nur die Indexgröße der Suchmaschinen aufblähen würden. Wenn Kurzworte aber inhaltlich wichtig sind und deshalb in eine Suche einbezogen werden sollen, sollten sie zusammen mit einem weiteren Begriff als Phrase gesucht werden, z. B. »Windows NT«, »Windows 95« oder »PC-Versand« (jeweils mit Anführungszeichen).

8.6 Einschränkung auf Dokumentattribute

Was bei fast allen »normalen« Datenbanken üblich ist, ist bei den Internet-Suchmaschinen (und längst nicht bei allen) erst seit kurzer Zeit gegeben: die Möglichkeit, eine Suche auf bestimmte Attribute oder »Felder« einzuschränken. Denken Sie zum Vergleich an einen Bibliothekskatalog, bei dem Sie vorgeben können, ob Sie nach Autor, Titel, Verlag oder anderen Kriterien suchen möchten. Auf diese Weise können Sie präzise unterscheiden, ob Sie beispielsweise Bücher von Goethe oder über Goethe suchen.

Bei den Suchmaschinen kann man im allgemeinen aber lediglich den gesamten Text von Dokumenten auf einmal durchsuchen – beziehungsweise den Teil des Textes, den die Suchmaschinen tatsächlich verarbeitet haben.

Nun haben WWW-Dokumente im Gegensatz zu Büchern sehr vielfältige Strukturen – das wurde bereits im ersten Kapitel als Grund für die schwierige Informationssuche im Internet beschrieben. Vor allem gibt es keine standardisierte Form, wie Informationen über ein Dokument erfaßt (und damit auch gesucht) werden können. Hiermit sind Informationen über Autor, Herausgeber, Titel oder Erstellungsdatum gemeint, die die Suche manchmal erleichtern können. Auch Informationen über die Art eines Dokuments könnten wichtig für eine Recherche sein: beispielsweise eine Unterscheidung, ob es sich bei einem Dokument um einen Forschungsbericht, einen Aufsatz, eine Produktbeschreibung, eine private Homepage o.ä. handelt. All diese Informationen sind leider im Normalfall nicht direkt suchbar. Sie »stecken« zwar irgendwo in den Dokumenten, sind aber nicht so markiert, daß sie von den Suchmaschinen verarbeitet werden können.

Allerdings lassen sich einige Strukturelemente, die in allen WWW-Dokumenten vorhanden sind (oder zumindest in korrekt erstellten Dokumenten vorhanden sein sollten), für Suchzwecke ausnutzen. Die wenigen Elemente, die Sie bisher bei einigen Suchmaschinen verwenden können, sind:

Mit diesen Suchmöglichkeiten können Sie nicht nur Ihre Recherchen sinnvoll einschränken und unwichtige Dokumente ausschließen, sondern Sie können auch sehr spezielle Recherchen durchführen, die in den folgenden Beispielen beschrieben werden.

Die wohl wichtigste Suchmöglichkeit ist die Titelsuche. Während normalerweise der gesamte Text eines Dokuments durchsucht wird, wird bei der Titelsuche nur der Titel9 der Dokumente berücksichtigt. Dokumente, die das gesuchte Thema nur am Rande oder nur durch einen Verweis behandeln, können so aus der Trefferliste ferngehalten werden, was zu genaueren Ergebnissen führt.

Sehr sinnvoll ist auch die Möglichkeit, ein Rechercheergebnis auf einen bestimmten Datumszeitraum einzuschränken. Viele Dokumente im WWW bleiben auf Servern »liegen«, obwohl sie nicht mehr aktuell sind – mit der Datumssuche können Sie vorgeben, daß nur neuere oder aktualisierte Dokumente gefunden werden.

Mit der Einschränkung auf Dateitypen schließlich können Sie zielgenau nach Grafiken, Java-Applets, Videodateien, VRML-Welten oder anderen Dateitypen suchen.


Abbildung 8-7: Suchoptionen bei Hotbot und Northern Light

Syntax und Beispiele

Sehen wir uns also an, wie AltaVista/Fireball, Northern Light und Hotbot die Suche nach unterschiedlichen Dokumentattributen handhaben.

Bei Hotbot treffen Sie die Auswahl mit Menüunterstützung. Hotbot unterstützt die Suche nach Hypertextlinks, Datum, Dateityp, Serverdomain oder -name.

Bei AltaVista bzw. Fireball und Infoseek ist folgende Syntax zu verwenden:

AltaVista / Fireball / Infoseek

Suche nach ...

Syntaxbeispiel

Anmerkungen

Dokumenttitel

title:kino

Keine Leerzeichen nach dem Doppelpunkt

Servername

host:microsoft

Findet nur Dokumente auf Servern, in denen »microsoft« im Hostnamen vorkommt.

Serverdomain

domain:de

domain:fr

Findet nur Dokumente auf Servern der Domain »fr« bzw. »de« . Im Beispiel werden also nur Dokumente von deutschen bzw. französischen Servern gefunden.

URL

url:biman

Findet Dokumente, in deren URL »biman« vorkommt – entweder im Rechner- oder im Verzeichnis-/Dateinamen.

Hypertextlink

link:www.dom.de

Findet Dokumente mit Verweisen auf »www.dom.de« – dies können sowohl Dokumente auf diesem Server selbst als auch Dokumente auf anderen Servern sein.

Dateityp

link:mpg (oder link:avi, link:wrl, link:wav)

Findet Dokumente mit Verweisen auf MPEG-Videos (bzw. AVI-Videos, 3D-Welten, WAV-Sounds).

Northern Light und Intersearch unterstützen nur die Attribute TITLE und URL.

Tabelle 8-6: Suche nach Dokumentattributen bei AltaVista

Daneben kann in der »Detailsuche/Advanced Query« bei Altavista und Fireball, in der »Power Search« bei Northern Light und im Suchformular von Hotbot in einem gesonderten Eingabefeld auch ein Datumszeitraum vorgegeben werden.

Praktische Anwendung

Mit den hier beschriebenen Suchmöglichkeiten können Sie vielfältige Experimente durchführen. Probieren Sie zum Beispiel folgende Anfragen. In Klammern finden Sie jeweils die Syntax für eine »Advanced Query« bei AltaVista bzw. eine Detailsuche bei Fireball.

Sie suchen Informationen über Vespa-Roller. Um nicht alle Dokumente zu finden, in denen das Wort irgendwo vorkommt, beschränken Sie die Suche auf den Titel (title:vespa). Um nur Dokumente aus Italien zu finden, schränken Sie die Suche auf Rechner ein, die in der Domainangabe »it« (Italien) aufweisen (title:vespa AND domain:it).

Sie möchten wissen, wie viele Verweise auf Ihren eigenen Server zeigen (link:www. mein-server.de oder, um Ihre eigenen Seiten nicht mitzuzählen, link:www.mein-server.de AND NOT host:www.mein-server.de). Damit werden im ersten Schritt alle Dokumente gefunden, die einen Verweis auf irgendeine Seite bei »www.mein-server.de« enthalten. Im zweiten Schritt werden alle Dokumente auf dem Server »www.mein-server.de« abgezogen, so daß nur noch Dokumente übrigbleiben, die von außerhalb auf »www.mein-server.de« verweisen.

Sie haben irgendwo einen URL gelesen und nur den Dateinamen behalten können. Er lautet »biman.html« (url:biman.html).

Sie möchten wissen, was Microsoft zum Thema »Makro-Virus« zu sagen hat (»ma*ro virus« AND host:microsoft). Damit werden Dokumente gefunden, die auf Servern mit dem Hostnamen »microsoft« liegen und die Phrase »macro virus« bzw. »Makro-Virus« enthalten (das Sternchen sorgt dafür, daß sowohl das deutsche »makro« als auch das englische »macro« gefunden wird).

Sie möchten wissen, ob es in Frankreich gelungen ist, den Gebrauch des englischen Wortes »browser« zu unterbinden (browser AND domain:fr). Damit werden Dokumente auf Servern in der Domain »fr« (Frankreich) gefunden, in denen das Wort »browser« vorkommt.

Sie wollen feststellen, ob die Firma Bayer einen oder mehrere WWW-Server unter ihrem Namen betreibt (host:bayer). Damit werden alle Dokumente auf Servern gefunden, in deren Hostname »bayer« vorkommt.

Zum Schluß noch ein kurzer Hinweis: In Kapitel 7 werden die sogenannten »Meta-Daten« besprochen, die von Web-Autoren verwendet werden, um ihre Dokumente zu kennzeichnen (vgl. Abbildung 7-2). Fireball und Intersearch erlauben es zwar, diese Attribute gezielt zu durchsuchen, aber von der Verwendung dieser Suchoption ist abzuraten – der Standard, nach dem diese Kennzeichnung erfolgt, ist relativ neu, so daß zu viele Dokumente im Internet nicht mit den entsprechenen Angaben versehen sind und daher so nicht gefunden werden können.

8.7 Genauere Suchanfragen mit Klammern

Die ganze Leistungsfähigkeit von Booleschen Operatoren, der Phrasensuche und attributbasierten Suchanfragen läßt sich nur ausreizen, wenn Sie einzelne Teilaspekte zusammenfassen und mit anderen neu kombinieren können. Dafür werden Klammern verwendet. Klammern werden von AltaVista und Fireball (nur in der »Advanced Query«/Detailsuche), von Excite und von Northern Light unterstützt.

Die Klammern werden wie bei mathematischen Gleichungen verwendet. Sie geben die Reihenfolge vor, in der die Suchanfragen verarbeitet und verknüpft werden. Die eingeklammerten Teile werden dabei jeweils gesondert ausgeführt und die Ergebnisse anschließend kombiniert.

Sehen wir uns einmal ein Beispiel an:

(restaurant OR bar) AND Köln AND (mexican OR mexikanisch)

Zunächst werden die Klammernpaare ausgewertet: Mit »restaurant OR bar« werden alle Dokumente gefunden, die in irgendeiner Form von einem Restaurant oder einer Bar handeln. Im zweiten Frageteil wird mit »Köln« nach allen Dokumenten gesucht, die von Köln handeln.

Im dritten Teil wird schließlich nach dem Vorkommen von »mexican« bzw. »mexikanisch« gesucht. Die englische Schreibweise wurde als Alternative mit aufgenommen, weil viele mexikanische Lokale genau diese Schreibweise anstelle der deutschen führen.

Mit den Klammern werden die Teilfragen nun voneinander getrennt und die jeweiligen Teilergebnisse anschließend mit AND verknüpft. Die Beispielanfrage zielt also auf mexikanische Bars oder Restaurants in Köln.

Die passenden Begriffe ermitteln

Die Suchbegriffe für die Verwendung Boolescher Verknüpfungen mit Klammern müssen gut durchdacht sein. Sie finden die passenden Begriffe am besten heraus, wenn Sie sich vorstellen, wie ein Dokument aussehen könnte, das Sie finden möchten, und welche Formulierungen dort verwendet werden – also indem Sie rückwärts vom gewünschten Ergebnis zur Fragestellung kommen. Das folgende Beispiel zeigt die gedanklichen Schritte, die dazu notwendig sind.

Nehmen wir an, es werden Informationen, Bezugsquellen oder Hersteller von schadstofffrei gegerbten Lammfellen gesucht:

1. Wie könnte das Ergebnis aussehen?

Ein Dokument, das die gesuchten Informationen enthält, könnte beispielsweise eine der folgenden Formulierungen enthalten:

..... unsere Lammfelle sind rein pflanzlich gegerbt ....

.... Babys liegen gesund auf natürlich gegerbten Schaffellen ....

.... Wir bieten: Lammfelle mit chromfreier pflanzlicher Gerbung .....

.... Bestellnummer 33242: Lammfell, 100x30cm, natürliche Gerbung ....

2. Relevante Formulierungen und Wortstämme finden

Als nächstes werden die wichtigen Begriffe und Formulierungen herausgepickt, wobei gleich auf gemeinsame Wortstämme geachtet wird – diese können mit der Trunkierung gesucht werden:

..... unsere Lammfelle sind rein pflanzlich gegerbt ....

.... Babys liegen gesund auf natürlich gegerbten Schaffellen ....

.... Wir bieten: Lammfelle mit chromfreier pflanzlicher Gerbung .....

.... Bestellnummer 33242: Lammfell, 100x30cm, natürliche Gerbung ....

3. Synonyme zusammenfassen und Wortstämme abtrennen

Beim Zusammensetzen des Suchausdrucks werden schließlich die synonym verwendeten Begriffe jeweils in Klammern mit OR zusammengefaßt und dann mit AND miteinander verknüpft. Das könnte im Ergebnis etwa so aussehen:

(lammfell* OR schaffell*) AND (chromfrei* OR pflanzlich* OR natürlich*) AND (gerbung OR gegerbt*)

Mit diesem Ausdruck werden nur Dokumente gefunden, die mindestens jeweils einen Begriff aus jedem der geklammerten Begriffspaare enthalten. Durch die Trunkierung werden auch alle Schreibvarianten und Flexionsformen erfaßt. Nur wenige Suchmaschinen unterstützen alle benötigten Features, also Boolesche Anfragen, Klammern und Trunkierung, aber bei Altavista, Fireball und Northern Light können Sie sie benutzen.

Zusammenfassung

In diesem Kapitel sind viele unterschiedliche Suchfunktionen besprochen worden. Nicht alle der hier beschriebenen Möglichkeiten sind gleich wichtig, aber je nachdem, was Sie suchen, kann manchmal nur eine spezielle Suchfunktion zum Erfolg führen.

In der alltäglichen Praxis sind bei Stichwortabfragen vor allem die Phrasensuche, die Suche nach Dokumentattributen und die Möglichkeit zum Ausschluß störender Treffer wichtig. Wenn Sie sich mit einer Suchmaschine vertraut machen, sollten Sie herausfinden, ob und wie solche speziellen Anfragen möglich sind, und sie dann auch nutzen.

Für fortgeschrittene Recherchen ist die Kombination verschiedener Suchaspekte wichtig – entweder nach Ihren Vorgaben mit Booleschen Operatoren oder nach den Relevanzberechnungen der Suchsoftware. Hier kommt es darauf an, die grundsätzlichen Unterschiede zwischen den beiden Verfahren zu durchschauen und bei der Suche zu beachten. Bei der Benutzung von Datenbanken und Suchmaschinen müssen Sie also herausfinden, welches Verfahren von der jeweiligen Datenbank verwendet wird, und Ihr Vorgehen daran orientieren.

9. Recherchestrategien

Sie haben jetzt alle wichtigen Hilfsmittel kennengelernt, die für die Informationssuche im Internet benötigt werden: Suchmaschinen, thematische Verzeichnisse, Besprechungsdienste und Meta-Suchhilfen, die Ihnen den Weg zu speziellen Datenbanken weisen oder gleich in mehreren Datenbanken für Sie suchen können. Außerdem kennen Sie die wichtigsten Spezialfunktionen, mit denen Sie bei Suchmaschinen oder auch bei anderen stichwortbasierten Suchhilfen Ihre Suchanfragen präzisieren können.

In diesem Kapitel sollen nun die Mosaiksteinchen zusammengefügt werden. Sie werden sehen, wie Sie die verschiedenen Suchhilfen für bestimmte Recherchezwecke sinnvoll einsetzen können. Dafür werden einige typische Anfragen besprochen. Zuvor werden die Vorüberlegungen beschrieben, die Sie vor der Durchführung einer Recherche anstellen sollten.

9.1 Vorüberlegung: Was suche ich eigentlich?

Die erste Frage, die Sie sich vor einer Recherche im Internet stellen sollten, ist, ob es überhaupt sinnvoll ist, im Internet zu suchen, oder ob das Gesuchte nicht auf anderem Weg leichter gefunden werden kann. Viele Dinge lassen sich auch in den Zeiten der globalen Computervernetzung immer noch mit einem Anruf schneller herausfinden.

Statt beispielsweise erst den URL eines Fahrplansystems der Deutschen Bahn herauszufinden und dann dort mühsam eine Zugverbindung nachzuschlagen, könnten Sie ebensogut die telefonische Fahrplanauskunft anrufen. In der täglichen Praxis werde ich oft gebeten, solche und ähnliche Informationen aus dem Internet zu beschaffen, obwohl sie auch auf anderem Wege zu finden sind. Vergessen Sie also nicht, daß das Telefon, das Notizbuch oder ein persönlicher Kontakt oftmals nützlicher sind als das Internet.

Wo könnte die gesuchte Information veröffentlicht sein? Wer könnte sie anbieten?

In den ersten beiden Kapiteln dieses Buches finden Sie einen Überblick über die verschiedenen Arten von Internetanbietern und über die wichtigsten Internetdienste. Überlegen Sie, in welchem Internetdienst die gesuchte Information zu finden sein könnte, und wählen Sie anhand dieser Vorüberlegung die passende Suchhilfe aus. Dabei ist es besonders interessant, darüber nachzudenken, wer ein Interesse an der Verbreitung der gesuchten Information haben könnte.

Ein Beispiel: Sie suchen Informationen zum Telekommunikationsgesetz, das viele interessante Regelungen für den Betrieb und die staatliche Überwachung von Telekommunikations- und Datennetzen enthält. Informationen zu diesem Thema könnten an verschiedenen Stellen zu finden sein:

Diese kurze Auflistung soll nur Ihr Vorstellungsvermögen anregen, sie ist keinesfalls komplett. Gerade weil es so einfach ist, Informationen im Internet zu plazieren, vervielfacht sich auch die Anzahl der Quellen, die Sie anzapfen können. Probieren Sie die genannten Beispiele einmal aus – Sie werden staunen, wie viele unterschiedliche Gesichtspunkte zum gesuchten Thema zusammenkommen.

Wenn Sie vor dem Beginn einer Recherche schon eine Vorstellung davon haben, wer der potentielle Anbieter einer Information sein könnte, können Sie die passenden Suchhilfen auswählen, um diesen Anbieter zu finden. Im obigen Beispiel etwa würden Sie thematische Verzeichnisse wie DINO oder Yahoo einsetzen, um die betreffenden Ministerien, Parteien oder Zeitschriften zu finden, Meta-Suchhilfen wie Klug Suchen, um juristische Datenbanken zu finden, oder WWW-Suchmaschinen, die das WWW nach dem Begriff »TKG« oder »Telekommunikationsgesetz« durchforsten.

Ein anderes Beispiel: Sie möchten wissen, wie viele Platten eine bestimmte Pop-Musikerin veröffentlicht hat. Zum Kreis der möglichen Informationsquellen gehören in diesem Fall die Musikerin selbst (vielleicht unterhält sie ein eigenes WWW-Angebot) und ihre Plattenfirma, aber auch die Server von Online-Plattenläden, deren Kataloge zur Steigerung der Verkaufszahlen meist exzellente Suchmöglichkeiten bieten. Möglich ist aber auch, daß Fans oder Fanclubs dieser Musikerin auf ihren privaten WWW-Homepages ausführliche biographische Angaben zusammengetragen haben. Das Interesse an der Verbreitung bestimmter Informationen ist nicht unbedingt mit professionellen Verpflichtungen oder finanziellem Kalkül verbunden, sondern kann auch spielerischer Natur sein. Auch das können Sie sich zunutze machen.

9.2 Die richtigen Suchbegriffe verwenden

Die Auswahl der geeigneten Suchbegriffe für eine Stichwortsuche ist entscheidend für den Erfolg einer Recherche. In Kapitel 4 und 8 wurde die Auswahl von Suchbegriffen schon kurz angesprochen. Folgendes müssen Sie berücksichtigen:

Je größer die Datenbank, desto spezieller der Suchbegriff

Die Datenbanken der WWW-Suchmaschinen enthalten Millionen von Dokumenten. Damit steigt die Wahrscheinlichkeit, daß Sie auch sehr spezielle Suchbegriffe wie zum Beispiel unsere »Rechtschreibreform« finden. Die Trefferzahlen allgemeiner Begriffe wie »Musik«, »Computer« oder »Medizin« gehen dagegen in die Zigtausende.

In kleinen Verzeichnissen wie zum Beispiel DINO oder Web.de mit relativ wenigen Einträgen – im Vergleich zu den Suchmaschinen – ist es andererseits eher unwahrscheinlich (wenn auch nicht ausgeschlossen), daß sehr spezielle Begriffe auftauchen. Wenn Sie in einer großen Datenbank nach einem zu allgemein formulierten Begriff suchen, erhalten Sie zu viele Treffer. Benutzen Sie dagegen in einem kleinen Verzeichnis einen zu speziellen Begriff, finden Sie unter Umständen gar nichts. Stimmen Sie also Ihre Suchbegriffe auf die Größe der durchsuchten Datenbank ab. Wenn Sie nicht wissen, wie groß eine Datenbank ist, machen Sie eine Proberecherche und orientieren sich an der Anzahl der gefundenen Treffer.

Je spezieller die Datenbank, desto spezieller der Suchbegriff

Es gibt Datenbanken, die auf ein bestimmtes Fachgebiet spezialisiert sind, zum Beispiel medizinische Datenbanken, Firmenverzeichnisse oder Softwarekataloge. Wenn Sie in einer medizinischen Datenbank nach »Krebs« suchen oder in einem Softwarekatalog den Suchbegriff »Windows« verwenden, werden die Trefferzahlen annähernd die Größe der Datenbanken selbst erreichen. Sie müssen also Ihre Suchbegriffe auch auf das inhaltliche Spektrum der abgefragten Datenbank abstimmen.

Vom Speziellen zum Allgemeinen

Dieser Ratschlag gilt vor allem für die Recherche bei den großen Suchmaschinen: Fangen Sie zunächst mit speziellen Stichwörtern an, zum Beispiel mit besonderen Fachausdrükken, und weiten Sie Ihre Suche aus, wenn diese speziellen Begriffe nicht gefunden werden. Sinnvoll wäre beispielsweise folgende Reihenfolge: Klappskulpturen-Picasso-Maler-Kunst oder Sichelzellenanämie-Anämie-Stoffwechselstörung.

Denken Sie auch an die Sprache ...

Stichwortrecherchen bei Suchmaschinen und thematischen Verzeichnissen beziehen sich immer auf Wörter, die in den erfaßten Dokumenten vorkommen. Einige Autoren fügen in ihre Dokumente zusätzliche Schlagwörter ein, damit auch anderssprachige Suchbegriffe zu Treffern führen, aber dieses Vorgehen ist nicht die Regel. Das bedeutet, daß Sie im Regelfall nur Dokumente finden, die in der gleichen Sprache verfaßt sind wie die Suchbegriffe.

Das Internet ist ein internationales Medium, und die Suchmaschinen erfassen die Dokumente unabhängig von der verwendeten Sprache. Wenn Sie also denken, daß Sie eine Information auch in einer anderen Sprache gebrauchen können, verwenden Sie entsprechende Suchbegriffe. Ein englisch-deutsches Wörterbuch sollte ohnehin zur Standardausrüstung für Internetrecherchen gehören, aber natürlich können Sie auch andere Sprachen benutzen.

9.3 Beispielrecherchen

In diesem Abschnitt sollen nun einige typische Recherchen durchgeführt werden. Anhand der Beispiele werden Sie sehen, wie Sie die verschiedenen Suchhilfen, die es gibt, allein oder in Kombination miteinander einsetzen können.

Präsenz im Netz: Ist ... im Internet vertreten?

Einer der häufigsten Suchansätze für Internetrecherchen ist die Suche nach einem bestimmten Anbieter, z. B. einer Firma, einer Behörde oder einer Institution. Schon mehrfach wurde in diesem Buch der Ratschlag gegeben, Informationen immer auch direkt an der Quelle, nämlich beim möglichen Urheber, zu suchen. Nun wollen wir sehen, wie diese Quelle gefunden werden kann. Die Präsenz im Internet ist heute weitgehend gleichbedeutend mit der Präsenz im World Wide Web, daher wird in diesem Abschnitt beschrieben, wie Sie herausfinden können, ob ein Anbieter im WWW zu finden ist.

Raten

Es klingt verblüffend, aber in vielen Fällen hilft tatsächlich Raten. Die meisten Firmen oder Organisationen, die im WWW präsent sind, lassen sich ihren Namen oder auch einzelne Produktbezeichnungen als Domainnamen reservieren. In Kapitel 11 und im Anhang finden Sie nähere Informationen über den Aufbau und die Bedeutung von URLs und Domainnamen. Hier sei daher nur erwähnt, daß aus dieser Praxis die Möglichkeit resultiert, einfach über die Eingabe eines URL wie http:// www.(name).de/ eine deutsche Firma oder Institution zu finden. Bei Firmen sollten Sie alternativ auch www.firma.com ausprobieren – das gilt sowohl für deutsche als auch für internationale Unternehmen.

Probieren Sie also einige Kombinationen aus, und denken Sie dabei auch an mögliche Abkürzungen oder Produktbezeichnungen. Einige Beispiele als Anregung:

http://www.bundestag.de/

http://www.tagesschau.de/

http://www.persil.de/

http://www.adobe.com/

http://www.branchenbuch.com/

http://www.spiegel.de/

Manchmal steckt der Teufel im Detail: Unerwartete Bindestriche oder unübliche Abkürzungen lassen diese Taktik ins Leere laufen. Schlimmstenfalls erhalten Sie eine Fehlermeldung, was nicht weiter schädlich ist. Sie sollten jedenfalls nicht zuviel Zeit mit dem Herumprobieren vergeuden, wenn die ersten Versuche nicht erfolgreich waren.

An der Quelle nachschlagen

Um im WWW mit einem eigenen Domainnamen aufzutreten oder E-Mail-Adressen mit dem eigenen Firmen- oder Institutionsnamen zu erhalten, muß man sich beim zuständigen Network Information Center registrieren lassen. Die Registrierungsdaten der NICs sind öffentlich zugänglich, so daß Sie also direkt an der Quelle nachschlagen können, ob eine Institution mit eigenen Diensten im Internet präsent ist und welchen Domainnamen sie hat. Das deutsche NIC führt leider keine brauchbare Datenbank mehr, die öffentlich zugänglich ist – dort kann man nur recherchieren, wenn man den Domainnamen bereits kennt. Aber die Daten der deutschen Domaininhaber können auch beim RIPE, der offiziellen Koordinierungsstelle für den europäischen Internetadreßraum, abgefragt werden (http://www.ripe.net/cgi-bin/ripedbsearch).

Suchen Sie dort nach dem Anbieter, dessen Internetpräsenz Sie interessiert. Sie können entweder einen Domainnamen oder den Namen einer Firma oder Institution suchen.


Abbildung 9-1: Suche nach einem Anbieter im RIPE-Verzeichnis

Im Suchergebnis erhalten Sie die Domainnamen aller gefundenen Anbieter (im Beispiel: alle Anbieter, bei denen »aldi« im Domainnamen oder in der Firmenbezeichnung vorkommt) sowie einige weitere technische Informationen. Anschließend können Sie versuchen, mit »http://www.(domainname).de/« fündig zu werden – in den meisten Fällen werden Sie damit Erfolg haben.

Experimentieren Sie mit der Suche – Sie können beispielsweise auch nachsehen, welche Banken schon im Internet präsent sind, wenn Sie nur nach »bank« suchen. Entsprechendes gilt auch für andere Branchen, sofern die Branchenbezeichnung irgendwo im Firmennamen vorkommt. Probieren Sie zum Beispiel »versicherung« oder »bibliothek«.

Das RIPE hat nur die Registrierungsdaten europäischer Domains in seiner Datenbank. Weil viele deutsche Anbieter aber auch andere Domains wählen (insbesondere .com), müssen Sie unter Umständen auch andere Quellen heranziehen.

Das Verzeichnis WebSitez (http://www.websitez.com/) erlaubt Ihnen eine Suche nach Domainnamen oder -inhabern, die einen bestimmten Begriff beinhalten.

Die Suche nach Domainnamen und -beschreibungen findet allerdings nur Anbieter, die tatsächlich selbst Internetserver betreiben oder betreiben lassen. Kleinere Firmen, Institute oder Vereine, die keinen eigenen Server betreiben, sondern ihre Seiten auf fremden Servern ablegen, werden so nicht gefunden.

Suchmaschinen benutzen

Wenn Sie Firmen oder Institutionen mit Hilfe von Suchmaschinen suchen, sollten Sie zunächst über eine Meta-Suchmaschine eine »quick and dirty«-Abfrage mit dem gesuchten Namen abschicken. Sollte sich dann herausstellen, daß die Treffermenge zu groß ist, können Sie Ihre Suchanfrage mit einigen Kniffen sinnvoll einschränken. Dies ist insbesondere dann nötig, wenn der Firmenname gleichzeitig auch ein Wort oder Begriff in einer Sprache ist.

Thematische Verzeichnisse nutzen

Die Nutzung thematischer Verzeichnisse wurde schon im vierten Kapitel genauer beschrieben. An dieser Stelle sei lediglich erwähnt, daß Sie sie ebenfalls dazu verwenden können, um nach der Präsenz einer Institution zu suchen. Wählen Sie dazu ein Verzeichnis, das den geographischen Raum abdeckt, in dem Sie den Anbieter vermuten (z. B. also DINO oder Yahoo Deutschland für deutsche und Yahoo USA oder Looksmart für internationale Anbieter).

Besondere Verzeichnisse finden und nutzen (mehrstufige Suche)

Wenn Sie mit den bisher beschriebenen Methoden keinen Erfolg hatten, sollten Sie versuchen, fachspezifische Verzeichnisse zu benutzen, beispielsweise ein Firmenverzeichnis, eine Liste aller Bibliotheken, ein Verzeichnis von Fotografen im WWW o.ä. Sie müssen die Suche also in mehreren Stufen durchführen: zunächst ein brauchbares Verzeichnis finden und dieses dann durchsuchen.

Für den ersten Schritt bieten sich vor allem die thematischen Verzeichnisse, die Besprechungsdienste und die Meta-Suchhilfen an. Von dort aus können Sie dann zu den eigentlichen Spezialverzeichnissen verzweigen und Ihre Suche durchführen. Abbildung 9-2 zeigt eine Suche nach Firmenverzeichnissen bei Klug Suchen und die Liste der »Business directories« beim Internet Sleuth.


Abbildung 9-2: Einstieg in eine mehrstufige Suche: Zuerst muß ein geeignetes Verzeichnis gefunden werden

Informationen zu einem Themenbereich finden

Dieser Suchansatz wird immer dann verfolgt, wenn man sich in ein Thema neu einarbeiten möchte oder muß und nicht konkrete Einzelinformationen braucht, sondern eher einen generellen Überblick. Das gleiche Bedürfnis haben meist auch neue Internetbenutzer, die sich im Internet zunächst über ihre beruflichen oder privaten Hauptinteressen informieren möchten.

Die Suchmaschinen sind für solche thematischen Recherchen wenig geeignet, denn im Regelfall weiß man zu Beginn der Suche gar nicht genau, wonach man eigentlich suchen soll. Statt dessen sind hier die thematischen Verzeichnisse die richtigen Suchhilfen. Ihre Benutzung wird in Kapitel 4 beschrieben.

Wenn Sie sich die Zeit zum ausgiebigen Stöbern im WWW nicht nehmen können oder wollen, um auf diese Weise brauchbare Websites zu finden, müssen Sie auf die Vorarbeit anderer zurückgreifen und einen der in Kapitel 5 beschriebenen Besprechungsdienste benutzen. Fangen Sie mit dem »Clearinghouse for Subject Oriented Internet Resource Guides« an – wenn Sie dort zu Ihrem Thema einen oder mehrere »Guides« finden, können Sie diese als Ausgangspunkte für weitere Recherchen nehmen. Sollten Sie dort nicht fündig werden, probieren Sie einen der anderen Besprechungsdienste, allen voran die Britannica oder, für Deutschland, Lycos WOW.

Um noch einmal auf das ausgiebige Stöbern zurückzukommen: oftmals findet man dabei interessante Ressourcen, und diese Mitnahmeeffekte machen auch den großen Reiz bei der Suche im Internet aus. Ohnehin sollten Sie sich nicht ausschließlich auf die Auswahl der Besprechungsredaktionen verlassen, sondern sich auch selbst auf die Suche machen.

Die Experten finden

Bereits im ersten Kapitel wurde auf die Informationsangebote von spezialisierten Institutionen hingewiesen, zum Beispiel von Forschungseinrichtungen, Universitätsinstituten, Spezialbibliotheken und Archiven. Die Fachkompetenz solcher Institutionen bzw. ihrer Mitarbeiter und Mitarbeiterinnen spiegelt sich (hoffentlich ...) in ihrem WWW-Angebot wider, was Sie sich zunutze machen können. Überlegen Sie also, ob Sie für Ihr gesuchtes Thema eine solche führende Institution kennen (Beispiele: Raumfahrt – Nasa; Menschenrechte – Amnesty International usw.), und versuchen Sie, ihr Internetangebot zu finden. Wenn Ihnen auf Anhieb keine geeignete Institution einfällt, können Sie alternativ auch versuchen, über das WWW-Angebot großer Universitäten zu einzelnen Fachinstituten oder Fakultäten vorzudringen, um sich dort umzusehen. In aller Regel gibt es dann bei diesen Experten-Sites wiederum gut aufbereitete Listen mit Verweisen auf weitere brauchbare Quellen.

Gleichgesinnte finden

Mit Sicherheit gibt es eine Menge Internetnutzer, die ähnliche Interessen haben wie Sie – bei einer geschätzten Benutzerzahl von über 100 Millionen Menschen weltweit ist das jedenfalls zu erwarten. Wenn Sie die Orte im Internet finden, an denen sich diese »Kollegen« austauschen, können Sie von ihrem Wissen profitieren und im Gegenzug vielleicht auch anderen weiterhelfen. Im nächsten Kapitel, in dem es um langfristige Strategien geht, finden Sie Tips, wie Sie passende Newsgruppen und Mailinglisten finden.

Software finden

Die Suche nach Software hat verschiedene Aspekte, die unterschiedliche Suchstrategien erfordern. In diesem Abschnitt wird besprochen, wie Sie Dateien finden, deren Namen Sie schon kennen, wie Sie Free- und Shareware für bestimmte Einsatzzwecke finden, wie Sie sich über kommerzielle Software informieren können und wo Sie Hilfestellungen bei der Auswahl aus dem vielfältigen Angebot finden.

Dateien finden

Software wird im Internet generell in komprimierter und gebündelter Form verbreitet. Daher sind alle zusammengehörenden Dateien stets in einer einzigen Archivdatei zusammengepackt und können auf einmal heruntergeladen werden. Wenn Sie schon den Dateinamen (!) eines Programmpakets kennen, das Sie haben möchten, können Sie es mit Hilfe spezieller Datenbanken leicht finden. Wenn Sie nur den Namen des Programms, nicht aber den Dateinamen des Archivpakets kennen, lesen Sie bitte im nächsten Abschnitt weiter.

Die Verteilung von Software über das Internet verursacht einen wesentlichen Anteil des Datenverkehrs; deshalb werden viele Dateien auf sogenannten »Mirror«-(Spiegel-) Rechnern an mehreren Stellen im Internet vorgehalten. Sie sollten immer versuchen, Dateien von einem möglichst nahegelegenen Rechner herunterzuladen. Dies ist sowohl in Ihrem eigenen Interesse (schnelle Ladezeit) als auch im Interesse aller Internetnutzer (geringere Netzbelastung).

Um auf deutschen FTP-Servern anhand eines Dateinamens nach Software zu suchen, können Sie beispielsweise die Archie-Datenbank der TH-Darmstadt (http://archie.th-darmstadt.de/) oder den ASK-Sina-Service an der Universität Karlsruhe verwenden (http://www.ask.uni-karlsruhe.de/asksina/sina.html).

Sowohl Archie als auch ASK-Sina beziehen ihre Daten aus den »Inhaltsverzeichnissen« vieler deutscher FTP-Server. Diese Verzeichnisse können nach Stichwörtern durchsucht werden – wobei »Stichwörter« in diesem Fall nicht wörtlich zu verstehen ist. In den Verzeichnissen sind nur die Dateinamen enthalten, keine Beschreibungen.

Um eine Suche durchzuführen, tragen Sie den gesuchten Dateinamen in die Eingabefelder ein und schicken die Suchanfrage ab. Ein Tip zur Eingabe des Suchbegriffs: Viele Dateinamen enthalten auch die Versionsnummern der Software (z. B. »gswin10.zip«). Probieren Sie einmal, die Ziffern und die Endung wegzulassen (etwa »gswin« statt »gswin10.zip«) und den Suchbegriff als Substring zu suchen. So finden Sie auch verschiedene Versionen des Programms und können sich die neueste aussuchen.

Die Suchergebnisse werden als Hypertextlinks dargestellt, die direkt zur gesuchten Datei führen. Wenn Ihr WWW-Browser ftp-Transfers unterstützt (was meist der Fall ist), müssen Sie den Dateinamen nur noch anklicken, und die Datei wird heruntergeladen. Denken Sie daran, einen nahegelegenen Server auszusuchen!


Abbildung 9-3: Archie und ASK Sina – Hilfe zur Suche nach Dateien

Programme finden

Archie und ASK-Sina erlauben Ihnen nur die Suche nach Dateinamen. Wenn Sie allerdings gar keinen konkreten Datei- oder Programmnamen kennen, sondern nur den Einsatzzweck eines Programms, brauchen Sie andere Suchhilfen. Sowohl bei Search.com als auch beim Internet Sleuth finden Sie eine Reihe von Software-Suchdiensten. Zwei der besten Softwaresuchdienste sind Filez (http://www.filez.com) und Shareware.com (http://www.shareware.com/). Shareware. com ist ebenso wie Search.com ein Service von C|net (http://www.cnet.com/), was für hohe Qualität bürgt. Trotz des irreführenden Namens verzeichnet Shareware.com nicht nur Shareware, sondern auch Freeware und Public-Domain-Software.

Bei Shareware.com und Filez können Sie nicht nur nach Dateinamen suchen, sondern auch nach Stichwörtern aus der Kurzbeschreibung der Programme. Diese Kurzbeschreibungen sind in Englisch gehalten, deshalb müssen Sie englische Suchbegriffe benutzen. Besonders nützlich ist die zusätzliche Möglichkeit, die Suche auf Programme für ein bestimmtes Betriebssystem einzuschränken.

Auf der Einstiegsseite von Shareware.com können Sie entweder direkt eine Suche starten oder – was zu empfehlen ist – weiter zur »Power Search« gehen, wo Sie mit einem übersichtlichen Formular Ihre Suchanfrage genauer formulieren können.

Angenommen, Sie suchen ein Programm, mit dem Sie unter Windows 95 in mehreren Dateien Textstellen suchen und ersetzen können. Zunächst müssen Sie sich für die Suche passende (englische) Suchbegriffe überlegen. Für unser Beispiel wären das etwa die Wörter search und replace. Sie werden mit AND verknüpft, weil beide Wörter in der Programmbeschreibung vorkommen sollen. Zusätzlich wird im Auswahlmenü der verschiedenen Rechnertypen »MS-Windows 95« gewählt, um nur Programme für Windows 95 zu finden.


Abbildung 9-4: Suche nach Software bei Shareware.com

Im Suchergebnis wird zunächst eine Liste der gefundenen Programme gezeigt. Wenn Sie eines dieser Programme auswählen, erhalten Sie von Shareware.com eine Übersicht über FTP-Server, von denen das Programm heruntergeladen werden kann. Dabei wird automatisch versucht, nahegelegene Server zuerst anzuzeigen.

Neben den Suchfunktionen bietet Shareware.com noch weitere nützliche Dienste. In einem redaktionellen Teil finden Sie immer aktuelle Tips, Listen der beliebtesten und der neuesten Programme und interessante Artikel rund um das Thema »Software«.

Kommerzielle Software

Kommerzielle Softwarepakete gibt es im Internet immer häufiger zum direkten Herunterladen (zumindest als Test- oder Demoversion); vor allem können Sie sich aber Informationen, Updates oder Ergänzungen dazu beschaffen.

Der erste Anlaufpunkt ist auch hierfür wieder die eigentliche Quelle, also der Hersteller. Die meisten Softwarefirmen unterhalten WWW-Server, von denen Sie sowohl Produktinformationen als auch Treiber, Bugfixes (Fehlerkorrekturen) und manchmal auch kostenlose Zusatzsoftware abrufen können. Versuchen Sie also zunächst, den Hersteller eines Programms mit den weiter oben beschriebenen Methoden im Internet ausfindig zu machen. Zunehmend sind die URLs auch in den Hilfedateien der Software zu finden.

Eine weitere Informationsquelle sind aber auch die Onlinekataloge von Software-Versandhäusern. Sie sind vor allem dann hilfreich, wenn Sie nicht ein bestimmtes Produkt suchen, sondern sich darüber informieren wollen, was für Programme es für einen bestimmten Verwendungszweck gibt und wie hoch die Preise für diese Programme sind.


Abbildung 9-5: Softwareinformationen aus Händlerkatalogen

Gut aufgebaute Onlinekataloge von Softwareversendern bieten Ihnen mehrere Suchmöglichkeiten. Sie können Programme entweder nach Kategorien geordnet »durchblättern« (um beispielsweise die Prospektangaben mehrerer Grafikprogramme zu vergleichen) oder mit einer Stichwortsuche den Katalog durchsuchen (z. B. um alle E-Mail-Programme zu finden, die im Angebot sind). Softwareversender mit Onlinekatalogen finden Sie über thematische Verzeichnisse wie Yahoo in den entsprechenden Kategorien. Abbildung 9-5 zeigt die Kategorienliste eines solchen Anbieters (links: http://www.isn.com/) und die Informationen, die man in einem Katalog finden kann (rechts: http://www.softline.de/).

Kommentierte Softwarelisten

Wenn Sie nun mit den hier beschriebenen Suchmethoden mehrere Programme ausfindig gemacht haben, die für Sie in Frage kommen, stellt sich das Problem der Auswahl. Gerade im Sharewarebereich ist es meist schwierig, sich vorab über die Funktionalität eines Programms zu informieren – statt dessen müssen Sie Zeit und Arbeit für eine Probeinstallation opfern. Es gibt jedoch eine Alternative: Sharewareserver mit Besprechungen oder Beurteilungen der Programme, die zum Herunterladen bereitstehen.


Abbildung 9-6: Softwarebesprechungen

Sie finden gute Sharewareserver mit Hilfe der in Kapitel 5 erwähnten Besprechungsdienste. Beispielsweise gibt es bei den »Lycos Top 5%« die Kategorie »Software Archives«, in der die besten Softwareserver aufgeführt sind. Dort wiederum können Sie nicht nur Programme zum Herunterladen finden, sondern zusätzlich auch Besprechungen zu den einzelnen Programmen. Abbildung 9-6 zeigt zwei Beispiele für Windows- und Macintosh-Software.

Personen finden

Eine Person selbst finden (Homepage, E-Mail-Adresse)

Für die Suche nach einer E-Mail-Adresse gibt es spezielle Verzeichnisse, so daß an dieser Stelle eigentlich gar nicht viel dazu gesagt werden muß. Ein guter Einstieg für eine solche Suche ist MESA, dei deutsche Meta-Suchmaschine für E-Mail-Adressen (http://mesa.rrzn.uni-hannover.de). Weitere Mailverzeichnisse finden Sie aber auch bei Klug Suchen oder bei Search.com, wo Sie in der Rubrik »People« Links und auch Eingabemasken für die Suche in mehreren großen E-Mail-Verzeichnissen finden.

Bevor Sie eine solche Suche starten, sollten Sie sich allerdings überlegen, ob Sie die Adresse vielleicht auch durch persönliches oder telefonisches Nachfragen direkt vom Betroffenen erfahren können...

Wenn keiner dieser Wege erfolgreich war, müssen Sie versuchen, den oder die Gesuchte auch im WWW oder in Newsgruppen zu finden – dazu müssen Sie dann wieder Suchmaschinen benutzen. Einige Tips zur Suche:

Informationen über Personen finden (Schauspieler, Autoren, Musiker ...)

Die Suche nach Informationen über eine Person bedarf einiger Vorüberlegungen. Bereits am Anfang dieses Kapitels wurde am Beispiel einer Popmusikerin beschrieben, welche verschiedenen Quellen für eine solche Suche in Frage kommen. Sie können das Beispiel auch auf andere Bereiche übertragen.

Bei Personen, die nicht allgemein bekannt oder gar berühmt sind, können Sie zunächst eine »quick and dirty«-Recherche mit einer Meta-Suchmaschine oder mehreren einzelnen Suchmaschinen wagen (denken Sie daran, den Namen als Phrase zu suchen). So stellen Sie fest, ob überhaupt etwas zu dieser Person zu finden ist. Bei populären Stars werden Sie mit dieser Methode jedoch zu viele ungenaue Treffer erzielen. In diesem Fall sollten Sie versuchen, die Treffermenge sinnvoll zu beschränken:

Eine Alternative ist wiederum der Weg über die Besprechungsdienste. Angenommen, Sie hätten den Film »Tote tragen keine Karos« gesehen und suchten nun Informationen über die Schauspielerin Rachel Ward. Ihr möglicher Suchweg könnte so aussehen: Sie suchen im Britannica-Verzeichnis nach einer guten Kinodatenbank, finden heraus, daß die beste Kinodatenbank die »Internet Movie Database« ist (http://us.imdb.com/), und suchen dort schließlich nach Rachel Ward. Abbildung 9-7 zeigt diesen Weg.


Abbildung 9-7: Mehrstufige Suche nach einer Schauspielerin: Von den »Britannica Best of the Web« (über die »Internet Movie Database«) zu Rachel Ward

Zu guter Letzt noch ein Tip für die Suche nach den wirklich Großen: Unter http://www.biography.com bietet AT&T die Onlineausgabe eines bekannten biographischen Lexikons kostenlos an. Sie können dort derzeit etwa 20 000 Biographien von Stars aus allen Epochen finden.


Abbildung 9-8: »Biography«: Suche nach Biographien

9.4 Andere spezielle Suchhilfen

Am Ende dieses Kapitels möchte ich nochmals auf die in Kapitel 6 besprochenen Meta-Suchhilfen hinweisen. Die Beispielrecherchen haben Ihnen gezeigt, wie Sie mit etwas Phantasie viele zusätzliche Quellen finden können, um Ihre Suche erfolgreich abzuschließen. Besonders die Meta-Suchhilfen wie »Klug Suchen« oder Search.com sind ein wichtiger Wegweiser, wenn Sie zusätzliche Suchmöglichkeiten ausfindig machen wollen.

Drei spezielle Hilfsmittel sollen hier noch ausdrücklich genannt werden, da sie für besonders häufig gestellte Anfragen benötigt werden: für die Suche nach akutellen Nachrichten, nach Multimediadateien (Bildern/Fotos, Musik, Videos) und für die Suche nach Orten (Reisezielen).

Suche nach aktuellen Nachrichten

Für die Suche nach aktuellen Nachrichten aus aller Welt ist das Internet das geeignetste Medium überhaupt. Viele große Verlage, Zeitungen und Agenturen unterhalten auch Online-Redaktionen, und sobald eine Meldung so weit ausformuliert ist, daß sie halbwegs präsentabel ist, kann sie schon von jedermann abgerufen werden – unabhängig vom Erscheinungstermin der Morgenzeitung oder dem Sendebeginn der nächsten Tagesschau. Apropos Tagesschau: natürlich haben auch fast alle Fernseh- und Hörfunksender auf Ihren Websites einen Bereich, in dem aktuelle Nachrichten veröffentlicht werden.

Auch die Betreiber der Suchmaschinen und Web-Verzeichnisse wollen Ihre Benutzer rundum verwöhnen und bieten – meist in Kooperation mit Nachrichtenagenturen – tagesaktuelle Nachrichten. Zusätzlich gibt es auch Zusammenfassungen und Überblicksartikel zu einzelnen Themen sowie Verweise zu relevanten externen Websites. In Tabelle 9-1 finden Sie die URLs der empfehlenswertesten Nachrichtendienste.

Deutschsprachig

International/Englischsprachig

Seite 1

http://seite1.web.de/

Excite NewsTracker

http://nt.excite.com/

Dino-News

http://www.dino-online.de/dino-news/

NewsBot

http://www.newsbot.com/

Yahoo-Schlagzeilen

http://www.yahoo.de/schlagzeilen/

Northern Light NewsSearch

http://www.northernlight.com/news.html

Tabelle 9-1: Nachrichtendienste

Aber es kommt noch besser: Auch für die Suche in den Online-Ausgaben vieler Zeitungen gibt es Meta-Suchmaschinen, die mehrere Quellen auf einmal durchsuchen. Der kleine Anbieter Paperboy (http://www.paperboy.de/) hat es vorgemacht, und der Gruner-&-Jahr-Konzern hat einige Zeit später der Fireball-Suchmaschine die Nachrichtensuchmaschine Paperball zur Seite gestellt (http://www.paperball.de/).


Abbildung 9-9: Meta-Suchmaschinen für Online-Zeitungen: Paperball und Paperboy

Beiden ist gemeinsam, daß sie es ermöglichen, auf einen Schlag alle Artikel aus einer Vielzahl von Online-Ausgaben deutscher Tageszeitungen zu durchsuchen. Dazu muß allerdings erwähnt werden, daß die meisten Zeitungsverlage nur jeweils einen Teil ihrer Artikel online veröffentlichen und nur dieser Teil – wiederum nur für eingeschränkte Zeiträume – via Internet durchsuchbar ist.

Neben der Stichwortsuche bieten sowohl Paperboy als auch Paperball die Möglichkeit, eine »persönliche Tageszeitung« zusammenzustellen. Man kann nach einer unkomplizierten Anmeldung verschiedene eigene Rubriken mit festen Suchbegriffen einrichten, die dann auf Knopfdruck die jeweils tagesaktuellen Treffer zu diesen Suchbegriffen liefern.

Während Paperboy mit über 300 – auch ausländischen – Quellen umfangreichere Ergebnisse bietet, ist bei Paperball die Personalisierung eleganter: Zu jeder selbstdefinierten Rubrik läßt sich auch der Kreis der durchsuchten Quellen festlegen. So kann man beispielsweise für Lokalmeldungen nur die Zeitungen der eigenen Region und für Wirtschaftsnachrichten nur Wirtschaftsblätter auswählen. Welcher der beiden Dienste besser für Sie geeignet ist, hängt also von Ihren persönlichen Vorlieben ab. Abbildung 9-10 zeigt die so angepaßten »persönlichen Zeitungen«.


Abbildung 9-10: Die »persönliche Zeitung« nach eigenen Vorgaben zusammengestellt

Multimedia-Suche

Sie wollen eine selbstgemachte Geburtstagskarte mit einem Bart-Simpson-Bild verschönern oder suchen ein schönes Froschquaken als Startsound für Windows?

Sie könnten zwar probieren, mit den Suchmöglichkeiten im Dateinamen, die u.a. Altavista und Fireball bieten, einen Zufallstreffer zu landen (suchen Sie z.B. nach nach »link:quak.wav« oder »link:bart.jpg«, um Seiten zu finden, die eine solche Datei enthalten).

Aber auch bei der Suche nach Multimediadateien sind Sie nicht auf die allgemeinen Suchmaschinen allein angewiesen. Vielmehr stellen viele Suchmaschinenbetreiber gesonderte Datenbanken von Bild-, Ton- und Videodateien bereit. In der Regel sind das lizenzierte Komplettsammlungen, die einfach »hinzugekauft« oder durch vertragliche Kooperationen mit eingebunden werden, aber es gibt auch die Möglichkeit, das gesamte Internet nach Multimediadateien zu durchsuchen. Besonders praktisch sind die Vorschauseiten bei Altavista und Interpix, die Ihnen die Treffer in einer verkleinerten Übersicht anzeigen. Tabelle 9.2 listet einige Einstiegspunkte für die Multimediasuche auf.

http://www.lycos.com/picturethis

Lizenzkollektion, webweite Suche, Bilder und Sound

http://image.altavista.com/

Lizenzkollektion und webweite Suche mit Vorschau, Ähnlichkeitssuche

http://ipix.yahoo.com/

http://isurf.interpix.com/

webweite Suche mit Vorschau, Ähnlichkeitssuche

http://mp3.lycos.com/

webweite Suche für MP3-Dateien

http://www.mp3meta.com/

Meta-Suchmaschine für MP3-Dateien

Tabelle 9-2: Spezielle Suchhilfen für Multimedia-Dateien

Vergessen Sie nicht, daß diese Dateien in der Regel nicht frei von Urheberrechten sind, auch wenn sie kostenlos anzusehen oder herunterzuladen sind.


Abbildung 9-11: Nach Timbuktu oder nach Tonga?

Suche nach Orten (Reisezielen)

Bevor Sie sich bei der Wahl Ihres Urlaubsortes festlegen, können Sie sich im Internet umfassend vorbereiten: Touristeninformationen, Anreisehinweise, Wechselkurse, Fahrpläne, Wetterdaten, Livekameras und aktuelle Termine können gesucht und gefunden werden. Neben der Suche mit den üblichen Suchhilfen sollten Sie sich auch die Websites von CityNet (http://www.city.net/) und VirtualTourist (http://www.virtualtourist.de/) vormerken. Bei beiden finden Sie einen zentralen Einstiegspunkt in ein weltweites Verzeichnis, von dem aus Sie sich dann zu der gesuchten Region durchklicken können. Mit Hilfe dieser geographischen Navigation finden Sie auf jeden Fall Ihren Weg – gleichgültig, um welchen Ort es geht.

10. Langfristige Strategien – wie man sich auf dem laufenden hält

Bisher ging es hauptsächlich darum, wie man sich im Bedarfsfall mit den passenden Suchmethoden sofort Informationen beschaffen kann. In diesem Kapitel wird nun geschildert, wie Sie das Internet dazu nutzen können, sich über bestimmte Themen oder Sachverhalte, die Sie interessieren, auf dem laufenden zu halten.

Beim Erscheinen der vorigen Auflage dieses Buches wurde gerade das Schlagwort »Push-Technologie« im wahrsten Sinne des Wortes gepusht. Die Push-Technologie sollte Web-Inhalte automatisch zu den Interessenten übertragen. Damit wurde es ermöglicht, den Inhalt von Websites oder ganz allgemein von Informationsdiensten zu abonnieren. Spezielle Clientsoftware oder eingebaute Browser-Erweiterungen übernahmen die Aufgabe, die jeweils neuen Inhalte zu empfangen und lokal zu speichern. Das sollte die Interessenten von der lästigen Pflicht befreien, sich aktiv zu einem Angebot hinbewegen zu müssen, um Neuigkeiten oder Änderungen zu finden.

Diese Funktionalität ist zwar immer noch in den beiden populärsten Webbrowsern enthalten (natürlich mit jeweils eigenen zueinander inkompatiblen Spezifikationen), aber durchgesetzt hat sich das Prinzip nicht. Werfen Sie einen Blick in die Hilfedatei Ihres Webbrowsers, wenn Sie sich für diese Möglichkeit interessieren.

Viele Web-Anbieter offerieren aber auch etwas simplere Lösungen: Auf Anforderung können Sie sich via E-Mail über die jeweils neuesten Artikel oder Dienste auf einer Website informieren lassen. Mit den URLs, die in den Mail-Nachrichten enthalten sind, können dann die jeweiligen Seiten direkt angesteuert werden. Halten Sie also auf Ihren bevorzugten Websites Ausschau nach solchen Newsdiensten.

10.1 Der neue Trend: Portal Sites

Anstelle der Push-Technologie richtet sich zur Zeit die Medienaufmerksamkeit auf die sogenannten »Portal Sites«. Damit ist gemeint, daß sich ein Anbieter bemüht, die Bedürfnisse der Besucher so umfassend zu befriedigen, daß sie nur noch diesen Anbieter als Einstiegstor (»Portal«) ins Internet verwenden. Auf diese Weise können die Besucher mit sanfter Gewalt auf weitere eigene Angebote oder auf Websites von Geschäftspartnern oder Schwesterunternehmen aufmerksam gemacht werden, um dort die Werbe- und Verkaufsumsätze zu erhöhen (vgl. auch Abbildung 7-4).

Der Schlüssel zu der gewünschten starken Kundenbindung ist die Personalisierung: Man bietet Ihnen die Möglichkeit, eine persönliche Startseite einzurichten, deren Inhalt Sie weitgehend selbst festlegen können.

Wenn Sie sich bei so einem Dienst anmelden und Ihre persönlichen Vorlieben angeben, werden Ihnen jeweils aktuelle Nachrichten zum gewünschten Thema, die Ergebnisse Ihres Lieblingssportvereins, neue Kinofilme oder die Aktienkurse Ihres Portfolios angezeigt. Auch zusätzliche Features wie z. B. eine Mailfunktion mit eigener Adresse, die via WWW genutzt werden kann, gehören zum Angebot.


Abbildung 10-1: Persönliche Vorgaben für ein Web-Portal einstellen (hier »My Yahoo«)

Solche persönlichen Portale werden sowohl von Suchmaschinenbetreibern angeboten (z.B. http://my.excite.de/ oder http://de.my.yahoo.com/) wie auch von Microsoft und Netscape, den Herstellern der meistbenutzten Webbrowser (http://www.netscape.com/ bzw. http://my.netscape.com/ und http://www.msn. com/). Letztere können durch voreingestellte Startseiten im Browser enorme Zugriffszahlen verbuchen, und sie möchten dieses Kapital nicht aus der Hand geben – daher betreiben sie die Portale gleich selbst. Im Falle von Netscape übersteigen die direkten und indirekten Umsätze aus dem NetCenter (so heißt das Portal von Netscape) bereits den Umsatz, der durch Software erzielt wird.

Auf den ersten Blick ist es ein fairer Handel: Die Anbieter stecken Geld und Aufwand in die stetige Aktualisierung der Meldungen und den Ausbau der Dienste, und die Benutzer »bezahlen« dafür mit dem Anschauen der Werbebotschaften – ähnlich wie beim Privatfernsehen. Es gibt jedoch einen Haken: Der Abruf der personalisierten Seiten setzt immer eine Anmeldung mit Benutzernamen und Paßwort voraus, was nicht nur umständlich in der Handhabung ist, sondern auch einen tiefen Einblick in Ihre Privatsphäre zuläßt.

Ab dem Zeitpunkt der Anmeldung kann nämlich jede Aktion, die Sie auf so einer personalisierten Seite durchführen, kontrolliert und in einem sogenannten Benutzerprofil festgehalten werden. Welche Nachrichten und Aktienkurse lesen Sie, welche Werbebanner klicken Sie an, welche Suchbegriffe geben Sie in der dazugehörenden Suchmaschine ein – all diese Informationen können auch über längere Zeit hinweg bei jedem Besuch gesammelt werden. Sie sollten sich also zumindest überlegen, ob Sie bei einer Anmeldung wirklich Ihren richtigen Namen und Ihre E-Mail-Adresse angeben wollen ...

Abgesehen von den Datenschutzaspekten bleibt es Geschmackssache, ob man sich ein »Portal« einrichten möchte. Sämtliche Dienste der Portale sind auch ohne Anmeldung zu nutzen – lediglich die individuelle Zusammenstellung entfällt dann, so daß unter Umständen ein paar zusätzliche Mausklicks nötig sind, um zur gesuchten Information zu gelangen.

Neben diesen eher WWW-orientierten Hilfen gibt es aber noch weitere Möglichkeiten, um stets die aktuellsten Neuigkeiten zu erfahren. Sie werden in den folgenden Abschnitten kurz besprochen.

10.2 Newsgruppen lesen

Im zweiten Kapitel wurde schon beschrieben, daß der potentielle Nutzwert der Newsgruppen unter anderem im Gedankenaustausch zu bestimmten Themen besteht. Wenn es also eine Newsgruppe zu einem Thema gibt, das Sie besonders interessiert, sollten Sie sie regelmäßig durchsehen und feststellen, ob gerade interessante Neuigkeiten diskutiert werden. Wie Sie passende Newsgruppen finden, ist ebenfalls im zweiten Kapitel beschrieben. Als Alternative können Sie natürlich auch die Newsgruppensuche von DejaNews oder der großen Suchmaschinen verwenden. Suchen Sie in den Newsgruppen nach einigen allgemeinen Stichwörtern aus Ihrem Interessengebiet, und sehen Sie sich dann an, in welchen Gruppen dieses Thema behandelt wird. Auf diese Weise finden Sie eine Auswahl an passenden Gruppen für die regelmäßige Lektüre.

10.3 Mailinglisten finden und abonnieren

Auch zum Nutzen von Mailinglisten wurde im zweiten Kapitel schon viel gesagt. Gerade wenn es um spezielle berufliche Interessen geht, sind Mailinglisten unverzichtbar, um aktuelle Entwicklungen zu verfolgen und zu diskutieren. Das Problem bei der Suche nach Mailinglisten ist die Tatsache, daß sie per E-Mail betrieben werden und daher im Gegensatz zu Newsgruppen und WWW-Dokumenten oft nicht direkt mit Suchmaschinen gefunden werden können. Es gibt jedoch einige spezielle Verzeichnisse von Mailinglisten, die vor allem internationale/englischsprachige Listen nachweisen, und mit einer passenden Suchstrategie können Sie auch mit Suchmaschinen fündig werden.

Zusätzlich sollten Sie aber auch die Mund-zu-Mund-Propaganda nicht außer acht lassen: Fragen Sie Berufskollegen oder Bekannte mit gleichen Interessen, ob und ggf. welche Mailinglisten sie Ihnen empfehlen können.

Spezialverzeichnisse für Mailinglisten

In den folgenden Verzeichnissen können Sie sowohl thematisch geordnet als auch auf Stichwortbasis nach Mailinglisten suchen. Die Verzeichnisse sind englischsprachig, daher sollten Sie Suchbegriffe in Englisch eingeben. Lediglich Liszt hat auch deutsche Kurztitel für deutsche Listen.

Schließlich sei noch erwähnt, daß in der internationalen Newsgruppe news.answers und in den deutschen Newsgruppen de.answers sowie de.etc.lists einmal monatlich eine Liste mit internationalen bzw. deutschen Mailinglisten veröffentlicht wird (die deutsche Liste ist allerdings klein und nicht sehr gut gepflegt.)

Mailinglisten mit Suchmaschinen finden

Vor allem die international verbreiteten englischsprachigen Mailinglisten sind in den oben erwähnten Spezialverzeichnissen gut dokumentiert. Bei deutschsprachigen Mailinglisten sieht es nicht ganz so gut aus. Versuchen Sie daher Ihr Glück mit Suchmaschinen. Empfehlenswert wäre eine Suchstrategie, die sowohl »Mailingliste« als auch »Mailing-Liste« umfaßt und das gesuchte Thema mit ein paar Stichwörtern kurz umreißt. Versuchen Sie zum Beispiel:

Wandeln Sie die Beispiele entsprechend Ihren Bedürfnissen ab.

Im Anhang finden Sie übrigens eine kurze Anleitung zum Abonnieren von Mailinglisten.

10.4 Electronic Journals/E-Zines

Sicher informieren Sie sich regelmäßig durch die Lektüre von Fachzeitschriften und Magazinen über die Themen, die Sie beruflich oder privat interessieren. Im Internet gibt es ähnliche Veröffentlichungen: sogenannte E-Journals oder E-Zines. Die Bezeichnung »E-Journal« wird meist für fachbezogene und wissenschaftliche Publikationen verwendet, während im Entertainmentbereich eher von »E-Zines« die Rede ist. Gemeint ist aber das gleiche: Veröffentlichungen, die von einer »Redaktion« (die manchmal auch nur aus einer Person besteht) in regelmäßiger Folge zu einem bestimmten Thema herausgebracht werden – so wie eine gedruckte Zeitschrift.

Das Spektrum der elektronischen Zeitschriften ist breit gefächert – inhaltlich wie qualitativ. Es gibt wissenschaftliche E-Journals, die von professionellen Redaktionen oder Verlagen mit Beiträgen renommierter Autoren produziert werden und nur gegen Bezahlung abrufbar sind; daneben gibt es aber auch von Fachleuten betreute Journale, die kostenlos zugänglich sind, »handgestrickte« Zines von Privatleuten, zum Beispiel Fanmagazine von Popstars, Veröffentlichungen von Firmen, die ihre Kundenmagazine online präsentieren, und viele weitere mehr.

Qualität elektronischer Zeitschriften

Die Qualitätsbeurteilung elektronischer Zeitschriften ist schwierig. Ganz oben auf der Qualitätsskala sind auf jeden Fall die Zeitschriften einzuordnen, die ein sogenanntes »peer review«-Verfahren durchführen. Dabei wird – genau wie bei gedruckten Zeitschriften – jeder Beitrag zunächst von Fachleuten des gleichen Gebiets oder von einem verantwortlichen Herausgeber geprüft, bevor er veröffentlicht wird. Auch die organisatorische Anbindung eines E-Journals an einen Verlag oder eine renommierte Institution (z. B. Fachgesellschaft, Berufsverband, Universitätsinstitut o.ä.) bürgt meist für Qualität. In allen anderen Fällen bleibt es Ihrem kritischen Verstand überlassen, die Qualität solcher elektronischen Zeitschriften und die Qualifikation ihrer Herausgeber zu beurteilen.

Bezug elektronischer Zeitschriften

Elektronische Zeitschriften werden auf unterschiedlichen Wegen verbreitet. Am häufigsten ist die Verbreitung via E-Mail und via WWW. E-Journals, bei denen Wert auf grafische Gestaltung gelegt wird (sei es wegen des Designs oder wegen mathematischer Formeln) werden gern im Postscript- oder PDF-Format verbreitet.

Der Bezug via E-Mail entspricht dem Abonnieren einer Mailingliste – mit dem Unterschied, daß Sie hier nur als passiver Empfänger auftreten und es nur einen einzigen Absender gibt, nämlich den Herausgeber. Bei der Veröffentlichung via WWW wird der Text der jeweiligen Ausgabe auf einem WWW-Server verfügbar gemacht, meist gemeinsam mit einem Archiv der älteren Ausgaben. Oft gibt es auch eine Kombination aus beiden Verfahren. Der Bezug via E-Mail hat dabei den Vorteil, daß Sie sich nicht jedesmal um den Abruf kümmern müssen.

Elektronische Zeitschriften finden

Um elektronische Zeitschriften zu einem für Sie interessanten Gebiet zu finden, können Sie eine der folgenden Möglichkeiten nutzen:

10.5 »Leitseiten« finden und beobachten

Bei Ihren Recherchen und Streifzügen durch das World Wide Web haben Sie sicher ab und zu Seiten gefunden, die scheinbar alle interessanten oder relevanten Verweise auf Internetquellen zu einem bestimmten Thema zusammenstellen. Wenn Sie eine solche Seite zu einem für Sie wichtigen Thema finden, die gut gemacht ist und dauerhaft gepflegt wird, können Sie sie zu Ihrer persönlichen »Leitseite« machen. Legen Sie Bookmarks für solche Seiten an, und schauen Sie regelmäßig vorbei, was es Neues zu diesem Thema gibt.

Beachten Sie aber dabei die folgenden Kriterien, um sicherzugehen, daß Sie auf das richtige Pferd setzen:

Wenn Sie diese Kriterien durchgehen, werden Sie sehr schnell feststellen können, ob es sich um eine wertvolle Einstiegsseite handelt oder nur um eine der vielen Sammlungen wahllos zusammengetragener URLs, die mit Enthusiasmus begonnen werden und anschließend verwaisen.

Gute und brauchbare »Leitseiten« finden sich häufig dort, wo einzelne Personen oder Institutionen sich ohnehin mit dem Thema der Seite beschäftigen müssen und wo eine gewisse Routine im Umgang mit dem Internet herrscht, zum Beispiel bei Universitätsinstituten und -bibliotheken, bei Forschungseinrichtungen, bei großen Onlineanbietern, aber möglicherweise ebenso bei engagierten Privatleuten, die viel Zeit und Arbeit in die Zusammenstellung möglichst umfassender Links zu ihrem Hobby stecken. Während also Raumfahrtfans auf jeden Fall regelmäßig bei der NASA vorbeischauen sollten, empfiehlt sich für Ärzte vielleicht eher die Einstiegsseite einer medizinischen Fakultät oder Forschungseinrichtung, um nur zwei Beispiele zu nennen.

Leitseiten automatisch beobachten

Wenn Sie nun für Ihr bevorzugtes Thema eine gute »Leitseite« gefunden haben, können Sie diese auch automatisch überwachen, um mitzubekommen, ob etwas Neues hinzugekommen ist. Entweder verwenden Sie dazu Ihre eigene Software, oder Sie benutzen einen Online-Erinnerungsdienst.

Viele WWW-Browser können auf Anforderung die gespeicherten Bookmarks auf Veränderungen überprüfen. Bei langen Bookmarklisten ist dies allerdings ein zeitraubendes Verfahren, das sich für Modembenutzer nicht unbedingt empfiehlt. Alternativ können Sie auch sogenannte »Offline«-Browser verwenden. Das sind Programme, die eine vorgegebene Liste von URLs abarbeiten und die Dokumente herunterladen, damit Sie sie anschließend ohne laufende Telefongebühren in Ruhe lesen können. Diese Offline-Browser können Ihnen auch melden, wenn sich an einem Dokument etwas geändert hat. Sie finden eine Aufstellung solcher Programme bei Yahoo unter http://www.yahoo.com/ Business_and_Economy/Companies/Computers/Software/Internet/ World_Wide_Web/Offline_Web_Agents/.

Schließlich können Sie auch den URL-Minder (http://www.netmind.com/) beauftragen, Sie über Veränderungen an Ihrer »Leitseite« zu informieren. Der URL-Minder (URL-Erinnerer) ist ein Robotprogramm, das auf einem Server der Firma Netmind läuft. Sie können dort Ihre E-Mail-Adresse sowie den zu überwachenden URL hinterlassen und werden bei jeder Änderung via E-Mail benachrichtigt.

11. Schnelle Beurteilung von Suchergebnissen

In diesem Kapitel finden Sie Tips für die Beurteilung der Trefferlisten, die Sie beim Einsatz der bisher beschriebenen Suchhilfen erhalten. Dabei wird auch die Frage der »Objektivität« der Betreiber von Suchhilfen angesprochen. Außerdem finden Sie Hinweise dazu, wie Sie in einer längeren Liste von Treffern erfolgversprechende Verweise erkennen können.

11.1 Was der URL verrät

Schon ein erster Blick auf die Trefferliste einer Suchmaschine kann Ihnen einige Anhaltspunkte für die Brauchbarkeit der angezeigten Suchergebnisse bieten. Die meisten Suchmaschinen liefern standardmäßig einige Textauszüge und Angaben zu Titel, Dateigröße oder Aktualisierungsdatum mit, die Ihnen die Auswahl erleichtern.


Abbildung 11-1: URL-Anzeige im sichtbaren Text (Fireball), in der Statuszeile (Yahoo), durch Zahlencode verschleiert (Web.de)

Aber auch der URL selbst kann weitere wichtige Anhaltspunkte liefern; es ist daher besonders ärgerlich, wenn er bei manchen Suchmaschinen oder Verzeichnissen absichtlich oder aus Nachlässigkeit nicht in den Trefferlisten gezeigt wird. Falls der URL nicht im Klartext erscheint, fahren Sie mit dem Mauszeiger über den anklickbaren Text, dann wird er in der Statuszeile angezeigt.

Ein URL besteht aus den folgenden Bestandteilen:

http://

www.brausekonzern.de

/brause/rezepte.htm

Das verwendete Übertragungsprotokoll, hier http

Der Hostname des Servers, meist bestehend aus Rechner- und Domainname

Der Pfad zur gesuchten Datei, bestehend aus Verzeichnis- und Dateiname

Tabelle 11-1: Bestandteile eines URL

Top-Level- und Second-Level-Domains

Am Ende des Rechnernamens steht die sogenannte Top-Level-Domain, im obigen Beispiel also »de«. Eigentlich entspricht die Top-Level-Domain dem Ländercode nach ISO 3166, der eine geographische (und damit meist auch sprachliche) Zuordnung eines Angebots ermöglicht. Aus der Entstehungsgeschichte des Internets stammt noch die Aufteilung der amerikanischen Top-Level-Domains nach ihrer Organisationszugehörigkeit. Einige dieser Domains stehen heute aber auch nicht-amerikanischen Anbietern offen, so daß beispielsweise auch deutsche Firmen Domainnamen wie »firma.com« registrieren lassen können. In der folgenden Liste sind die wichtigsten Top-Level-Domains aufgeführt.10

Top-Level-Domain

Verwendung

com

Kommerzielle Anbieter, international

edu

Bildungseinrichtungen, nur USA

gov

Bundesbehörden, nur USA

mil

Militärische Einrichtungen, nur USA

net

Netzanbieter und Provider, international

org

nichtkommerzielle Angebote, international

Ländercodes, z. B.


ca

Kanada

de

Deutschland

fr

Frankreich

it

Italien

nl

Niederlande

uk

Großbritannien

us

USA

Eine Liste aller Top-Level-Domains finden Sie unter http://info.isoc.org/adopsec/domains.html und eine stets aktuelle Liste aller Ländercodes unter ftp://ftp.fu-berlin.de/pub/doc/iso /.

Tabelle 11-2: Die Top-Level-Domains

Vor der Top-Level-Domain steht im Rechnernamen die Second-Level-Domain – das ist der Domainname, den sich die Anbieter selbst aussuchen können (im obigen Beispiel also »brausekonzern«). Eigentlich gilt bei der Registrierung das Prinzip »wer zuerst kommt, mahlt zuerst«. Dabei versuchen die Anbieter natürlich, sich einen Namen zu sichern, der zu ihrem Angebot paßt.

Allerdings gibt es bei Eigennamen und Waren- oder Markenzeichen Einschränkungen: Die rechtmäßigen Inhaber solcher Warenzeichen oder Eigennamen legen großen Wert auf den Internetauftritt unter dem eigenen Namen und scheuen dabei auch vor dem Rechtsweg nicht zurück. Da die Rechtslage aber nicht eindeutig ist, wird alternativ häufig viel Geld in den Rückkauf von Domainnamen investiert. Wenn Sie also URLs mit solchen Domainnamen sehen, können Sie im Regelfall davon ausgehen, daß Sie tatsächlich an der »offiziellen« Quelle gelandet sind (z. B. http://www.microsoft.com/ oder http://www.bundesregierung.de/).

In Deutschland, wo es die organisationsabhängige Domainaufteilung à la gov, com, org usw. nicht gibt, werden bestimmte Domainnamen nur an definierte Nutzerkreise vergeben. So gelten beispielsweise für die Hochschulen immer Domainnamen mit Hochschulbezeichnung (uni-koeln.de oder th-darmstadt.de), die ein privater URL nicht enthalten könnte. Bei Städtenamen ist die Lage nicht so eindeutig; mangels einheitlicher Rechtsprechung treten häufig private Anbieter unter dem Namen von Städten oder Regionen auf.

Alle weiteren Bestandteile vor der Top- und Second-Level-Domain sind für die Beurteilung weniger aussagekräftig – sie sind von jedem »Besitzer« einer Domain frei wählbar und bezeichnen konkrete Rechner und interne Subnetze. Dabei können sechsteilige Namensgebirge wie »www.ietf.cnri.reston.va.us« herauskommen; üblicherweise sind es aber drei bis vier Bestandteile (z. B. »www. heuschnupfen.de« oder »snoopy.nt.fh-koeln.de«).

Erst Blick, dann Klick – Schlüsse aus dem Domainnamen ziehen

Aus der Kombination von Top- und Second-Level-Domain können Sie schon einige Schlüsse bezüglich des Anbieters ziehen. Sehen Sie sich den URL also kurz an, bevor Sie darauf klicken (vgl. Abbildung 11-1).

Nehmen wir an, Sie suchten Informationen zum Parteiprogramm der CSU und erhielten bei einer Suchanfrage unter anderem die folgenden URLs als Treffer: http://www.csu.de/programm/inhalt.html und http://www.uni-xyz.de/polfak/ analysen/csu.html. Es liegt nahe, unter dem ersten URL sozusagen »offizielle« Informationen zu erwarten, während auf dem Universitätsserver eher mit Kommentaren und Anmerkungen zu rechnen ist.

Ein anderes Beispiel: Sie haben Informationen über das neue kalorienfreie Fett »Olestra« gesucht und haben nun die Wahl zwischen Treffer-URLs mit dem Domainnamen »fda.gov« und »olestra.com«. Der Domainname verrät Ihnen, daß im ersten Fall eine (amerikanische) Behörde hinter der Veröffentlichung steht (hier die FDA, also die Arzneimittelbehörde) und im zweiten Fall eine Firma, möglicherweise sogar der Inhaber des Markennamens selbst. Das Wissen über den Anbieter läßt wiederum Rückschlüsse auf die zu erwartenden Informationen zu.

Im Internet kann jedermann problemlos publizieren, weshalb es oft schwierig ist, den Wahrheitsgehalt oder die Authentizität von Veröffentlichungen zu prüfen. Der Domainname als Herkunftsbezeichnung erlaubt Ihnen zumindest eine grobe Voreinschätzung. Achten Sie deshalb beim Anklicken von Links darauf, wo Sie landen, damit Sie die gelieferten Informationen richtig beurteilen. Im Zweifelsfall hilft auch die in Kapitel 9 beschriebene Vorgehensweise, um den Inhaber eines Domainnamens herauszufinden.

Schlüsse aus den Verzeichnis- und Dateinamen ziehen

Die Vergabe von Datei- und Verzeichnisnamen ist von vielen Faktoren abhängig. Dabei spielen manchmal nur technische Gesichtspunkte eine Rolle (zum Beispiel die verwendete Serversoftware), aber meist werden die Namen nach inhaltlichen Kriterien vergeben. Ein URL wie »http://www.genios.de/whatsnew/ whatsnew.html« läßt ohne weiteres vermuten, daß das dahintersteckende Dokument Neuigkeiten über die Firma Genios oder über ihr Angebot enthält.

Tilden-URLs und Benutzer-Homepages

Auf vielen Servern finden sich neben den »offiziellen« Veröffentlichungen der jeweiligen Firma oder Institution auch Dokumente von Benutzern oder Bediensteten, die entweder privater Natur sind oder zumindest nicht zum eigentlichen Kernangebot gehören.

Je nach Einrichtung der Serversoftware sind diese Benutzerverzeichnisse häufig an der Tilde (˜)11 im URL zu erkennen (z. B. http://www.medizin.uni-xyz.de/˜mueller/text.html).

Viele Internetprovider bieten Ihren Privatkunden auch an, eigene Seiten im Netz zu veröffentlichen. Diese Seiten werden entweder auf gesonderten Servern (z. B. http://members.aol.com/... oder http://home.t-online.de/...) oder in gesonderten Verzeichnissen (z. B. http://www.compuserve.com/homepages/ ....) gelagert, die man am Namen erkennt.

Hier ist oftmals Vorsicht angebracht – neben sehr guten, fachlich korrekten und liebevoll gepflegten Angeboten finden sich häufig unvollständige, unrichtige, nicht autorisierte oder veraltete Dokumente. Nehmen Sie solche Angebote genauer unter die Lupe, bevor Sie ihre Inhalte für eigene Zwecke verwenden oder weitergeben.

Im Datei- und Verzeichnisnamen spiegelt sich oft die hierarchische oder organisatorische Struktur eines Internetangebots wider, so daß Sie erkennen können, an welcher Stelle Sie in einen Server »einsteigen« und in welchem inhaltlichen Umfeld das aufgerufene Dokument steht. Sehen Sie sich also URLs ruhig etwas genauer an, bevor Sie sie aufrufen, denn so können Sie unter Umständen das Durchsehen langer Trefferlisten abkürzen.

Domainname und URL sind natürlich rein formale Kriterien und sollten deshalb keinesfalls überbewertet werden. Vergleichen Sie ihre Beurteilung mit derjenigen von Büchern: Der Verlag, das Format und die Aufmachung lassen zwar schon vorab Rückschlüsse auf den Inhalt zu, aber letztlich ist es doch der Inhalt selbst, der zählt.

Zum Schluß ein kleiner Test: Sehen Sie sich einmal den folgenden (tatsächlich existierenden) URL an: http://www.netstore.de/˜god/ – würden Sie nach den Ausführungen dieses Abschnitts glauben, daß dies tatsächlich Gottes Homepage ist? Oder würden Sie sie eher unter http://www.christusrex.org/ vermuten?

11.2 Kommerzielle Interessen der Betreiber von Suchhilfen

Bisher ging es in diesem Buch um die Unterstützung, die Sie von den verschiedenen Suchhilfen bekommen können. Viele Internetbenutzer sind zunächst begeistert, daß so leistungsfähige Dienste kostenlos bereitstehen. Bei aller Begeisterung sollten Sie aber eines nicht aus den Augen verlieren: Fast alle Suchhilfen werden aus wirtschaftlichem Interesse betrieben. Die Aktienkurse der an der Börse notierten Unternehmen, die Suchhilfen betreiben, steigen in schwindelerregende Höhen.

Weil das Suchen und Finden von Informationen im Internet nur mit der Unterstützung leistungsfähiger Suchinstrumente erfolgreich sein kann, erzielen diese Dienste sehr hohe Zugriffszahlen. Die großen Suchmaschinen verzeichnen mehrere Millionen (!) Anfragen täglich. Hohe Zugriffszahlen erlauben den Betreibern wiederum, hohe Preise für die Plazierung von Anzeigen und Werbelogos zu erzielen. Dagegen ist an sich nichts einzuwenden, denn die Suchdienste erbringen eine sinnvolle Dienstleistung, die mit erheblichem Aufwand für Hardware, Leitungsanbindung und Personal verbunden ist.

Um diesen Aufwand zu finanzieren, gibt es nur zwei Alternativen. Entweder verlangt man Geld für die Benutzung (und schränkt damit den Kreis der potentiellen Benutzer von vornherein auf diejenigen ein, die zu zahlen bereit sind), oder man bietet den Service kostenlos an und versucht, seinen Aufwand auf andere Weise zu decken – meist mit Werbeeinblendungen oder mit kostenpflichtigen Einträgen in die Suchdatenbank. Wegen der großen Konkurrenz kostenlos nutzbarer Suchhilfen ist es sehr schwierig, zahlende Kunden zu mobilisieren. Deshalb wird meist die zweite Alternative, die Finanzierung über Werbung, gewählt.

Dieses Modell bringt die Betreiber der Suchhilfen allerdings in ein Dilemma. Die Benutzer erwarten vollständige und korrekte Informationen, sonst wechseln sie zu anderen Suchhilfen. Die zahlenden Kunden dagegen möchten maximale Aufmerksamkeit für ihre Werbung erzielen und wollen möglichst viele Benutzer dazu animieren, anklickbaren Verweisen auf ihre eigenen Server zu folgen.

Diese Interessen widersprechen sich manchmal. Stellen Sie sich vor, eine Fluglinie schaltet eine Anzeige beim Betreiber einer Suchmaschine. Wenn nun nach dem Stichwort »Fluglinie« gesucht wird, erscheinen im Suchergebnis auch alle anderen Fluglinien, die der Suchmaschine bekannt sind – also auch solche, die keine Anzeige gebucht haben. Genau diese Vollständigkeit der Ergebnisse ist die Voraussetzung dafür, daß die Suchmaschine überhaupt einen sinnvollen Service für ihre Benutzer anbieten kann. Deshalb ist es auch nicht möglich, nur Einträge von zahlenden Kunden in die Datenbank aufzunehmen.

Daher wird zum Teil versucht, den zahlenden Kunden Priorität einzuräumen und ihre Einträge an hervorgehobener Stelle zu plazieren. Wenn eine Anzeige als solche erkennbar ist (was im WWW derzeit anhand des streifenförmigen Banner-Formats meist problemlos möglich ist), kann man leicht zwischen Werbung und Suchergebnis unterscheiden. Aber was ist mit der Reihenfolge der Treffer? Mit entsprechender Programmierung wäre es ohne weiteres möglich, bestimmte Treffer zu »bevorzugen«, also im Suchergebnis an einer hervorgehobenen Stelle ganz am Anfang aufzulisten. In diesem Fall wäre die Beeinflussung der Ergebnisanzeige für die Benutzer nicht erkennbar.

Wie wir schon in Kapitel 7 im Zusammenhang mit dem Ranking besprochen haben, ist die Programmierung von Rankingmechanismen sehr komplex und wird obendrein als Firmengeheimnis gehütet. Außerdem ist das Ranking bereits ohne Beeinflussung durch Anzeigenkunden längst nicht perfekt – insofern spielt es eigentlich aus der Sicht des Benutzers keine Rolle, ob nun ein Treffer zufällig oder gegen Bezahlung vorn steht.

Zwar sind solche Methoden von den Betreibern etablierter Suchhilfen bisher stets dementiert worden, aber wenn man die große Konkurrenz der Suchdienste untereinander und die fallenden Preise für Bannereinblendungen bedenkt, fällt es zumindest schwer, diesen Beteuerungen zu glauben. Es gibt auch schon Anbieter, die bezahlte Einträge aufnehmen, ohne dies gut sichtbar anzugeben (z. B. GoTo, http://www.goto.com/).

Allgemein üblich ist aber, eine Verknüpfung zwischen den Suchbegriffen und den im Suchergebnis eingeblendeten Anzeigen durchzuführen: Wenn Sie beispielsweise das Wort »Hotel« suchen, wird neben den eigentlichen Treffern vorzugsweise Werbung von Reiseveranstaltern oder Buchungsagenturen angezeigt.

Dieses Verfahren scheint ein brauchbarer Kompromiß zu sein. Letztlich ist die Werbung immer noch das »kleinere Übel«, ohne das viele Internetangebote nicht existenzfähig wären. Ohnehin sollten diese Anmerkungen nur noch einmal das vor Augen führen, was am Anfang des Kapitels schon gesagt wurde: Achten Sie darauf, wer Ihnen etwas mitteilt, wenn Sie den Inhalt beurteilen. Und trainieren Sie den »Rosinenpickerblick«, der schon in Kapitel 7.1 empfohlen wurde.

12. Information als Ware: kommerzielle Anbieter

In diesem Buch ging es bisher ausschließlich um Informationsquellen, die kostenlos im Internet zur Verfügung stehen. Bereits im ersten Kapitel wurde aber angedeutet, daß vor allem wirtschaftlich verwertbare Informationen meist nicht kostenlos abrufbar sind. Bei der Benutzung der Suchmaschine Northern Light sind uns schon kostenpflichtige Dokumente begegnet.

Um keine Mißverständnisse aufkommen zu lassen: es stimmt nicht, daß alles, was Sie im Internet kostenlos abrufen können, frei von Rechten Dritter ist und ohne weiteres weiterverwendet werden darf. Vielmehr handelt es sich um Informationen, die von den jeweiligen Inhabern des Urheberrechts aus unterschiedlichen Motiven (vgl. Kapitel 1) ins Netz gegeben werden – und zwar meistens, ohne daß sie ihre Rechte daran aufzugeben beabsichtigen.

Daneben gibt es aber genügend Fälle, in denen selbst eine derart eingeschränkte Veröffentlichung im Internet überhaupt nicht in Frage kommt. Sei es, weil die Autoren sich von einer kontrollierten Abgabe einen finanziellen Vorteil versprechen (zum Beispiel bei einem Buch wie diesem) oder weil die Erstellung eines Textes (einer Grafik, einer ganzen Datenbank etc.) mit Kosten verbunden war, die wieder gedeckt werden müssen.

Besonders der letztere Gesichtspunkt steht bei den kommerziellen Datenbanken im Vordergrund, die in diesem Kapitel kurz vorgestellt werden sollen. Sie haben insofern mit dem Thema dieses Buches zu tun, als sie inzwischen überwiegend via Internet leicht erreichbar sind und die Betreiber sich deshalb nach und nach der großen Gruppe der Internetbenutzer öffnen. Außerdem werden in diesem Kapitel Online-Bestellsysteme für Fachliteratur vorgestellt. Mit diesen Diensten können Sie Ihre Internetrecherchen professionell vervollständigen.

12.1 Die »klassischen« kommerziellen Datenbanken

Schon in den späten 50er Jahren wurde damit begonnen, elektronische Kataloge wissenschaftlicher Publikationen anzulegen. Die wachsende Zahl der Veröffentlichungen machte es immer schwieriger, noch einen Überblick selbst über Teilgebiete der Forschung zu behalten und auf dem neuesten Stand zu bleiben. Pikanterweise hat vor allem die Tatsache, daß die damalige Sowjetunion 1957 noch vor den USA einen Satelliten ins All schießen konnte, eine Reihe von westlichen Regierungen zum Handeln veranlaßt. Mit staatlicher Unterstützung wurden große bibliographische Datenbanken aufgebaut, die den Wissenschaftlern den effektiven Zugriff auf die relevante Literatur erleichtern und Doppelarbeit bei der Forschung vermeiden sollten. Vor der Investition von viel Geld und Zeit in aufwendige Projekte sollte definitv ausgeschlossen werden, daß die jeweilige Fragestellung schon bearbeitet wurde.

Literaturdatenbanken ohne Text?

»Bibliographisch« bedeutet, daß in diesen Datenbanken nicht der gesamte Text von Aufsätzen und Büchern gespeichert wird, sondern, genau wie in einer gedruckten Bibliographie, nur wichtige Angaben wie Autor, Titel, Thema und Inhaltsangaben (sogenannte Abstracts). Anhand der Fundstellenangabe konnte man dann die gewünschten Veröffentlichungen in Papierform von einer Bibliothek beschaffen lassen. Diese Aufbereitung wird bis heute beibehalten, allerdings ist die Beschaffung der gefundenen Literatur wesentlich leichter und schneller geworden.

Text und Volltext

Im Laufe der Jahre wurden die bestehenden Systeme ausgebaut. Neue Datenbanken kamen auf den Markt, auch solche, die nicht in erster Linie forschungsorientiert waren, sondern auch Veröffentlichungen anderer Gebiete erfaßten, zum Beispiel Sozial-, Rechts- oder Wirtschaftswissenschaften, aber auch die Inhalte von Tageszeitungen und populären Zeitschriften. Da die Kosten für Datenspeicher und Rechnerkapazität stetig sanken und gleichzeitig immer mehr Publikationen für den Druck ohnehin in eine digitalisierte Form gebracht wurden, war es auch möglich, sogenannte Volltextdatenbanken anzulegen.

In diesen Volltextdatenbanken ist nicht nur ein bibliographischer Verweis auf den Originaltext sowie seine Bezugsquelle, sondern der Originaltext selbst erfaßt. Diese Art der Aufbereitung wird vor allem im Pressebereich gewählt.

12.2 Produktion kommerzieller Datenbanken

Die Produktion und der Betrieb kommerzieller Datenbanken sind sehr aufwendig. Zunächst müssen alle Veröffentlichungen des jeweiligen Fachgebietes gefunden und gesichtet werden. Es muß beurteilt werden, ob sie zum inhaltlichen Spektrum der Datenbank gehören, und schließlich müssen diejenigen Publikationen, die aufgenommen werden sollen, für die Datenbank aufbereitet werden. Für jeden dieser Schritte werden ausgebildete Fachleute des betreffenden Gebiets gebraucht.

In der folgenden Tabelle finden Sie ein Beispiel für ein so aufbereitetes Dokument; es stammt aus der größten – und wohl bekanntesten – medizinischen Datenbank MEDLINE. Damit Sie sich ein Bild vom Umfang solcher professionell produzierten Datenbanken machen können, sei noch erwähnt, daß beispielsweise die MEDLINE über acht Millionen Aufsätze, Bücher und Tagungsbeiträge aus der medizinischen Fachliteratur seit 1966 mit einem geschätzten Zugang von 400.000 Dokumenten jährlich umfaßt.

Originalauszug aus der Datenbank (hier: Medline)

Erläuterungen

TI – [Treadmill ergometry with submaximal load in children and adolescents with mucoviscidosis (CF)]

Aufsatztitel – ins Englische übersetzt

TT – [Laufbandergometrie mit submaximaler Belastung bei Kindern und Jugendlichen mit Mukoviszidose (CF).]

Originaltitel – in diesem Fall ein deutscher Aufsatz

SO – Pneumologie 1991 Nov;45(11):906-9

Quelle, Jahr, Heft, Seiten

AU – Eichinger T; Zimmermann T

Autoren

MJ – Cystic Fibrosis [physiopathology]; Exercise Test; Lung [physiopathology]

Hauptschlagwörter

MN – Adolescence; Adult; Carbon Dioxide [blood]; Child; Oxygen [blood]; Physical Fitness; Quality of Life

Nebenschlagwörter

PT – JOURNAL ARTICLE

Dokumenttyp (hier: Aufsatz in einer Zeitschrift)

AB – Patients suffering from mucoviscidosis can improve their quality of life and can cope with greater physical load if they undergo intensive treatment. This can be objectively confirmed by measuring the lung function, by performing a blood gas analysis and by means of a self-rating mood scale. Load tests can be performed additionally, e. g. by ..... [gekürzt wiedergegeben]

»Abstract« (Zusammenfassung)

... weitere Felder nicht wiedergegeben


Tabelle 12-1: Auszug aus dem MEDLINE-Datensatz eines Aufsatzes

Der eigentliche Nutzen dieser Datenbanken liegt in der strukturierten Aufbereitung, die eine Wissenschaft für sich ist. Erst die Anreicherung der Originaldaten mit einer Inhaltsangabe und den nach festen Regeln vergebenen Schlagwörtern ermöglicht eine effektive Recherche. Genau diese Aufbereitung verursacht aber auch immense Kosten, denn sie ist nur zu geringen Teilen automatisierbar – alles in allem kommen Bearbeitungskosten bis zu 100 DM und mehr je Dokument zusammen. Damit dürfte auch klar sein, warum solche Datenbanken kostenpflichtig sind. Bei der Nutzung fallen dabei meist sowohl Kosten für die Recherchezeit als auch Kosten für jedes angezeigte Dokument an. Hinzu kommen bei vielen Anbietern auch feste Grundgebühren.

Datenbanken wie MEDLINE gibt es auch für viele andere Fachgebiete, von der Luft- und Raumfahrt über Physik oder Chemie bis hin zu den Rechts-, Sozial- und Wirtschaftswissenschaften und den schon erwähnten Pressedatenbanken.

12.3 Zugang zu kommerziellen Datenbanken

Häufig wird die eigentliche Erstellung von Datenbanken von ihrer Vermarktung und Bereitstellung getrennt. Bis zum heutigen Tag werden sie meist von besonderen Rechenzentren (Hosts) bereitgestellt, die den technischen Betrieb sicherstellen, Rechercheprogramme entwickeln und die Abrechnung übernehmen. Aus Effektivitätsgründen haben die Hosts jeweils mehrere Datenbanken eines Fachgebiets oder auch unterschiedlicher Fachgebiete im Programm. Bei manchen Hosts können Tausende Datenbanken einzeln oder z. T. auch gleichzeitig abgefragt werden.

Umgekehrt kann ein Datenbankproduzent seine Daten auch an mehrere Hosts oder weitere Anbieter verkaufen. Die medizinische Datenbank MEDLINE beispielsweise wird zwar nur einmal von der National Library of Medicine in den USA produziert, aber von einer Vielzahl von Anbietern über besondere Online-Zugänge, auf CD-ROM und auch im Internet angeboten – jeweils mit unterschiedlichem Umfang, anderen Recherchemöglichkeiten und zu unterschiedlichen Preisen – zum Teil sogar kostenlos. Wenn Sie einmal so eine »richtige« Datenbank ausprobieren wollen, benutzen Sie den kostenlosen FreeMedline-Zugang beim Deutschen Institut für Medizinische Dokumentation (DIMDI, http://www.dimdi.de/).

Für den Zugriff auf Datenbankhosts müssen Sie meist besondere Nutzungsverträge abschließen. Darüber hinaus war es bisher unerläßlich, die jeweils verwendete Abfragesprache genau zu kennen, die obendrein von Host zu Host variierte. Deshalb werden solche Datenbankrecherchen bis heute von spezialisierten Informationsvermittlern in Bibliotheken und Unternehmen durchgeführt.

Inzwischen haben die Hostbetreiber auch die Endbenutzer als Kunden ins Visier genommen, weil ihre Datenbanken nun via Internet für jedermann leicht erreichbar geworden sind. Mit spezieller Retrievalsoftware, die die komplizierte Abfrage vereinfacht, sowie mit moderaten Preisen soll auch diese Nutzerschicht die Datenbanken nutzen können, ohne einen Vermittler einschalten zu müssen. Abbildung 12-1 zeigt einen Vergleich zwischen einer befehlsgesteuerten Recherche und einer Endnutzerrecherche in natürlicher Sprache mit Softwareunterstützung (hier mit dem »Knowledge Finder«).


Abbildung 12-1: Datenbankrecherche früher und heute

In der folgenden Tabelle finden Sie die URLs der WWW-Server einiger wichtiger Datenbankanbieter für verschiedene Fachgebiete. Sie können sich dort weiter über das Angebotsspektrum, die Preise und die Zugangsmodalitäten informieren. Fast alle bieten inzwischen den Datenbankzugriff über WWW-Gateways an.

Aber Vorsicht: Obwohl die Anbieter sich bemühen, leicht bedienbare Benutzersoftware zu liefern, sind diese Datenbanken doch vor allem für die berufliche Nutzung gedacht. Das werden Sie auch an den Preisen bemerken. Neben dem reinen Zugang benötigen Sie meist auch Schulungen für die effektive (und geldbeutelschonende) Nutzung.

Host / URL

Fachgebiet

Datenbanken (Beispiele)

GBI

http://www.gbi.de/

Wirtschaft, Presse

u. a. Zeitungen im Volltext (z. B. FAZ, taz, Welt), betriebs- und wirtschaftswiss. Datenbanken

Genios

http://www.genios.de/

Wirtschaft, Finanzen

u. a. Handelsblatt im Volltext, Unternehmens- und Bilanzdaten, Bonitätsinformationen

JURIS

http://www.juris.de/

Recht

u. a. deutsche Gesetze, Kommentare, Urteile, juristische Literatur

DIMDI

http://www.dimdi.de/

Medizin, Psychologie

u. a. Datenbanken zur Medizin, Psychologie und zum Gesundheitswesen; FreeMedline kostenlos

STN / Fachinformationszentrum Karlsruhe

http://www.fiz-karlsruhe.de/

Physik, Chemie, Technik, Patente

u. a. Chemical Abstracts, Patentdatenbanken

FIZ Technik

http://www.fiz-technik.de

Technik, Normen

u. a. Maschinenbau, Bauwesen, deutsche und internationale Normen

Dialog Corporation

http://www.dialog.com/

v. a. Technik, aber auch fast alle anderen Gebiete

Zusammenschluß zweier ehemals selbständiger Hosts (DIALOG und Datastar) – internationale Datenbanken aller Fachgebiete

Gruner & Jahr Pressedatenbanken

http://www.pressedatenbank.guj.de/

Populäre Zeitschriften

Artikel der GuJ-Zeitschriften wie Geo, Stern, Brigitte etc., aber auch Tageszeitungen; reicht bis in die 50er Jahre

Tabelle 12-2: Wichtige Datenbankhosts

12.4 Fachliteratur online bestellen

Die in den vorigen Abschnitten beschriebenen Datenbanken sind vor allem Hilfsmittel für umfassende Recherchen für den professionellen Einsatz. Wenn Sie aber schon eine Quellenangabe haben oder sich mit weniger ausgefeilten Recherchemöglichkeiten zufriedengeben, können Sie via Internet direkt Literaturbestellungen aufgeben und sich die gesuchten Artikel per E-Mail oder Fax schnellstmöglich zusenden lassen.

Komfort hat seinen Preis

Literaturbestellungen aller Art können Sie sehr günstig über Ihre örtliche Universitätsbibliothek oder Stadtbücherei abwickeln lassen – das ist derzeit allerdings manchmal mit längeren Wartezeiten verbunden. Wenn Sie es eilig haben oder lieber in Ruhe von zu Hause aus arbeiten möchten, können Sie auch direkt bei diversen Anbietern bestellen. Dieser Weg ist kostspieliger als die Beschaffung über eine Bibliothek, dafür aber schneller und unabhängig von Öffnungszeiten.

Die hier beschriebenen Bestellmöglichkeiten gelten nicht für Bücher, sondern nur für Aufsätze in Fachzeitschriften und vergleichbare Fachliteratur, z. B. Kongreßbeiträge oder Forschungsberichte. Bücher müssen Sie sich nach wie vor entweder über den Buchhandel oder über Ihre Bibliothek beschaffen.

Document Delivery-Dienste

Wie der Name andeutet, handelt es sich bei Document Delivery-Diensten um Anbieter, die Fachliteratur beschaffen und zustellen. Meist wird vorausgesetzt, daß Sie bereits eine Quellenangabe haben – also beispielsweise den Titel eines Aufsatzes und der Zeitschrift, in der er erschienen ist, sowie Erscheinungsjahr, Heftnummer und Seitenangabe. Mit diesen Angaben können Sie eine kostenpflichtige Bestellung aufgeben. Der bestellte Artikel wird dann per E-Mail, Fax oder Briefpost zugestellt.

Ein Beispiel für einen Document Delivery-Dienst mit Recherchemöglichkeit ist Uncover, erreichbar unter http://uncweb.carl.org/. Uncover enthält die täglich aktualisierten Inhaltsverzeichnisse von etwa 17.000 englischsprachigen Fachzeitschriften und Periodika mit insgesamt über sieben Millionen Artikeln – zum Teil sogar mit kurzen Inhaltsangaben der Artikel.

Die Besonderheit bei Uncover ist die kostenlose Recherche: Sie können via Internet im Datenbestand von Uncover kostenlos recherchieren und erhalten im Suchergebnis die volle Quellenangabe, mit der Sie sich gefundene Artikel ggf. auch in Ihrer lokalen Bibliothek beschaffen können. Schneller geht es allerdings bei Uncover selbst: Dort können Sie alle gefundenen Artikel direkt bestellen und über Kreditkarte bezahlen. Sie erhalten sie dann im Regelfall spätestens innerhalb von 24 Stunden per Fax oder E-Mail.

Für eine geringe jährliche Grundgebühr können Sie sich von Uncover regelmäßig per E-Mail die Inhaltsverzeichnisse von bis zu 50 Zeitschriften sofort bei deren Erscheinen zustellen lassen. Im Preis enthalten ist auch die Möglichkeit, bis zu 25 Stichwörter vorzugeben, nach denen alle neu aufgenommenen Dokumente durchsucht werden. Sobald ein neues Dokument aus Ihrem Interessenkreis eingeht, werden Sie benachrichtigt.


Abbildung 12-2: Anfrage und Suchergebnis einer Recherche bei Uncover

Ähnliche Dienste sind auch in Deutschland im Aufbau. Allerdings sind die deutschen Anbieter weniger freigiebig – eine kostenlose Recherche mit Trefferanzeige, wie sie Uncover oder auch Northern Light bieten, gibt es leider nur für Angehörige von Hochschulen. Einige nordrhein-westfälische Hochschulbibliotheken betreiben ein System namens Jason/Jade (Journal Articles Sent on Demand/Journal Article Database). Die JASON-Komponente erlaubt die Bestellung von Artikeln aus dem Bestand der über 70.000 laufend abonnierten Zeitschriften an NRW-Hochschulbibliotheken. Dafür wird allerdings eine genaue Quellenangabe benötigt. Mit JADE können die dazu berechtigten Benutzer in den Inhaltsverzeichnissen (nicht im Volltext!) von etwa einem Drittel der 70.000 Zeitschriften nach Stichwörtern suchen und gefundene Artikel »auf Knopfdruck« bestellen. Wenn Sie über einen Internetzugang an einer Hochschule verfügen, dann erkundigen Sie sich bei Ihrer Hochschulbibliothek nach diesen Diensten. Alle anderen müssen draußen bleiben ...

Ein staatlich unterstütztes Liefersystem mit dem vielversprechenden Namen SUBITO ist 1998 eingerichtet worden (http://www.subito-doc.de/). Auch SUBITO bietet Ihnen einen Direktzugang zu einem Recherche- und Bestellsystem, das von mehreren Anbietern aus dem deutschen Bibliothekswesen getragen wird. Die staatlichen Fördergelder ermöglichen eine relativ kostengünstige Lieferung; die angestrebte Lieferzeit (Fax oder E-Mail) soll 72 Stunden nicht überschreiten. In der Endausbaustufe, für die es freilich noch keinen festgelegten Zeitpunkt gibt, ist sogar die Bestellung und Ausleihe von Büchern geplant. Den Einstieg in SUBITO sowie weitere Informationen finden Sie unter http://www.subito-doc.de/.

Weitere Document Delivery-Dienste, z. B. solche für spezielle Fachgebiete, finden Sie in sehr übersichtlicher Form mit Kurzbeschreibungen und Erläuterungen unter http://dils2.lboro.ac.uk/fiddo/fiddo.html oder in der Yahoo-Kategorie http://www.yahoo.com/Business_and_Economy/Companies/Information/Document_Delivery/

Direktbestellungen bei einer Bibliothek

Für alle wissenschaftlichen Disziplinen gibt es in Deutschland sogenannte Schwerpunktbibliotheken, die Literatur (insbesondere auch Fachzeitschriften) zu einzelnen Fachgebieten möglichst vollständig erwerben. Sie erhalten dafür gesonderte Mittel und müssen im Gegenzug die so beschaffte Literatur anderen Hochschulen zur Verfügung stellen.

Viele Schwerpunktbibliotheken sind via Internet direkt erreichbar und bieten auch Direktbestellmöglichkeiten für Firmen und Privatkunden. Diese Bestellungen sind natürlich ebenfalls kostenpflichtig. Die Preise sind oft günstiger als bei kommerziellen Document Delivery-Diensten.

Unter http://wwwsub.sub.uni-hamburg.de/ finden Sie das Projekt WEBIS als zentralen Einstiegspunkt. WEBIS sammelt die Angebote der Schwerpunktbibliotheken aller Fachgebiete unter einem Dach. Sie können dort jeweils die für Ihr gesuchtes Fachgebiet zuständige Bibliothek finden und feststellen, ob es eine Möglichkeit zur Direktbestellung gibt.

Übrigens können Sie bei den spezialisierten Bibliotheken oft auch sehr gute Zusammenstellungen von empfehlenswerten Internetressourcen des jeweiligen Fachgebiets finden. Zum Teil sind diese Zusammenstellungen direkt in WEBIS einsehbar, ansonsten ist aber ein Besuch auf den Homepages der jeweiligen Bibliotheken immer lohnenswert.

12.5 Andere kommerzielle Dienste

Neben den bisher aufgeführten Diensten gibt es noch eine Fülle weiterer kostenpflichtiger Internetangebote, die Sie zu Informationszwecken nutzen können. Sie alle hier zu beschreiben ist allein aufgrund ihrer Vielzahl nicht möglich. Sie finden beispielsweise in der Yahoo-Kategorie http://www.yahoo.com/Business_and_Economy/Companies/Information / eine Reihe von Anbietern kommerzieller Datenbanken und Informationsdienste. Besonders im Bereich berufsbezogener Online-Dienste ist derzeit ein reges Wachstum zu beobachten, z.B. für Ärzte oder Anwälte.

Der besondere Nutzen des »Kaufs« internetbasierter Dienste im Vergleich zur Anschaffung gedruckter Literatur liegt zum einen in der Aktualität und zum anderen in der Anpassung an Ihre Bedürfnisse. Sie können tagesaktuelle Meldungen, Börsenkurse, Presseagenturmeldungen und ähnliche Informationen erhalten, deren eigentlicher Wert gerade in der Aktualität liegt, und Sie können bei den meisten Anbietern eigene Interessenschwerpunkte (sogenannte Profile) angeben, über die Sie laufend individuell informiert werden möchten.

Bevor Sie allerdings einen kostenpflichtigen Informationsdienst in Anspruch nehmen, sollten Sie zunächst einmal prüfen, ob vergleichbare Informationen nicht an anderer Stelle im Internet kostenlos erhältlich sind. Die große Konkurrenz der Anbieter führt dazu, daß oftmals genau das, was Sie bei dem einen Anbieter bezahlen müssen, bei einem anderen testweise oder auf Dauer kostenlos erhältlich ist.

Übrigens sind auch bei den großen Online-Diensten (beispielsweise bei Compuserve, AOL oder T-Online) eine Reihe von interessanten und nützlichen Datenbanken, Nachschlagewerken und Informationsdiensten in den Basispreisen enthalten. Wenn Sie also das Internet über einen solchen Anbieter nutzen, sollten Sie sich auch einmal genau in dessen internen Angeboten umsehen.

Anhang

A. Suchindex – wo finde ich was?


B. Die wichtigsten URLs im Überblick12

Meta-Suchmaschinen

Meta-Ger (dt.)

http://meta.rrzn.uni-hannover.de/

Apollo 7 (dt.)

http://www.apollo7.de/

SavvySearch

http://www.savvysearch.com/

MetaCrawler

http://www.metacrawler.com/

Cyber411

http://www.cyber411.com/

MESA (nur E-Mail-Adressen)

http://mesa.rrzn.uni-hannover.de/

Deutsche Suchmaschinen

Fireball

http://www.fireball.de/

Intersearch

http://www.intersearch.de/

Infoseek Deutschland

http://www.infoseek.de/

Eule

http://www.eule.de/

Lotse

http://www.lotse.de/

Altavista (http://www.altavista.com/)

Northern Light

http://www.northernlight.com/

Hotbot

http://www.hotbot.com/

Excite

http://www.excite.com/

Infoseek

http://www.infoseek.com/

Lycos

http://www.lycos.com/

Thematische Verzeichnisse

Dino Katalog (dt., auch regional)

http://www.dino-online.de/seiten.html

Yahoo (dt.)

http://www.yahoo.de/

Web.DE (dt.)

http://web.de/

AllesKlar (dt., auch regional)

http://www.allesklar.de/

Gerhard (dt., wissenschaftl.

http://www.gerhard.de/

»Deutsche Datenquellen«

http://www.rz.uni-karlsruhe.de/Outer-space/VirtualLibrary/

Yahoo

http://www.yahoo.de/

Looksmart

http://www.looksmart.com/

Besprechungsdienste

Webtip (dt.)

http://www.webtip.de/

Lycos WOW (dt.)

http://wow.lycos.de/

Britannica

http://www.ebig.com/

Argus Clearinghouse

http://www.clearinghouse.net/

Lycos Top 5%

http://point.lycos.com/categories/

Meta-Listen weiterer Suchhilfen

Klug Suchen (dt.)

http://www.klug-suchen.de/

Yabba (dt.)

http://www.yabba.de/

Search.de (Anbieter: DFN)

http://www.search.de/

Internet Sleuth

http://www.isleuth.com/

Search.com (Anbieter: C|Net)

http://www.search.com/

Dino – Liste von Suchhilfen

http://www.dino-online.de/seiten/go03is.htm

Web.DE – Liste von Suchhilfen

http://web.de/sql/select/Computer/Internet/Info/

Cusi Deutschland

http://www.unix-ag.uni-siegen.de/search/

Cusi (Original)

http://web.nexor.co.uk/public/

Spezielle Suchmaschinen/Datenbanken

Online-Zeitungen

http://www.paperboy.de/

Online-Zeitungen

http://www.paperball.de/

Dejanews (Newsgruppen/Archiv)

http://www.dejanews.com/

Dt. Newsgruppen (ohne Archiv)

http://netnews.web.de/

RIPE (Domainnamen/Inhaber)

http://www.ripe.net/cgi-bin/ripedbsearch

Websitez (Domainnamen/Inhaber)

http://www.internic.net/ds/webfinder/WebFinder.html

Mailinglisten

http://www.liszt.com/

Entry – deutsche Websites geographisch suchbar

http://www.entry.de/

Bundestags-Informationssystem

http://dip.bundestag.de/

C. Fehlermeldungen umgehen: URL-Tricks

Sicher haben Sie diese Situation schon öfter erlebt: Nach mühsamer Sucharbeit haben Sie in einer Suchmaschine oder einem Verzeichnis einen vielversprechenden Verweis gefunden, der genau die Information in Aussicht stellt, die Sie gesucht haben – aber nachdem Sie ihn angeklickt haben, erhalten Sie eine Fehlermeldung: Das gewünschte Dokument kann nicht geladen werden.

Geben Sie sich damit nicht zufrieden! Manchmal kann man sich mit Tricks behelfen und doch noch zum Ziel kommen. In diesem Anhang werden einige dieser Tricks beschrieben.

Was passiert eigentlich beim Aufruf eines URL?

Ein URL besteht aus mindestens drei Teilen: Der erste Teil gibt das verwendete Protokoll (also den Übertragungsstandard) an, der zweite Teil den Namen des Zielrechners, und der dritte Teil enthält schließlich den Namen und den Verzeichnispfad der angeforderten Datei:

http://

www.stbib-koeln.de/

cdrom/bwvcdrom.htm

Protokoll
z. B. http, ftp, gopher

Hostname

Verzeichnis und Dateiname

Tabelle C-1: Bestandteile eines URL

Wenn Sie mit Ihrem Browser einen URL aufrufen, sind mindestens drei, meist aber sogar noch mehr Rechner und die Leitungsverbindungen zwischen all diesen Rechnern beteiligt. Ist auch nur eine der notwendigen Komponenten defekt, klappt der Aufruf nicht. Sehen Sie sich einmal Abbildung C-1 an.


Abbildung C-1: Aufruf eines URL

Beim Aufruf eines URL spricht Ihr Browser zunächst einmal den »zuständigen« Nameserver (meist bei Ihrem Provider) an. Dieser Rechner wandelt den Rechnernamen, der im URL enthalten ist, in die numerische IP-Adresse des Zielrechners um. Anhand der numerischen Zieladresse versucht nun Ihr Browser, zu dem Zielrechner eine Verbindung aufzubauen. Gelingt das, wird der im URL angegebene Dateiname angefordert. Wenn diese Datei auf dem Zielrechner vorhanden und zum Abruf freigegeben ist, wird sie übertragen.

Die meisten Internetprovider setzen für die rationelle Ausnutzung der Netzverbindungen sogenannte Proxy-Cache-Server ein, die als Zwischenspeicher fungieren. Die Browser der Benutzer müssen dann so konfiguriert werden, daß sie diese Proxy-Cache-Server benutzen. Bei dieser Konstellation spricht Ihr Browser nicht direkt den Zielrechner an, sondern nur den Proxy-Server, der Sie dann entweder sofort aus seinem Zwischenspeicher bedient oder seinerseits die angeforderten Dokumente vom Zielrechner abruft, zwischenspeichert und an Ihren Browser weitergibt. In Firmennetzwerken werden Proxy-Server auch aus Sicherheitsgründen vorgeschaltet. Wenn Sie nicht wissen, ob Sie einen Proxy-Server verwenden, müssen Sie sich die entsprechenden Eintragungen in den Konfigurationsmenüs Ihres Browsers oder in Ihrer Netzwerkkonfiguration ansehen oder Ihren Netzwerkadministrator fragen.

Lesen und verstehen Sie die Fehlermeldungen

Die Fehlermeldungen vieler Browser und auch die der meisten Server und Proxy-Server sind nicht auf Anhieb verständlich. Aus den meisten Fehlermeldungen geht aber zumindest hervor, was nicht Ordnung ist. Anhand der Abbildung im vorigen Abschnitt können Sie feststellen, welchem System der Fehler zuzuordnen ist.

Ist eine Verbindung mit dem Zielrechner zustandegekommen?

Unterscheiden Sie, ob eine Verbindung zum Zielserver überhaupt zustandegekommen ist oder nicht. Wenn eine Fehlermeldung besagt, daß die von Ihnen angeforderte Datei nicht vorhanden ist (wahrscheinlich der häufigste Fall) oder daß Sie keine Zugriffsberechtigung haben, dann heißt das im Umkehrschluß, daß wenigstens der Zielserver selbst in Betrieb ist und der Verbindungsaufbau bis zu diesem Rechner geklappt hat. In diesem Fall können Sie gleich im nächsten Abschnitt weiterlesen.

Wenn keine Verbindung zustandegekommen ist, können Sie aus den Fehlermeldungen schließen, woran es gelegen hat. Die häufigsten Ursachen sind in der folgenden Tabelle zusammengefaßt.

Fehler

Beispiele für Fehlermeldungen

Mögliche Abhilfe

Die IP-Adresse des Zielrechners wurde nicht gefunden.

»Kein DNS-Eintrag«

»Host not found«

»DNS lookup failed«

Prüfen Sie den Rechnernamen auf Schreibfehler; senden Sie ggf. die Anfrage nochmals ab.-

Die Adresse wurde gefunden, aber es konnte keine Verbindung aufgebaut werden.

»Zeitüberschreitung«

»Keine Antwort erhalten«

»Connection timed out«

»No route to host«

Versuchen Sie es mehrmals, evtl. einige Zeit später; bleibt das Problem auf Dauer bestehen, ist der Zielrechner entweder offline oder unter anderem Namen erreichbar – Sie müssen nochmals recherchieren.

Proxy-Server ist nicht erreichbar, überlastet oder anderer Fehler liegt vor.

»Couldn’t find proxy server«

»Connection timed out«

ggf. ausführliche Fehlermeldung des Proxy-Servers (erscheint meist im Browser-Fenster)

Versuchen Sie es mehrmals; schalten Sie die Benutzung des Proxy-Servers vorübergehend (!) ab (schlagen Sie ggf. in der Dokumentation oder Hilfe zu Ihrem Browser nach).

Der Zielrechner ist erreichbar, verweigert aber den Verbindungsaufbau.

»Connection refused«, »Socket not connected«, »Document contains no data«

Versuchen Sie es mehrmals, ggf. einige Zeit später.

Tabelle C-2: Mögliche Fehler beim Verbindungsaufbau

»Document not found« – und nun?

Wenn der angesprochene Server behauptet, die angeforderte Datei sei nicht vorhanden, ist noch nicht alles verloren. Zumindest wissen Sie nun, daß der Zielrechner in Betrieb ist, und können ein bißchen herumexperimentieren, um die gewünschte Information doch noch zu bekommen.

1. Achten Sie auf Schreibfehler und die Groß- und Kleinschreibung

Falsche URLs, die von Hand eingegeben werden, von Notizzetteln, aus Zeitschriften oder anderen Vorlagen stammen, sind die häufigste Fehlerquelle. Auch Autoren von WWW-Seiten können beim Einbau von Links in ihre Dokumente Fehler machen. Überprüfen Sie also zunächst die Schreibweise, und achten Sie dabei auch auf die Groß- und Kleinschreibung. Sehen Sie sich den URL genau an, und achten Sie auf unlogische oder orthografisch unkorrekte Schreibweisen. Probieren Sie ruhig verschiedene Variationen aus. Oft werden auch die Dateisuffixe .htm und .html verwechselt – probieren Sie im Zweifelsfall beides.

2. Nutzen Sie den logischen Aufbau von URLs

URLs enthalten Verzeichnis- und Dateinamen. Die Betreiber von WWW- und FTP-Servern vergeben diese Namen meist nach einem logischen, wiederkehrenden Schema. Wenn Sie ein solches Schema erkennen, können Sie es variieren. Falls beispielsweise ein (erfundener) URL wie http://www.ein-server.de/statistik/1996/januar.html nicht funktioniert, könnten Sie vielleicht mit einem anderen Monatsnamen Glück haben. Bei einem fehlerhaften URL wie http://www.eine-zeitung.de/arciv/1995.html könnte die richtige Schreibweise von »archiv« eventuell zum Erfolg führen. Auch hier können Sie mit etwas Glück den richtigen URL herausfinden.

3. Klettern Sie in der Verzeichnisstruktur

Probieren Sie nacheinander die verschiedenen Verzeichnisebenen oberhalb des fehlerhaften URL aus. Entfernen Sie dazu jeweils den letzten Teil des URL bis zum nächsten Schrägstrich. Wenn also http://www.irrgarten.de/haus/zimmer/stuhl.html nicht funktioniert, versuchen Sie nacheinander http://www.irrgarten.de/haus/zimmer, http://www.irrgarten.de/haus/ und http://www.irrgarten.de/. Spätestens auf der obersten Ebene (im genannten Beispiel also bei http://www.irrgarten.de werden Sie einen Einstieg in das System finden. Von dort aus können Sie versuchen, die ursprünglich gesuchte Information auf dem Server zu finden.

4. Benutzen Sie lokale Suchhilfen

Denken Sie daran, daß viele Server die Möglichkeit zur lokalen Volltextsuche bieten, mit deren Hilfe Sie die Inhalte schnell durchsuchen können. Wenn Sie also in Schritt 3 auf der obersten Ebene in einen Server »eingestiegen« sind, halten Sie Ausschau nach Verweisen auf Index- oder Suchseiten. Wenn Sie von dort aus eine Stichwortsuche starten, sollten Sie ganz einfache Suchstrategien verwenden (z.B. zunächst nur nach einzelnen, allgemeinen Stichwörtern suchen).

5. Helfen Sie mit Suchmaschinen nach

Wenn all dies nicht zum Erfolg geführt hat, können Sie als letzte Alternative noch die speziellen URL-basierten Suchmöglichkeiten einiger Suchmaschinen probieren, die in diesem Buch beschrieben wurden. Zur Erinnerung: Bei Altavista und Fireball können Sie beispielsweise mit der Syntax url:suchbegriff bzw. host:suchbegriff arbeiten. Hier sollten Sie nicht den ganzen (falschen) URL suchen, sondern nur Teile davon, ggf. auch miteinander kombiniert. Für das letzte Beispiel könnten Sie zum Beispiel bei Fireball die Anfrage +host:irrgarten +url:stuhl stellen – aber auch jede andere Kombination der Bestandteile von URL oder Rechnernamen ist möglich.

Dieser letzte Tip gilt natürlich nur für den Fall, daß der nicht auffindbare URL nicht von der gleichen Suchmaschine geliefert wurde, die für die Überprüfung verwendet wird. Bei Links, die von Suchmaschinen stammen, können Sie davon ausgehen, daß sie zumindest zum Zeitpunkt der Aufnahme in die Datenbank korrekt waren. Da aber die Suchmaschinen ihre Einträge nur mit einer gewissen zeitlichen Verzögerung überprüfen, kann es durchaus passieren, daß sich URLs in der Zwischenzeit ändern. In diesem Fall hilft nur eine der Methoden eins bis vier.

D. Mailinglisten abonnieren

Mailinglisten werden von spezieller Software verwaltet, die die Neuanmeldungen hinzufügt und Abmeldungen der »subscribers» ausführt. Außerdem übernimmt die Software auch die Verteilung der Nachrichten an alle Abonnenten, wie in Abbildung 2-3 dargestellt. Kommandos an diese Software werden per E-Mail übermittelt. Dazu werden zwei verschiedene E-Mail-Adressen verwendet: eine »Verwaltungsadresse« für die An- und Abmeldung und weitere Kommandos (z. B. für die Anforderung von Hilfetexten) und eine »Listenadresse« für die eigentliche Verteilung der E-Mails.

Um sich einer Mailingliste anzuschließen, müssen Sie sich zuerst als Teilnehmer registrieren lassen. Dazu genügt eine einfache E-Mail an die Verwaltungsadresse (nicht an die Listenadresse!). Die Verwaltungsadresse trägt entweder den Namen der verwendeten Software (etwa listproc, majordomo oder maiser) oder sie hat das Format listenname-request@domain.xy. An diese Adresse schicken Sie eine E-Mail, die nur den Text »subscribe«, gefolgt vom Namen der Liste enthält. Bei manchen Programmen müssen Sie als dritten Parameter noch Ihren Namen anfügen.

Sobald diese Anforderung abgearbeitet worden ist, werden Sie als Teilnehmer in die von Ihnen angegebene Liste eingetragen und erhalten ab diesem Zeitpunkt alle Nachrichten, die an diese Liste gerichtet werden, als E-Mail zugesandt.

Zur Begrüßung erhalten Sie meist eine Bestätigung über die Aufnahme in die Liste, die auch Informationen über die Liste und über wichtige Kommandos der Listensoftware enthält. Besonders wichtig ist der Hinweis, wie Sie sich aus der Liste wieder abmelden können. Die Begrüßungsnachricht sollten Sie daher speichern, damit Sie diese Informationen später zur Hand haben, wenn Sie sie brauchen.

Wenn Sie sich an der Diskussion beteiligen möchten, indem Sie selbst eine Frage stellen, eine Information weitergeben oder auf eine gestellte Frage antworten, können Sie nun mit einer E-Mail an die Listenadresse alle Teilnehmer erreichen. Aber Vorsicht: Vor dem Absenden von Nachrichten sollten Sie die Empfängeradresse nochmals prüfen, damit wirklich nur solche Nachrichten an alle Empfänger verbreitet werden, die auch hierfür gedacht sind. Das gilt besonders, wenn Sie privat auf eine Listen-Mail antworten wollen, denn häufig ist die Listenadresse als Standardadresse für Antworten markiert und wird von Ihrer Mailsoftware automatisch eingetragen.

Wenn Sie mehr über Mailinglisten wissen wollen, empfiehlt sich ein Blick in das Buch Effektiv E-Mail nutzen, das ebenfalls bei O’Reilly erschienen ist, oder Sie rufen online unter http://www.fbi.fh-koeln.de/hilfe/manual/biman53.htm eine vom Autor dieses Buches verfaßte Anleitung zum Umgang mit Mailinglisten ab.

E. Checkliste: Datenbank- und Suchmaschinentest

Gleichgültig ob Sie eine neue Suchmaschine ausprobieren, eine via Internet angebotene medizinische Datenbank erstmals benutzen oder in einem Ihnen unbekannten Webangebot die lokale Volltextsuche benutzen wollen – am Anfang steht eine meist wenig aussagefähige »Suchbox«:


Abbildung E-1: Typisch – eine »Suchbox« ohne Erläuterungen

Mit der folgenden Checkliste können Sie innerhalb von fünf Minuten feststellen, was hinter der Suchbox steckt und ob die noch unbekannte neue Suchhilfe wert ist, in Ihre Bookmarks aufgenommen zu werden:

  1. Was wird durchsucht?
    Machen Sie sich klar, was Sie da überhaupt durchsuchen – ist es das Inhaltsverzeichnis des besuchten Webangebots? Eine gesonderte Datenbank? Das gesamte Internet mit einer Suchmaschine? Wenn keine eindeutigen Angaben hierzu gemacht werden, bedarf es der folgenden Proberecherchen, um diesen Punkt aufzuklären.

  2. Gibt es Hilfetexte?
    Wenn nein: Alarm! Das Fehlen deutet schon auf ein unprofessionelles oder hastig zusammengestricktes Angebot hin. Wenn ja: lesen Sie sich diese Hilfetexte kurz durch. Im Idealfall finden Sie sowohl Hilfe zur Anfragesyntax als auch Informationen zum Umfang. Leider wird insbesondere Letzteres oft verschwiegen. Deshalb fahren wir mit mit dem Check fort:

  3. Fangen Sie mit einer einfachen Suche an.
    Beginnen Sie mit einem einzigen Suchbegriff, um sich einen ersten Eindruck zu verschaffen. Nehmen Sie dazu einen allgemein gehaltenen Suchbegriff – abhängig davon, was für eine Datenbank Sie gerade testen. In einer Nachrichtendatenbank kann das etwa das Wort »Bundeskanzler« sein, in einer medizinischen Datenbank vielleicht »Krebs« oder bei einer allgemeinen Suchmaschine das Wort »Kunst« – oder ein anderes häufig vorkommendes Wort.
    Sehen Sie sich das Suchergebnis an. Welche Zusatzinformationen gibt es zu den Treffern (z. B. Datum, Autor, sonstige Angaben)? Sind sowohl alte als auch neue Dokumente dabei? Achten Sie auch auf die Trefferzahl – eine Nachrichtendatenbank, in der der Bundeskanzler nur zweimal erwähnt wird, sollte Sie genauso mißtrauisch machen wie eine allgemeine Suchmaschine, die nur wenige Treffer für den Suchbegriff »Kunst« liefert. Zur besseren Einschätzung können Sie die gleiche Abfrage auch in einer ähnlichen Datenbank oder Suchmaschine durchführen, die Sie bereits kennen, und dann feststellen, wie der Testkandidat im Vergleich dazu abschneidet.

  4. Suchen Sie etwas Bekanntes.
    Suchen Sie jetzt etwas, von dem Sie wissen, daß es auf jeden Fall vorhanden sein müßte. Beispielsweise könnten Sie zum Testen eines Ärzteverzeichnisses Ihre Hausärztin suchen oder beim Test einer allgemeinen Suchmaschine ausprobieren, was zum Thema »Bundestag« zu finden ist. Fehlt die gesuchte Information, besteht der Verdacht, daß die Datenbasis nicht vollständig ist.

  5. Suchen Sie etwas Altes und etwas Neues ...
    ... um festzustellen, wie aktuell eine Datenbank ist und wie weit sie in die Vergangenheit zurückreicht. Beispiel: Wenn Sie einen Restaurantführer testen, suchen Sie nach einem Restaurant, von dem Sie wissen, daß es neu eröffnet hat; in einer Kinodatenbank probieren Sie es mit einem brandneuen und einem sehr alten Film.

  6. Testen Sie Sonderfunktionen, Verknüpfungen und Umlaute
    Wenn Sie es noch genauer wissen wollen, können Sie zum Schluß noch ausprobieren, ob AND- und OR-Verknüpfungen oder die bekannte +/- -Syntax unterstützt werden und ob auch Begriffe mit Umlauten, Sonderzeichen oder Zahlen gesucht werden können. Dieser letzte Test ist eigentlich nur noch notwendig, wenn Sie anhand der vorherigen Tests einen guten Eindruck gewonnen haben.

Schon nach den ersten fünf Tests können Sie ungefähr abschätzen, wie umfangreich und wie aktuell die getestete Datenbank ist und ob sie für die weitere Benutzung in Frage kommt. Wenn die Testergebnisse nicht nach Ihrem Geschmack sind, dann zweifeln Sie nicht an sich, sondern erst einmal am Anbieter. Viele Anbieter bringen mit vollmundigen Anpreisungen Suchmaschinen oder Datenbanken ins Netz, die noch im Test- oder Aufbaustadium sind – und dieses häufig auch nicht verlassen.

F. Weiterführende Informationen

Detailliertere Informationen über die Arbeitsweise von Suchmaschinen und anderen Suchdiensten, die über den Umfang dieses Buches hinausgehen, sowie aktuelle Meldungen rund um das Thema »Suchen im Internet« finden Sie auf der folgenden Website:

Search Engine Watch (http://www.searchenginewatch.com/),

die beste und umfangreichste Quelle zum Thema. Hier finden Sie umfassende Informationen zu allen wichtigen (internationalen) Suchdiensten – Inhalt, Funktionsweise, Größe, Besprechungen, technische und geschäftliche Hintergründe und vieles mehr. Monatlich werden aktuelle Daten und Informationen hinzugefügt, und mit dem monatlichen Newsletter können Sie sich über Neuigkeiten auf dem Suchmaschinen-Markt auf dem Laufenden halten.

Für den deutschsprachigen Bereich gibt es leider nichts vergleichbares, aber die beiden folgenden Websites sind ebenfalls empfehlenswert:

Business interactive (deutschsprachig – http://www.kso.co.uk/)

Eigentlich ein kostenpflichtiger Informationsdienst für Web-Marketing, aber zum Themenspektrum gehört auch Wissenswertes über Suchhilfen aller Art aus dem Blickwinkel des Informationsanbieters. Von der Homepage aus sind in allen drei Bereichen von Business interactive jeweils kostenlos einsehbare Abschnitte zum Thema Suchmaschinen erreichbar, wo auch eher technische Informationen zum Ranking und zur Arbeitsweise der Spider und Robots zu finden sind. Mit den Online-Tools kann man seine eigene Homepage mit den Augen von Suchmaschinen betrachten lassen.

Suchfibel aktuell (http://www.suchfibel.de/aktuell )

Die Suchfibel ist ein umfangreicher Führer durch die Welt der Suchdienste mit einem ähnlichen Themenspektrum wie dieses Buch. Im Abschnitt »Suchfibel Aktuell« werden darüberhinaus regelmäßig Neuigkeiten und aktuelle Informationen geboten, die insbesondere für deutschprachige Benutzer von Interesse sind. Über den Newsletter »infoliste« können Sie diese Inhalte auch per E-Mail erhalten.

Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Rechteinhabers unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Speicherung und Verarbeitung in elektronischen Systemen.

1Die URLs: http://www.snafu.de/~tilman/zauber/ (Zaubertricks); http://www.testfinder.de/ (Testindex – die Warentestes); http://www.cnow.com/ und http://www.telecd.de/ (Musiktitel); http://www.compuserve.de/bc_recht/gesetze/ (Gesetzestexte); http://www.imdb.com (Filmdatenbank); http://www.culture.fr/ (s.Bases de données: Joconde – Kunstwerke in Frankreich).

2Die Autoren der erwähnten Science-Studie veröffentlichen unter http://www.neci.nj.nec.com/homepages/lawrence/websize.html von Zeit zu Zeit aktualisierte Daten.

3Dabei ist allerdings nicht auszuschließen, daß Angebote zahlender Werbekunden "wohlwollend" ( um es vorsichtig zu formulieren) besprochen werden...

4Allerdings bleibt bei solchen Prozentangaben nach wie vor die Frage zu klären: fünf Prozent von was?

5Es ist möglich, ein Eingabeformular für eine Datenbankabfrage auf einem anderen Server abzuspeichern als die Datenbank selbst. Im HTML-Code solcher Eingabeformulare ist der Server festgelegt, an die Anfrage geschickt werden soll.

6Kurz vor Fertigstellung der vorliegenden Auflage des Manuskriptes ging mit Yabba (http://www.yabba.de) ein weiterer empfehlenswerter Meta-Dienst ans Netz.

7Nicht jedoch Altavista und Fireball – hier können Sie in einem gesonderten Feld nochmals Begriffe vorgeben, die bei der Sortierung bevorzugt werden.

8 Beachten Sie die unterschiedliche Syntax bei der "Simple Query" und "Advanced Query" bei Alta Vista bzw. bei Rireball Express- und Fireball Detail-Suche!

9Als Titel wird nicht die sichtbare Überschrift einer Seite verwendet, sondern die im HTML-Code enthaltene Titelangabe, die in den <TITLE>-Tags steht (viele Browser zeigen diesen diesen Text in der Kopfzeile und den Bookmarklisten an). Diese Titelangabe ist nicht in allen Dokumenten enthalten.

10 Das System der Vergabe von Domain- und Top-Level-Domainnamen steht derzeit vor einer Neustrukturierung; neben den hier aufgeführten wird es schon bald weitere Bezeinungen für Top-Level-Domain geben.

11Ersatzweise wird manchmal auch die Kodierung "%7E" verwendet.

12Eine aktuelle Fassung dieser Liste können Sie online auf der Homepage des Autors (http://www.ausschlafen.com/) finden.

1