Die häufigsten Suchanfragen:Was heisst eBay Was heisst Google Was heisst IPhone Was heisst B2C Was heisst WLAN Was heisst Weihnachten Was heisst China Was heisst Vespa Was heisst Hubraum Was heisst Trojaner Was heisst Usenet
Google ist eine Suchmaschine des US-Unternehmens Google Inc. Übereinstimmende Statistiken zeigen mit Marktanteilen von mehr als 80 Prozent aller weltweiten Suchanfragen Google als Marktführer unter den Internet-Suchmaschinen.[1] [2] [3] Die Seite ging am 7. September 1998 als Testversion online, seitdem hat sich ihre Oberfläche nur geringfügig verändert. Durch den Erfolg der Suchmaschine in Kombination mit kontextsensitiver Werbung (siehe Google AdSense) konnte das Unternehmen Google Inc. eine Reihe weiterer Software-Lösungen finanzieren, die über die Google-Seite zu erreichen sind. Die Suche ist nach wie vor der Kernbereich des Google-Geschäftsfelds. Zeitweise verwendete Konkurrent Yahoo die Datenbanken für die eigene Suche.
Der Begriff „Google“EtymologieDie Bezeichnung Google basiert auf einem Wortspiel (manche Quellen sprechen auch von einem Rechtschreibfehler) mit der amerikanischen Aussprache des Wortes googol.[4] Milton Sirotta, der Neffe des amerikanischen Mathematikers Edward Kasner, hatte den Ausdruck im Jahr 1938 erfunden, um der Zahl mit einer Eins und hundert Nullen (10100) einen Namen zu geben. Die Google-Gründer wiederum suchten eine treffende Bezeichnung für die Fülle an Informationen, die ihre Suchmaschine im Web finden sollte.[5] Das Verb „googeln“Der Rechtschreib-Duden nahm das Verb googeln (sprich: [ˈɡuːgl̩n] „guhg(e)ln“) 2004 in die 23. Auflage auf.[6] 2006 bat Google Zeitungs- und Wörterbuchredaktionen, „to google“ oder „googeln“ nicht allgemein für die Suche im Internet zu verwenden, um einer Gattungsbegriffbildung und damit dem Verlust des Markenschutzes vorzubeugen. Auf eine Bitte von Google wurde der Eintrag in der 24. Auflage des Duden genauer definiert („mit Google im Internet suchen“).[7] Arbeitsweise der Google-SucheIndexierung von InternetseitenDie Google-Suchmaschine folgt mithilfe so genannter Webcrawler den gefundenen Links und versucht so, möglichst viele publizierte Seiten in ihren Suchindex aufzunehmen. (Zum Umfang dieser Datenbank siehe Indexgröße). Dabei werden die Seiten nach Suchbegriffen und Schlüsselworten aufgegliedert. Sortierung der SuchergebnisseGoogle zielt darauf ab, den Nutzern die Suchergebnisse nach Relevanz zu sortieren. Der Sortieralgorithmus der Suchergebnisse stützt sich unter anderem auf ein patentiertes Verfahren, das den so genannten PageRank-Wert errechnet. Dieser repräsentiert die Linkpopularität, d.h. er gibt an wie gut ein Dokument verlinkt ist und von wem. Neben dem PageRank werden weitere Faktoren in die Sortierung einbezogen, so wird etwa das Auftreten der Suchbegriffe im Dokumententitel oder in Überschriften gewertet. Des Weiteren spielt die Verwendung der Begriffe als Ankertext in verweisenden Dokumenten eine große Rolle. Letzteres wird bei Google-Bomben missbraucht. Insgesamt gibt Google an, mehr als 200 Faktoren in die Berechnung einfließen zu lassen[8]. Die exakte Funktionsweise der Seitensortierung ist Googles Betriebsgeheimnis, nicht zuletzt, um Manipulationen durch Website-Betreiber zu erschweren, die die eigene Site für gewisse Begriffe auf den Ergebnisseiten möglichst weit nach oben bringen möchten. Die Suchmaschinenoptimierung beschäftigt sich mit Methoden, dies zu erreichen. Einschränkungen aufgrund DatenschutzDas politische Umfeld erlaubt teils nicht, dass alle Suchergebnisse angezeigt werden. Beispielsweise in der Schweiz können selbst private Personen eine Löschung eines Links fordern, sofern ein Link im Zusammenhang mit der eigenen Person im Suchergebnis von Google erscheint. Diesbezüglich muss sich Google Inc. an das Bundesgesetz über den Datenschutz halten. TechnikHardware-ArchitekturGoogle Inc. betreibt weltweit eine Reihe von Rechenzentren, die jeweils die komplette Funktionalität der Suchmaschine enthalten. Eine Benutzeranfrage wird, durch das Domain Name System (welches Namen wie google.com in IP-Adressen übersetzt) gesteuert, im Idealfall an das netztopologisch nächste Rechenzentrum – nur manchmal mit dem geographisch nächstgelegenen identisch – geleitet und von diesem beantwortet. Fällt ein Rechenzentrum komplett aus, können die verbleibenden Rechenzentren die Last übernehmen. Jedes Rechenzentrum besteht aus einem Computercluster. Die verwendeten Rechner sind IBM-kompatible Personal Computer, bestehen also aus preiswerten Standardkomponenten. Hier kommt das selbstentwickelte Google File System zum Einsatz, eine verteilte Architektur, bei der alle Daten mehrfach redundant auf verschiedenen Geräten gespeichert sind. Ist einer der Rechner oder nur eine Festplatte eines Rechners ausgefallen, werden die entsprechenden Daten von einer anderen Stelle im Cluster auf einen Ersatzrechner umkopiert und die ausgefallene Hardware-Komponente kann im laufenden Betrieb ausgetauscht werden, ohne dass Ausfälle entstehen. Das Gesamtsystem ist auch leicht skalierbar, da nach Bedarf immer weitere Rechner und Festplatten hinzugefügt werden können. Durch Ablage der einzelnen Datenstrukturen (Indizes, Dokumentenkopien, Verzeichnisse aller Art) auf verschiedenen Rechnern und die große Anzahl verfügbarer Einzelrechner lassen sich Anfragen sehr schnell beantworten, da durch die Parallelisierung der zu erledigenden Arbeit nur ein Bruchteil der Zeit benötigt wird, die ein einzelner Rechner benötigen würde – in der Tat beschäftigen sich bis zu 1000 Einzelrechner mit jeder Suchanfrage. Eine Antwortzeit von höchstens einer halben Sekunde wird als Richtwert angestrebt. Die schnelle Lieferung von Ergebnissen hatte auch frühzeitig zur Popularität von Google beigetragen. Die Konkurrenz ließ sich mit der Anfragebeantwortung oft mehr Zeit. Insbesondere bei inkrementellen Anfragen, also immer weiter verfeinerten Anfragen des Benutzers, der das jeweils vorige Suchergebnis berücksichtigt, ist die Zeitersparnis insgesamt deutlich spürbar.[9] SoftwareAls Betriebssystem wird eine funktionsreduzierte Variante der Linux-Distribution Red Hat verwendet.[10] Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware. MapReduceDer zentrale Aspekt aller verteilten Google-Anwendungen, allen voran die Indizierung des Internets und die Suche darin, ist der von Google entwickelte Algorithmus MapReduce für die automatisierte Parallelisierung von Arbeitsaufträgen in Clustern.[11] Der Entwickler muss bei diesem speziellen Programmierstil nur zwei Hooks implementieren, die, in Anlehnung an entsprechend benannte und ähnlich arbeitende Funktionen der LISP-Sprachfamilie, map und reduce genannt werden. Die Map-Funktion erzeugt dabei in allen entsprechend entworfenen Anwendungen aus dem gesamten Input (zum Beispiel der Gesamtheit aller betrachteten Webseiten) eine Liste von Zwischenresultaten in Form von Wertepaaren, die einen Schlüssel mit einem symbolischen Wert kombinieren. Zum Beispiel wird so für jedes Vorkommen von „Wert“ in einem Text ein Paar ('Wert','1') erzeugt – jedes mal, wenn die Funktion auf das Wort trifft. Die Menge der Zwischenresultate wird dann durch die Reduce-Funktion derart reduziert, dass mit jedem Schlüssel nur noch ein symbolischer Wert assoziiert ist, der sich aus der Menge aller symbolischen Werte für diesen Schlüssel in den Zwischenergebnissen ergibt. Eine typische Aufgabe wäre, unter Rückgriff auf das Beispiel weiter oben, alle (beispielsweise 43) Paare ('Wert','1') je Schlüssel zu einem einzigen Paar pro Schlüssel zu kombinieren – etwa ('Wert','43').[12] Die Leistung von MapReduce ist nun, dass alle anderen Aufgaben, die mit der Parallelisierung dieser Aufgaben zusammenhängen (und sich prinzipiell für alle solch parallelisierten Anwendungen wiederholen), vom Framework übernommen werden. Es kümmert sich um die Verteilung der Funktionalitäten, der Daten und Zwischenergebnisse und um das Einsammeln der Ergebnisse und beinhaltet zudem Maßnahmen zur Fehlerbehandlung (via redundanter oder wiederholter Ausführung)[13][14] – etwa wenn ein einzelner Arbeiter-Rechner ausfällt oder so schlechte Leistungen zeigt, dass er die Fertigstellung des Gesamtergebnisses übermäßig verzögert. Google selbst setzt den Algorithmus in steigendem Maße für seine eigene Arbeit ein – nach Einführung von MapReduce im Jahre 2003 hatte sich die Anzahl der Produktionsanwendungen in der Code-Bibliothek von Google binnen zwei Jahren auf fast 1000 Anwendungen exponentiell vervielfacht.[15] In der zentralen Anwendung, dem Aufbau des Dokumenten-Indexes für die Suchmaschine selbst, sind 24 Instanzen von MapReduce hintereinander geschaltet.[16] IndexgrößeDie ungefähre Anzahl der Dokumente im Index der Websuche wurde die ersten sieben Jahre unten auf der Hauptseite eingeblendet.
Außerdem existierte im Juni 2005 nach eigener Aussage ein Index von 1.187.630.000 Bildern, einer Milliarde Usenet-Artikeln, 6.600 Katalogen und 4.500 Nachrichtenquellen. Seit dem siebten Geburtstag des Unternehmens Google im September 2005 wird die Größe des Index nicht mehr auf der Hauptseite angezeigt, da laut Eric Schmidt keine eindeutige Zählweise existiert.[19] Im Juli 2008 ermittelte Google nach eigenen Angaben[18] das Vorhandensein von mehr als einer Billion URLs im World Wide Web. Suchdienstleistungen für PortaleGoogles Suchtechnik wird auch an Internetportale lizenziert, um dort eine Websuche anbieten zu können, ohne dass Benutzer das Portal verlassen müssten. Google ApplianceMit der Google Appliance verkauft Google seine Suchtechnologie an Unternehmen, die sie im eigenen Intranet einsetzen möchten. Bei der Appliance handelt es sich um einen Server mit vorinstallierter Software, der im unternehmenseigenen Netz dieselbe Aufgabe übernimmt, die Google für das World Wide Web leistet. Dokumente werden im Index vorgehalten und Suchanfragen beantwortet. Gebrauch der SuchmaschineWeitere Funktionen:
Folgende Funktionen stehen nicht in allen landesspezifischen Versionen von Google zur Verfügung. Unter anderem können sie in den Google-Mutationen Deutschlands, Österreichs und der Schweiz verwendet werden:
Erweiterte BenutzungEs kann zusätzlich zu dieser einfachen Such-Syntax eine erweiterte Syntax in die Suchmaske eingegeben, bzw. größtenteils auch über die „erweiterte Suche“ zusammengeklickt werden. Folgende, teils undokumentierte Schlüsselbegriffe sind derzeit bekannt. Diese Schlüsselbegriffe werden durch einen Doppelpunkt „:“ gekennzeichnet.
Die angewendeten Suchformeln lassen sich auch in Form der URL, die Google bei einer Suche ausgibt, speichern bzw. wiederholen und verlinken. Weitere Funktionen bieten die zusätzlichen Google-Funktionen.[20] ErgebnisseGoogle zeigt zehn Suchergebnisse je Seite an. Die Darstellungsform eines Treffers kann sich unterscheiden, normalerweise wird der Titel, die Zusammenfassung und der Link angezeigt. Google schränkt die Anzeige von Treffern auf maximal 1000 ein. Einbettungen der Google-Suche
Easter EggsDie Programmierer haben in den Suchalgorithmen Easter Eggs, also scherzhafte Überraschungen, versteckt. Einige Beispiele:
Das Google-LogoZu besonderen Anlässen, wie dem Tag der Erde oder dem Jahrestag des ersten Fluges der Montgolfière, wird das Google-Logo seit 2000 von dem Mitarbeiter Dennis Hwang verändert. Diese themenbasierenden Logos werden auch Google Doodle (engl. Gekritzel) genannt. Zusätzlich ist das Logo statt mit der Google-Homepage mit einer Suchanfrage mit dem entsprechenden Thema als Suchtitel verlinkt. Zur EM 2008 veranstaltete Google erstmals in Deutschland einen Wettbewerb namens Doodle4Google, bei dem Kinder und Jugendliche im Alter von 5 bis 18 aufgerufen wurden, ein Logo zur EM zu gestalten. Das Gewinnerlogo wurde am Tag des EM-Finales auf der deutschen Google-Startseite gezeigt. In anderen Ländern gab und gibt es ähnliche Wettbewerbe. Weitere Wettbewerbe in Deutschland folgten, so veranstaltete Google zum 20-jährigen Jubiläum des Tags der deutschen Einheit erneut einen Wettbewerb, bei dem das Thema Deutschland im Mittelpunkt stehen sollte. Manipulation der SuchergebnisseGoogle-BombingAufgrund seiner bedeutenden Marktposition ist Google Hauptziel von Suchmaschinen-Spamming, was speziell auch Google-Bombing genannt wird. Dabei wird versucht, gute Positionen bei möglichst vielen Suchbegriffen zu erzielen. Diese Suchbegriffe haben oft nichts mit dem eigentlichen Inhalt der Seite zu tun. Es werden Techniken wie Brückenseiten, Linkfarmen oder Page-Cloaking eingesetzt. Erstmals im größeren Umfang öffentlich wahrgenommen wurde die Möglichkeit der Suchmaschinenmanipulation im Zusammenhang mit einer Google-Bombe, die sich auf den amerikanischen Präsidenten George W. Bush bezog. Der Suchbegriff „miserable failure“[22] (zu Deutsch: „klägliches Scheitern“ oder „jämmerlicher Versager“) wurde von Bush-Gegnern mit seiner offiziellen Biografie verknüpft. Im Gegenzug versuchten Bush-Unterstützer dasselbe mit Michael Moore. Die Plätze wechselten seither gelegentlich. Manipulationen, die zum Zweck haben, das Ranking von Websites speziell bei Google zu verbessern, werden auch als Google-Spamming bezeichnet. Versuche, konkurrierende Internetseiten aus den Google-Ergebnissen herauszukegeln, bezeichnet man als Google Bowling. Google ändert seine Algorithmen zur Bestimmung des Rankings regelmäßig ab, um Missbrauch zu erschweren. Die Spammer ziehen stets nach und passen ihre Seiten entsprechend an. Unlautere Suchmaschinen-OptimierungIm Januar 2006 wurde bekannt, dass Google stärker gegen unseriöse Methoden bei der Optimierung von internationalen Webseiten vorgehen will. Als erste Konsequenz des von Google-Mitarbeiter Matt Cutts[23] angekündigten verschärften Kampfes gegen Spam in Deutschland und anderen nicht-angelsächsischen Ländern, entfernte die Suchmaschine die Online-Fahrzeugbörse Automobile.de und den Fahrzeughersteller BMW aus ihrem Index.[24] Ihnen wurde vorgeworfen, durch massiven Einsatz von Keywords (Spam), Doorway-Pages und JavaScript-Weiterleitungen Suchergebnisse zum eigenen Vorteil unlauter optimiert zu haben. Die Seite von BMW wurde bereits nach wenigen Tagen wieder in den Index aufgenommen, nachdem der Betreiber die strittigen Doorway-Pages entfernt hatte.[25] Ergebnisfilterung in DeutschlandBereits seit einigen Jahren sind Suchergebnisse der Suchmaschine Google von Websites von verbotenen Meinungsäußerungen hauptsächlich politischer Natur bereinigt. Anfangs wurden wegen Urheberrechtsverletzung auch Seiten der Scientology-Kirche herausgefiltert. Mittlerweile entfernt Google alle Inhalte, für die jemand bei Google eine infringement notification (engl.: etwa „Rechtsverletzungsbescheid“) gemäß dem amerikanischen Digital Millennium Copyright Act einreicht.[26] Um wie viele Seiten es sich handelt und inwieweit derzeit eine Ausweitung auf andere Inhalte wie z. B. kinderpornografische oder politisch extremistische Inhalte stattfindet, ist nicht bekannt.[27][28]. Die Filtertechnik von Google wird auch als SafeSearch-Filtertechnik bezeichnet. Dieser Name wurde erstmalig von Google verwendet. Weitere Suchmaschinen bieten heute diese Filtertechnik an, um jugendgefährdende und pornografische Inhalte auszufiltern. Der Benutzer wird über einen Hinweis auf die Filterung der Suchergebnisse „aus Rechtsgründen“ aufmerksam gemacht. Dabei wird auf eine Erläuterung verwiesen, dass „von einer zuständigen Stelle in Deutschland mitgeteilt wurde, dass die entsprechende URL unrechtmäßig ist“. Welche zuständige Stelle das ist oder aufgrund welcher gesetzlichen Grundlage die Entfernung erfolgte, wird nicht erläutert.[29] Kritik an GoogleDie Suchmaschine Google und Google Inc., die nach Gründung anfänglich eine sehr gute Presse hatten, werden in jüngerer Zeit häufig aufgrund von Datenschutzproblemen und allein schon aufgrund der monopolähnlichen Stellung im Suchmaschinenmarkt in Deutschland kritisiert. → Siehe auch Google Inc. Literatur
WeblinksOffizielle Seiten
Artikel über Google
Presseberichte
Quellenangaben
Text und Bilder dieses Beitrags stammen aus dem Artikel Google der freien Enzyklopädie Wikipedia und stehen unter der GNU Free Documentation License. Die Liste der Autoren ist in der Wikipedia unter dieser Seite verfügbar, der Original-Artikel lässt sich hier bearbeiten. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||