Google Zoeken: verschil tussen versies

Beluister (info)
Uit Wikipedia, de vrije encyclopedie
Verwijderde inhoud Toegevoegde inhoud
Jarii94 (overleg | bijdragen)
k Wijzigingen door 82.173.56.42 (Overleg) hersteld tot de laatste versie door MatthijsWiki
Regel 22: Regel 22:


== Werking ==
== Werking ==
De basis van de Google-zoekmachine is een [[Octrooi|gepatenteerd]] algoritme dat PageRank heet. PageRank wordt gebruikt om de resultaten van een zoekopdracht te rangschikken. Net als in de wetenschap de waarde van een [[Wetenschappelijke literatuur|wetenschappelijk artikel]] wordt afgemeten aan het aantal citaties (aanhalingen), bepaalt PageRank het belang van een pagina aan de hand van het aantal keer dat er naar [[hyperlink|gelinkt]] wordt vanaf andere internetpagina's. Elke verwijzing betekent een stem voor een pagina. Google analyseert ook de pagina die de stem uitbrengt. PageRank werkt met een schaal van 0 tot en met 10. Een hoge PageRank betekent dat de pagina bij alle zoekopdrachten hoog zal scoren.
De basis van de Google-[[zoekmachine]] is een [[Octrooi|gepatenteerd]] [[algoritme]] dat [[PageRank]] heet. PageRank wordt gebruikt om de resultaten van een zoekopdracht te rangschikken. Net als in de wetenschap de waarde van een [[Wetenschappelijke literatuur|wetenschappelijk artikel]] wordt afgemeten aan het aantal [[citatie]]s (aanhalingen), bepaalt PageRank het belang van een pagina aan de hand van het aantal keer dat er naar [[hyperlink|gelinkt]] wordt vanaf andere internetpagina's. Elke verwijzing betekent een stem voor een pagina. Google analyseert ook de pagina die de stem uitbrengt. PageRank werkt met een schaal van 0 tot en met 10. Een hoge PageRank betekent echter niet dat de pagina bij ''alle'' zoekopdrachten hoog zal scoren.


=== Algoritme ===
=== Algoritme ===

Versie van 2 dec 2014 18:11

Google
Logo
Google Zoeken
Type Zoekmachine
Taal Verschillend
Registratie Optioneel
Eigenaar Google Inc.
Opgericht 15 september 1997
Status Actief
Link www.google.com
Portaal  Portaalicoon   Media

Google is een zoekmachine van Google Inc. voor documenten op het wereldwijd web, gelanceerd in 1997[1] door twee promovendi aan de Stanford-universiteit, Larry Page en Sergey Brin. Page en Brin hadden twee jaar gewerkt aan een geavanceerde methode voor het vinden van informatie op internet. Al snel verdrong Google AltaVista en werd het 's werelds populairste zoekmachine. Gebruikers waren tevreden over de zoekresultaten en over de presentatie ervan: op een rustige pagina, zonder de schreeuwerige advertenties die bij veel andere zoekmachines te zien waren.

De naam is een variant van het getal "googol", de aanduiding voor een 1 met honderd nullen (10100). De term weerspiegelt de bedrijfsmissie om alle informatie van de wereld toegankelijk en nuttig te maken. Larry Page was gefascineerd door wiskunde en 'Googol'. De naam is uiteindelijk 'Google' geworden door een spelfout van Larry.[2]

Inmiddels zijn er Google-versies in verschillende talen, waaronder sinds 2002 ook in het Nederlands.

Bij verjaardagen van belangrijke mensen of speciale gebeurtenissen gebruikt Google soms een toepasselijke variant van het Google-logo op zijn pagina's, een Google Doodle genaamd.

Werking

De basis van de Google-zoekmachine is een gepatenteerd algoritme dat PageRank heet. PageRank wordt gebruikt om de resultaten van een zoekopdracht te rangschikken. Net als in de wetenschap de waarde van een wetenschappelijk artikel wordt afgemeten aan het aantal citaties (aanhalingen), bepaalt PageRank het belang van een pagina aan de hand van het aantal keer dat er naar gelinkt wordt vanaf andere internetpagina's. Elke verwijzing betekent een stem voor een pagina. Google analyseert ook de pagina die de stem uitbrengt. PageRank werkt met een schaal van 0 tot en met 10. Een hoge PageRank betekent echter niet dat de pagina bij alle zoekopdrachten hoog zal scoren.

Algoritme

Google heeft een aantal algoritmes - circa 200 algoritmes in totaal, waarvan van circa 150 de werking bekend is - om te bepalen welke pagina het eerst in de resultaatlijst wordt genoemd. Belangrijk daarbij is, naast het belang van een zoekterm op de pagina, hoe vaak er naar een pagina gelinkt wordt, vanaf welke pagina's en met welke tekst.

Omdat miljoenen mensen Google gebruiken om pagina's te vinden, is het voor aanbieders van materiaal nuttig om hoog in Google vermeld te worden. Dit noemt men Search engine optimization of SEO. Daarbij worden er methoden gebruikt om kunstmatig de 'pagerank' van pagina's op Google te verhogen, bijvoorbeeld door het creëren van 'fake' webpagina's, die slechts dienen om naar andere pagina's te verwijzen, zodat deze een hogere rang krijgen. Google heeft een aantal malen zijn algoritme aangepast om zo het effect van dergelijke praktijken te verminderen of teniet te doen. Harde uitspraken die de plaats van een webpagina in de resultatenlijst van een zoekopdracht voorspellen zijn erg moeilijk en vaak twijfelachtig. Het exacte algoritme van Google wordt namelijk door de makers geheimgehouden en is voor buitenstaanders niet altijd even gemakkelijk te begrijpen. Niemand weet hoe zwaar PageRank doorweegt in het algoritme.[3]

De index

Elke zoekopdracht doorzoekt in minder dan een seconde een index die is opgebouwd uit bijna 10 miljard webpagina's (stand juli 2007). Een groot deel van die pagina's wordt regelmatig bezocht door de spider van Google, Googlebot genaamd. De spider leest de pagina en slaat de gegevens op in de index. De spider is in staat om hyperlinks te volgen, en kan op die manier een groot deel van het web bezoeken. Volgens Google werd op 25 juli 2008 de mijlpaal van 1 miljard unieke URL's overschreden.

Cache

Google maakt bij het crawlen (doorzoeken van het wereldwijd web) een kopie van elke pagina (de cache-versie).[4] Als het een tekst is die is opgeslagen als afbeelding, is de cache-versie vaak wel doorzoekbaar en als tekst kopieerbaar. Ook de inhoud van een bestand op een website dat alleen met een speciaal programma kan worden geopend kan zo soms zichtbaar worden gemaakt.

Techniek

Van meet af aan is er voor gekozen niet te werken met één grote centrale computer, maar met een netwerk van zeer veel relatief goedkope computers. Google's serverpark bestaat naar schatting uit meer dan 450.000 systemen die zijn opgebouwd uit standaard hardwarecomponenten. De computers staan verspreid over allerlei datacentra. Door clusters redundant uit te voeren kunnen defecte machines eenvoudig vervangen worden.

Energieverbruik en kooldioxide-uitstoot

Google beweert dat een enkele zoektocht totaal ongeveer 1 kJ of 0,0003 kWh kost en een uitstoot van 0,2 gram CO2 (1 meter rijden met een gemiddelde auto) produceert.[5]

Tips

  • Google kan met behulp van aanhalingstekens zoeken op hele zinnen. De zoekmachine laat dan alleen pagina's zien waar de ingevoerde woorden meteen na elkaar en in deze exacte volgorde te zien zijn.
  • Als men wil weten hoeveel inwoners bijvoorbeeld Parijs heeft, kan men het beste het volgende intypen: "Parijs heeft * inwoners". De zoekmachine ziet het sterretje als een joker, dus op die plaats kan van alles staan. Maar als iemand op zijn website de volzin "Parijs heeft stokbrodige inwoners" heeft staan, zal Google die pagina dus ook laten zien. Het kan ook in samenstellingen, bijvoorbeeld: "de snelheid van het licht is * per * "; men vindt dan de snelheid van het licht in meters per seconde maar ook in kilometers per uur.
  • Het is ook mogelijk met de zoekmachine binnen een site te zoeken: je weet dat de info die je zoekt op de betreffende site staat, maar niet wáár. Het kan dan slim zijn om met Google binnen die site te zoeken. Het gaat als volgt: 'site:' gevolgd door de naam van die website (overigens werkt dit het best zonder de toevoeging 'www'). Als men bijvoorbeeld een nieuwsbericht van De Telegraaf over koningin Máxima zoekt, typ dan: maxima site:telegraaf.nl
  • De zoekmachine heeft ook de mogelijkheid naar definities te zoeken. Gebruik dan 'define:' gevolgd door de zoekterm. Als men bijvoorbeeld een definitie van snelheid zoekt, typ dan: define:snelheid.
  • Google heeft ook een ingebouwde rekenmachine. Indien als zoekterm een rekensom (bijvoorbeeld 5 * sqrt(9)) wordt gegeven, komt bovenaan de zoekresultaten het antwoord te staan.
  • Google kan ook als valutacalculator gebruikt worden. Om de koers van de dollar tegen de Euro te vinden kan men typen: 1 dollar in euro.
  • Wanneer men de naam van een voetbalclub die in een hoogste landelijke divisie speelt, invoert, zal er boven de zoekresultaten de eindstand van de laatst gespeelde wedstrijd staan. Daaronder staat welke club de volgende tegenstander is.
  • Google waarschuwt in de zoekresultaten voor onveilige websites met behulp van Google Safe Browsing. Wanneer men toch op een onveilige link klikt, wordt men omgeleid naar een waarschuwingspagina.

Google-bombing

Zie Googlebom voor het hoofdartikel over dit onderwerp.

Bij sommige woorden die men op Google intypt konden in het verleden verrassende resultaten worden geconstateerd. Zo was het eerste resultaat bij de woorden miserable failure ("jammerlijke mislukkeling") de biografie van George W. Bush. Bij de woorden raar kapsel was het eerste resultaat een site over Jan Peter Balkenende.

Dit zijn twee voorbeelden van een fenomeen genaamd Google-bombing, waarbij een relatief kleine groep mensen besluit om bepaalde woorden door te linken naar een uitgekozen website. Om het miserable failure-resultaat te bereiken, werden bijvoorbeeld maar 32 linken gebruikt. Volgens Google is er niets verkeerd met de relevantie. Wanneer de competitiviteit laag ligt, is het niet moeilijk om er hoog voor te scoren. Bij Google-bombing van een algemene en zwaar competitieve term als "SEO" zal dat minder snel lukken.

Trivia

  • Googlewhacking is een spel dat zich baseert op het verkrijgen van één enkele hit op een bepaalde zoekterm.
  • Google bevat verschillende verstopte grapjes, zogenaamde easter eggs.
  • Iets opzoeken op Google wordt googelen genoemd.
  • Google ligt al geruime tijd onder vuur vanwege het te gemakkelijk vindbaar maken van torrents voor illegale films of muziek. In oktober 2014 heeft het bedrijf zijn algoritme daarom aangepast: torrentsites worden sindsdien lager gerankt.[6]

Externe links

Commons heeft mediabestanden op de pagina Google.
noicon
Door op de afspeelknop te klikken kunt u dit artikel beluisteren. Na het opnemen kan het artikel gewijzigd zijn, waardoor de tekst van de opname wellicht verouderd is. Zie verder info over deze opname, bekijk de oorspronkelijke versie of download de opname direct. (Meer info over gesproken Wikipedia)