Zoekmachine

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
zoekresultaten van de opensource zoekmachine Openwebspider

Een zoekmachine is een computerprogramma waarmee men informatie kan zoeken in een bepaalde collectie; dit kan een bibliotheek, het internet, of een persoonlijke verzameling zijn.

Zonder nadere aanduiding bedoelt men tegenwoordig meestal een webdienst waarmee met behulp van vrije trefwoorden volledige tekst (full text) kan worden gezocht in het gehele World Wide Web.

In tegenstelling tot startpagina's of webgidsen is er geen of zeer weinig menselijke tussenkomst nodig; het bezoeken van de webpagina's en het sorteren van de rangschikkingen gebeurt met behulp van een algoritme.

Google is wereldwijd de meest gebruikte zoekmachine, andere populaire zoekmachines zijn Yahoo!, Bing en Baidu.

Technieken[bewerken]

Zoekmachines indexeren webpagina's geautomatiseerd door middel van robots/spiders. Dit zijn programma's die webpagina's downloaden en vervolgens nuttige informatie verzamelen van de pagina, zoals woorden en verwijzingen. De links worden weer aan de spider als input gegeven om weer gedownload te worden. De gevonden woorden worden opgeslagen in een gigantische database.

De zoekmachines werken met verschillende technieken. Oorspronkelijk werkten de zoekmachines met de door de webmasters zelf opgegeven zoektermen (keywords), maar daar werd veel misbruik van gemaakt doordat de webmasters keywords gingen gebruiken die veel publiek trokken, maar geen verband hielden met de inhoud van de pagina, zoals het woord 'seks'.

Daarom werden diverse andere alternatieve technieken ontwikkeld. Zo werkt onder andere Google met de populariteit van de websites: het aantal malen dat een website op andere websites wordt vermeld. Op de websites van de zoekmachines is meestal wel informatie te vinden over hoe ze werken.

Het aantal spider-based-zoekmachines is beperkt. Grote internationale zoekmachines zijn Google, Teoma, Bing en Yahoo!. Bekende Nederlandse zoekmachines bedoeld om te zoeken naar Nederlandstalige pagina's zijn Kobala, Ilse en voorheen ook Track. Walhello is een in Nederland ontwikkelde internationale zoekmachine.

Er zijn ook metazoekmachines, zoekmachines die werken via de resultaten van andere zoekmachines. Voorbeelden zijn Metacrawler, Ixquick en Ez2Find. Nederland kent ook metazoekmachines zoals Zoeken.nl, Multizoeker, Metaspider.nl, Zoekal en Laquza.

Wolfram Alpha is een zoekmachine op internet, die niet zoekt naar pagina's (zoals Google doet), maar naar antwoorden op vragen, dat doet hij door te zoeken in een database van informatie

Gebieden[bewerken]

De meeste zoekmachines zijn bedoeld om iets op het web te vinden via het HTTP-protocol. Het gaat dan om informatie die ook met een browser bekeken kan worden. Daarnaast kunnen sommige zoekmachines ook informatie in nieuwsgroepen vinden. Bijvoorbeeld Google kopieert veel nieuwsgroepen naar de eigen servers, zodat daar in gezocht kan worden. Tot slot zijn er enkele zoekmachines die kunnen zoeken naar bestanden via het File Transfer Protocol.

Zoekmachine-marketing[bewerken]

Nuvola single chevron right.svg Zoekmachine-optimalisatie

Zoekmachine-marketing (search engine marketing) is het geheel aan activiteiten bedoeld om een webpagina hoog te laten scoren in de zoekresultaten van een zoekmachine, op voor de webpagina relevante trefwoorden of zoektermen. Zoekmachine-marketing bestaat uit twee onderdelen:

Adverteren bij zoekmachines[bewerken]

Een andere manier om 'hoog te scoren' bij zoekmachines is adverteren. Aanvankelijk kon er tegen betaling een plaats hoog in de ranking 'gekocht' worden als advertentie. Tegenwoordig is het bij bijna alle zoekmachines zo dat een dergelijke praktijk niet meer mogelijk is, omdat gebruikers het niet meer accepteren. In plaats daarvan worden er op een aparte plaats (vaak aan de rechterkant, soms ook bovenaan) zogenaamde 'gesponsorde koppelingen' getoond. Dit wordt door gebruikers als minder storend ervaren, omdat 'echte resultaten' en advertenties duidelijker te onderscheiden zijn.

De advertentieruimte bij de gesponsorde koppelingen wordt meestal 'verkocht' per opbod via het 'pay per click'-systeem. Bij bijvoorbeeld Google Adwords wordt de positie bij de gesponsorde koppelingen bepaald door het bod van de adverteerder te vermenigvuldigen met de Click-Through Rate.

Gespecialiseerde zoekmachines[bewerken]

Om de hegemonie van marktleiders als Google te ontlopen richten sommige zoekmachines zich op een bepaald specialisatiegebied. Zij worden ook wel verticale zoekmachines genoemd. Omdat zij speciaal zijn ontworpen om juist voor dit speciale gebied de beste resultaten naar boven te halen, denken zij het hier beter te doen dan algemene zoekmachines.

Een van die specialisatiegebieden is de academische wereld. Elsevier richt zich met Scopus op dit gat in de markt, waarmee zowel wetenschappelijk tijdschriften worden doorzocht, als wel de academische kennis op het Internet door gebruik te maken van Scirus. Web of Science (van Thompson Isi) is een concurrent die negenduizend tijdschriften en een krantenarchief van zestig jaar doorzoekt. Google probeert met Google Scholar zelf ook een speler in deze markt te worden. OAIster van de Universiteit van Michigan richt zich op wetenschappelijke informatie die door ruim duizend universiteiten en onderzoekscentra via Digital Academic Repositories beschikbaar wordt gemaakt. De MedischeZoekmachine.nl richt zich speciaal op medische zoektermen.

Een andere specialisatiegebied voor zoekmachines zijn diensten en consumentenproducten. Voor het vinden van op de Nederlandse markt huizen zijn Jaap.nl, HuizenZoeker.nl en Zuka.nl gespecialiseerd, in België kan je hiervoor terecht op Immoweb.be, Immoture.be en Hebbes.be. Voor vacatures Askjim.nl en Indeed, en voor auto's Gaspedaal.nl. Het Nederlandse El Cheapo heeft zich gespecialiseerd in het vergelijken van bepaalde producten bij verschillende aanbieders. Google doet hetzelfde met Froogle. Onderwijsinformatie is te vinden met Davindi. Een internationale boekenzoeksite is Addall.com.

Nadelen zoekmachines[bewerken]

Naast de vele voordelen van zoekmachines zoals Google, kleven er ook nadelen aan het gebruik van grote zoekmachines. Door de toename van data wordt het steeds moeilijker om gerichter te kunnen zoeken op een bepaald gebied, of in een andere taal dan het Engels. Vaak kun je op kleine, regionale zoekmachines, zoals hierboven staat beschreven, wel specifieke informatie krijgen in jouw taal, maar bij dit soort zoekmachines ontbreken de zoek– en analysekwaliteiten. Voor vele grote zoekmachines is het een uitdaging om ook deze kleine, regionale sites te betrekken in hun zoekresultaten.

Doordat zoekmachines heel het internet in kaart kunnen brengen vormen ze ook een probleem inzake privacy. Als privacygevoelige data eenmaal op internet zijn gepubliceerd zijn die data, zelfs als deze verwijderd zijn van de website waar zij stonden, vaak terug te vinden in de archieven van zoekmachines.

Bij Google uit zich dit in de mogelijkheid om de cache te kunnen bekijken. Daarnaast zou Google niet goed omgaan met de privacy van gebruikers van de zoekmachine. Zo zou Google de data niet-geanonimiseerd opslaan om aan de hand van de zoekgeschiedenis van de gebruiker beter passende advertenties te tonen.

De open source zoekmachine DuckDuckGo biedt een ongefilterd en privacyveilig alternatief.

Zoekfunctie[bewerken]

Een website, en een programma zoals een browser of reader, hebben vaak een zoekfunctie. Soms hebben deze opties zoals "alles markeren" en "hoofdlettergevoelig". Bij het zoeken in één document is er soms de optie "alles markeren" en kan men vaak de zoekrichting kiezen: vooruit of achteruit. Soms gaat men na het eind vanzelf weer verder vanaf het begin (en omgekeerd bij achteruit zoeken), soms stopt het zoeken bij het eind/begin. Soms onthoudt het programma waar men met het zoeken begonnen is en stopt het na één cyclus.

Zie ook[bewerken]

Literatuur[bewerken]

  • Chung et al (2006) “SpidersRUs: Creating specialized search engines in multiple languages,” Decision Support Systems,, nr. 42, pp. 1697-1714
  • Chau et al (2007) “Supporting non-English Web searching: An experiment on the Spanish business and the Arabic medical intelligence portals,” Decision Support Systems
  • Hargittai, E. (2007) “The social, political, economic, and cultural dimensions of search engines: An introduction,” Journal of Computer-Mediated Communication, nr. 12
  • Guan, T en K. F. Wong (2003) “Nstar: an interactive tool for local web search,” Information & Management, nr 41, pp. 213-225
  • Braun-LaTour et al (2007) “Mood, information congruency, and overload,” Journal of Business Research, nr. 60, pp. 1109-1116
Zoek dit woord op in WikiWoordenboek