Wikipedia:Pas op met Google-treffertellingen

Uit Wikipedia, de vrije encyclopedie
Dit is een essay. De pagina beschrijft niet een officiële regel of richtlijn, maar geeft enkel de mening weer van de auteur(s). Voel je vrij om aanpassingen te maken of erover te discussiëren op de overlegpagina.
Notendop Deze pagina in een notendop: Google-treffertellingen zijn een onbetrouwbare methode om de juiste schrijfwijze van een woord te achterhalen.

Bij onzekerheid over de juiste spelling van een woord bestaat nogal eens de neiging om Google-treffers van de verschillende schrijfwijzes te gaan tellen. Daarbij dient echter de nodige voorzichtigheid te worden betracht. Deze methode heeft namelijk veel beperkingen, waardoor zij allesbehalve betrouwbare resultaten geeft.

Het spreekt vanzelf dat wat hier over Google wordt gezegd, mutatis mutandis ook voor andere zoeksystemen geldt.

Alleen over frequentie, niets over kwaliteit[bewerken | brontekst bewerken]

Google-treffers zeggen alleen iets over het aantal vermeldingen, niets over de kwaliteit ervan. Google telt uiteraard alleen het feitelijke voorkomen van een bepaald woord in de opgegeven schrijfwijze, ongeacht of deze goed of fout is. Daarbij is de telling noodzakelijkerwijs beperkt tot het internet, en wel tot dat gedeelte ervan dat voor Google bereikbaar is.

De laagdrempeligheid van internet maakt dat veel mensen zich niet erg bekommeren om de juiste schrijfwijze. Daar komt bij dat veel mensen tegenwoordig een minder goed ontwikkeld woordbeeld lijken te hebben van vooral minder frequente en buitenlandse woorden. Alle denkbare fouten worden op internet dan ook aangetroffen.

Tolerantie in de zoekalgoritmes[bewerken | brontekst bewerken]

Enerzijds bevatten de zoekalgoritmes bewust bepaalde toleranties voor de schrijfwijze. Dat vergroot de kans dat men ondanks een schrijffout een term toch vindt. Ook past Google zijn algoritmes regelmatig aan, terwijl ze deze algoritmes strikt geheim houden. Voor het doel van Google, namelijk het doorzoekbaar maken van internet, is dit goed. Het werkt echter contraproductief voor het tellen van verschillende schrijfwijzes: deze zullen immers vaak door elkaar in één trefferlijst voorkomen. De gegeven totaaltelling zal dus reeds meerdere schrijfwijzes omvatten!

Alleen gebruik op internet[bewerken | brontekst bewerken]

Doel van Google is, zoals gezegd, het internet doorzoekbaar maken. Google is niet geïnteresseerd in schriftelijk taalgebruik buiten internet om, en evenmin in mondeling taalgebruik. En juist in gedrukte tekst wordt gewoonlijk het zorgvuldigst met taal en spelling omgesprongen.

Bovendien hebben velen de neiging om juist op internet informeler te schrijven en zich niet zo te bekommeren om de juiste schrijfwijze. De kans dat foute schrijfwijzes sterker vertegenwoordigd zijn, is daardoor bij Google juist groter.

Talen[bewerken | brontekst bewerken]

Zoeksystemen als Google geven treffers, ongeacht de taal van de gevonden documenten. Men kan in de zoekfunctie wel een taalvoorkeur opgeven, maar dat werkt lang niet altijd betrouwbaar. Gewoonlijk trachten de zoeksystemen de taal van een document te detecteren (bijvoorbeeld op basis van frequenties van bepaalde lettercombinaties, en andere soortgelijke criteria), maar dat is lang niet altijd waterdicht. Bovendien worden de algoritmes geregeld aangepast.

Zeker bij wetenschappelijke onderwerpen worden vaak internationale termen gebruikt, waarvan echter wel de spelling aan de taal is aangepast. Een schrijfwijze die in het Nederlands fout is, kan in bepaalde andere talen wel correct zijn; dergelijke treffers in die andere taal zouden dan ten onrechte meegewogen worden.[1]

Google Books[bewerken | brontekst bewerken]

Er worden tegenwoordig steeds meer gescande boeken op internet gepubliceerd, onder meer door Google. De kans dat daarin de juiste schrijfwijze wordt gebruikt, zal groter zijn dan die op internet in het algemeen. Uit de zoektreffers blijkt echter niet altijd duidelijk hoeveel er betrekking hebben op dergelijke boeken.

Ook bij rechtstreeks online gepubliceerde boeken is de kans op spelfouten groter dan in gedrukte boeken. Een boek drukken is duur. Te drukken boeken worden daarom goed nagekeken voordat ze gedrukt worden. Bij online gepubliceerde boeken kunnen indien nodig spelfouten nog gemakkelijk achteraf worden gecorrigeerd. De drang om van tevoren goed te corrigeren is hier dan ook mogelijk kleiner.

Verder zullen ook hier bijna-identieke woorden uit andere talen valse treffers opleveren.

Interpretatie van de getallen[bewerken | brontekst bewerken]

Een van de duidelijkste bewijzen dat Google-treffers voor dit doel onbruikbaar zijn, is wel het volgende voorbeeld.

  • Als 10 auteurs in 10 publicaties de foute schrijfwijze A gebruiken, levert dat 100 treffers op voor de foute schrijfwijze.
  • Als daarentegen 25 auteurs in 2 publicaties de juiste schrijfwijze B gebruiken, levert dat slechts 50 treffers voor de juiste schrijfwijze op.

Dit zou tot de onterechte conclusie leiden dat de meestgebruikte schrijfwijze A juist is, en de minder frequente B fout.

Het bovenstaande voorbeeld lijkt misschien wat gezocht. Maar in discussieforums wordt vaak de voorgaande bijdrage gekopieerd om daar vervolgens op te reageren. Daardoor kan een foute schrijfwijze die iemand slechts éénmaal heeft gebruikt, op de duur juist steeds meer treffers opleveren. Veel mensen zijn geneigd de spelling die in Google de meeste treffers oplevert, als de „juiste” te beschouwen. Juist daardoor zal juist deze – nog steeds foute! – schrijfwijze op de duur nog meer gaan voorkomen, waardoor de foute schrijfwijze alleen maar nog meer „bevestigd” lijkt te worden. Een vergelijkbaar effect hebben ook klonen en imitaties van Wikipedia en van andere websites. Als teksten uit bestaande websites klakkeloos gekopieerd worden, tellen alle typefouten daarin ook evenzovele malen mee.[2] Dit vertroebelt de telresultaten.

Alternatieven[bewerken | brontekst bewerken]

Het meest gezaghebbende alternatief is uiteraard het officiële Groene Boekje. Op Wikipedia staat ook een goede samenvatting. Op internet kan men terecht bij de Woordenlijst der Nederlandse Taal.[3] Daarnaast is er op internet de Geïntegreerde Taalbank[4] van het INL, die ook het WNT omvat.

Voor veelvoorkomende taalvragen kan men terecht bij het Taalunieversum[5] van de Nederlandse Taalunie. Concrete vragen kan men stellen aan diverse taaladviesdiensten[6] in Nederland en België.

Externe links[bewerken | brontekst bewerken]