Alfabetische volgorde

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Alfabetisering of alfabetische ordening (of alfabetische rangschikking) is in ruime zin het ordenen van tekens - meestal letters - in de volgorde van het bijbehorende alfabet, en de op basis van het principe van de lexicografische volgorde daaruit afgeleide volgorde van woorden en frasen.

In het Latijnse alfabet zoals dat ook voor de Nederlandse taal wordt gebruikt, zijn er 26 letters die een vaste volgorde kennen. Doordat lemma's in alfabetische volgorde worden opgeslagen, zoals in een archief, woordenboek of encyclopedie, wordt het terugzoeken ervan vergemakkelijkt.

Werkwijze[bewerken]

Alfabetisering wordt tegenwoordig vaak met een computer gedaan. De tekst heeft een bepaalde ASCII-representatie en daarop kan zonder meer gesorteerd worden. Deze methode - die onder andere wordt gebruikt voor de lemma's in Wikipedia[bron?] - werkt prima als de gegevens ook weer door een computer opgezocht moeten worden, maar voor gebruik door mensen stelt men vaak andere eisen:

  • Meestal wil men dat spaties en leestekens genegeerd worden.
  • Meestal wil men geen onderscheid maken tussen hoofdletters en kleine letters.
  • In veel talen wordt bij de alfabetisering geen onderscheid gemaakt tussen letters met en zonder diakritische tekens. Hierop zijn echter uitzonderingen: in het Spaans komt de Ñ na de N en in Scandinavische talen komen Ä en Ö na de Z. Men moet zich dus ook afvragen of men een vreemde naam wil alfabetiseren volgens de regels in de oorspronkelijke taal of volgens de eigen taal.
  • In sommige talen kent men combinaties van letters die voor de alfabetische volgorde als een letter gelden. In het Spaans zijn dat CH en LL, in het Nederlands (volgens sommigen) IJ. Hierbij geldt weer hetzelfde probleem als met diakritische tekens, waarbij men zich bijvoorbeeld moet bedenken dat in de plaatsnaam Dijon geen IJ voorkomt, maar wel een I en een J.
  • Personen worden meestal gesorteerd op achternaam en pas daarna op voornaam. (Eerst Jansen, Alfred; daarna komt Jansen, Bob). Het voorvoegsel (van, de) wordt in Nederland bij het sorteren meestal achteraan gezet, zoals: Vries, Jan de.
  • Ook lidwoorden worden meestal genegeerd. Dus: Volkskrant, de.
  • Afkortingen, vooral aan het begin, worden liever vermeden. Men sorteert dus op Laan van Meerdervoort of Meerdervoort, laan van, maar niet op Ln v Meerdervoort.
  • In genealogische lijsten kiest men vaak voor een standaardspelling, omdat namen, voor de invoering van de Burgerlijke stand vaak willekeurig geschreven werden. Namen als Cleyn, Cleijn, Klein, worden door elkaar gesorteerd alsof er Klein stond.
  • Iets dergelijks geldt ook voor de namen van instellingen. Men maakt bij de sortering geen onderscheid tussen Nederlandse, Neederlandsche en Nederlandsche, aangezien de gebruiker vaak niet weet wat de juiste spelling is.
  • Getallen worden op numerieke volgorde gesorteerd, dus 3 komt eerder dan 13. Voor mensen is dat vanzelfsprekend, maar voor computers is een ingreep nodig om dat te bereiken. Soms bereikt men het door in de invoer voorloopnullen of -spaties te schrijven.

Volgorde[bewerken]

Er worden twee vormen van sorteren onderscheiden[1]:

  • Woord voor woord (vooral in registers) - hierbij wordt gekeken naar het eerste woord, waarop wordt gesorteerd (bijvoorbeeld: 1) te moede; 2) te rade gaan; 3) ten aanhoren van);
  • Letter voor letter (vooral in woordenboeken) - hierbij worden spaties genegeerd (bijvoorbeeld: 1) te moede; 2) ten aanhoren van; 3) te rade gaan).

De volgorde van de 26 letters is standaard (in kapitalen): A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Deze volgorde houdt misschien verband met het feit dat de letters vroeger ook wel als cijfers werden gebruikt. Er is een duidelijke overeenkomst aan te wijzen met de volgorde van andere alfabetten, zoals het Grieks, Hebreeuws en Fenicisch.

Achternamen[bewerken]

volgens Taaladvies.net (van de Taalunie) in 2006:

"Voor een gewone lijst met namen (bijvoorbeeld klanten of personeelsleden) adviseren wij om de familienaam in zijn geheel vooraan te laten staan en de spaties te negeren. Wij raden af om rekening te houden met spaties (en eventuele apostrofs) in de familienaam, want dit zou tot gevolg hebben dat een naam als Van den daele vóór Vande Kerckhove komt te staan.

  • Toelichting:
    • bij het alfabetisch ordenen is er in grote trekken keuze tussen letter-voor-letter-ordening of woord-voor-woord-ordening.
      • Bij letter-voor-letter-ordening worden de spaties en apostrofs genegeerd. Daarbij geldt ook dat "niets komt voor iets", dus Vandevel komt voor Vandevelde. Deze ordening komt vooral in woordenboeken voor.
      • Bij woord-voor-woord-ordening staan alle termen die met hetzelfde woord beginnen bij elkaar, en wordt op het tweede woord gealfabetiseerd. Deze ordening is gebruikelijk in registers. Hier wordt het koppelteken genegeerd.
    • In Vlaanderen worden voorvoegsels als de, van, ter, van de, als vaste onderdelen van de naam gezien, zoals onveranderlijk vastgelegd in de burgerlijke stand. Namen met zulke voorvoegsels worden onder de letter van het voorvoegsel geïndexeerd. Luc De Vos staat bij de D, net als Luc Devos.
    • In Nederland worden de voorvoegsels achter de voornaam gezet en klein gespeld. Er wordt dan op het kernwoord geïndexeerd, behalve natuurlijk als het voorvoegsel aan de naam vastzit. Luc De Vos komt hier bij de V, terwijl Luc Devos bij de D komt.
    • Volgens de conventies die gelden voor literatuurlijsten, komen los geschreven voorzetsels en lidwoorden (van, de,..) die deel uitmaken van de familienaam, achteraan te staan.
    • Er is een tendens om de letter-voor-letter-ordening steeds meer voorrang te laten geven, mede omdat computerprogramma's daarop sorteren."
Bronnen, noten en/of referenties