Classificatie

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Linnaeus' tabel van het dierenrijk uit de Systema Naturae (1735).

Een classificatie is een indeling van verschijnselen, objecten of processen in groepen op grond van overeenkomst of verwantschap in eigenschappen of kenmerken. Voorwerpen die in dit verband in de bibliotheekwetenschap niet gemakkelijk geclassificeerd kunnen worden, worden realia genoemd.

Inhoud

[bewerken] Algemeen

Onder classificatie kunnen verschillende zaken worden verstaan:

  1. indexeren, sorteren, diagnosticeren, identificeren of determineren: het rubriceren van objecten of verschijnselen in een gekozen, reeds bestaand classificatiesysteem, of het vaststellen van de identiteit van objecten volgens één of meer criteria.
  2. Clusteranalyse; het classificeren; classificatie in engere zin: het ontwerpen van een classificatiesysteem op grond van overeenkomst van objecten in hun kenmerken. Hierbij kunnen beschrijvende multivariate statistische methoden gebruikt worden.
  3. Classificatiesysteem: het resultaat van de vorige stap (ook dit heet wel een classificatie): de in groepen ingedeelde verschijnselen, objecten of processen.

Classificatie in engere zin of clusteranalyse is van nut bij de datareductie, dus bij het opsporen van redundantie en de samenvatting van gegevens, bij de reductie van ruis, bij het opsporen van uitbijters, bij modelvorming en bij de interpretatie van de samenhang met externe (verklarende, onafhankelijke) variabelen zoals omgevingsfactoren.

Het is niet strikt noodzakelijk dat een classificatie wordt gemaakt op grond van een specifieke eigenschap (monothetische classificatie). Zo kunnen objecten een groep eigenschappen met elkaar gemeen hebben (polythetische classificatie), zonder dat een specifieke eigenschap bij alle objecten voorkomt. Denk hierbij aan syndromen van eigenschappen. Wittgenstein noemt dit soort overeenkomsten 'familiegelijkenissen'. Ook kunnen objecten in een groep worden gezet juist omdat ze niet over een bepaalde eigenschap beschikken. Soms wordt voor classificatie in het algemeen de term 'taxonomie' gebruikt. Hiermee wordt vaak meer specifiek de classificatie van levende wezens bedoeld.

Omdat een classificatie een kunstmatige constructie is, zijn de indelingscriteria subjectief. Wel kan worden gezegd dat een classificatie in meer of mindere mate bruikbaar is voor het doel waarvoor deze is gemaakt. Veel verschijnselen kunnen dan ook op verschillende manieren worden geclassificeerd. Een goed voorbeeld hierbij zijn de verschillende biologische classificaties van levende wezens. Bij de taxonomie van levende wezens werd oorspronkelijk uitgegaan van uiterlijke vormen, terwijl tegenwoordig de veronderstelde gemeenschappelijke afstamming, o.a. af te leiden uit genetische overeenkomsten, als het belangrijkste criterium geldt. De classificatie van de 'Library of Congress' is minder geschikt voor kleine bibliotheken. Een classificatie is meestal beter te gebruiken als de groepen waarin deze is opgedeeld elkaar niet overlappen.

In de biologie worden classificatie en ordinatie vaak als elkaar aanvullende multivariate methoden van gegevensverwerking gezien.

[bewerken] Classificeren in engere zin, clusteranalyse

Het classificeren verloopt in de volgende stappen

  1. De keuze van de te classificeren objecten (entiteiten, individuen, operationele eenheden, monsters, opnames, tellingen, sample units, relevées), op grond waarvan een classificatie gemaakt moet worden.
  2. De keuze van de kenmerken (attributen, eigenschappen, variabelen, characters, traits, features, cases) die gebruikt zullen worden bij het classificeren. Soms is een classificatie gebaseerd op de mate waarin één bepaalde eigenschap bij een object voorkomt. Zo kunnen stenen geordend worden op hun hardheid.
  3. De reeks van waarden die de kenmerken (character states, observations, values, qualities) mogen aannemen en de meetschalen die daarbij gebruikt zullen worden.
  4. De vaststelling van de weegfactoren van de kenmerken (bijvoorbeeld a priori gelijke weging). In de cladistiek worden plesiomorfieën ('primitieve' kenmerken) licht, maar juist de apomorfieën ('afgeleide' kenmerken) zwaar gewogen binnen de onderzochte groep van objecten.
  5. Het meten / waarnemen en het vastleggen van de waarden van de kenmerken van de objecten.
  6. De keuze van de classificatiemethode. Vaak is daarbij een keuze van de maat voor verwantschap (similariteit) of voor het verschil (distantie) tussen de objecten nodig. Ook moet er bijvoorbeeld gekozen worden uit een divisieve (top-down) methode, een agglomeratieve (bottom up) methode (beide hiërarchisch) of een niet-hiërarchische methode.
  7. De bewerking van de verzamelde gegevens, met als resultaat de classificatie van de objecten en/of van de kenmerken of een dendrogram.

Bij het classificeren wordt dus een aantal subjectieve beslissingen genomen.

Het is ook mogelijk niet de objecten, maar de kenmerken te classificeren.

Bij sommige classificatiemethoden is voorafgaande berekening van overeenkomst of verschil niet nodig. Clusters voor objecten en kenmerken kunnen bij sommige methoden gelijktijdig berekend worden.

[bewerken] Eigenschappen, kenmerken

De volgende eigenschappen zijn meestal in classificaties terug te vinden:

[bewerken] Vorm

Veel grote classificatiesystemen zijn hiërarchisch gestructureerd. Groepen zijn hierbij onderverdeeld in subgroepen die op hun beurt ook weer in groepen zijn onderverdeeld (divisief en hiërarchisch). Hoe hoger een groep in een hiërarchie is geplaatst, hoe algemener de beschrijving ervan zal zijn.

Het is ook mogelijk om de systemen van beneden naar boven op te bouwen (agglomeratief en hiërarchisch). Groepen worden samengevoegd in een groep van een hoger niveau en deze weer tot nog hogere niveaus.

In de biologie worden beide methoden tegelijk gebruikt bij de classificaties van organismen. Het centrale niveau is dat van de soort. Soorten kunnen weer worden onderverdeeld in lagere taxa, zoals ondersoort en variëteit. Soorten zelf worden samengevoegd in geslachten en deze weer in families en in taxa van nog hogere rang.

[bewerken] Identificeren of Determineren

Het identificeren of determineren kan in verschillende stappen worden onderverdeeld:

  1. Het kiezen van het classificatiesysteem.
  2. Het analyseren van een object: het onderzoek naar de betrokken kenmerken.
  3. Het op grond van de waarden van de kenmerken bepalen tot welke groep het object behoort.

Ook de term diagnose wordt hier wel gebruikt. Meer specifiek wordt het woord diagnose op het medische vlak gebruikt: door een diagnose wordt een ziekte geïdentificeerd vanuit optredende symptomen.

[bewerken] Soorten classificaties

Er bestaan verschillende soorten classificaties.

Zo zijn er classificaties die dienen om informatie snel te kunnen vinden:

Verder dienen classificaties ook om complexe verschijnselen op een geordende wijze te kunnen analyseren. Denk hierbij aan:

Door deze ordening van gegevens kan er makkelijker over gecommuniceerd worden.

[bewerken] Studie van classificatie

In de biologie valt classificatie van organismen onder de 'taxonomie', die van plantengemeenschappen onder 'syntaxonomie'.

In de communicatiewetenschap wordt theorie ontwikkeld over de grondslagen, de historie, de implicaties en de praktisch kanten van het classificeren. Leerzame literatuur op dit gebied is:

  • B.C. Vickery, Classification and Indexing in Science, Butterworths London, 1958.
  • E.W. Beth; Wetenschap en Classificatie, Nider 's Gravenhage, 1959.
  • Loosjes, Th.P. ea.; Biobliotheek en documentatie: Handboek ten dienste van de opleidingen, Van Loghum Slaterus, 1977.

In de wiskunde valt classificatie onder de 'Verzamelingenleer'

[bewerken] Organisaties

Er is een aantal organisaties die zich op wetenschappelijke wijze bezighouden met classificaties.

In Nederland:

  • VOC (Vereniging voor Ordinatie en Classificatie, opgericht 1989)

Internationaal:

  • CLAD (Associação Portuguesa de Classificação e Análise de Dados)
  • BCS (British Classification Society)
  • CSNA (Classification Society of North America)
  • GfKl (Gesellschaft für Klassifikation)
  • IFCS (International Federation of Classification Societies)
  • IPRCS (Irish Pattern Recognition and Classification Society)
  • JCS (Japanese Classification Society)
  • SFC (Société Francophone de Classification)
  • SIS (Società Italiana di Statistica)
  • SoCCCAD (Central American and Carribean Society of Classification and Data Analysis)

[bewerken] Zie ook

[bewerken] Externe links

Persoonlijke instellingen
Naamruimten

Varianten
Handelingen
Navigatie
Informatie
Hulpmiddelen
Afdrukken/exporteren
In andere talen