Classificatie

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Linnaeus' tabel van het dierenrijk uit de Systema Naturae (1735)

Onder classificatie verstaat men de activiteiten die leiden tot een classificatiesysteem: een indeling van verschijnselen, objecten of processen in groepen op grond van overeenkomst of verwantschap in eigenschappen of kenmerken. Daarnaast verstaat men onder classificatie het resultaat van die activiteiten: het classificatiesysteem.

Voorwerpen die in dit verband in de bibliotheekwetenschap niet gemakkelijk geclassificeerd kunnen worden, worden realia genoemd.

Algemeen[bewerken]

Onder classificatie kunnen verschillende zaken worden verstaan:

  1. Clusteranalyse, het classificeren of classificatie in engere zin: het ontwerpen van een classificatiesysteem op grond van overeenkomst van objecten in hun kenmerken. Hierbij kunnen beschrijvende multivariate statistische methoden gebruikt worden. Elke "klasse" wordt daarbij door een diagnose gekarakteriseerd: een opsomming van de onderscheidende, specifieke kenmerken.
  2. Classificatiesysteem: het resultaat van de vorige stap, ook dit heet wel een classificatie: de in groepen ingedeelde verschijnselen, objecten of processen. Voorbeeld: het periodiek systeem der elementen.
  3. Indexeren, sorteren, diagnosticeren, identificeren of determineren: het rubriceren van objecten of verschijnselen in een gekozen, reeds bestaand classificatiesysteem, of het vaststellen van de identiteit van objecten volgens één of meer criteria. Voorbeeld: determinatie van planten met behulp van een flora.

Voor objecten kunnen de termen classificatiesysteem, typologie en taxonomie nagenoeg als synoniem gebruikt. In de psychologie, informatica/kunstmatige intelligentie worden deze begrippen soms echter wel onderscheiden. Het verschil zit 'm vooral in de manier waarop de indeling tot stand komt: empirisch (taxonomie) of conceptueel (typologie).

Classificatie in engere zin of clusteranalyse is van nut bij de datareductie, dus bij het opsporen van redundantie en de samenvatting van gegevens, bij de reductie van ruis, bij het opsporen van uitbijters, bij modelvorming en bij de interpretatie van de samenhang met externe (verklarende, onafhankelijke) variabelen zoals omgevingsfactoren.

Het is niet strikt noodzakelijk dat een classificatie wordt gemaakt op grond van één specifieke eigenschap (monothetische classificatie). Zo kunnen objecten een groep eigenschappen met elkaar gemeen hebben (polythetische classificatie), zonder dat één specifieke eigenschap bij alle objecten voorkomt. Denk hierbij aan syndromen van eigenschappen. Wittgenstein noemt dit soort overeenkomsten 'familiegelijkenissen'. Ook kunnen objecten in een groep worden gezet juist omdat ze niet over een bepaalde eigenschap beschikken. Soms wordt voor classificatie in het algemeen de term 'taxonomie' gebruikt. Hiermee wordt vaak meer specifiek de classificatie van levende wezens bedoeld.

Omdat een classificatie een kunstmatige constructie is, zijn de indelingscriteria subjectief. Wel kan worden gezegd dat een classificatie in meer of mindere mate bruikbaar is voor het doel waarvoor deze is gemaakt. Veel verschijnselen kunnen dan ook op verschillende manieren worden geclassificeerd. Een goed voorbeeld hierbij zijn de verschillende biologische classificaties van levende wezens. Bij de taxonomie van levende wezens werd oorspronkelijk uitgegaan van uiterlijke vormen, terwijl tegenwoordig de fylogenie, o.a. af te leiden uit genetische overeenkomsten, als het belangrijkste criterium geldt. De classificatie van de 'Library of Congress' is minder geschikt voor kleine bibliotheken. Een classificatie is meestal beter te gebruiken als de groepen waarin deze is opgedeeld elkaar niet overlappen.

In de biologie worden classificatie en ordinatie vaak als elkaar aanvullende multivariate methoden van gegevensverwerking gezien.

Clusteranalyse[bewerken]

Nuvola single chevron right.svg Zie Clusteranalyse voor het hoofdartikel over dit onderwerp.

Clusteranalyse is classificatie in engere zin: het groeperen in 'clusters' of 'klassen' van objecten (entiteiten, individuen, operationele eenheden, monsters, opnames, tellingen, sample units, relevées) op grond van hun kenmerken (attributen, eigenschappen, variabelen, characters, traits, features, cases). Het resultaat is een classificatiesysteem. Meestal worden dendrogrammen gebruikt om het resultaat van clusteranalyse weer te geven.

Er is een grote variatie aan classificatiemethoden te onderscheiden op grond van het al of niet overlappen van de klassen, de af- of aanwezigheid van een hiërarchie, de wijze van opbouw van het dendrogram en de noodzaak van het vooraf berekenen van de onderlinge verschillen tussen de objecten.

Bij het classificeren moeten enkele subjectieve beslissingen worden genomen, zoals bij de keuze van de te clusteren objecten en de keuze van de kenmerken, hun aantal en hun weegfactoren. Daarna moet ook nog gekozen worden uit de verschillende clustermethoden. Het is ook mogelijk niet de objecten, maar de kenmerken te classificeren. Bij sommige methoden gebeurt dit echter gelijktijdig.

In de biologie (met name in de systematiek) worden beide methoden tegelijk gebruikt bij de classificaties van organismen. Het centrale niveau is dat van de soort. Soorten kunnen weer worden onderverdeeld in lagere taxa, zoals ondersoort en variëteit. Soorten zelf worden samengevoegd in geslachten en deze weer in families en in taxa van nog hogere rang.

Classificatiesystemen[bewerken]

Nuvola single chevron right.svg Zie Classificatiesysteem voor het hoofdartikel over dit onderwerp.

Er bestaan verschillende classificatiesystemen. Zo zijn er classificaties die dienen om informatie snel te kunnen terugvinden:

  • de internationale classificatiesystemen die in bibliotheken worden gebruikt en specifieke classificatiesystemen voor het Nederlands en Vlaams taalgebied
  • de 'groepen' van zoekmachines op Internet

Verder dienen classificaties er ook voor dat er makkelijker gecommuniceerd kan worden. Voorbeelden van classificatiesystemen:

Voorbeelden van een classificatiesysteem voor Geheimhouding[bewerken]

Spreekt met bij defensie van een geclassificeerd document, dan betekent dat dat dat document in meer of mindere mate geheim is. Er zijn de volgende gradaties van geheimhouding:

  1. zeer geheim (top secret).
  2. geheim (secret)
  3. vertrouwelijk of confidentieel (confidential)
  4. dienstgeheim (restricted)
  5. niet geclassificeerd (unclassified)

De classificatie moet boven- en onderaan elke pagina worden vermeld. Een geclassificeerd document mag niet per post worden verstuurd.

Identificeren of determineren[bewerken]

Het identificeren, sorteren, diagnosticeren of determineren kan in verschillende stappen worden onderverdeeld:

  1. Het kiezen van het classificatiesysteem.
  2. Het analyseren van een object: het onderzoek naar de betrokken kenmerken.
  3. Het op grond van de waarden van de kenmerken bepalen tot welke groep het object behoort.

Ook de termen diagnose en diagnosticeren worden hier wel gebruikt. Meer specifiek wordt het woord diagnose op het medische vlak gebruikt: door een diagnose wordt een ziekte geïdentificeerd vanuit optredende symptomen.

In de biosystematiek is een diagnose voor een soort een beschrijving van de kenmerken aan de hand waarvan organismen van die soort ondubbelzinnig kunnen worden gedetermineerd (geïdentificeerd), meestal in vergelijking met verwante soorten. Vaak is daarvoor maar een beperkt aantal kenmerken noodzakelijk. Voor de wetenschappelijke beschrijving wordt de diagnose meestal in het Latijn gegeven. De verdere beschrijving wordt dan gedaan in een gangbare taal naar keuze, zoals Engels, Chinees, Frans, Japans.

Organisaties[bewerken]

Er is een aantal organisaties die zich op wetenschappelijke wijze bezighouden met classificaties.

In Nederland:

  • VOC (Vereniging voor Ordinatie en Classificatie, opgericht 1989)

Internationaal:

  • CLAD (Associação Portuguesa de Classificação e Análise de Dados)
  • BCS (British Classification Society)
  • CSNA (Classification Society of North America)
  • GfKl (Gesellschaft für Klassifikation)
  • ICTV (International Comittee on Taxonomy of Viruses)
  • IFCS (International Federation of Classification Societies)
  • IPRCS (Irish Pattern Recognition and Classification Society)
  • JCS (Japanese Classification Society)
  • SFC (Société Francophone de Classification)
  • SIS (Società Italiana di Statistica)
  • SoCCCAD (Central American and Carribean Society of Classification and Data Analysis)

Zie ook[bewerken]

Bronnen, noten en/of referenties

Leerzame literatuur

  • Vickery B.C. (1958) Classification and Indexing in Science, Butterworths London.
  • E.W. Beth (1959) Wetenschap en Classificatie, Nider 's Gravenhage.
  • Loosjes, Th.P. ea. (1977) Bibliotheek en documentatie: Handboek ten dienste van de opleidingen, Van Loghum Slaterus.

Externe links