Classificatie
Een classificatie is een indeling van verschijnselen, objecten of processen in groepen op grond van overeenkomst of verwantschap in eigenschappen of kenmerken. Voorwerpen die in dit verband in de bibliotheekwetenschap niet gemakkelijk geclassificeerd kunnen worden, worden realia genoemd.
Inhoud |
[bewerken] Algemeen
Onder classificatie kunnen verschillende zaken worden verstaan:
- indexeren, sorteren, diagnosticeren, identificeren of determineren: het rubriceren van objecten of verschijnselen in een gekozen, reeds bestaand classificatiesysteem, of het vaststellen van de identiteit van objecten volgens één of meer criteria.
- Clusteranalyse; het classificeren; classificatie in engere zin: het ontwerpen van een classificatiesysteem op grond van overeenkomst van objecten in hun kenmerken. Hierbij kunnen beschrijvende multivariate statistische methoden gebruikt worden.
- Classificatiesysteem: het resultaat van de vorige stap (ook dit heet wel een classificatie): de in groepen ingedeelde verschijnselen, objecten of processen.
Classificatie in engere zin of clusteranalyse is van nut bij de datareductie, dus bij het opsporen van redundantie en de samenvatting van gegevens, bij de reductie van ruis, bij het opsporen van uitbijters, bij modelvorming en bij de interpretatie van de samenhang met externe (verklarende, onafhankelijke) variabelen zoals omgevingsfactoren.
Het is niet strikt noodzakelijk dat een classificatie wordt gemaakt op grond van een specifieke eigenschap (monothetische classificatie). Zo kunnen objecten een groep eigenschappen met elkaar gemeen hebben (polythetische classificatie), zonder dat een specifieke eigenschap bij alle objecten voorkomt. Denk hierbij aan syndromen van eigenschappen. Wittgenstein noemt dit soort overeenkomsten 'familiegelijkenissen'. Ook kunnen objecten in een groep worden gezet juist omdat ze niet over een bepaalde eigenschap beschikken. Soms wordt voor classificatie in het algemeen de term 'taxonomie' gebruikt. Hiermee wordt vaak meer specifiek de classificatie van levende wezens bedoeld.
Omdat een classificatie een kunstmatige constructie is, zijn de indelingscriteria subjectief. Wel kan worden gezegd dat een classificatie in meer of mindere mate bruikbaar is voor het doel waarvoor deze is gemaakt. Veel verschijnselen kunnen dan ook op verschillende manieren worden geclassificeerd. Een goed voorbeeld hierbij zijn de verschillende biologische classificaties van levende wezens. Bij de taxonomie van levende wezens werd oorspronkelijk uitgegaan van uiterlijke vormen, terwijl tegenwoordig de veronderstelde gemeenschappelijke afstamming, o.a. af te leiden uit genetische overeenkomsten, als het belangrijkste criterium geldt. De classificatie van de 'Library of Congress' is minder geschikt voor kleine bibliotheken. Een classificatie is meestal beter te gebruiken als de groepen waarin deze is opgedeeld elkaar niet overlappen.
In de biologie worden classificatie en ordinatie vaak als elkaar aanvullende multivariate methoden van gegevensverwerking gezien.
[bewerken] Classificeren in engere zin, clusteranalyse
Het classificeren verloopt in de volgende stappen
- De keuze van de te classificeren objecten (entiteiten, individuen, operationele eenheden, monsters, opnames, tellingen, sample units, relevées), op grond waarvan een classificatie gemaakt moet worden.
- De keuze van de kenmerken (attributen, eigenschappen, variabelen, characters, traits, features, cases) die gebruikt zullen worden bij het classificeren. Soms is een classificatie gebaseerd op de mate waarin één bepaalde eigenschap bij een object voorkomt. Zo kunnen stenen geordend worden op hun hardheid.
- De reeks van waarden die de kenmerken (character states, observations, values, qualities) mogen aannemen en de meetschalen die daarbij gebruikt zullen worden.
- De vaststelling van de weegfactoren van de kenmerken (bijvoorbeeld a priori gelijke weging). In de cladistiek worden plesiomorfieën ('primitieve' kenmerken) licht, maar juist de apomorfieën ('afgeleide' kenmerken) zwaar gewogen binnen de onderzochte groep van objecten.
- Het meten / waarnemen en het vastleggen van de waarden van de kenmerken van de objecten.
- De keuze van de classificatiemethode. Vaak is daarbij een keuze van de maat voor verwantschap (similariteit) of voor het verschil (distantie) tussen de objecten nodig. Ook moet er bijvoorbeeld gekozen worden uit een divisieve (top-down) methode, een agglomeratieve (bottom up) methode (beide hiërarchisch) of een niet-hiërarchische methode.
- De bewerking van de verzamelde gegevens, met als resultaat de classificatie van de objecten en/of van de kenmerken of een dendrogram.
Bij het classificeren wordt dus een aantal subjectieve beslissingen genomen.
Het is ook mogelijk niet de objecten, maar de kenmerken te classificeren.
Bij sommige classificatiemethoden is voorafgaande berekening van overeenkomst of verschil niet nodig. Clusters voor objecten en kenmerken kunnen bij sommige methoden gelijktijdig berekend worden.
[bewerken] Eigenschappen, kenmerken
De volgende eigenschappen zijn meestal in classificaties terug te vinden:
- tijd (chronologie, historie)
- ruimte (geografie)
- materie (substantie)
- proces (activiteit)
- informatie (zoals boekinhoud, erfelijke informatie)
[bewerken] Vorm
Veel grote classificatiesystemen zijn hiërarchisch gestructureerd. Groepen zijn hierbij onderverdeeld in subgroepen die op hun beurt ook weer in groepen zijn onderverdeeld (divisief en hiërarchisch). Hoe hoger een groep in een hiërarchie is geplaatst, hoe algemener de beschrijving ervan zal zijn.
Het is ook mogelijk om de systemen van beneden naar boven op te bouwen (agglomeratief en hiërarchisch). Groepen worden samengevoegd in een groep van een hoger niveau en deze weer tot nog hogere niveaus.
In de biologie worden beide methoden tegelijk gebruikt bij de classificaties van organismen. Het centrale niveau is dat van de soort. Soorten kunnen weer worden onderverdeeld in lagere taxa, zoals ondersoort en variëteit. Soorten zelf worden samengevoegd in geslachten en deze weer in families en in taxa van nog hogere rang.
[bewerken] Identificeren of Determineren
Het identificeren of determineren kan in verschillende stappen worden onderverdeeld:
- Het kiezen van het classificatiesysteem.
- Het analyseren van een object: het onderzoek naar de betrokken kenmerken.
- Het op grond van de waarden van de kenmerken bepalen tot welke groep het object behoort.
Ook de term diagnose wordt hier wel gebruikt. Meer specifiek wordt het woord diagnose op het medische vlak gebruikt: door een diagnose wordt een ziekte geïdentificeerd vanuit optredende symptomen.
[bewerken] Soorten classificaties
Er bestaan verschillende soorten classificaties.
Zo zijn er classificaties die dienen om informatie snel te kunnen vinden:
- de internationale classificatiesystemen die in bibliotheken worden gebruikt
- BBC (Bliss Bibliografische Classificatie)
- CC (Colon Classificatie)
- DDC (Dewey Decimale Classificatie)
- LCC (Library of Congress-Classificatie)
- UDC (Universele Decimale Classificatie)
- specifieke classificatiesystemen voor het Nederlands en Vlaams taalgebied
- NBC (Nederlandse Basisclassificatie) voor wetenschappelijke bibliotheken
- NUR (Nederlandse Uniforme Rubrieksindeling) voor de boekhandel
- PIM-systeem
- PLIMP (PLaatsing van Informatieve Media d.m.v. Pictogrammen)
- SISO (Schema voor de Indeling van de Systematische catalogus in Openbare bibliotheken)
- vereenvoudigd SISO
- themaplaatsing
- ZIZO (zonder inspanning zoeken)
- de 'groepen' van zoekmachines op Internet
- bij defensie houdt classificatie in dat een document in meer of mindere mate geheim is. Er zijn vier gradaties, van laag naar hoog: dienstgeheim (restricted), vertrouwelijk (confidential), geheim (secret), zeer geheim (top secret).
Verder dienen classificaties ook om complexe verschijnselen op een geordende wijze te kunnen analyseren. Denk hierbij aan:
- classificatie van organismen (zie ook taxonomie, soort, binominale nomenclatuur)
- classificatie van levensgemeenschappen (zie ook syntaxonomie)
- classificatie van sterren en nevels en gaswolken (Harvard classificatie van sterren, Hertzsprung-Russelldiagram)
- classificatie van windsterkten
- classificatie van (psychologische) ziekten (bijvoorbeeld DSM IV)
- het Periodiek systeem der elementen
- classificatie van informatie in de informatiebeveiliging (de mate van vertrouwelijkheid)
Door deze ordening van gegevens kan er makkelijker over gecommuniceerd worden.
[bewerken] Studie van classificatie
In de biologie valt classificatie van organismen onder de 'taxonomie', die van plantengemeenschappen onder 'syntaxonomie'.
In de communicatiewetenschap wordt theorie ontwikkeld over de grondslagen, de historie, de implicaties en de praktisch kanten van het classificeren. Leerzame literatuur op dit gebied is:
- B.C. Vickery, Classification and Indexing in Science, Butterworths London, 1958.
- E.W. Beth; Wetenschap en Classificatie, Nider 's Gravenhage, 1959.
- Loosjes, Th.P. ea.; Biobliotheek en documentatie: Handboek ten dienste van de opleidingen, Van Loghum Slaterus, 1977.
In de wiskunde valt classificatie onder de 'Verzamelingenleer'
[bewerken] Organisaties
Er is een aantal organisaties die zich op wetenschappelijke wijze bezighouden met classificaties.
In Nederland:
- VOC (Vereniging voor Ordinatie en Classificatie, opgericht 1989)
Internationaal:
- CLAD (Associação Portuguesa de Classificação e Análise de Dados)
- BCS (British Classification Society)
- CSNA (Classification Society of North America)
- GfKl (Gesellschaft für Klassifikation)
- IFCS (International Federation of Classification Societies)
- IPRCS (Irish Pattern Recognition and Classification Society)
- JCS (Japanese Classification Society)
- SFC (Société Francophone de Classification)
- SIS (Società Italiana di Statistica)
- SoCCCAD (Central American and Carribean Society of Classification and Data Analysis)