Gebruiker:Taka/Categorisatieproblemen

Uit Wikipedia, de vrije encyclopedie

Hier onder een lijstje met problemen van de categorisatie. Vergelijk het met de etalage van Frikimenia. Voeg gerust dingen toe of streep dingen door die inmiddels zijn opgelost.

Zie ook Gebruiker:Taka/Categorie:Internet


Basisproblemen[bewerken | brontekst bewerken]

  • Een belangrijk probleem is dat "alles" op een heleboel verschillende manieren is in te delen: naar kleur, lengte, leeftijd, alfabet, wetenschap, afstand..... In niet alle gevallen is elke indeling even relevant, maar er blijven vrijwel altijd meerdere dimensies over om iets zinvol in te delen. Om soepel met zoveel dimensies om te gaan is een flexibel systeem nodig. Het categorisatiesysteem van de wikipedia is (by design) star.
De mogelijkheden zijn:
  • Categorieën aanmaken die meerdere dimensies in zich hebben. Als (onzinnig maar nuttig) voorbeeld: "Blauwe, lange dingen die ver weg zijn".
  • Een artikel in meerdere categorieën plaatsen. Een artikel dat in de hierboven genoemde categorie staat, zou ook in de categorieën categorieën "Blauwe dingen", "Lange dingen" en "Dingen die ver weg zijn" kunnen worden gezet. Of in de categorieën "Blauwe, lange dingen" en "Dingen die ver weg zijn".
Maar het blijft een mouw die wordt aangepast en geen structurele oplossing. Voor een zinvolle indeling moeten aangemaakte categorieën voldoende onderscheidend zijn, maar ook weer niet zo vergaand dat er per categorie slechts één of twee artikelen zijn. En daarnaast is het ook weer niet de bedoeling dat een artikel in 50 verschillende categorieën wordt gezet - want dat maakt elke categorie op zich nietszeggend en de lijst vermelde categorieën bij een artikel wordt dan ook onoverzichtelijk.
Alternatieven:
Het beste zou zijn om te werken met trefwoorden, en de gebruiker de mogelijkheid te bieden te zoeken op elke gewenste combinatie van trefwoorden. Dat kan echter niet - de wikipedia-software biedt daar geen mogelijkheden toe. De wikipedia biedt wel andere mogelijkheden, die ook al worden gebruikt.
  • Lijsten. Een alternatief dat al bestond (en gebruikt werd) voor de invoering van categorieën op de wikipedia: aanmaken van lijsten. Het nadeel is dat dat met de hand moet gebeuren, het voordeel is dat elke denkbare doorsnede kan worden gemaakt.
  • Portalen, ook met de hand gemaakt en onderhouden, bieden een thematisch overzicht.
  • Goede artikelen over brede onderwerpen. Als artikelen over brede onderwerpen goed zijn geschreven, leiden ze de deelonderwerpen in, en verwijzen naar uitgebreidere informatie daarover. De lezer kan lekker doorklikken.
  • Sjablonen. Samenhangende onderwerpen krijgen nu al vaak een sjabloon mee, waardoor in elk van die artikelen een lijstje komt te staan van verwante onderwerpen.
Ok, we moeten het hier doen met de gegeven mogelijkheden. Het punt is dan hoe deze gegeven mogelijkheden het best worden benut. Niet dat daar niet over nagedacht is, er zijn zelfs een aantal voorstellen voor gedaan, zie Wikipedia:Categorisatievoorstel en Overleg Wikipedia:Categorisatievoorstel. Het punt is echter dat deze hele discussie niet tot een besluit heeft geleid. Met als gevolg dat categorieën "vrij" zijn voor eenieder. En ook al zijn er regelmatig overleggen over, er vallen al snel een aantal tekortkomingen op in de huidige categorisatie.
Een tweede aspect van indeling is het verschijnsel "subcategorie". Bijvoorbeeld bij een indeling volgens "wetenschap" ligt een subverdeling voor de hand. "Ecologie" is een discipline van "Biologie". En "Milieukunde" is een interdisciplinaire wetenschap ("Scheikunde", "Rechten", "Biologie"). Dus het is wenselijk dat de indeling recursief is, dan is deze "subcategorisatie" aan te pakken. Deze mogelijkheid wordt ook geboden in het categorisatiemodel van de wikipedia: een categorie kan als zodanig in een hogere categorie worden gezet. Wat dit betreft heb ik geen aanmerkingen.

Soort problemen[bewerken | brontekst bewerken]

Er kunnen verschillende mogelijke problemen met de categorisatie worden onderscheiden:

  • Inkonsistente categorieeën. Deze kunnen op verschillende manieren ontstaan, maar kunnen ook het gevolg zijn van een verkeerde keuze van de basiscategorieën (die in mijn zienswijze onafhankelijke dimensies zouden moeten zijn, en elke dimensie zou in eigen basiscategorie moeten hebben).
  • Vreemdsoortige categorieën. Categorieën die dusdanig specialistisch zijn dat ze eigenlijk alleen als lijst bestaansrecht hebben. Maar ook categorieën die het artikel rubriceren, en niet het onderwerp van het artikel. Een aantal van artikel, niet onderwerp-categorieën blijken een praktisch nut te hebben, zoals Categorie:Beginnetje.
  • Verkeerd gebruik van categorieën. Kan altijd gebeuren, dat een artikel in de verkeerde categorie is ingedeeld. Zolang dat geen patroon is voor een categorie, val ik er niet over.

En dan nog overige problemen, die op verschillende manieren kunnen ontstaan. Hieronder een lijstje met dingen die ik ben tegengekomen.

Inconsistente categorieën[bewerken | brontekst bewerken]

  • Zie Categorie:Alles. Naar mijn idee missen er een aantal basiscategorieën, en dat wreekt zich vervolgens. Dingen zijn bijvoorbeeld in te delen naar wetenschap en naar aard van het beschreven verschijnsel. Deze worden nogal eens verward en gekruist. Er staan bijvoorbeeld categorieën voor Spieren en botten en Hart- en vaatstelsel onder Categorie:Anatomie, waarbij deze laatste categorie duidelijk in de tak van wetenschappen staat. Feitelijk mist er een basiscategorie Categorie:Natuurverschijnsel. Bij gebrek daaraan worden natuurverschijnselen maar onder de wetenschap geplaatst die zich met het verschijnsel bezig houdt.
Opmerking: dit is niet een algemeen euvel, er zijn bijvoorbeeld wel basiscategorieën voor Categorie:Heelal en Categorie:Techniek. Ik wil hier vooral mee aangeven dat er niet goed is nagedacht over welke dimensies er zijn.
De verwarring heeft ook te maken met de dubbele betekenis van het begrip internetdienst:
  • De onderverdeling van internet in e-mail, www, ftp, chat, usenet etc.
  • Een niet zo duidelijke gedefinieerde woordsamenstelling die geldig is voor elke dienst die via internet wordt aangeboden.
  • Overigens: waarom staat de Wereld in Geografie (in de indeling per Wetenschap) en niet in Planeet (als onderdeel van het Heelal). Gezien de verdere (geografische) indeling van de categorie Wereld is zou dat laatste het geval moeten zijn.
  • De Categorie:Milieu met o.m. artikelen over bodemvervuiling en CO2-opslag is een subcategorie van Categorie:Biologie. De artikelen in de Categorie:Milieu horen niet thuis onder een wetenschap, en dan al zeker niet onder biologie. De milieuproblematiek is een maatschappelijk en geen wetenschappelijk verschijnlijk.
Overigens zou Milieuproblematiek een betere naam voor de categorie zijn. In tegenstelling tot natuur zijn er met het milieu alleen problemen (en oplossingen daarvoor). Er is geen wetenschap die het milieu als zodanig onderzoekt, Milieukunde houdt zich bezig met milieuproblematiek.
  • Categorie:Mens staat in Categorie:Maatschappij. Dat moet andersom. De maatschappij (de samenleving) is het resultaat van menselijk handelen. Een Honingbij hoort toch ook niet gerubriceerd te worden als onderdeel van een bijenkolonie.
Er is ook de hoofdcategorie Categorie:Persoon, maar die is niet duidelijk te onderscheiden van Categorie:Mens. Het artikel Domineeskind staat in Categorie:Mens (en ook in Categorie:Persoon naar eigenschap), maar de Categorie:Domineeskind staat in een tak van Categorie:Persoon. Het lijkt me een stuk overzichtelijker om de Categorie:Persoon op te doeken en alle subcategorieën daarvan onder Categorie:Mens te zetten.
Misschien is een categorie:Mens en maatschappij een oplossing voor de verwarring en overlap? Michiel1972 25 apr 2005 21:05 (CEST)
Lijkt me een goeie oplossing, ik las al dat er een keer zo'n suggestie was gedaan.Taka 25 apr 2005 21:15 (CEST)
  • Onder Categorie:Militaria valt van alles wat maar enigszins met leger en oorlog te maken heeft, inclusief Categorie:Oorlog, Categorie:Spion etc. Het woord Militaria staat niet in de online vandale, en uit de context op google blijkt dat het woord eigenlijk uitsluitend gebruikt wordt voor dingen die verzameld kunnen worden en die in verband staan met militairen.

Vreemde categorieën[bewerken | brontekst bewerken]

  • Categorie:Pseudoniem. (categoriseert het artikel, en niet het onderwerp). Moeten daar alleen artikelen in waarbij het artikel onder een pseudoniem staat, zoals Multatuli? En niet artikelen waarbij een persoon bekend is onder een pseudoniem, maar het artikel onder de werkelijk naam staat, zoals Willem van den Hout (die vooral bekend staat onder zijn pseudoniem "Willy van der Heide", maar nog een aantal andere pseudoniemen gebruikte). Dit laatste geeft een ander probleem aan: wat te doen met iemand die meerdere pseudoniemen gebruikt.
  • Het is soms interessant om te weten wat het beroep van iemands vader was. Maar een Categorie:Slagerszoon ?? Komt er ook een Categorie:Slagersdochter? Er is al wel een Categorie:Domineeskind. Als de aldus gecategoriseerde personen iets gemeenschappelijk hebben vanwege het beroep van hun vader, dan is het interessant om er een artikel van te maken, met desnoods een lijstje bekende "domineeskinderen" of "slagerszonen". Maar een categorie heeft hier niets te zoeken.

Logisch juiste categorieën, maar toch[bewerken | brontekst bewerken]

Antropocentrisme[bewerken | brontekst bewerken]

Zelfs het artikel mes is ingedeeld in de Categorie:Medisch instrument, terwijl een medisch mes een Scalpel heet.
Niet direct. Wel via categorie:Anatomie. Michiel1972 25 apr 2005 21:07 (CEST)

Helemaal loos[bewerken | brontekst bewerken]

Ik kwam dit nog tegen op Overleg:Lijst van lijsten van burgemeesters en heb het hierheen verplaatst, hier staat het beter.

Laten we een Categorie:Categorie aanmaken, of een Lijst van categorieën. Binnenkort ook op deze wikipedia: Portaal:Portalen, Portaal:Categorieën op de Wikipedia, Lijst van Portalen, Categorie:Portaal (sterker nog, we hebben al een Categorie:Hoofdportalen, en dingen als Categorie:Wikipedia:Portalen archief). Wat te denken van een Lijst van Portaalcategorieën, een Portaal:Lijsten.

Om kort te gaan: iedereen probeert zijn eigen ordening aan te brengen, en de argumentatie "mijn geliefde ordening is beter dan de jouwe" is net zoiets als wie het verst kan spugen. Taka 5 apr 2005 10:56 (CEST)

Hier staat het inderdaad beter, te meer omdat het je eigen toevoeging was op Overleg:Lijst van lijsten van burgemeesters. HenkvD 18 jun 2005 15:05 (CEST)
Oh leuk is dit: Categorie:Artikel op Portaal:Informatica, Categorie:Complete lijsten (ter onderscheid van Categorie:Lijsten waar ook artikelen op staan die nog niet aangemaakt zijn), Categorie:Alfabetische gesorteerde lijsten, Categorie:Chronologisch gesorteerde lijsten, Categorie:Lijsten die op andere wijze gesorteerd zijn, Categorie:Lijsten die in artikelen staan en die wegens auteursvermelding niet verplaatst kunnen worden naar een eigen lemma.
Taka 5 apr 2005 11:13 (CEST)