Wikipedia:De kroeg/Archief/20210615

Uit Wikipedia, de vrije encyclopedie


7 jun 2021 22:02 (CEST)

Taxon-artikelen van een bot[bewerken | brontekst bewerken]

Als medewerker aan een project om de categorienamen van de dierenartikelen naar de meervoudsvorm om te zetten (zie hier) kwam ik via de geslachtsnaam Zanclea op een fout in de encyclopedie (we hadden twee dierengeslachten met die naam, en dat kan niet). Nadat het opgelost was, kon ik vandaag overal de link naar Zanclea (neteldieren) aanpassen. De artikelen over de soorten in dat geslacht zijn in 2011 aangemaakt door Grashoofdbot, met de beste bedoelingen uiteraard. In elk artikeltje kwam ik de zin tegen: "De poliep komt uit het geslacht Zanclea." Dat is nonsens. Soorten worden door taxonomen bij elkaar in geslachten geplaatst, ze komen er niet uit. Toch is een dergelijke zin in ongeveer 100.000 artikelen te lezen.

Een ander voorbeeld van een Grashoofdbot-artikel is Ophiura acervata. In de eerste versie daarvan stond dit: "Ophiura acervata is een slangster uit de familie Ophiuridae. De ster kruipt over de zeebodem met hun flexibele, slangachtige armen, die gemakkelijk afbreken en daarna weer aangroeien. De zeekomkommer komt uit het geslacht Clarkcomanthus en leeft in de zee. Ophiura acervata werd in 1869 voor het eerst wetenschappelijk beschreven door Lyman." Na commentaar op de tekst (een slangster is geen ster, en ook geen zeekomkommer, en het was nogal onhandig verwoord) stond er, na wat nawerk van een paar bots, dit: "De slangster kruipt over de zeebodem met zijn flexibele, slangachtige armen. Deze armen breken gemakkelijk af, maar groeien vanzelf weer aan." We hebben ongeveer 2000 artikelen over slangsterren, en in elk daarvan stond exact die zin. Ik heb me daar in 2017 een keer inwendig kwaad over gemaakt en vervolgens al die artikelen ontdaan van dit soort desinformatie. De lezer hoort dergelijke algemene informatie te vinden door op de link slangster te klikken, waar dan beter uitgelegd staat wat een slangster is. Dat hoort niet 2000 keer in elk afzonderlijk artikel te staan, de indruk wekkend dat het een beschrijving van die ene soort is. Volkomen on-encyclopedisch!

Bij de zeekomkommers stond in elk artikel: "De zeekomkommer heeft een lang, leerachtig lijf en leeft in de zee." opnieuw 2000 artikelen, en voor de meeste soorten was die beschrijving een leugen. Ook allemaal aangepakt. Bij de zeesterren: "Aan de onderkant van het lichaam bevindt zich een mondopening. De romp bestaat uit een schijf met armen. De ster kan verloren of beschadigde delen van z'n lichaam regenereren." Ruim 3000 keer verwijderd. Ik geloof dat ik in die tijd alle stekelhuidigen onder handen heb genomen. Maar kijk eens wat je dan in de meeste gevallen overhoudt. En dan moet nu nog gecheckt worden of de als bron gebruikte database de soort nog steeds als geaccepteerde soort vermeldt, want de taxonomie staat niet stil. En Grashoofdbot was niet erg kieskeurig, dus maakte ook artikelen aan over namen die als nomen dubium of 'taxon inquirendum' geregistreerd waren. Ik heb vandaag geprobeerd twee van die artikelen te nuweggen, maar van in elk geval één, Zanclea indica werd dat niet geaccepteerd omdat het niet aan de nuweg-criteria zou voldoen. Een artikel dat doet of het over een soort gaat, terwijl het gebaseerd is op een naam waarvan niet bekend is welk taxon ermee bedoeld is, en dat voldoet niet aan het criterium "Pagina's met inhoud zonder zinvolle informatie"? Kom nou zeg! We hebben alleen al over de hydroïdpoliepen 3500 van dit soort artikelen; over de neteldieren in totaal 11.000, en daarbij is het echt veel vaker op dezelfde manier fout gegaan.

Voor de artikelen in de Categorie:Pijlstaart heb ik al eens iets vergelijkbaars gedaan als hierboven geschetst. Want 1700 artikelen met vrijwel exact deze inhoud (zelfde getallen, zelfde bizarre referenties) was om je dood te schamen.

Er zijn echter ook heel wat artikelen waaraan nog nooit iets is gedaan. Hier een voorbeeld van één over een borstelworm. Daarvan hebben we er 11.000. Op de naam en de taxonauteur na allemaal identiek. We hebben ruim 400 artikelen over Acoelomorpha met identieke tekst. En ik zou zo nog een tijd kunnen doorgaan want het is een enorme waslijst. Grashoofd heeft het allemaal met veel inzet en met de beste bedoelingen gedaan, maar ik denk dat we achteraf kunnen vaststellen dat hij met veel te weinig kennis van zaken aan het werk was, en daarbij een veel te grote vrijheid heeft gekregen. Wat in elk geval ontbrak was enig begrip van de betekenis van een naam in een database. Niet elke naam die er uitziet als een wetenschappelijke naam is ook automatisch de geaccepteerde naam van een taxon. Een ruwe schatting is dat er tien keer zoveel namen zijn gepubliceerd als er taxa worden onderscheiden. Van elke tien namen zijn er dus negen synoniemen. Dat moet men zich wél realiseren als men een database met namen wil gebruiken als bron voor het produceren van artikelen: wat is de waarde van de erin opgenomen namen? Zelfs lang niet elke available name (zoals door een andere bot uit een database over vlinders werd gehaald) is een geaccepteerde naam van een soort.

Grashoofdbot was de ergste niet. Op de Zweedse Wikipedia ontstond Lsjbot, die met ongepaste trots 10.000 artikelen per dag uitbraakte (zie mijn beschrijving van het effect daarvan hier). Op de Zweedse zijn ze tot inkeer gekomen. Ik weet niet hoe ze daar precies selecteren, maar inmiddels zijn er anderhalf miljoen artikelen van Lsjbot genomineerd om te worden verwijderd of al weg. Gezien de enorme hoeveelheid werk die er nog kleeft aan het opknappen van de artikelen van Grashoofdbot, en het schamele resultaat dat er dan overblijft, daarbij opgeteld dat er dan nog niet eens gecheckt is of het artikel wel een geaccepteerd taxon betreft, het volgende:

1) Als er een serieus gebrek wordt geconstateerd aan zo'n artikel, bijvoorbeeld dat het een naam van een niet geaccepteerd taxon betreft (dus alle nomina nuda, nomina dubia, taxa inquirenda, of gewoon een spelfout in de naam terwijl we het artikel ook onder de correcte naam hebben), dan moet het mogelijk zijn het zonder verder gezeur op de nuweg-lijst te zetten. De curieuze situatie doet zich namelijk nu steeds voor dat het bij 'artikelen' die met een snelheid van 20 per minuut de encyclopedie ingeflikkerd zijn, en dus drie seconden werk hebben gekost, uren werk kost om ze stuk voor stuk verwijderd te krijgen. Als je ziet wat ik af moet argumenteren bij 'Aeshna flavifrons' (een naam uit een suppressed work, dus de naam bestaat niet eens) of Zanclea indica om artikelen die overduidelijk uit aperte onzin bestaan, verwijderd te krijgen....

2) Bij artikelen waaraan sinds de creatie ervan geen handmatige wijzigingen hebben plaatsgehad, en die onzinfrases als de hierboven genoemde bevatten, moet het mogelijk zijn ze op grotere schaal te verwijderen. Er zijn hier collega's die heel handig zijn met scripts, en die ongetwijfeld geautomatiseerd per artikel op zulke zaken kunnen checken. Het wordt tijd dat we gaan overwegen of we deze in meerdere opzichten al te slorig aangemaakte producten nog wel langer in deze encyclopedie willen hebben.

Dus ik gooi de knuppel in het hoenderhok. WIKIKLAAS overleg 26 mei 2021 00:01 (CEST)[reageer]

Goed plan, mijn steun heb je! Natuur12 (overleg) 26 mei 2021 00:14 (CEST)[reageer]
Laatst werd er trots gedaan over het twee miljoenste artikel op deze wiki. Ik denk dat we nog trotser kunnen zijn wanneer we weer terug zijn bij één miljoen. –bdijkstra (overleg) 26 mei 2021 00:38 (CEST)[reageer]
Wat is de meerwaarde van een botartikel, we hebben toch het driefeitencriterium voor een beginnetje? Hans Erren (overleg) 26 mei 2021 07:42 (CEST)[reageer]
Wikiklaas geeft (geheel terecht) aan dat dit een gebied uit de wetenschap betreft waar veel specifieke en specialistische kennis nodig is, kennis die ook nog eens best vaak door de tijd heen verandert. Wat tien jaar geleden een eigen soort was, kan nu zomaar een ondersoort zijn geworden, en dat kan dan ook nog eens in het vakgebied niet algemeen geaccepteerd zijn. In de computerkunde heb je de term SISO die staat voor "Shit In, Shit Out", en daar refereert Wikiklaas dan ook naar. Als de input uit je gegevensset vol rommel zit, komt er aan de andere kant ook rommel uit. Wat het wel lastig maakt, is dat de moderatoren die dit moeten afhandelen niet zomaar als onzin kunnen classificeren, want die zijn zeer waarschijnlijk niet ingewijd in de taxonomie. Voor hen is het ook niet zomaar te bepalen of iets zeer breed genomen onzin is, of dat Wikiklaas het op persoonlijke titel onzin vindt. Voor enkele artikelen zou de verwijderlijst daar normaal gesproken uitkomst moeten bieden, als niemand bezwaar heeft kan het dan na 14 dagen prima weg.
Daar waar er systematische fouten zijn gemaakt bij het aanmaken, moeten we wellicht kijken hoe die op een gelijkluidende manier weer systematisch zijn recht te trekken. Niet zozeer zoals hierboven wordt gesteld door klakkeloos alle 1 miljoen taxa te verwijderen (ik geloof dat we er 1,1 miljoen hebben), maar als we met een script pak-m-beet 100.000 artikelen kunnen verbeteren, lijkt het me zinvol te kijken hoe dat gedaan kan worden, en wie dat kan doen. Voor het verbeteren van de inhoud kom je doorgaans niet veel weerstand tegen.
Dat de voorbeelden van Wikiklaas op de beoordelingslijst nu zoveel vragen opwerpen, komt juist doordat het voor de rest niet zo klip en klaar is, dat dit onzin betreft die nooit had aangemaakt moeten worden. Vaak staan er dan ook nog bronnen bij, en links naar andere talen. Daarbij is het de vraag, of een soort die de wetenschap een tijd heeft gevoerd, en vervolgens heeft afgevoerd, bij ons wel moet worden verwijderd. Als een bedrijf stopt te bestaan verwijderen wij het artikel ook niet, maar wordt daar een aantekening van gemaakt. Nu ligt dat in dit geval vaak wat genuanceerder, maar over die nuance gaat het nu juist. Als dit project puur en alleen over taxonomie ging, hoefden we die discussie niet te voeren, en hadden we mogen verwachten dat het tot de standaard bagage van de vrijwilligers behoorde, maar de meesten weten hier meer van voetballers en B-acteurs dan van borstelwormen. Edoderoo (overleg) 26 mei 2021 11:21 (CEST)[reageer]
Ik heb nooit iets zomaar 'onzin' genoemd, maar er altijd bij vermeld waarom het onzin was. Een artikel over 'Aeshna flavifrons' is onzin omdat die naam uit een suppressed work komt, en dus voor de taxonomie helemaal niet bestaat. Dat jij zo'n helder argument niet wilt aannemen, is een ander verhaal. Een artikel op basis van een naam die als 'taxon inquirendum' is gelabeld, is onzin. De specialisten moeten eerst uitmaken of er überhaupt een taxon is dat met die naam aangeduid kan worden (en dan wordt de naam waarschijnlijk een synoniem). Pas als dat gebeurd is, kunnen wij er zinnig iets over schrijven. Tot die tijd heeft het in de encyclopedie niets te zoeken.
Je vergelijkt 'afgevoerde namen' met 'bedrijven die zijn opgehouden te bestaan'. Dat is niet het probleem. Namen die letterlijk worden afgevoerd, zoals 'Aeshna flavifrons', hebben nooit enige betekenis gehad. Andere namen die worden 'afgevoerd' worden niet letterlijk afgevoerd maar worden synoniemen van andere namen. Dat lossen wij vlot op met een redirect. Het gaat in de talloze gevallen waarvan ik hierboven een schets geef echter niet om 'een soort die de wetenschap een tijd heeft gevoerd, en vervolgens heeft afgevoerd', maar om artikelen waarvan onduidelijk is of ze überhaupt wat waard zijn. En als je dat stuk voor stuk moet uitzoeken voor honderdduizenden artikelen, dan maak ik het eind daarvan niet meer mee, zoveel werk is dat. En het resultaat van die sisyfusarbeid zou bestaan uit honderduizenden inhoudsloze lemma's, dus dat is al het werk niet waard.
De 'bronnen' die erbij staan, betreffen doorgaans de lijsten of databases op basis waarvan de artikelen zijn aangemaakt. Dat de aanmaker een bron kan noemen, betekent niet dat hij/zij ook op een verantwoorde manier een artikel heeft gecreëerd. De 'links naar andere talen' betreffen in het overgrote deel de Vietnamese [viwiki] en twee Filipijnse [warwiki] en [cebwiki] Wikipedia's. Daar werden de artikelen op nog veel onverantwoorder manier dan bij ons aangemaakt door Lsjbot, op basis van onder meer Encyclopedia of Life. De zot! WIKIKLAAS overleg 26 mei 2021 14:14 (CEST)[reageer]
Ik zou het een stapje verder willen nemen, Wikipedia is denk ik niet hetzelfde als Wikispecies, ik denk dat heel veel van deze inhoudsloze database headers het beste naar hun eigen project (nl.wikispecies) zouden kunnen verhuizen. De meeste artikelen hebben geen encyclopedische inhoud. Er staat in de meeste gevallen één feit met bron in deze artikelen. (x is een y. bron:taxonoom in zzzz). Dat voldoet niet aan de definitie van wat een encyclopedie beoogt te vertellen, een encyclopedie "biedt [...] feitelijke kennis over het met dat woord aangeduide onderwerp, verklaart het belang en de ontwikkeling ervan, verhaalt hoe het onderwerp zich verhoudt tot een meer algemeen kennisgebied en verwijst naar eventuele onderdelen, afgeleiden en deelgebieden." Dat is hier niet het geval. Dat de databaseboom meekomt, is niet echt een feit, als ik een artikel aanmaak met "De Kerkstraat is een straat in Kerkdriel. Deze straat bevindt zich in de buurt Kerkdriel, in de wijk Wijk 00 Kerkdriel en in de gemeente Maasdriel, in de provincie Gelderland, en het land Nederland, op het continent Europa, op de planeet Aarde, in de Melkweg, in het Heelal" zou ik terecht gedoe krijgen. Hoeveel feiten over de Kerkstraat zijn dat? Het bijwerken is ook mission impossible. Voorbeeld: Categorie:Gewone sluipwesp heeft 20.806 entries. Neem ik 10 minuten de tijd om ieder artikel te controleren en bij te werken is dat 3468 uur werk. Met 1880 werkbare uren per jaar zou het dus iets minder dan twee jaar kosten om die éne categorie bij te werken. Dan kan je door naar de Categorie:Bladkevers, 17K entries, en zo voort. Ik denk echt dat een eigen project een betere plaats hiervoor is. Milliped (overleg) 26 mei 2021 11:32 (CEST)[reageer]
@Edo: Ik schreef niet "klakkeloos" of gaf ook maar enige hint dat het mijn bedoeling zou zijn om onzorgvuldig te werk te gaan. –bdijkstra (overleg) 26 mei 2021 11:56 (CEST)[reageer]
Voor een groot deel heeft Wikiklaas gelijk. Het idee dat het mogelijk is een lemma verwijderd te krijgen via de verwijderlijst als het geen vandalisme of reclame is heb ik al meer dan tien jaar geleden opgegeven.
        Er wordt door diverse gebruikers gerefereerd naar een minimum van drie feiten, maar wat daar niet bij vermeld wordt, is dat de aanhangers hiervan ook zelf willen bepalen wat een "feit" is en daarbij een onbegrensde fantasie blijken te hebben. Het overgrote merendeel van dit soort lemma's bevatten minder dan één echt feit.
        Wat weer niet waar is, is dat speciale kennis nodig is (zoals Edoderoo stelt) voor het schrijven van een lemma over dieren. Net als voor alle andere lemma's is er betrouwbare literatuur nodig, en die komt er bij een bot niet aan te pas. Er wordt gekopieerd uit een database, en dan gehoopt dat er spontaan, door kabouterjes, ooit een echt lemma uit wil groeien.
        Wat ook niet waar is, is dat er in de echte wereld noodzakelijkerwijs één Single Point of View bestaat over wat er wel en wat niet een goede soort is. De realiteit is anders.
        Overigens is de situatie op Wikidata nog weer veel erger; daar worden op grote schaal soorten gefabriekt, die in werkelijkheid nooit bestaan hebben. - Brya (overleg) 26 mei 2021 12:41 (CEST)[reageer]
Ik heb een paar artikelen over beestjes en met die artikelen in de hand kan ik niet stellen dat ik een goede bioloog ben. Het beoordelen van biologische artikelen durf ik dus ook niet altijd. Ik moet volledig kunnen vertrouwen op de kennis van de nominator. Wel is het zo dat ik de vaak niet echt gedegen geschreven artikelen te mager vind voor Wikipedia, een artikel als: X is een Y, voor het eerst beschreven door Z in NNNN lijkt mij een prima artikel voor Wikispecies en hier lijkt mij dat een nutteloze pagina. Ik heb geloof ik misschien, eigenlijk hooguit, vijf van dergelijke pagina's ook uit kunnen breiden met wat tekst. Ik ben National Geographic daar nog altijd dankbaar voor. Dqfn13 (overleg) 26 mei 2021 12:59 (CEST)[reageer]
Ik heb meen ik een jaar of 10(!) geleden al vrijwel exact hetzelfde plan voorgesteld als Milliped hierboven, dus alle ultrakorte taxon-artikeltjes overzetten naar een eigen nl-versie van Wikispecies. Dat mocht toen van menigeen absoluut niet (ik geloof omdat de mijlpaal van een miljoen artikelen toen zo snel mogelijk bereikt moest worden). Niet alleen horen al die taxonomische gegevens natuurlijk bij uitstek in een database (wat in de basis iets heel anders is dan een encyclopedie), als de gegevens ook nog eens onjuist zijn (dat is althans wat Wikiklaas hierboven zegt) is er helemáál een reden om hier linea recta in actie te komen. De geloofwaardigheid van Wikipedia-nl is toch al uiterst wisselend, en wordt met dit soort zaken alleen maar verder ondergraven. De Wikischim (overleg) 26 mei 2021 13:18 (CEST)[reageer]
@Edoderoo: je schrijft over specialistische kennis, en dat is waar het hier is misgegaan, in elk geval bij de artikelen van Grashoofdbot. In een encyclopedie moet het zo zijn dat iemand een artikel uitsluitend aanmaakt als hij/zij daarvoor de nodige deskundigheid heeft. Brya verwijst naar de literatuur en dat is correct, maar er is kennis van taxonomie nodig om de taxonomische literatuur te kunnen begrijpen, en op basis daarvan een lemma te schrijven. Door Grashoofdbot zijn veel artikelen aangemaakt zonder dat hij wist waarover hij het had. In het geval van WoRMS als bron is de database een van de betere die je kunt kiezen. Maar zelfs de betrouwbaarste bronnen kunnen niet verhinderen dat er onzin wordt geschreven als degene die de bron gebruikt niet snapt wat de waarde van de erin vermelde gegevens is. Wij zitten nu opgezadeld met een enorme hoeveelheid lemma's waarin onzin staat (de loze frases die Grashoofdbot aan zijn lemma's meegaf). En als die eerste onzin eruit is, dan weten we alsnog niet of het lemma wel een geaccepteerd taxon 'beschrijft' (want Grashoofdbot maakte ook artikelen op basis van namen die als 'nomen dubium', 'nomen nudum' of 'taxon inquirendum' waren gelabeld), en tot slot geeft het 'artikel' geen enkele informatie, anders dan de auteur van de naam, en een plaats in een taxonomische structuur. Zo'n lemma had niet aangemaakt moeten worden, en het mag niet al te moeilijk worden gemaakt om het dus ook weer te verwijderen. Jij noemt de verwijderlijst, maar dat kun je alleen maar doen omdat je werkelijk geen flauw benul hebt van de enorme aantallen waarom het hier draait. Het is de enorme moeite niet waard om per artikel uit te zoeken of wat er staat überhaupt wel klopt, want als het blijkt te kloppen (in de zin dat de naam en de combinatie in elk geval door enkele deskundigen als geaccepteerd worden beschouwd), dan zit je alsnog met een leeg artikel. Dat moet je als encyclopedie helemaal niet willen bieden.
Ik heb enkele jaren geleden een klein deel van de door een andere bot aangemaakte artikelen gecheckt. Bij het vlindergeslacht Strymon stelde ik een soortenlijst samen op basis van alle artikeltjes die bij ons over een Strymon waren aangemaakt: 77 in totaal. Daarvan waren er drie daadwerkelijk een Strymon; de rest betrof namen die inmiddels in een ander geslacht waren geplaatst, of namen die helemaal niets betekenden, en alleen maar in databases voorkwamen en van elkaar gekopieerd werden. Het betekende, zo heb ik dat indertijd opgeschreven, dat bij ons de paradoxale toestand bestond dat het aantreffen van een artikel over een Strymon zo goed als een garantie was dat het geen Strymon betrof. Voor dat geslacht, en voor Lycaena en ook nog voor enkele verwante geslachten, heb ik het uitgezocht en gecorrigeerd. Dat is monnikenwerk. De oorzaak van alle fouten was het onjuist gebruik van een database (LepIndex). En het correctiewerk dat gedaan is, betreft slechts een druppel op een gloeiende plaat. De encyclopedie liegt haar gebruikers dus op grote schaal voor. En het wordt tijd dat er ook eens grootschalig iets aan gedaan wordt.
@De Wikischim: het lijkt me een uitermate slecht plan om een nl-versie van Wikispecies aan te gaan maken op basis van de huidige reeks van artikelen waarvan we in het grootste deel van de gevallen niet weten of het om een geaccepteerde naam gaat. Je zou dan de ene hoop desinformatie omzetten in een andere hoop desinformatie. Met dit soort voorstellen kunnen we niks. WIKIKLAAS overleg 26 mei 2021 13:43 (CEST)[reageer]
Het leuke van digitale databases is toch dat je op grote schaal kan checken op bepaalde eigenschappen (bv. 'geaccepteerde naam')? –bdijkstra (overleg) 26 mei 2021 13:52 (CEST)[reageer]
Als dit voor alle taxon geldt, dan lijkt het mij beter dat we dus alle taxonomische artikelen verwijderen, tenzij het om een uitgebreid artikel gaat. Voor de taxonomische artikelen die ik heb aangemaakt (dat is het astronomische aantal van 10 artikelen) durf ik in te staan voor de juistheid er van. Eentje is wel verbeterd door collega's omdat ik of de zaken niet goed heb begrepen, of mijn op dat moment toch recente informatie bleek achteraf achterhaald te zijn. Over de andere artikelen heb ik nog nooit iemand gehoord. Dqfn13 (overleg) 26 mei 2021 13:59 (CEST)[reageer]
@Bdijkstra: de grootste moeite heb ik met de Grashoofdbot-artikelen waarin allemaal identieke 'beschrijvingen' staan. Maar er zijn ook andere bots ontspoord. Je noemt het mooie van een digitale database dat je kunt checken op 'accepted name'. Bij WoRMS is dat zo (in elk geval nu, in mijn herinnering was dat tien jaar geleden anders). LepIndex, een database met ooit gepubliceerde namen van vlinders, heeft nooit de intentie gehad om uitspraken te doen over de acceptatie van een naam. Het doel was om van alle gepubliceerde namen de bibliografische gegevens te verzamelen: auteur, jaar en plaats van publicatie (plaats als in: tijdschrift of boek). De enige informatie die ze erbij geven is of een naam available is, dat wil zeggen: volgens de regelen der kunst gepubliceerd voor een taxon in de rang van ondersoort of hoger. Synoniemen zijn ook 'available names'. Maar de bot heeft over elke 'available name' in Lepindex een artikel aangemaakt. Voor veel namen dus met een andere combinatie dan de huidige omdat de database de basioniemen (of zo je wilt protoniemen) vermeldt, en dus ook over veel namen die inmiddels allang gesynonymiseerd zijn met een andere naam. Als de botbestuurder zich daarvan niet bewust is, dan gaat het mis, zoals ik hierboven met het geval Strymon heb geïllustreerd. WIKIKLAAS overleg 26 mei 2021 14:32 (CEST)[reageer]
Dat zo'n nominatie gedoe geeft, begrijp ik heel goed. De nuweg-criteria zijn heel strikt en op de verwijderlijst ontstaan discussies, daar is die voor.
Lees ik goed dat er zo'n 800.000 artikelen weg moeten? Handmatig gaat dat op basis van één (1) minuut per lemma 1700 werkdagen van acht uur kosten, dat gaat niemand doen. Het zal meer projectmatig moeten, waar deze kroegdiscussie een goede aanzet voor is.
Een goed begin lijkt me, om een weg tenzij-aanpak te gebruiken, een witte lijst dus. WoRMS-lemma's kunnen blijven of zijn minstens systematisch te controleren, begrijp ik. Verder kan alles blijven waar door een mens een ref aan toegevoegd of gewijzigd is, althans voorlopig, lijkt me. Zijn er meer of andere criteria voor zo'n witte lijst?  →bertux 26 mei 2021 15:21 (CEST)[reageer]
Zeer terecht dat dit, opnieuw, aan de orde wordt gesteld. Er is imo slechts een oplossing die werkbaar zal blijken. Ik heb daar eerder voor gepleit maar dat werd steeds weggehoond. Een bot kan geen lemma's schrijven, een bot kan ze hopelijk wel massaal verwijderen anders is de ellende niet te overzien. Prima als mensen hun best gaan doen om het op een andere manier op te lossen, maar eerlijk gezegd, het lijkt mij een vreselijke verspilling van energie en goede wil. Peter b (overleg) 26 mei 2021 15:31 (CEST)[reageer]
Ha, fijn, @Bertux: een praktisch voorstel. Een lemma met een afbeelding (handmatig van ons of via Wikidata) lijkt me een reden om zeer voorzichtig te zijn. En verder is het misschien een idee om eens met een proefprojectje te beginnen. Ik noemde hierboven de artikelen in de categorie Acoelomorpha. Dat zijn er 433, een aantal dat in mijn beleving te overzien is. WIKIKLAAS overleg 26 mei 2021 15:36 (CEST)[reageer]
Overigens vanuit de verwijderende moderator gedacht: met Twinkle is het mogelijk om meerdere artikelen tegelijk te verwijderen als deze artikelen op dezelfde pagina, of in dezelfde categorie, gelinkt staan. (Misschien kon dat voorheen ook al, maar dat is mij niet bekend.) Encycloon (overleg) 26 mei 2021 15:48 (CEST)[reageer]
De artikelen hoeven zeker niet alle 110.000 tegelijk en in 1x weg, dus een proefprojectje kan sowieso een goede start zijn. Zeker als dat in een hoekje is waar die bot er duidelijk een potje van heeft gemaakt, en er relatief weinig menselijk handelen tussen heeft gezeten, hoeft dat ook niet tot heel veel tegenstand te leiden. Maar aan de andere kant: hierboven wordt al gesteld dat de scope van sommige databases ruimer is dan sommigen hier nuttig achten. Het zal toch een discussie blijven tussen de rekkelijken en de preciezen, de een wil alle items uit een deelgebied beschrijven, een ander alleen de belangrijkste. Je kunt daar overeenstemming in willen bereiken, maar dat gaat in de praktijk toch niet lukken: discussie blijft er altijd. Edoderoo (overleg) 26 mei 2021 16:19 (CEST)[reageer]
Het is niet dat de scope van een database ruimer is dan sommigen nuttig achten. De bedoeling van het dierenproject was om over zoveel mogelijk bestaande soorten (en geslachten en hoger) een artikel aan te maken. En passant zijn er echter ook artikelen aangemaakt op basis van een naam die ofwel niet bestaat, ofwel een twijfelachtige status heeft, ofwel een synoniem van een andere naam is (waarover we dan ook een artikel hebben), ofwel een niet langer geaccepteerde combinatie omdat de soort inmiddels in een ander geslacht wordt geplaatst (en dan dus met een groot risico op het aanmaken van dubbele artikelen over één soort). En dat gebeurde doordat de scope van de database niet goed werd begrepen. Ik kan begrijpen dat er collega's zijn die vinden dat er alleen artikelen moeten worden aangemaakt over taxa waarover we meer weten dan alleen een naam. Ik kan het ook begrijpen dat er collega's zijn die over elke soort een beginnetje willen maken zodat het aanvullen ervan eenvoudig is als er extra kennis over gevonden wordt. Maar er is volgens mij niemand die het ooit een goed idee heeft gevonden of zal vinden om artikelen aan te maken op basis van namen die niet de geaccepteerde naam van een taxon zijn. Dat stond ook het dierenproject niet voor ogen maar het is helaas wél wat er op ruime schaal is gebeurd. Onder meer door databases te gebruiken die niet geschikt waren voor het doel dat het dierenproject voor ogen stond.
De reden dat ik deze discussie ben begonnen is het aanpakken van die desinformatie. Het zou natuurlijk verdomd handig zijn als elk artikel dat we onterecht hebben een vlag had die dat aangaf. Maar dat is niet zo, dus je zou dat van artikel tot artikel individueel moeten uitzoeken. Dat zal in de praktijk ondoenlijk blijken voor de meeste groepen (bij de libellen was het wél goed te doen, maar dat is eerder een uitzondering). En mijn stelling is dat je dan bij een groep waarbij onmiskenbaar veel overbodige artikelen zijn aangemaakt, beter alle artikelen kunt opruimen waarin uitsluitend de naam, auteur en taxonomische positie van een taxon worden genoemd, omdat je niet weet welke correct zijn, en welke niet, en je geen andere manier hebt om het verspreiden van desinformatie tegen te gaan. WIKIKLAAS overleg 26 mei 2021 18:05 (CEST)[reageer]
De kreet "een soort die de wetenschap een tijd heeft gevoerd, en vervolgens heeft afgevoerd," wordt te pas en te onpas gebruikt. Iets is niet zomaar de wetenschappelijke naam van een soort. Als twee mensen in een café zitten en op een bierviltje iets schrijven als "de boom voor café In de Bierkelder vinden wij een nieuwe soort en we noemen hem Arbor magnifica, [etc], [etc]", dan is dat nog geen wetenschappelijke naam van een soort. Als een van die mensen in een drukkerij werkt en vijfhonderd van die bierviltjes drukt gaat er al iets schuiven, en als die drukkerij een tijdschrift drukt waarin die opmerking stiekem ingevoegd wordt ligt het alweer anders. In ruim tweeënhalve eeuw is er een heel scala aan al-dan-niet-gepubliceerde namen verschenen. En sinds zo een eeuw zijn er dan ook regels over wat wel en niet een formele wetenschappelijke naam is, en welke wetenschappelijke naam wanneer gebruikt mag worden. Formele wetenschappelijke namen zijn formele eenheden met eigen bestaansrecht.
        En die formele wetenschappelijke namen zijn er in alle soorten en maten. Er zijn hele categoriën van namen die nooit als correcte naam van enig taxon gebruikt zijn, en nooit gebruikt kunnen zijn, per definitie. En nog andere categoriën. Dus als men gaat zoeken in een database is het uitkijken. En zelfs als een database "betrouwbaar" is wil dat nog niet zeggen dat het een afdoende bron is. Een telefooboek kan ook heel betrouwbaar zijn, maar is niet geschikt als basis voor lemma's. - Brya (overleg) 26 mei 2021 19:04 (CEST)[reageer]
Speciaal voor Edoderoo, maar ook voor eventuele andere geïnteresseerden heb ik, om dit overleg verder niet te vervuilen, in mijn eigen naamruimte een stuk aangemaakt over "Een soort die de wetenschap een tijd heeft gevoerd, en vervolgens heeft afgevoerd". WIKIKLAAS overleg 27 mei 2021 01:32 (CEST)[reageer]
Bevinden die verkeerde Grashoofdbot-artikelen zich ook in andere Wikipedia-taalversies? Kortom, zijn ze door iemand met een bot vertaald? En maakt ook Wikidata gebruik van de verkeerde gegevens van Grashoofdbot? HT (overleg) 27 mei 2021 07:26 (CEST)[reageer]
Je raakt daar een volgend probleem, HT. Of de artikelen van Grashoofdbot vertaald zijn weet ik niet. Van Joopwikibot daarentegen ben ik wél eens massaal botmatige vertalingen in een andere taalversie tegengekomen, ik meen dat het de Vietnamese (viwiki) was. Maar van veel van de artikelen van Grashoofdbot bestaan wel anderstalige versies omdat Lsjbot die heeft aangemaakt op basis van dezelfde bronnen, maar nog minder kritisch dan Grashoofd.
Ik beschreef elders de 319 Lycaena-artikelen bij ons, omdat Joopwikibot iedere available name in LepIndex in een artikel had omgezet; Lsjbot maakte het nog veel bonter: die spuwde er ruim 600 uit omdat hij ook elke naam die nota bene expliciet als unavailable was gelabeld in een artikel omzette, alsof het een geaccepteerde soort betrof. Ik heb dat recent hier nog genoemd om het probleem van botartikelen te schetsen, en ik heb het ooit hier aangekaart op de OP van het dierenproject van de Zweedse Wikipedia.
Omdat Lsjbot op vier taalversies enkele miljoenen artikelen per taalversie heeft geproduceerd, zijn die namen ook allemaal gekoppeld en in WikiData terechtgekomen. Brya noemde hierboven al de items over gefabriekte niet-bestaande namen daar. Misschien kan Edoderoo vertellen of een naam ook automatisch in WikiData terechtkomt als er maar één taalversie is met een artikel, maar volgens mij ben ik zelf in WikiData ook al wel eens een item tegengekomen waar maar één taalversie een artikel over had, dus ik vrees dat het antwoord 'ja' is. Het was ook vanwege de links in Wikidata dat ik indertijd besloot om op de Zweedse Wikipedia aan de bel te trekken over de uitwassen van Lsjbot. Want op het gebied van taxonomie behoren de Wikipedia's en WikiData op dit moment tot de grootste verspreiders van desinformatie. WIKIKLAAS overleg 27 mei 2021 14:06 (CEST)[reageer]
De problemen op Wikidata zijn groter dan dat. Het is niet alleen dat lemma's op diverse Wikipedia's over niet-bestaande soorten serieus genomen worden, er zijn ook gebruikers die willens en wetens items maken met niet-bestaande soorten. Dit onder het motto "als er een naam is, is er ook een soort", wat je reinste Origineel Onderzoek is. - Brya (overleg) 27 mei 2021 18:27 (CEST)[reageer]
Het leek me niet erg hoffelijk om deze discussie hier te voeren zonder de aanmaker van de artikelen daarvan op de hoogte te brengen. Ik had dus, met lood in de schoenen, dat wel, een bericht achtergelaten op de OP van Grashoofd. De reactie die daarop volgde was buitengewoon sportief en volwassen: "Tien jaar later kan ik niet anders dan het met je motivatie eens zijn. Mijn zegen zou je in ieder geval hebben om het zwikkie te verwijderen waarvan duidelijk aantoonbaar is dat het onjuiste informatie bevat. Laat ik nog een stapje verder gaan: mijn zegen heb je zelfs om alle taxon-beginnetjes uit de hand van de bot desgewenst te verwijderen. Het ging 10 jaar geleden inderdaad om die mijlpaal van een miljoen en totaal niet om de inhoud/E-waarde. Nu ik ouder en wijzer ben, stel ik voor: Laten we daar nu maar eens wat aan doen. Hopelijk krijg je het erdoor." Op het gesputter van Edoderoo hierboven na, merk ik dat er slechts bijval is om dit aan te pakken. Ik denk dat we het er op een andere plek over moeten gaan hebben hoe we het technisch precies aanpakken. Lymantria denkt er ook over mee. Ik hoop dat Joopwiki nog wat tijd heeft, want die is goed in het omgaan met digitale gegevens. Ik hoop ook op meedenken door bdijkstra, en wellicht zijn er andere collega's die zich geroepen voelen om hun vaardigheden beschikbaar te houden. En ik merk dat bertux praktische suggesties had. Ik kom hier na het weekend op terug. WIKIKLAAS overleg 28 mei 2021 13:26 (CEST)[reageer]
Dat is inderdaad een buitengewoon sportieve reactie. Complimenten aan jullie beiden! Vinvlugt (overleg) 28 mei 2021 16:53 (CEST)[reageer]
Dit probleem van de botartikelen kan in feite eenvoudig opgelost worden. Zet bovenaan elk dergelijk artikel een banner met een neutrale bewoording zoals "De correctheid van dit artikel is nog niet nagezien" (dit kan gebeuren met een bot). Ik werk in de en.wikipedia al zeventien jaar aan het aanvullen van dergelijke botartikelen (die veel beter werden ontworpen dan alhier). Vele duizenden zijn reeds de revue gepasseerd en hopelijk kan ik dit nog enkele jaren doen. Waarom neemt niemand de moeite hiervoor in de nl.wikipedia ? Zo moeilijk is het ook niet. Ik ben ook van quasi het nulpunt moeten beginnen. Men kan dit reeds op eenvoudige wijze doen, door de vele duizenden foto's uit de commons naar hier te importeren in de botartikels (controleer wel even of deze foto's wel de aanvaarde naam geven ofwel een vroeger synoniem). Elke foto zegt reeds meer dan een eenvoudige tekst. Verschillende vooraanstaande natuurhistorische musea hebben hun uitgebreide fotocollectie geschonken aan de commons. Waarom er dan geen gebruik van maken ? En als men dan ook de taxonomie controleert, kan men dan eveneens de banner verwijderen. JoJan (overleg) 28 mei 2021 17:46 (CEST)[reageer]
Wikiklaas heeft dus jarenlang zeer intensief aan dergelijke artikelen gewerkt. Maar er komt geen einde aan. Ook niet na 20 of 30 jaar. Natuur12 (overleg) 28 mei 2021 19:15 (CEST)[reageer]
Ik zie mijn naam hierboven ook af en toe staan. Dus ook van mij even een reactie m.b.t. bot-aanmaak. Ik maak een onderverdeling wat wel c.q. minder goed is gegaan in de tijd dat er veel diersoorten per bot werden aangemaakt. Goede (naar mijn menig) in ieder geval e.e.a. via de Worms en daaraan gelinkte datasets. Ik heb hierbij zelf n.a.v. nader onderzoek ook verbetering aan de Worms dataset laten aanbrengen o.a. bij de beerdiertjes; Spinnen, vogels en vissen hebben ook een goede onderliggende dataset en zoogdieren ook zover ik me kan herinneren. Minder goed het werk via de Lepindex alhoewel ik hier ook betere stukken heb toegevoegd via een crosslink met de gegevens in Funet en de daarin genoemde bronnen, daarnaast komen niet alle vlinders uit de Lepindex dus meerdere delen van de vlinders zijn wel betrouwbaar.. Bij de overige grote groepen van insecten durf ik geen uitspraak meer te doen over bijv. de gearchiveerde Hallan dataset, of zaken gerelateerd aan kevers (nu alleen betaalde toegang.) Wel denk ik dat er ook hier groepen zullen zijn die goed cq minder goed zijn. Mijn conclusie is dat alles weg doen niet noodzakelijk is en ik blijf op het standpunt staan dat ieder werkelijk bestaand of uitgestorven beestje een plaats op Wikipedia verdient. Vergeet daarbij niet dat e.e. een levend iets is, ook nu nog wijzigen namen steeds, door verplaatsingen naar andere geslachten en of het plaatsen als synoniem. Alleen het volgen van Zootaxa of de wijzigingen in Worms is voor een eenling onmogelijk.Joopwiki (overleg) 28 mei 2021 20:31 (CEST)[reageer]
Het gaat er in hoofdzaak om dat de taxonomische naamgeving die in de hier ter discussies staande botartikelen wordt gebruikt voor het overgrote deel onjuist en/of achterhaald lijkt, althans dat is wat ik uit de bijdragen hierboven van m.n. Wikiklaas opmaak. Verder is het enerzijds natuurlijk zo dat elk wetenschappelijk beschreven diersoort, hoe weinig info er ook over voorhanden is, in principe voldoet aan de regels voor encyclopedische relevantie. Alleen is het allemaal vaak zo mager dat je je moet afvragen of je nu echt vele honderdduizenden, zo niet miljoenen van dit soort ultrakorte artikelen in de encyclopedie moet willen (vooropgesteld uiteraard dat de info in de artikeltjes inhoudelijk correct is, anders moeten ze hoe dan ook worden verwijderd). Een project als Wikispecies zou zich in de basis veel beter voor al dit soort gegevens lenen (ik zeg hier dus helemaal niet dat die info nergens binnen de projecten een plaats mag hebben, integendeel). Het rare is dan weer dat er van Species momenteel geen anderstalige versies dan de Engelse lijkt te bestaan (er zijn alleen maar hoofdpagina's in allerlei andere talen waaronder het Nederlands).
Dus we zijn hier nog niet uit. Wikispecies-nl mèt echte inhoud zou een oplossing kunnen zijn (overigens eentje die o.a. ikzelf jaren geleden ook al heb voorgesteld, maar iedere keer werd dat weer van tafel geveegd waardoor we dus nog altijd met deze onopgeloste kwestie zitten). De Wikischim (overleg) 29 mei 2021 00:02 (CEST)[reageer]
We zitten niet met deze onopgeloste kwestie doordat het voorstel van De Wikischim telkens van tafel wordt geveegd. We zitten met deze kwestie doordat van de medewerkers die er zich mee bezighouden (in de breedste zin, dus ook in overleg in de kroeg) er te weinig een taxonomische achtergrond hebben, en er tot nu toe te weinig mensen van overtuigd waren dat er een ernstig probleem was. Daardoor was het onmogelijk het op een andere manier aan te pakken dan artikel voor artikel, en dan moest je keeper Edoderoo nog passeren. En dat is ondoenlijk gebleken. Dat het voorstel van de Wikischim telkens van tafel werd geveegd mag beschouwd worden als een van de weinige lichtpuntjes in deze hele kwestie. Met dat voorstel zouden we namelijk de ene hoop onbetrouwbare data hebben omgezet in een andere hoop even onbetrouwbare data.
Ik vat het probleem nog even samen, ook voor Jojan. In de eerste plaats is er een forse hoeveelheid artikelen aangemaakt met een generieke tekst die suggereert dat het om een beschrijving van een soort gaat maar dat niet doet (zoals ik hierboven heb geciteerd voor de stekelhuidigen). Die generieke tekst moet sowieso weg. Daarbij was/is niet elke bij het dierenproject gebruikte database even betrouwbaar, en zijn de botbestuurders niet altijd even zorgvuldig geweest met het selecteren van de records uit die databases, waardoor er veel soort-artikelen zijn aangemaakt op basis van een naam die geen soort representeert. Dat doet zich bij de ene groep in ernsiger mate voor dan bij de andere. Bij de vlinders die niet uit Afromoths zijn gehaald, is het evident een probleem. Ik noem steeds dat voorbeeld omdat ik er goed mee bekend ben. Het scheiden van artikelen met 'correcte data' van artikelen met 'incorrecte data' is bij veel diergroepen lastig (maar WoRMS heeft tegenwoordig een statement 'accepted' of 'not accepted' bij elke naam, dus als een bot dat kan uitlezen, zou er voor namen die uit WoRMS komen, automatisch geselecteerd kunnen worden). Waar het selecteren lastig is, is het de vraag hoe ernstig het is om en passant ook artikelen met 'correcte data' weg te gooien, als die in wezen niet meer inhouden dan een wetenschappelijke naam met een auteur, gegevens die inderdaad beter thuis zijn in Wikispecies. WIKIKLAAS overleg 29 mei 2021 12:05 (CEST)[reageer]
Je noemt AfroMoths, ik zou daaraan Fauna Europaea willen toevoegen, hoewel die hun identificatiecodes op zeker moment helemaal hebben omgegooid. Lymantria overleg 30 mei 2021 12:32 (CEST)[reageer]
De samenvatting is niet compleet: deze lemma's bevatten geen informatie, maar alleen data. En lemma's met alleen data zijn hier verboden (Wat Wikipedia niet is). Het is dan wel zo dat er hier onder gebruikers niet genoeg kennis is om te (h)erkennen dat deze lemma's geen informatie bevatten; en daarnaast is het ook nog eens inderdaad zo dat in sommige gevallen zelfs de data niet kloppen. Het voorstel van De Wikischim heeft het voordeel van het probleem over de schutting te gooien. - Brya (overleg) 29 mei 2021 14:15 (CEST)[reageer]
Ik denk dat menig gebruiker wel ziet dat deze artikeltjes vrijwel geen informatie bevatten. Maar als je daar over begint, krijg je te horen 'beestjes zijn altijd EW' of 'het beestje staat in een database en is dus verifieerbaar en dús EW'. En aangezien we het over gigantische aantallen artikelen hebben, is er ook geen beginnen aan om er iets tegen te doen. Net als menig andere regel op WP:NIET leven we ook deze regel niet na. Thieu1972 (overleg) 29 mei 2021 14:51 (CEST)[reageer]
Een beetje flauw, maar 'data' is niets anders dan 'informatie' in een ruwe vorm. Wat je wil onderscheiden is 'redundant/overtollig' informatie, die is af te leiden uit de naam en klassificatie. Een vlinder zal altijd vleugels hebben en voortgekomen zijn uit een larve(rups). Dat de vlinder blauwe vleugels heeft, zich voed met bepaalde bloemen, alleen in een bepaald gebied voorkomt en maar een week leeft, is wel informatie die specifiek aan de vlindersoort gekoppeld kan zijn. Probleem is dat je een robot geen teksten kan laten analyseren of er inhoudelijke relevante informatie in het artikel aanwezig is. Met gegevens afkomstig van Wikidata kan dit wel, daar je kan selecteren op ingevulde eigenschappen die wel of niet relevant zijn. Van een goed ingevulde complete wikidata-item kan wel automatisch een NL artikel aangemaakt worden. Dan vertrek je wel van alleen 'data'. Maar als wij meer willen dan de data die al in de infobox staat, zal aanvullende tekst (niet-robot) verplicht zijn. Maar dan nog kunnen wij niet automatisch onzin bijdragen opsporen. Dan kan een voorselectie op bewerkingen van bekende 'misbruikers' wel een hulpmiddel zijn. Doel is van zoveel mogelijk werk door scripts te laten doen en veel handwerk te vermijden.Smiley.toerist (overleg) 29 mei 2021 14:56 (CEST)[reageer]
Auw "'data' is niets anders dan 'informatie' in een ruwe vorm"!!! Het is allicht beter om eerst iets terug op te zoeken alvorens het zo unverfroren neer te schrijven. - Brya (overleg) 29 mei 2021 18:05 (CEST)[reageer]
Een bot kan wél rapporteren of een groep artikelen allemaal tweezinners zijn van dezelfde vorm. –bdijkstra (overleg) 29 mei 2021 19:29 (CEST)[reageer]
De hier genoemde taxon-lemma’s zijn door een bot gemaakt en zullen dus ook door een bot verwijderd kunnen worden. Dat er dan ook lemma’s kunnen verdwijnen die wèl deugen, dat is dan maar zo. Het verwijderen van de lemma’s met de verkeerde informatie gaat, vrees ik, anders te lang duren. Van mij mag Wikiklaas zijn gang gaan. HT (overleg) 30 mei 2021 00:37 (CEST)[reageer]
Als een bot met verwijderrechten is wat Wikiklaas nodig heeft dan kan dat in goed overleg denk ik best gerealiseerd worden. Wat mij betreft is elk mogelijk hulpmiddel bespreekbaar. Natuur12 (overleg) 30 mei 2021 01:52 (CEST)[reageer]
Nog even met een botje gekeken. Er zijn iets meer dan 118.000 verwijzing naar de lepindex.Joopwiki (overleg) 1 jun 2021 21:17 (CEST)[reageer]

Sluipwespen[bewerken | brontekst bewerken]

bdijkstra, zou je eens een dergelijk botje op de 22K artikelen in de Categorie:Gewone_sluipwesp los kunnen laten? Dus een subcategorie of andere flag aanmaken die aangeven dat een artikel wél andere informatie bevat dan de tweezinners. Netto kan dan het overige, dat niet die flag gekregen heeft botmatig weg. NB, ik denk dat ook de artikelen over geslachten weg kunnen tenzij ze encyclopedische informatie bevatten, dat zijn in het algemeen alleen maar lijsten met verder informatieloze taxa. (database headers). Milliped (overleg) 1 jun 2021 22:03 (CEST)[reageer]
@Milliped: Van de bijna 21 duizend pagina's in die categorie zijn er zo'n 500 geslachten en zo'n 100 soorten die géén tweezinner zijn. Ik heb een lijstje gemaakt van de soorten op Gebruiker:Bdijkstra/dump/Niet-triviale gewone sluipwespen. –bdijkstra (overleg) 7 jun 2021 10:23 (CEST)[reageer]
Dank bdijkstra! Ik zie dat je in de dump soorten hebt staan, hoe heb je de geslachten uitgesoorteerd? Ik ben de dump nog even handmatig aan het nalopen, daar zit ook nog een paar artikelen tussen die geen inhoudelijke beschrijving van het onderwerp kennen. Nu eem beetje de vraag wat te doen met de rest. De kans bestaat wel straks iemand een botrun gaat doen waar de informatie "dit insect heeft pootjes" of iets anders triviaals, maar dat zal het probleem vangebrek aan encyclopedische inhoud niet verhelpen. Me dunkt dat de overgebleven 21K artikelen niet op het Nederlandstalige Wikipediaproject thuishoren, maar ik kan me voorstellen dat ergens iemand blij is met een vrij bewerkbare, GFDL beschikbare taxonomie database. Mijn voorstel zou dus zijn om deze categorie, minus de excepties in de lijst van Bdijkstra staat, op Wikipedia te verwijderen, en eventueel de dump van de huidige categorie op een nieuw op te zetten nl.wikispecies.org te zetten. Wat betreft het verwijderen: We hebben al eerder massaverwijderingen gehad, het idee is wel om dat zorgvuldig te doen. Wat niet echt mogelijk is 20K artikelen los nomineren. Dat zou via de verwijderlijst te doen zijn, waarbij liefhebbers aan kunnen geven welke artikelen om andere redenen behouden moeten blijven. Milliped (overleg) 7 jun 2021 13:31 (CEST)[reageer]
Initieel had ik alleen artikelen getest met een titel van twee of meer woorden, maar er blijken ook wat triviale namen tussen te staan dus nu heb ik de geslachten uitgesorteerd via " (geslacht)" in de titel en via de parameter taxon in de infobox. –bdijkstra (overleg) 7 jun 2021 14:28 (CEST)[reageer]
Dat ziet er goed uit! Een steekproef laat me zien dat het klopt. Ik denk dat we dan dus de geslachten vooralsnog met rust laten, maar misschien dat dat dan een losse lijst zal moeten worden opdat deze als whitelist gebruikt zal moeten worden. Ik denk dan dat het proces moet zijn dat dan de overige categorieinhoud genomineerd moet worden op WP:TBP, en dat na twee weken het script nogmaals moet gedraaid moet worden om te kijken of er iets veranderd is en op de whitelist , en vervolgens alles wat in de categorie staat en niet gewhitelist is verwijderd kan worden. Milliped (overleg) 8 jun 2021 11:46 (CEST)[reageer]

Vraag in het Kunstcafe[bewerken | brontekst bewerken]

Bij gebrek aan een specifiek literaire cafe verwijs ik ook hier even naar mijn vragen in het Kunstcafé over het literaire tijdschrift Lumière (tijdschrift en vereniging). Vriendelijke groet Geerestein (overleg) 8 jun 2021 14:00 (CEST)[reageer]