Wikipedia:De kroeg/Archief/20211203

Uit Wikipedia, de vrije encyclopedie

(Kopje afgesplitst van #Verslag Wiki conferentie hierboven)

Wie oprechte belangstelling voor mijn presentatie heeft, kan een keer in zoom/teams/hangouts een demonstratie krijgen. Contact via het e-mail-formulier voor belangstellenden. Ik heb zaterdag laten zien hoe ik met een pythonscript en enkele sjablonen een opzetje van een artikel vanuit een WikiData-item maak. Het artikeltje is dan vaak nog een beginnetje, maar de infobox, structuur en bronnen krijg je dan op een presenteerblaadje. Mogelijk ook interessant voor de "kleinere" wiki's. Edoderoo (overleg) 16 nov 2021 18:44 (CET)[reageer]
Yuk, wat een vreselijk plan om met een pythonscript en enkele sjablonen een lemma te genereren. Volgens mij is er op die wiki-conferentie iets overgeslagen. Namelijk of we wel die kant op willen: naar de eenvoudigste en dus luiste manier om een lemma te creëren, dat natuurlijk ook nog eens ultrakort moet zijn. We moeten echt stoppen met het toejuichen, faciliteren en wat al niet meer van het creëren van zogenaamde "beginnetjes'. Het enige dat hier echt lijkt te tellen is wie de langste heeft, ofwel wie heeft de Wikipedia-versie met de meeste lemma's. Terwijl kenners weten dat het juist om de dikte (lees: verdieping) gaat. HT (overleg) 16 nov 2021 19:16 (CET)[reageer]
Niemand houd je toch tegen om dat saaie uitzoekwerk, dat we allemaal moeten doen, dan maar over te slaan? Ik krijg tenminste een lijst met bronnen kado, en kan de geboortedatum niet meer verkeerd overtypen. Dat jij dat een slecht idee vindt, zegt meer over jou dan over mijn script, denk ik dan maar. Edoderoo (overleg) 17 nov 2021 07:09 (CET)[reageer]
Eens met Edo, en ook een klein beetje met HT. Het lijkt me dat artikelen waar al een frame klaarstaat eerder beter dan slechter zullen uitpakken: je houdt meer tijd over voor het echte werk. Dat geestdodende werk is een van de redenen waardoor ik weinig nieuwe artikelen schrijf. Anderzijds bevat Wikidata veel gegevens van onbekende kwaliteit, die kunnen niet klakkeloos overgenomen worden. Misschien kan dat script aan het frame een onderhoudscategorie toevoegen, zodat na te gaan is hoe het op termijn uitpakt?  →bertux 17 nov 2021 08:25 (CET)[reageer]
Wikidata is voor een flink deel opgebouwd met Wikipedia als bron en die gegevens zijn weer deels zonder bron. Wikipedia is geen betrouwbare bron, maar wordt met Edo's opzet wel gebracht als zaligmakend. Feitelijk wordt met dat pythonscript alles, maar dan ook echt alles dat op Wikipedia staat betrouwbaar en geschikt verklaard om zonder enige controle op WP:NL over te nemen. Dan heb ik het nog niet over door gebruikers zelfbedachte verkeerde feiten die op Wikidata geplaatst worden. Over de kwaliteit van Wikidata zijn de meningen verdeeld, hier heb je er twee: hier en hier. Het heeft verder geen zin om een encyclopedie op te bouwen met tweeregelige lemma's. Twee derde van de lezers in Nederland kiezen nu al voor de Engelstalige Wikipedia, waar wél uitgebreide lemma's te vinden zijn. Het geopperde plan is alleen maar leuk voor personen die zoveel mogelijk zelf aangemaakte lemma's op hun naam willen hebben staan. Met kwaliteit heeft het echt niets van doen. Maar WP:NL krijgt de encyclopedie die het verdient. HT (overleg) 17 nov 2021 08:47 (CET)[reageer]
Wat is er mis mee als je vijftig uur aan een lemma besteedt en de feiten dubbelcheckt, en daarbij een scriptje gebruikt om een kwartier stomvervelend werk uit te sparen? Dat lijkt me een zinvolle toepassing en dat is hoe ik graag zou werken. Dat het ook anders kan, begrijp ik, maar wie onzorgvuldig genoeg is om ratseflats een artikel in elkaar te flansen, is dat zonder script ook, de artikelen bewijzen het.
Ik vermoed dat de artikelkwaliteit voornamelijk van de auteur afhangt, niet van de werkwijze. Voor mij persoonlijk geldt dat zeker: artikelen waar ik veel uren in gestoken heb en tevreden over ben, liggen zeer dicht bij elkaar qua kwaliteit, zonder dat ik daar speciaal op uit was. Misschien zouden we dat eens moeten doen: een steekproef maken van drie artikelen per auteur en daar een collegiale kwaliteitsscore aanhangen. Wie ontevreden is met het resultaat, kan een nieuwe steekproef vragen, maar weet in negen van de tien gevallen dat hij werk te doen heeft  →bertux 17 nov 2021 09:44 (CET)[reageer]
Gelukkig heeft HT echt geen enkel idee waar hij het over heeft, en roept hij maar wat. HT, ga al mijn nieuwe artikelen maar na, en pleur ze op de beoordelingslijst, want als ik jouw zo volg, zijn al mijn artikelen totaal onbetrouwbaar en gebruik ik klaarblijkelijk overal bronnen die enkel liegen. Een beetje weinig GUVGW weer vandaag. Edoderoo (overleg) 17 nov 2021 10:09 (CET)[reageer]
Wat er mis mee is, is dat wanneer een scriptje gebruikt wordt de kans bestaat dat artikelen werkelijk alleen op basis van dat script aangemaakt worden. Er zijn legio voorbeelden van dat soort artikelen waarvan de 'bronnen' louter bestaan uit databases wat schuurt met WP:NIET/CM en wat slordigheidsfouten en relevantieproblemen oplevert. Zo'n script lijkt te leiden tot een focus op kwantiteit; zo snel mogelijk zoveel mogelijk artikelen aanmaken, maar aanvulling op basis van bronnen die het onderwerp beschrijven of een controleslag achteraf blijft dan achterwege. hiro the club is open 17 nov 2021 10:14 (CET)[reageer]
Daarvoor leek mij een onderhoudscategorie zinvol: een artikel dat daar een maand in staat zonder veel nabewerking kan genomineerd worden voor verwijdering  →bertux 17 nov 2021 10:18 (CET)[reageer]
Laten we niet naïef zijn mensen, er worden elke dag artikelen gemaakt over bijv voetbalspelers die maar uit 2 regels bestaan. Dus het is niet zo er hier iets nieuws gebeurt. Ik kan alleen maar toejuichen dat er een vast opzetje is van een infobox en gebruik van bronnen. Zouden meer artikelen moeten hebben, naar mijn mening. Het lijkt mij wel interessant om eens mee te kijken @Edoderoo. Met vriendelijke groeten, Crazyphunk 17 nov 2021 11:49 (CET)[reageer]
Ja, er verschijnen meer artikelen die uit twee regels bestaan. Maar laten we dat alsjeblieft niet gaan faciliteren door scripts te gaan gebruiken die zich baseren op brakke bronnen - waaronder Wikidata - die heel gemakkelijk tot fouten en - verwijzend naar het transliteratieprobleem - interne inconsistentie kunnen leiden. Ik zou alleen maar toe kunnen juichen dat we eens meer aandacht gaan schenken aan kwaliteit in plaats van kwantiteit. hiro the club is open 18 nov 2021 01:46 (CET)[reageer]
Gebruiker:Happytravels heeft in de kern een duidelijk punt: Wikidata is inderdaad opgebouwd uit ongelijksoortige en soms niet-gecontroleerde bronnen, en gebruik van die data kan heel nuttig zijn, maar kan je niet zomaar blind toepassen. Bij gebruik van deze werkwijze zou je dus moeten overwegen om standaard een twijfel-sjabloon (met verklaring) aan het nieuwe artikel toe te voegen, zodat de status duidelijk is, en er er in principe controle komt op semi-automatisch aangemaakte artikelen. Gebruikers die wat al te gemakkelijk met feiten omgaan, straffen we soms hardhandig af, en om kwaliteit te waarborgen moet je niet al te snel overgaan tot op grote schaal importeren van gegevens naar nieuwe artikelen. Hetzelfde geldt voor vertalingen van artikelen uit andere taalversies: als je dat één op één doet, mis je vaak de voor Nederland en België specifiek interessante feiten. Vysotsky (overleg) 17 nov 2021 10:34 (CET)[reageer]
Mijn artikelen zijn zeker niet semi-automatisch. Het gemak waarmee mijn script in verband wordt gebracht met onbronde onzin die zomaar grootschalig in Wikipedia wordt gekieperd is best zorgelijk te noemen. Edoderoo (overleg) 17 nov 2021 16:49 (CET)[reageer]
Ik denk inderdaad dat het samenstellen van een artikel op basis van properties in Wikidata niet gelijk is aan de grootschalige botimport die we hier ~12 jaar geleden hadden, van allerlei dorpjes, beestjes en soortgelijken. Ik denk dat wij (nl-wp), en met ons de internationale gemeenschap, hier wel van heeft geleerd: geloof het of niet, deze fout is echt internationaal bekend. Op Wikidata is makkelijk terug te vinden welke bron bij welke items gebruikt wordt, en ik kan me voorstellen dat je daarmee kunt selecteren welke properties wel of niet gebruikt worden voor het aanmaken van een artikel. Maar misschien moet ik daarvoor even op Edo's aanbod ingaan en een Zoomsessie bijwonen waarin hij uitlegt hoe hij werkt! Ciell need me? ping me! 17 nov 2021 17:36 (CET)[reageer]
Ik pas zeer regelmatig onjuiste zaken aan op wikidata. Zeker niet alle data die daar staat is correct, ook betrouwbare referenties (bij bijvoorbeeld geboorte of sterfdata) ontbreken zeer regelmatig. Ik zou er dus voor willen pleiten om zeer voorzichtig om te gaan met importeren van data die van wikidata komt. Vr groet Saschaporsche (overleg) 17 nov 2021 17:55 (CET)[reageer]
Een script zou natuurlijk verklaringen zonder bron kunnen overslaan, alsook verklaringen met alleen Wikipedia als bron. –bdijkstra (overleg) 17 nov 2021 17:58 (CET)[reageer]
Järveküla (Rae) is een van de artikelen die in 2012 door een bot zijn aangemaakt op basis van het corresponderende artikel in de Poolse Wikipedia. Het enige dat sindsdien met het artikel is gebeurd is dat het aantal inwoners is geactualiseerd. Als je dit artikel opnieuw zou laten aanmaken door een bot, maar nu op basis van Wikidata, krijg je dan iets heel anders? Sijtze Reurich (overleg) 17 nov 2021 22:52 (CET)[reageer]
@Edoderoo Je vroeg naar een recent lemma van jou waarin je onzin schreef. Ik verwijs naar een tweeregelig lemma van jou (dit), waarin je in de lopende tekst de naam Anna Wiktorowna Wjachirewa geeft en in de infobox Anna Viktorovna Vyakhireva. Beide transcripties zullen wel kloppen, maar er is geen hond die weet hoe haar naam nu geschreven moet worden. Nog dezelfde dag werd de lemmatitel door een andere gebruiker aangepast en stonden er van haar naam ineens drie verschillende schrijfwijzen in het lemma. Jij was in geen velden of wegen meer te bekennen om als aanmaker van het lemma in deze chaos orde te scheppen. Luiheid, na mij de zondvloed en iets met haastige spoed zijn zo maar enkele gedachten die mij dan te binnen schieten. Ik vind het verder bijzonder zorgelijk dat je blijkbaar een geautomatiseerd script nodig hebt om te voorkomen dat je een geboortedatum verkeerd overneemt, zoals je hierboven feitelijk aangeeft. mvg. HT (overleg) 17 nov 2021 23:39 (CET)[reageer]
Laten we er vooral even op letten op dat we geen geen persoonlijke aanvallen uitdelen. Nergens voor nodig. Met vriendelijke groeten, Crazyphunk 18 nov 2021 00:00 (CET)[reageer]
Even een jij-bak. Het belerende gedoe door de zich Happytravels noemende collega begint mij danig de keel uit te hangen. Ik heb even gezocht naar de prachtige nieuwe artikelen die deze geschreven zou hebben. Met moeite heb ik er twee gevonden, deze over de Olympische zomerspelen 2021, geschreven met glazen bol op 24 maart 2020, en deze uit 2019 over een prijs. Beiden ontstijgen echt niet het niveau van de meest luie collega hier. Beide artikelen zijn niet meer dan wat bijeengeraapte feitjes. Kortom, de "beste stuurman" staat aan wal te roepen dat een ander lui zou zijn? Te belachelijk voor woorden, een harder werkende collega zo uit te maken. Ik zou zeggen, de pot verwijt de ketel of nog erger. Verder terug heb ik niet gezocht, misschien zijn er voor september 2019 wel de nodige parels verschenen. Ik laat mij graag overtuigen. Elly (overleg) 18 nov 2021 04:07 (CET)[reageer]
@Ellywa: Ik schrijf al enkele jaren vrijwel geen nieuwe lemma's meer, maar houd mij vooral bezig met bestaande te verbeteren en uit te breiden. Het eerste voorbeeld dat je aanhaalt ben ik slechts begonnen omdat er net in die tijd veelal werd geschreven over "wordt gehouden", terwijl we midden in de coronapandemie zaten en het doorgaan van grote evenementen volstrekt onzeker was. Het lemma was een poging om in elk geval een aantal basale gegevens correct weer te geven, voordat iemand anders ze verkeerd bracht. Dat ik het lemma met een "glazen bol" zou hebben geschreven, laat ik voor jouw rekening. Het tweede voorbeeld is een afsplitsing van het lemma Johan de Witt, waarin diverse prijswinnaars werden besproken die daarin helemaal niet thuishoorden. En ook al was het door jou genoemde lemma nog geen 3000 bytes bij aanvang, er is toen naarstig gezocht naar de juiste formuleringen over wat die prijs precies inhield. Wat Johan de Witt verder betreft, ik heb op WP:NL meer over hem geschreven dan alle anderen hier samen. Mijn opzet van het lemma Moord op de gebroeders De Witt (bij aanmaak 21.000 bytes) kwam terug in een boek over die dubbele moord. Ik zeg niet dat het van mij werd afgekeken, maar ik was wel eerder. Inmiddels heb ik de afgelopen dikke vier jaar speciaal voor mijn werk aan Wikipedia meer dan honderd non-fictie boeken aangeschaft en dat aantal groeit nog steeds. Het kan natuurlijk altijd beter en uitgebreider, maar ik doe denk ik genoeg moeite. HT (overleg) 23 nov 2021 00:20 (CET)[reageer]
Dank voor de toelichting, dan weten we voortaan dat je geen nieuwe artikelen schrijft. Dan is het helemaal vreemd dat je iemand die dat wél doet voor lui uitmaakt. Daar mag je wel even op reflecteren, geef daar eens je eigen mening over svp. Alle waardering overigens voor wat je wel aan de artikelnaamruimte bijdraagt. Daar gaat het ons uiteindelijk toch om. Nieuwe artikelen zijn imho echter van zeer groot belang, om de encyclopedie actueel te houden. Of het nu gaat om een opkomende tenniskampioene, een nieuwe insectensoort of over een recent ontdekte planeet in een ver melkwegstel. Dat staat meestal in nog geen enkel papieren boek. Op Wikipedia hopelijk wel. Elly (overleg) 23 nov 2021 12:42 (CET)[reageer]
Iets meer waardering voor de artikelpoetsers mag wel…
Het is werk dat weinig aandacht krijgt, maar bijzondere kwaliteiten vraagt: een fijne neus voor twijfelachtig werk, een detective-instelling om de ondersteunende delen van een wrak geraamte te herkennen, een goed taalgevoel om je werk te integreren in het bestaande en bereidheid om werk te doen waarvan je weet dat het niet nodig zou zijn als anderen het behoorlijk deden. En dat alles met de kans dat je stank voor dank krijgt omdat de eerste auteur zijn versie niet meer herkent. Of voor lui uitgemaakt wordt  →bertux 23 nov 2021 12:55 (CET)[reageer]
@Elly: "Nieuwe artikelen zijn imho echter van zeer groot belang, om de encyclopedie actueel te houden." De encyclopedie houd je maar in beperkte mate actueel door nieuwe artikelen te schrijven. Juist het updaten van al bestaande artikelen draagt bij aan het actueel houden van de encyclopedie. Denk aan nieuwe taxonomische inzichten, nieuwe werken van kunstenaars, wetenschappelijke ontdekkingen, technologische ontwikkelingen etc. En vergeet niet het volwassen worden van de encyclopedie waardoor er nu veel beter naar relevantie en bronnen gekeken wordt dan, zeg, vijftien jaar geleden. Oude artikelen moeten daar ook op aangepast worden. Verder ben ik het er niet mee eens dat nieuwe informatie beter eerst op Wikipedia kan staan dan in papieren boeken. We hoeven niet de eerste te zijn. Sterker nog; we horen niet de eerste te zijn. Dat geeft een relevantie- en verificatieprobleem. Laten we alsjeblieft achter de meute aan lopen zodat we informatieve en gebalanceerde artikelen kunnen schrijven over relevante onderwerpen op basis van goede bronnen die opvraagbaar zijn. hiro the club is open 23 nov 2021 13:19 (CET)[reageer]
Ik onderstreep de woorden van bertux.
Het is misschien zelfs nog belangrijker dat de nieuwe artikelen zelf. Waarom? Omdat er beoordelingslijst regelmatig door nieuwe of semi-nieuwe gebruikers wordt verwezen naar oudere artikelen die ze als voorbeelden gebruikte. Als deze echter zelf niet voldoende zijn geeft dat de nieuwe gebruiker het idee dat er niet meer nodig was en ze dan tegen de muur lopen van veranderde meningen daarover. Het komt mijn inziens voort uit de ontstaan en daarna de eerste door doorontwikkelingsperiode van Wikipedia. Waaraan een nieuw artikel aan moet voldoen en precieze opname eisen zijn veranderd, niet alleen op basis van regels maar ook en misschien wel vooral ook op voet de instelling en inzicht van de gemeenschap waaraan een onderwerp aan moet voldoen en in welke vormen het acceptabel is voor de encyclopedie in de brede zin.
Het opkrikken en verbeteren, en opnieuw beoordelen van oude artikel kan helpen voorkomen dat deze nieuwe gebruikers tegen die muur en horde aanlopen hij het aanmaken van een artikel over een nieuw onderwerp. Dat het ook meteen de lat hoger legt voor het toevoegen van nieuwe artikelen is ook zo.
Ik denk is dat ook wat een aantal probeert aan te geven, dan men bang is dat het script de ruimte geeft voor ondermaatse nieuwe artikelen die dus later weer opgeknapt dienen te worden. Dat dat niet het geval hoeft te zijn is uiteraard zo. Maar ik zie wel wat ze bedoelen als men aangeeft dat wel er gevaar voor is dat zo gebruikt kan worden door sommige. Ook het rondpompen van informatie die uit Wikipedia zelf afkomstig is of van een niet al te betrouwbaar geachte bronnen, of waar alleen met bepaalde voorwaarden over gesproken kan worden, kan een probleem op leveren, als er geen nacontrole wordt gedaan na het gebruik van het script.
Op dit moment zie je ook problemen met vertalingen, vooral machinevertalingen, omdat er betere vertalingstools zijn valt het soms wat minder snel op, maar wie wat beter diens best doet om echt te lezen merkt op dat er allerlei grammaticale fouten inzitten, het qua taalgevoel niet kloppend is als even eens betekenis veranderingen en regelmatig ook nog overname van verkeerd of verkeerd begrepen brongebruik. Deze belande nu soms wel en soms niet om de beoordelingslijst, of als als toevoeging is moet dat weer teruggedraaid worden als het meer dan een paar zinnen is. En dan is misschien die machinevertalingen nog wat beter op te vangen en valt het sneller op dan wanneer men dat script gebruikt. DagneyGirl (overleg) 23 nov 2021 13:28 (CET)[reageer]

────────────────────────────────────────────────────────────────────────────────────────────────────. Allemaal waar, maar dat is helemaal niet mijn punt. Ik val over de verwijten die HT maakt richting een collega. Ik citeer nog maar eens: Luiheid, na mij de zondvloed en iets met haastige spoed zijn zo maar enkele gedachten die mij dan te binnen schieten. En daarbij vind ik ook dit te kort door de bocht: Ik vind het verder bijzonder zorgelijk dat je blijkbaar een geautomatiseerd script nodig hebt om te voorkomen dat je een geboortedatum verkeerd overneemt, zoals je hierboven feitelijk aangeeft. Met dat laatste negeert HT het feit dat alle mensen fouten maken in het overtypen van gegevens, en dat geautomatiseerde processen dat gewoon veel beter kunnen dan een mens. Elly (overleg) 23 nov 2021 14:31 (CET)[reageer]

Was het punt niet dat de informatie die uit de geautomatiseerde processen uit niet alleen handmatig ingevulde informatie, maar ook automatisch gehaalde informatie van Wikipedia zelf komen en daarmee je eventuele fouten overneemt als je het niet zelf nog eens controleert na het gebruiken van het scripje? Ik denk dat luiheid dan duidt op het niet controleren omdat men uitgaat van dat het wel zal kloppen. Ik dat HT het artikel aanhaalde omdat waarschijnlijk daar het script is gebruikt als ik het goed begrijp. Het artikel had twee verschillende schrijfwijzes, dus HT schat in dat er te weinig controle is gedaan om het artikel met de juiste transcriptie te plaatsen, in plaats van de Duitse en dat de aanmaker blijkbaar zich niet heeft gemengd in de discussie die gestart was in het Sportcafé. Het kan dan overkomen als aanmaken en wegwezen misschien. Dat het niet al te nette bewoording was onderstreep ik. DagneyGirl (overleg) 23 nov 2021 14:55 (CET)[reageer]

Wat weten we hier nu van?[bewerken | brontekst bewerken]

Oké, zo kan die wel weer. We zijn allemaal geweldig en de rest zijn knoeiers. Wie daar behoefte aan had heeft wat gal gespuugd, nu een resumé.

  • Er is een tooltje dat gemak kan bieden, maar mogelijk gemakzucht kan uitlokken en belonen. Min of meer zijn er drie stellingen:
    • Gemakzucht wordt uitgelokt, er ontstaan (te veel) lemma's die ondermaats zijn
    • Dankzij het gemak ontstaan er meer artikelen van voldoende kwaliteit
    • Het tooltje heeft geen invloed op de kwaliteit, die hangt af van de auteur en diens inspanningen

De drie stellingen putten niet alle mogelijkheden uit, dat hoeft ook niet. Mijn vraag: hebben we ervaringsfeiten, aanwijzingen of zelfs bewijzen voor een of meer van deze stellingen? →bertux 18 nov 2021 09:33 (CET)[reageer]

Waar gaan we dit bespreken, De Zwaluwenberg? En is de dresscode met of zonder geitenwollen sokken? Misschien kunnen we dan ook bespreken of bij de chauffeurs die in een automaat op hun cruisecontrol rijden, er (te veel) chauffeurs zijn met een ondermaatse rijvaardigheid. – De voorgaande bijdrage werd geplaatst door Sb008 (overleg · bijdragen)

Ik snap inderdaad de ophef hierboven niet. Met dat script lijkt me niets mis, zoals er ook niks mis is met het spreekwoordelijke aardappelschilmesje, als je het tenminste gebruikt om je aardappels te schillen, en niet om je partner wat aan te doen. In de handen van iemand die dat script gebruikt om vervelend werk te automatiseren, maar het resultaat daarna wel secuur checkt, is dat script dus een zegen, en in de handen van iemand die het gebruikt om zonder enige intellectuele inspanning snel even een artikeltje op Wikipedia te dumpen, is dat script een vervaarlijk onding. Kortom, wees blij met dit handige script, maar volg de lemma's die hiermee worden gestart wel net zo kritisch als je alle andere lemma's volgt. Over tot de orde van de dag? — Matroos Vos (overleg) 18 nov 2021 10:31 (CET)[reageer]

Beste Matroos, we hebben jaren geleden ingestemd met het botmatig aanmaken van lemma's over dorpen in land x en beestjes uit tig categorieën. Die lemma's zijn aangemaakt door bots van collega's die vanuit goede wil de inhoud wilden uitbreiden. Het idee was dat er ooit iemand de gestarte lemma's zou uitbreiden, voor 99,9% geldt echter dat dit nog steeds moet gebeuren. Is dat erg? Daar kun je over van mening verschillen. Wil je heel veel of wil je heel veel inhoud. HT zegt het misschien onaardig en Edo doet prima werk op wikidata, hem lui noemen is leugenachtig. Maar is er ook maar enig argument om te veronderstellen dat na het scriptje van Edo er iemand komt die daar een inhoudsvol lemma van gaat maken of hebben we straks niet 2 maar 4 miljoen lemma's zonder inhoud? Voordat je begint zou het wat mij betreft wel verstandig zijn daar eens heel goed, en bij voorkeur zonder verwijten of emotie, over na te denken. Peter b (overleg) 18 nov 2021 10:47 (CET)[reageer]
O, maar dan zijn we het snel eens hoor. Ik pleit nu juist niet voor het louter botmatig aanmaken van een zo goed als inhoudsloos artikel, maar ik zie geen enkel probleem als je dit script gebruikt waarvoor het volgens mij bedoeld is, namelijk om het vervelende, geestdodende vóórwerk op te knappen, waarna je zelf het artikel uiteraard nog het nodige vlees op de botten moet geven. Ik zie domweg het verschil met andere handige hulpmiddelen niet. Een programmaatje als Google Translate kan een uitkomst zijn als je het gebruikt om een basis te leggen voor een eigen vertaling, waarbij je consciëntieus alle kromme zinnen en vertaalfouten van dat programma corrigeert. En het is een onding als je die broodnodige correcties achterwege laat, en die automatische vertaling achteloos op Wikipedia dumpt. — Matroos Vos (overleg) 18 nov 2021 11:31 (CET)[reageer]
De vergelijking met het botmatig aanmaken van enorme aantallen artikelen lijkt niet helemaal op te gaan. Ik neem aan dat het script één artikelgeraamte per keer klaar zet, waar de auteur dan het vlees op moet leggen en de geest in moet blazen  →bertux 18 nov 2021 11:47 (CET)[reageer]
Dat klopt. Ik zie er daarom ook geen probleem in. Het zal weinig Etalage-waardige artikelen opleveren, mits met voldoende zorgvuldigheid uitgevoerd wordt helpt het om de encyclopedie te vullen met informatie waarvan je je afvragen of het anders de weg naar de encyclopedie had gevonden. StuivertjeWisselen (overleg) 18 nov 2021 23:19 (CET)[reageer]
Als het eerder aangehaalde artikel over Anna Vjachireva exemplarisch is voor zo’n bot-artikel, zou ik zeggen: doen! Het is een mooi raamwerk (blijkbaar ook nog inclusief foto zelfs) waar vandaan verder geschreven kan worden. Da’s ook gastvrij voor onze toekomstige collega’s: Hoe meer van dit soort nette beginnetjes met meer dan 3 feiten, des te kleiner de kans dat onervaren wikipedianen meteen op het matje worden geroepen omdat ze bv een eenregelig artikel over een persoon starten zonder de juiste wikisyntax. Groetjes, Sietske | Reageren? 18 nov 2021 15:48 (CET)[reageer]

In antwoord op bertux. Natuurlijk hangt de kwaliteit af van de inzet van de auteur die het tooltje - per definitie - slechts als middel gebruikt om een artikel te schrijven. Maar er zijn genoeg voorbeelden van artikelen die inhoudelijk of qua relevantie tegen het toelaatbare aan zitten of zelfs gewoon fouten bevatten maar toch in de hoofdnaamruimte geplaatst worden. Deze artikelen bevatten verder overwegend of uitsluitend cijfermateriaal, maar dan uitgesmeerd over enkele volzinnen. Dat schuurt met WP:NIET/CM ("zeker wel een onderdeel van een pagina (...) maar heeft geen bestaansrecht als artikel"). Ook relevantie is een aandachtspunt omdat veel artikelen louter op databases gebaseerd zijn en niet op bronnen die onderwerpen beschrijven. Als een artikel over een muziekalbum alleen op databases gebaseerd zou zijn, zou dat aanleiding geven tot een gang naar TBP. Waarom zouden we daar bij biografieën anders over denken? Terwijl die met een tooltje aangemaakte artikelen doorgaans niet méér lading dekken dan wat databases te melden hebben. Aanvulling achteraf blijft uit, ook al zitten we nu behoorlijk naïef te doen door te beweren dat een tooltje prima gebruikt kan worden om een raamwerk op te zetten voor een artikel. De facto blijft het daarbij; nazorg of aanvulling blijft uit.

Wat is ondermaats? Of twee zinnen voldoende zijn om een pagina een volwaardig artikel te noemen, schijnt af te hangen van hoe de wind waait. Edo maakt veel van dit soort artikelen aan maar vond zelf een soortgelijk artikel irrelevant op grond van "bronloos" en er werd, nota bene, de vraag gesteld wat "dit korte artikel met weinig inhoud in een encyclopedie [doet], en wat biedt het dan de lezer". Nee, dat artikel had geen infobox. Maar veel meer dan de informatie van een artikel samenvatten doet een infobox niet. En laten we kwaliteit alsjeblieft niet alleen meten aan de hand van hoeveel feitjes erin staan. Zes feitjes waarvan drie in een zin en drie in een infobox vind ik niet beter dan vier feitjes zonder infobox.

Tenslotte behoeft het geen uitleg dat artikelen in hoog tempo aanmaken, tot fouten leidt. Denk daarbij aan inhoudelijke fouten, fouten in bronvermeldingen of interne inconsistentie. Aardige voorbeelden hiervan zijn de duizenden artikelen die begin dit jaar op een nalooplijst zijn geplaatst. Nee, die artikelen zijn niet aangemaakt met een tooltje - voor zover ik weet - maar tooltjes maken het wel makkelijker om in hoog tempo artikelen aan te maken en dat is waar de schoen wringt, zeker als blijkt dat nazorg uitblijft.

Uiteindelijk is de vraag waar de lezer - en nieuwe aanwas onder de bewerkers - het meest mee geholpen is. Mijn mening moge duidelijk zijn; ik zie liever een betrouwbare encyclopedie met inhoud die up to date is en gebaseerd op bronnen die werkelijk een onderwerp beschrijven zodat de invloed die wij op het wereldbeeld van velen hebben kan steunen op een solide basis, dan een encyclopedie die uit zoveel mogelijk artikeltjes bestaat die zo snel mogelijk aangemaakt kunnen worden zodat we onszelf verschrikkelijk veel onderhoudswerk op de hals halen, ondoordacht informatie uit databases rondpompen en naar de pers kunnen rennen met de mededeling dat we drie miljoen artikelen hebben. hiro the club is open 19 nov 2021 02:51 (CET)[reageer]

Hoi Hiro, ik krijg zo langzamerhand sterk de indruk dat jij, en andere tegenstanders, niet zozeer tegen dat script zijn, als wel tegen de (in jullie ogen) structureel slordige wijze van werken van Edo. Ik ben niet bekend met het werk van Edo, dus ik heb geen flauw idee of jullie gelijk hebben of niet, maar het lijkt me wel goed om dit duidelijk te benoemen, want dat is eigenlijk een heel andere discussie, die niet over dit op zich handige tooltje, maar over de gebruiker (in jullie ogen: misbruiker) van dit tooltje gaat. Of we een dergelijke discussie over één specifieke collega in de Kroeg moeten voeren, weet ik ook niet. Wellicht is er een betere plek om dit overleg, desgewenst, voort te zetten? — Matroos Vos (overleg) 19 nov 2021 06:04 (CET)[reageer]
Hiro, die in een vorig wiki-leven mij al niet zo zag zitten, heeft afgelopen voorjaar hier in de kroeg opgeroepen mijn script te verbieden, het liefst met mij er bij, dus ik ben niet zo verbaasd dat hij nu weer komt roepen dat ik het ergste ben dat Wikipedia ooit is overkomen. Ook HT zijn haat tegen Wikidata is niet van gisteren. Dat Bertux mijn artikelen het liefst via een onderhoudscategorie na 30 dagen wil laten verwijderen is wel nieuwe informatie. Drie gebruikers die liever anoniem blijven, de groeten met die lafaards, ik ben er een beetje klaar mee. Edoderoo (overleg) 19 nov 2021 07:15 (CET)[reageer]
Edo, dat wil ik niet. Een artikel is goed of het is niet goed. De onderhoudscategorie zou alleen dienen om zicht te houden op wat er gebeurt. Goede, bebronde artikelen kunnen blijven, al zijn ze 100% op Wikidata en de daarin gegeven betrouwbare bronnen gebaseerd. De categorie maakt alleen zichtbaar wat anders onzichtbaar zou zijn  →bertux 19 nov 2021 11:31 (CET)[reageer]
(na bwc) Beste Matroos, mijn pijlen zijn gericht op het in hoog tempo aanmaken van artikelen. Het onder dit kopje voorgestelde soort tooltjes faciliteert dat en daar zet ik dan ook grote vraagtekens bij. Er zijn individuen die heel vaak dat soort tooltjes inzetten om in hoog tempo artikelen aan te maken en daarbij bochten afsnijden zoals nazorg, kwaliteitscontrole en/of relevantie. Die individuen zijn heel zichtbaar omdat hun namen vaak op Speciaal:NieuwePaginas voorbij komen of omdat het nu eenmaal opvalt dat hun werk wel erg vaak de grenzen van het toelaatbare opzoekt. Dat Edo bij die individuen hoort, speelt voor mij geen enkele rol van betekenis. Mijn pijlen zijn niet op het individu gericht, maar op het afgeleverde werk. Om de een of andere reden praten we daar liever niet over, zeker niet als betrokkene een uitgebreide staat van dienst heeft. Maar een uitgebreide staat van dienst is geen vrijbrief. Overigens heb ik er geen moeite mee als het ook andersom gebeurt. Ik laat me graag corrigeren waar ík bochten afsnij of simpelweg fouten maak.
Ik voel er weinig voor om de discussie nu ineens elders te gaan voortzetten. Hier is de discussie over tooltjes gestart en hier passen mijn reacties op dat soort tooltjes en, in het verlengde daarvan, het in hoog tempo aanmaken van artikelen. Nogmaals; het is mij niet om Edo te doen. Dat hij zich aangesproken voelt omdat juist hij tooltjes gebruikt en het opvalt hoe vaak nazorg uitblijft, is jammer maar verandert niets aan de discussie (ik ben trouwens benieuwd naar een reactie op mijn betoog).
Edo's reactie is doordrenkt met onwaarheden en persoonlijke aanvallen. Ik heb geen moeite met Edo; ik kan inhoudelijke discussie en emotie prima van elkaar scheiden. Ik heb hem zelfs meer dan eens bedankt voor een bewerking, of een muzikale tip gedeeld wanneer mij iets opviel. Ik heb vorig jaar hier in de kroeg helemaal niet opgeroepen om zijn script te verbieden. Ik wierp de vraag op wat wij als encyclopedie aan zeer korte artikeltjes hebben, precies dezelfde vraag die Edo opwierp in een beoordelingsnominatie die hij zelf startte omdat volgens hém een artikel te kort was. Ik wil Edo graag vragen of hij mij kan aanwijzen waar ik heb gezegd dat hij het ergste is dat Wikipedia ooit is overkomen. Ik zie dat nergens staan, maar het kan zijn dat ik erover heen lees. Geen van de drie gebruikers die Edo aanvalt, wenst liever anoniem te blijven. Althans, ik zie 'ons' gewoon bijdragen onder onze ingelogde accounts en ik heb Edo zelfs gepingd, zoals ik vrijwel altijd doe als ik iemand bij naam noem. Juist in het kader van transparantie. hiro the club is open 19 nov 2021 11:51 (CET)[reageer]
Oké, excuses, dan was mijn indruk niet helemaal juist. Maar laten we het dan inderdaad over het onderliggende probleem hebben, namelijk dat er blijkbaar collega's zijn – wie dan ook – die in sneltreinvaart, zonder zich serieus in het betreffende onderwerp te verdiepen, artikelen aanmaken. Ik blijf het lastig vinden om de discussie toe te spitsen op dit tooltje, dat net als een aardappelschilmesje ten goede of ten kwade kan worden gebruikt. De boosdoener is uiteindelijk niet dat tooltje, maar de groep van collega's die dat tooltje zou misbruiken om zonder enige intellectuele inspanning aan de lopende band lemma's te produceren. — Matroos Vos (overleg) 19 nov 2021 13:15 (CET)[reageer]
"Guns don't kill people, people kill people". Toch leidt het dragen van vuurwapens tot meer dodelijk geweld.[1] Alcohol is onschuldig, het is het misbruik ervan dat voor problemen zorgt. Toch verbieden we alcoholconsumptie in het verkeer, juist vanwege het misbruik. Vuurwerk is onschuldig maar wordt door onverlaten op verkeerde tijdstippen, onvoorzichtig en in te zware hoeveelheden afgestoken waardoor we tegen een verbod aan zitten te kijken. Zodra een aardappelschilmesje structureel vaak gebruikt wordt om mensen neer te steken, zal daar ook wel een wet of regel voor opgesteld worden die het dragen ervan aan banden legt. Ik voel wel wat voor het idee van bertux om met het tooltje aangemaakte artikelen in een onderhoudscategorie te plaatsen. hiro the club is open 19 nov 2021 15:08 (CET)[reageer]
Edoch, voor alcohol, vuurwerk, aardappelschilmesjes en zelfs voor vuurwapens geldt in onze Lage Landen bij de Zee geen algeheel verbod, maar een gedeeltelijk verbod dat toegespitst is op het voorkomen van misbruik. Wat dat betreft zou ik ook liever zien dat het gebruik van dit script wordt ontzegd aan degenen die er misbruik van maken, en niet aan iedereen. Maar goed, ik vrees dat we het op dit punt niet eens gaan worden, en dat is uiteraard ook geen ramp. Ik ben het in elk geval wel met je eens dat het goed zou zijn om de met dit nieuwe script gemaakte lemma's extra in de gaten te houden. — Matroos Vos (overleg) 19 nov 2021 15:51 (CET)[reageer]
Oh maar ik denk dat we behoorlijk op een lijn zitten, hoor. Ook ik ben geen voorstander van een algeheel verbod op gebruik van het tooltje of een script. Ik schreef dat ik er grote vraagtekens bij plaats. Ik had duidelijker kunnen verwoorden dat ik daarmee geen algeheel verbod wil suggereren, maar slechts dat ik mijn zorg wilde uiten dat het gebruik van het tooltje makkelijk tot problemen leidt. That's all. Wat mijn voorbeelden van wapens, alcohol en vuurwerk betreft; mijn punt was dat middelen aan banden gelegd worden bij misbruik maar in geen van deze gevallen is er sprake van een algeheel verbod maar dat er (strenge) regels zijn. Als mijn zorg weggenomen kan worden door de met het tooltje aangemaakte artikelen extra in de gaten te houden, bijvoorbeeld door ze in een onderhoudscategorie te plaatsen, lijkt me dat een prima oplossing. hiro the club is open 19 nov 2021 16:12 (CET)[reageer]
Graag zie ik z.s.m. een lijst tegemoet van lemma's die gemaakt zijn met de tool waar Edoderoo het over heeft. HT (overleg) 20 nov 2021 08:18 (CET)[reageer]
Want? StuivertjeWisselen (overleg) 22 nov 2021 18:50 (CET)[reageer]
Het geeft een beeld van de kwaliteit van de lemma's die met Wikidata-gegevens zijn begonnen. En aangezien Wikidata geen betrouwbare bron is, is er sowieso genoeg reden om een overzicht te hebben. HT (overleg) 22 nov 2021 23:51 (CET)[reageer]
En van wie verwacht je precies dat die lijst gaat opleveren? StuivertjeWisselen (overleg) 24 nov 2021 20:35 (CET)[reageer]
Maakt niet uit van wie. Van eenieder die daar belangstelling voor heeft. Er kan al begonnen worden met een lijst van enkele voorbeelden. HT (overleg) 24 nov 2021 22:08 (CET)[reageer]
Dat kun je prima zelf, met dezelfde link die Ellywa vorige week gebruikte om aan te tonen dat jij nooit een artikel aanmaakt, en de laatste keer dat je het wel deed, het eigenlijk best een slecht bebrond artikel was. Edoderoo (overleg) 26 nov 2021 12:53 (CET)[reageer]

Betreft stemmingen over vertaalsjablonen en Wikipedia en Wikidata wel of niet een betrouwbare bron[bewerken | brontekst bewerken]

Naar mijn mening moeten er echt maatregelen genomen worden om de inhoudelijke kwaliteit van de Nederlandstalige Wikipedia rigoureus te verbeteren. Binnenkort komt er een door Encycloon opgezette stemming over het wel of niet aanpassen van de benamingen van vertaalsjablonen (hier). In dat licht gezien wil ik een stemming organiseren over het wel of niet verplichten om een vertaalsjabloon in de hoofdnaamruimte te plaatsen (essentieel voor de lezer om snel de bron te weten te komen), over het wel of niet verplichten om bij het vertalen alleen bronvermeldingen over te nemen als die door de vertaler op juistheid zijn gecontroleerd, over het wel of niet toestaan van het ongecontroleerd overnemen van een of meerdere gegevens van een anderstalige Wikipedia en ten slotte over het wel of niet ongecontroleerd overnemen van gegevens van Wikidata (allemaal essentieel voor de kwaliteitsbewaking van Wikipedia). Reacties graag hier. HT (overleg) 22 nov 2021 11:12 (CET)[reageer]

Even snel wat de bronnen betreft; we hebben al de basisregel "voeg alleen bronnen toe die u zelf heeft geraadpleegd". hiro the club is open 22 nov 2021 14:43 (CET)[reageer]
@Hiro: Die basisregel staat op de pagina Wikipedia:Bronvermelding, die een "richtlijn" zou zijn. In hoeverre is dat dan een vaststaande regel? Op die pagina staat namelijk ook: "De inhoud op Wikipedia dient ontleend te zijn aan bronnen die niet alleen betrouwbaar zijn en waaraan een zekere autoriteit toegekend wordt, maar die ook op het onderwerp betrekking hebben." Dat zou dan betekenen dat we geen anderstalige Wikipedialemma's zouden mogen overnemen, maar dat wordt volop gedaan. En ook Wikidata wordt gebruikt als bron, maar ook die site is veelal niet betrouwbaar en is vaak gebaseerd op Wikipedia als bron. HT (overleg) 22 nov 2021 17:43 (CET)[reageer]
Ik zie een richtlijn niet als iets vrijblijvends. Volgens de Van Dale is het een aanwijzing voor te volgen gedrag en volgens onze dp is het daarnaast (onder andere) een bindend advies.
Met het 'overnemen' van artikelen van anderstalige Wikipedia's bedoel je waarschijnlijk vertalingen? Een vertaling geniet niet de voorkeur maar met een goede vertaling is op zich weinig mis. Het wordt problematisch wanneer de bronnen van het oorspronkelijke artikel niet gecontroleerd worden en/of wanneer een slecht artikel vertaald wordt. Merk op dat als we een artikel vertalen, we het oorspronkelijke artikel niet als bron gebruiken. De bronnen in dat artikel zijn de bronnen voor de vertaling.
Ik ben het met je standpunt eens dat Wikidata geen geschikte bron is. Zie Unsourced, unreliable, and in your face forever: Wikidata, the future of online nonsense, een artikel in The Register. Disclaimer; volgens Wikipedia:Reliable sources/Perennial sources is The Register negatief bevooroordeeld over Wikipedia en het artikel is zes jaar oud. Maar het valt niet te ontkennen dat Wikidata vol met onbebronde data staat, dat Wikidata veel gevoeliger is voor misbruik dan Wikipedia en dat we steeds meer informatie gaan rondpompen zonder erbij na te denken. hiro the club is open 23 nov 2021 01:45 (CET)[reageer]
Ik snap goed dat mensen in zijn algemeenheid graag heldere regels willen afspreken. Maar specifiek voor deze situatie: voor iedereen die voor z'n werk of opleiding ooit een literatuuronderzoek heeft moeten doen, spreekt het toch voor zich: gebruik je een bron, dan verwijs je naar die bron. Gebruik je een bron die zelf ook "slechts" een samenvatting is van wat in andere bronnen te vinden is, dan gebruik je die andere bronnen, tenzij je die andere bronnen niet kunt lezen of er niet aan kunt komen. Dan zoek je ófwel andere bronnen, of je roeit met de riemen die je hebt en verwijst dan toch maar naar die samenvattingsbron.
Het lijkt mij niet meer dan logisch dat deze werkwijze ook op wikipedia toegepast wordt, en ik zie de meerwaarde van een stemming daarom dan ook niet. Sietske | Reageren? 23 nov 2021 18:28 (CET)[reageer]
Voor jou is het logisch, voor mij is het logisch, voor vele anderen is het logisch maar niet voor iedereen. Er zijn er genoeg die nooit een literatuuronderzoek hebben gedaan, er zijn er genoeg die Wikipedia zien als tijdverdrijf om lekker leuke dingetjes te schrijven alsof het een blog is. Wikipedia wordt geschreven door mensen uit alle lagen van de bevolking. Als je vanuit je eigen nauwe perspectief schrijft dat iets logisch is, dan houd je geen rekening met de diversiteit in de gemeenschap. hiro the club is open 23 nov 2021 23:55 (CET)[reageer]
@Hiro: jouw bron stelt in de versie die ik raadpleegde dat 'sommige' gebruikers The Register als bevooroordeeld beschouwen. De site krijgt in elk geval een groene waardering voor correcte weergave van feiten.
Verder: in wezen maakt de betrouwbaarheid weinig uit als we maar een goed correctiemechanisme hebben.
Rondpompen is het fundamentele probleem, niet de betrouwbaarheid. Rondpompen van informatie omzeilt de waarborgen die we ingebouwd hebben tegen desinformatie. De juiste vraag is dus: hebben we een correctiemechanisme dat de rondgepompte informatie filtert en zuivert?
Zeker bestaan zulke mechanismen, zowel in Wikidata als in Wikipedia, maar ik ben er niet gerust op  →bertux 26 nov 2021 13:11 (CET)[reageer]