Naar inhoud springen

Wikipedia:De kroeg/Archief/20231210

Uit Wikipedia, de vrije encyclopedie

Wikidata driven infobox (2)[bewerken | brontekst bewerken]

Onlangs gaf Ecritures aan op 25 november een Wikidata driven infobox te installeren voor mediakunstenaars. De discussie werd op 21 nov. gearchiveerd (hier). Ik zou willen adviseren om het niet te doen. Mondo heeft in die eerdere discussie laten weten (waarvoor dank) dat veel Wikidata-parameters gevuld zijn met info die ongecontroleerd van Wikipedia-versies gehaald zijn. Dat komt de kwaliteit niet ten goede. Ongecontroleerd handmatig moet je niet doen en met behulp van een bot al helemaal niet. Enkele jaren geleden is hier duizenden in de hoofdnaamruimte geplaatste info afkomstig van Wikidata in een klap verwijderd wegens het te groot aantal fouten. En dus ook daarom moeten we niet beginnen aan het blind/ongecontroleerd overnemen van informatie van Wikidata. HT (overleg) 22 nov 2023 22:49 (CET)[reageren]

Je zou niet adviseren om de discussie te archiveren? of spreek je mij rechtstreeks aan en adviseer je mij geen wikidata driven infoboxen te installeren? Ik heb er al diverse gemaakt en ben geenszins van plan daar mee op te houden. Dus je advies - hoe goed ook bedoeld - leg ik naast me neer. Maar dank dat je de moeite hebt genomen me erover te adviseren :) Ecritures (overleg) 22 nov 2023 22:58 (CET)[reageren]
Wat er dan zou gebeuren zie je als je zoekt naar 'infobox wetenschapper wikidata', bv bij Theodore von Kármán. Wie controleert dat allemaal? Hobbema (overleg) 22 nov 2023 23:07 (CET)[reageren]
Bedankt voor het signaleren. De overkill aan gegevens bij Karman was echt heel lelijk. Wat let je in het vervolg, als je weer zoiets ziet om in de infobox te verwijderen. Hoe dan ook de infobox heb ik aangepast en de bewerker, die deze toevoeging geplaatst heeft heb ik op de OP een berichtje achtergelaten om de infobox niet meer zonder inperkingen te plaatsen. Wie het allemaal controleert weet ik helaas niet.Ldhank (overleg) 23 nov 2023 09:50 (CET)[reageren]
Hoho, als je me citeert, doe het dan alsjeblieft wel goed. Zoals je in die discussie kunt lezen, schreef ik “Het gaat inderdaad wel eens mis met Wikipedia als bron op Wikidata”. Dat betekent niet dat ik gezegd/bedoeld heb dat “veel Wikidata-parameters gevuld zijn met info die ongecontroleerd is”, zoals je nu in mijn mond probeert te leggen. Dat vind ik niet netjes, HT. Mondo (overleg) 22 nov 2023 23:21 (CET)[reageren]
Ik zie te vaak foutieve data staan in wikidata dat in andere projecten is opgevoerd. Dit hele wiki-project is een groot hobby en amateurisme project. Benader het ook zo. Vertrouw niet op deze schaal wat een ander opvoert in een ander deelproject. Het probleem van wikidata zo inrichten als een leidend automatisme is dat het alleen maar tot nog meer automatisch overgenomen en ongecontroleerde foutieve gegevens leidt. De optie "fix dan wat fout is" is correct, maar vereist dus wel de automatische reflex "vertrouw niks voordat je het gecontroleerd hebt". En dat is precies niet wat wikidata-automatisme zal doen. Labrang (overleg) 23 nov 2023 00:05 (CET)[reageren]
@Mondo: Formeel citeer ik je niet. Ik geef slechts weer wat je schreef. Maar als ik je citeer, dan is dat als volgt: "het aanvoeren van Wikipedia als bron [voor Wikidata] is meer een gevolg van de importtool en niet van gebruikers die Wikipedia als bron opvoeren". Sijtze Reurich verwoordt het vervolgens precies zoals het moet: "Het maakt niet zoveel uit of een bot of een mens Wikipedia opvoert als bron voor zichzelf, het hoort gewoon niet te gebeuren". En dat is precies een van de zaken die er met Wikidata fout gaan. Zelfs bronloze beweringen afkomstig van de meest onbekende Wikipedia's worden op Wikidata ongecontroleerd als feit opgeslagen. Ecritures (ik begrijp dat ze niet te vaak gepingd wil worden) heeft inderdaad eerder al Wikidata-gestuurde infoboxen aangemaakt. In elk geval bij die ik gecontroleerd heb ging het met het overnemen van informatie nogal eens fout, om reden dat de info in Wikidata onjuist was. En als jullie de discussie in die archieflink en hierboven lezen, dan is er duidelijk géén consensus om op deze voet verder te gaan. En als er geen consensus is, dan is de afspraak dat we het niet doen. @Mondo. Je stelt dat het met Wikidata "wel eens mis" gaat met info overnemen met Wikipedia als bron. Het gaat ontelbare keren mis, zo zeer zelfs dat - nota bene door Ecritures - enkele jaren geleden op WP:NL duizenden en duizenden van Wikidata afkomstige gegevens verwijderd werden omdat de foutenbrij niet om aan te zien was. En nu willen we toch doorgaan met het op automatische wijze ongecontroleerd overnemen van Wikidata-info. Het is onbegrijpelijk. Wikipedia is géén bron van zichzelf!! Wikipedia is ook niet bedoeld als project voor pure productie, zonder te letten op de kwaliteit. Daar lijkt het echter in veel gevallen wel op. HT (overleg) 23 nov 2023 08:00 (CET)[reageren]
Het kan best dat het vaker misgaat dan ik denk, maar dat is nog geen reden om mij woorden in de mond te leggen die ik niet gezegd heb.
Mondo heeft in die eerdere discussie laten weten (waarvoor dank) dat veel Wikidata-parameters gevuld zijn met info die ongecontroleerd van Wikipedia-versies gehaald zijn.”
Dat heb ik dus niet gezegd, ik heb gezegd dat het wel eens misgaat. Dat is waarom ik gisteravond reageerde zoals ik reageerde. Mondo (overleg) 23 nov 2023 10:13 (CET)[reageren]
Het zal ongetwijfeld wel eens mis lopen met de kwaliteit van Wikidatagegevens, maar we moeten niet doen alsof onze 'native' infoboxen op dat vlak beter zijn. Referenties zijn er nog zeldzamer dan op Wikidata en zelfs als ze er zijn is het geen garantie voor juistheid. Een belangrijke reden voor mij om meer vertrouwen te hebben in infoboxen gevoed door Wikidata, is dat de community daar groter is dan de onze. Bovendien: hoe meer die gegevens rechtstreeks worden overgenomen op Wikipedia, hoe meer eyeballs er zullen zijn om ze te verifiëren en te verbeteren. Idealiter zit je met de hele wereld erop te kijken. Juist vanuit de bezorgdheid voor kwaliteit ben ik dus geneigd meer vertrouwen te hebben in wikidata-infoboxen. Karmakolle (overleg) 23 nov 2023 12:49 (CET)[reageren]
Bij de gemeenten in Estland worden de oppervlakte en het bevolkingscijfer automatisch overgenomen uit Wikidata. Dat gaat wel goed, maar de gegevens van Wikidata zijn dan ook overgenomen uit databases van de Estlandse overheid. Sijtze Reurich (overleg) 23 nov 2023 16:16 (CET)[reageren]
Ja, dat is een ideale situatie, zeker voor zulke evolutieve gegevens. Na twintig jaar WP:NL mogen we wel concluderen dat we die op eigen kracht niet afdoende kunnen bijhouden en dat het intelligenter is te steunen op de wereldwijde Wikidatagemeenschap. Maar daar zowel als hier start alles met solide bronnen. Als die er niet zijn op een bepaald gebied (neem Afrikaanse bevolkingscijfers) moet het altijd mogelijk blijven de automatische overname uit Wikidata uit te schakelen of te overrulen. Karmakolle (overleg) 23 nov 2023 16:34 (CET)[reageren]
Die informatie is sowieso te overrulen door gewoon zelf wat in te vullen. Tot nu toe (in elk geval bij alle infoboxen die ik ken) is het als volgt: niets invullen = Wikidata; iets invullen = lokaal. Mondo (overleg) 23 nov 2023 18:05 (CET)[reageren]
Klinkt goed! Zou ik met infobox plaats Tsjechië eigenlijk ook eens moeten doen. En burgemeester ook. Nu krijg ik - als ik zelf niet in de gaten heb dat het inwoneraantal of de burgemeester moet worden bijgewerkt - hulp van Zatev (NL:WP) en een paar mensen van CS:WP, dus dan zou het eigenlijk makkelijker zijn om het gewoon breed op Wikidata te trekken. Mondo (overleg) 23 nov 2023 18:07 (CET)[reageren]
Jullie praten er mooi omheen, maar er is geen consensus. Einde oefening, dus. En kan iemand een antwoord geven op de vraag wat het onoverkomelijke bezwaar is om de Wikidata-gegevens vóór plaatsing op WP:NL te controleren op feitelijke juistheid? HT (overleg) 23 nov 2023 21:16 (CET)[reageren]
Er hoeft hier geen consensus voor te zijn. Mondo (overleg) 23 nov 2023 21:41 (CET)[reageren]
En waarom niet? En kan je aub antwoord geven op mijn vraag hierboven? HT (overleg) 23 nov 2023 22:45 (CET)[reageren]
Enkele voorbeelden uit de praktijk over problemen met Wikidata: recent schreef iemand hier een lemma over een persoon met een andere nationaliteit in de aanhef dan in de infobox. Ik meldde dat aan de aanmaker, en kreeg als antwoord dat de nationaliteit in de infobox rechtstreeks van Wikidata kwam. En toen? Niets! Er werd door de aanmaker niets aangepast. Pas toen ik de nationaliteiten dan maar ging verwijderen, kwam er actie. Ander voorbeeld van ik denk een jaar geleden: een bijdrager plaatste achter elkaar infoboxen die automatisch uit Wikidata werden ingevuld. Er stonden tal van fouten in. Eigenlijk kon een blinde het zien, want er werden landen genoemd die tijdens het leven van de persoon van het lemma nog niet bestonden. Ook de nationaliteit klopte hier en daar niet. En dus wees ik de plaatser van de infobox daarop, maar niets werd door hem/haar in Wikidata aangepast. Zo wordt het toch wel allemaal lastig en tijdrovend. Bijdragers die gegevens uit Wikidata halen, moeten die gewoon vooraf aan plaatsing controleren. Ik zie het probleem niet. HT (overleg) 24 nov 2023 08:30 (CET)[reageren]
Die verwisseling van actuele en historische landen kom ik ook tegen in onze eigen infoboxen, om nog te zwijgen van de categorieën. Maar je had al begrepen dat dat mijn algemene punt is. Karmakolle (overleg) 24 nov 2023 09:14 (CET)[reageren]
Wikipedia en Wikidata zijn beiden een samenwerkingsproject. Zonder deze intergratie zouden de fouten waarschijnlijk veel later worden opgespoord. Tuurlijk zou de plaatser van een automatische infobox de gegevens moeten controleren vlak na plaatsing, maar zoals gezegd kwamen deze fouten altijd al voor (denk alleen maar al aan accurate vlaggen) en de verantwoordelijkheid ligt niet alleen bij de aanmaker/plaatser van een infobox. Sjoerd de Bruin (overleg) 24 nov 2023 09:17 (CET)[reageren]
@Sjoerd de Bruin Het zijn inderdaad samenwerkingsprojecten en juist dan heb je een eigen verantwoordelijkheid. Het is dan ongepast ongecontroleerde feiten te plaatsen, waarvan je weet dat een deel fout is en het is ook ongepast om gemelde geconstateerde fouten niet zelf te willen verbeteren. HT (overleg) 24 nov 2023 09:48 (CET)[reageren]
Ik merk op dat blijkbaar teveel redacteuren niet geïnteresseerd zijn in serieus redactiewerk, namelijk controleren wat zij plaatsen. Even buiten het maken van vergissingen of een foutje. Niemand is foutloos, ook ik niet. Waar het om draait is bij constatering van een fout daar actie aan willen verbinden. Ik bespeur vooral gemakzucht en niet heel veel bereidheid om serieus tijd te steken in een lemma, op een aantal noeste arbeiders na natuurlijk (zie schrijfwedstrijd). Sorry dat ik zo provocatief uit de hoek kom, maar ik neem mijn taak vrij serieus hier dacht ik en vind het niet erg motiverend wat ik hier lees. Het voelt een beetje als "gekke Henkie". Labrang (overleg) 24 nov 2023 18:15 (CET)[reageren]
Dat is helemaal niet gek, dat is liefde en toewijding. Helaas niet bij iedereen in even sterke mate aanwezig als bij jou, maar het zijn toch meer dan uitzonderingen! Karmakolle (overleg) 24 nov 2023 18:33 (CET)[reageren]
Natuurlijk zullen het meer dan uitzonderingen zijn ;-) Ik zie een heleboel (het meeste) niet natuurlijk, dus het is makkelijk generaliserend over te komen. Maar goed, wat er ook als leidend wordt genomen, het valt of staat met de eigen verantwoordelijkheid en de opvatting daarover. Labrang (overleg) 24 nov 2023 19:04 (CET)[reageren]
Precies, in infoboxen met alleen lokale gegevens staan ook vaak genoeg fouten. In dat geval zou HT beter kunnen pleiten om infoboxen helemaal af te schaffen (al zou ik daar tegenstemmen). Mondo (overleg) 24 nov 2023 12:36 (CET)[reageren]
On artikelen staan ook fouten. Die dan ook maar afschaffen? En als we artikelen afschaffen, dan maar meteen Wikipedia afschaffen. Ik trek het misschien door in het absurde, maar zoals al eerder aangegeven, beter data opschonen in plaats van doen of het er niet is. Misschien is het inderdaad nog te vroeg om overal infoboxen te plaatsen die volledig op Wikidata draaien, maar de tussenoplossing: lokale data gaat voor data uit Wikidata lijkt me een tussenoplossing, tot er een betere manier is om alleen "schone" data te tonen. Mbch331 (overleg) 24 nov 2023 12:46 (CET)[reageren]
Precies, geheel mee eens. Mondo (overleg) 24 nov 2023 12:47 (CET)[reageren]
Nagel op de kop. Karmakolle (overleg) 24 nov 2023 13:02 (CET)[reageren]
HT komt elke twee maanden hier een discussie starten over hoe erg WikiData wel niet is, en dat het een schande is voor de hele Westerse wereld. Het begint wel een beetje flauw te worden zo. Urinoise (overleg) 24 nov 2023 20:44 (CET)[reageren]
@Urinoise HT moet wel continue aangeven dat je geen info ongecontroleerd uit Wikidata moet overnemen, omdat elke twee maanden nieuwe voorstellen komen om dat wel te doen. De opmerking hierboven van Mondo dat er ook fouten in lokale infoboxen staan is juist waar het om het draait. Die fouten worden met de importtool van Wikidata ongecontroleerd overgenomen en vervolgens verspreid over andere infoboxen die op Wikidata werken. Ik vraag niet om Wikidata te deleten of om alle artikelen te verwijderen, maar om de Wikidata-gegevens eerst te controleren op juistheid voordat je ze overneemt. Het is voor mij onbestaanbaar dat hierboven diverse bijdragers alles uit de kast trekken om maar een excuus te vinden om dat niet te hoeven doen. HT (overleg) 25 nov 2023 09:01 (CET)[reageren]
Je moet politicus worden ;-) Je doet jezelf voor als "heel schappelijk", maar ondertussen is dat niet wat anderen zien. Urinoise (overleg) 25 nov 2023 09:38 (CET)[reageren]
@Urinoise Om politicus te worden, moet je allereerst goed kunnen liegen. Daar ben ik niet zo goed in. Ik speel liever open kaart :) Overigens ontwaar ik bij jou twee andere belangrijke eigenschappen van politici: namelijk het ontwijken van het beantwoorden van vragen en het bagatelliseren van een probleem :) HT (overleg) 27 nov 2023 11:30 (CET)[reageren]
Wantrouwen en 'ga uit van slechte wil' is anders een eigenschap die prima past in de hedendaagse politiek. Labrang (overleg) 27 nov 2023 12:25 (CET)[reageren]
@Labrang: Met alleen argumenten probeer ik aan te tonen dat als je van Wikidata gegevens overneemt, dat je die eerst op juistheid moet controleren. Wat @Urinoise: daarentegen doet is niet met argumenten tegengas geven, maar mij vergelijkt met onder meer Geert Wilders. Jij Labrang, komt eveneens met een persoonlijke aanval. Wikidata is een wiki. Daarin hoort voor elke bewering een gezaghebbende bron bij te staan, wil je een gegeven overnemen en voor de zekerheid dien je e.e.a. eerst nog eens op juistheid te controleren. We schrijven hier voor de eeuwigheid en voor iedereen op de wereld. Dan mag je best aandacht schenken aan wat je opschrijft. HT (overleg) 1 dec 2023 07:07 (CET)[reageren]
Waar heb ik jou met Geert Wilders vergeleken? Je moet nu echt ophouden met die ongein. Dit soort verzinsels zijn enorm beledigend. Ik ga je vanaf nu nooit meer serieus nemen, krijg de *&$%# maar!!! Urinoise (overleg) 2 dec 2023 19:09 (CET)[reageren]
Volgens mij zijn we het gewoon eens. Labrang (overleg) 1 dec 2023 08:32 (CET)[reageren]
@Urinoise Je vergeleek mij onder meer met hem in je bijdrage van 25 nov. 09:38 uur hierboven, waarin je schrijft: "Je moet politicus worden ;-) Je doet jezelf voor als "heel schappelijk", maar ondertussen is dat niet wat anderen zien." Juist dan in de campagnetijd van de Nederlandse Tweede Kamerverkiezingen is er in de Nederlandse media grote aandacht over een "mildere toon" die de rechts-radicale politicus Geert Wilders zou aanslaan. Velen vinden hem echter nog steeds een gevaar voor de rechtsstaat. Zie bijvoorbeeld Bas van der Schot die dat treffend samenvat in een cartoon in de Volkskrant van 20 nov. jl. (hier), waarin de woorden "milder, milder, milder" voorkomen en tegelijkertijd Wilders wordt weergegeven als een hyena. Zie ook de redactionele artikelen van de Volkskrant van 23 nov. 2023 (hier) en RTL-Nieuws van 20 okt. jl. "hier). mvg. HT (overleg) 3 dec 2023 06:05 (CET)[reageren]

"Volledige" naam[bewerken | brontekst bewerken]

Sorry dat ik iets aanhaal dat ik eerder al op WP:Overleg gevraagd aanhaalde, maar de reactie bleef nog wat uit en het geraakt niet netjes opgelost. Op Overleg:René Van Goidsenhoven opende ik, na wat (te) persoonlijk gedoe, een overleg met de vraag of de parameter "volledige naam" in infoboxen ook daadwerkelijk de volledige naam moet bevatten, incl. alle voor- en familienamen, of dat "iets anders" ook volstaat. Het gaat waarschijnlijk ook wat breder dan dit artikel. MichielDMN 🐘 (overleg) 30 nov 2023 21:19 (CET)[reageren]

Lijkt me dat een volledige naam ook echt een volledige naam moet zijn, dus inclusief alle 2e, 3e en 4e voornamen. In geval van deze René: neem aan dat zo'n bron per definitie de volledige naam vermeldt? Thieu1972 (overleg) 30 nov 2023 23:02 (CET)[reageren]
Het feit dat bij alle genoemde personen in het document geen tweede (en meer) voornamen staan roept bij mij de vraag op of dat wel een juiste aanname is. Tenzij in Belgie meerdere voornamen nauwelijks voorkomen. Als meerdere voornamen net zo gewoon is als in Nederland is de kans wel erg klein dat alle personen slechts een voornaam hebben. Maar het moet gezegd: het kan wel zo'n toeval. Labrang (overleg) 30 nov 2023 23:30 (CET)[reageren]
In het algemeen is de invulling van "volledige naam" best een probleem op WP:NL. Maar al te vaak zie ik een invulling slechts gebaseerd op een eigen vermoeden van de bijdrager. Ongeacht speculaties dient een volledige naam op WP:NL een gezaghebbende bron te bevatten. Steeds vaker zie je van Wikidata afgeleide infoboxen verschijnen. Daar hoort gewoon een gezaghebbende bron te staan, wil je de volledige naam overnemen. Veel van die namen daar zijn weer afkomstig van het onbetrouwbare Wikipedia. Een goed voorbeeld van een verkeerde invulling is de Nederlandse huwelijksnaam (combinatie achternamen van twee partners). Dat is in Nederland een niet-officiële naam. Er zijn heel wat Wikipedianen die niet weten dat een Nederlandse huwelijksnaam officieus is. Zelfs de mensen zelf weten het soms niet. En dus kom je Nederlandse huwelijksnamen tegen in infoboxen hier, die weer middels de import-tool naar Wikidata verhuizen en vanaf daar naar alle andere WP-taalversies. HT (overleg) 1 dec 2023 06:38 (CET)[reageren]
Een gedistribueerde waarheid moet simpelweg gegarandeerd kunnen worden dat dat ook die waarheid is. Zolang dat niet het geval is, is het vragen om verspreiding van onjuiste gegevens buiten het gebied waar wij hier verantwoordelijk voor zijn. Met andere woorden, het vergt een verantwoordelijkheidsbesef waarvan ik me afvraag of dat voldoende aanwezig is (en voldoende is niet voldoende, laat dat ook duidelijk zijn). Data integriteit valt of staat met die maximaal kunnen garanderen. Labrang (overleg) 1 dec 2023 09:25 (CET)[reageren]
Voor de goede orde. Een onvolledig element in wikidata is eerder regel dan uitzondering. Zie bijv.Sigrid Kaag
Hoe het eigenlijk bedoeld is zie Hillary Clinton. Onder 'volledige naam' wordt de geboortenaam verstaan, dat is dus met alle voornamen. Een ander veld is Gehuwde naam. Ldhank (overleg) 1 dec 2023 09:42 (CET)[reageren]
Toch zie je bij sjablonen als Infobox persoon en Infobox artiest dat dit anders geïnterpreteerd wordt (geboortenaam en volledige naam zijn aparte parameters). Dan lijkt het er voor mij meer op dat veel sjablonen én teveel open voor interpretatie zijn, én gewoon niet voldoende gestandaardiseerd zijn. Zou het een idee zijn om eerst (projectmatig?) de infoboxen voor personen te standaardiseren, en pas daarna over de rol Wikidata te gaan praten? AnarchistiCookie Overleg 1 dec 2023 12:11 (CET)[reageren]
De namen van parameters in infoboxen is sowieso een ratjetoe. In de twee genoemde heb je bv overlijdensplaats en sterfplaats. Maar dat zou op een andere plaats besproken moeten worden (je hebt ook image, foto, plaatje, afbeelding etc). Hobbema (overleg) 1 dec 2023 18:18 (CET)[reageren]
Klopt, maar dat komt door dit: “Omdat wij niet aan standaardisering doen. Iedereen doet hoe hij/zij het graag doet.” Mondo (overleg) 1 dec 2023 21:42 (CET)[reageren]
De "huwelijksnaam" is een ingewikkeld iets, omdat je in de USA die naam officieel als je eigennaam kunt laten vastleggen, en na een echtscheiding (of eerder) weer kunt laten aanpassen. In Nederland is en blijft je huwelijksnaam een eigen bedenksel (de mogelijkheden worden je wel beperkt tot vier) die nooit en te nimmer een officiële status verkrijgt. En dan heb je nog de mensen die hun huwelijksnaam na een echtscheiding aanhouden. Een welbekend voorbeeld is Bianca Pérez-Mora Macias. Bianca wie? Bianca Jagger! Of zij de toevoeging Jagger officieel heeft kunnen laten vastleggen, weet ik echter niet heel zeker, maar ik dacht het niet. HT (overleg) 3 dec 2023 16:43 (CET)[reageren]
En niet te vergeten dan in Nederland tussenvoegsels niet officieel lijken te zijn. Mijn moeder krijgt van officiële instanties, gemeentes en de overheid altijd post met haar naam zonder tussenvoegsels. En ze is niet de enige in de familie. Mondo (overleg) 3 dec 2023 17:20 (CET)[reageren]