Wikipedia:De kroeg/Archief/20191004

Uit Wikipedia, de vrije encyclopedie


Defecte links naar Commons pagina's[bewerken | brontekst bewerken]

Ik heb een nieuwe pagina gemaakt: Gebruiker:Achim55/Bad links to pages on Commons. Vrijwilligers zijn welkom. Bedankt en groeten, --Achim55 (overleg) 24 sep 2019 11:35 (CEST)[reageren]

Ja, dat is teveel om in je eentje te doen. Ik zal ook eens kijken of er met een script icm WikiData een stuk van kan worden geautomagiseerd. Edoderoo (overleg) 25 sep 2019 10:16 (CEST)[reageren]
Ook Wikidata klopt de link niet altijd (althans de waarde voor P373). Als je script ook kan kijken naar de categorieën, dan is het wellicht een optie.
Categorie:Wikipedia:Commonscat met lokaal zelfde link als op Wikidata kan je niet aanpassen op basis van Wikidata (daar is de waarde voor P373 ook fout), Categorie:Wikipedia:Commonscat met lokaal andere link dan op Wikidata kan je wel overnemen van Wikidata (daar is de P373 waarschijnlijk wel goed). Mbch331 (Overleg) 25 sep 2019 19:40 (CEST)[reageren]
Ik ga er eerst een paar met de hand doen. Wellicht kan een script zien of de link wel/niet bestaat, dat kan voor Wikipedia-links in ieder geval wel, maar met Commons heb ik nog niet zoveel gedaan, en er zijn ook weinig voorbeeldscripts bij mij bekend. Ik heb er gisteren om te beginnen twee met de hand weggewerkt, een script schrijven begint immers altijd met oefenen door het werk handmatig te doen. Edoderoo (overleg) 26 sep 2019 08:46 (CEST)[reageren]
Ik ben daar recent ook mee bezig geweest en het viel me op dat veel nieuwe pagina's worden aangemaakt met {{Commonscat}} zonder dat de gelinkte Commons-categorie bestaat. Is daar preventief iets aan te doen? –bdijkstra (overleg) 26 sep 2019 09:20 (CEST)[reageren]
Dat is volgens mij niet alleen iets van de laatste jaren, maar ook iets van eerdere jaren, ben het eerder ook veel vaker tegengekomen. Romaine (overleg) 26 sep 2019 18:57 (CEST)[reageren]

Nalooplijst voor geboren en gestorvenlijsten van RonnieBot?[bewerken | brontekst bewerken]

Wat te doen met de artikelen van geboren en overleden per jaartal die aangemaakt zijn door RonnieBot, die vraag is wat onbeantwoord gebleven. Ik wilde dit al aankaarten maar was daarvoor niet meer in mogelijkheid gesteld, maar ik merk dat RonnieV inmiddels weer een andere controversiële wijzigingen heeft gedaan met zijn bot. Daarmee kan dit bericht als een trap na overkomen maar was en is niet zo bedoeld. Er was al afgesproken dat RonnieBot geen bewerkingen meer ging doen omdat het resultaat van diens updates op die pagina's naast de opmaak tot fouten of weer terugbrengen van fouten leidde, of halve verbeteringen opleverde. Echter is het probleem dat deze pagina's nog steeds vol met fouten staan. Het zijn er zoveel dat alles bijwerken eigenlijk ondoenlijk is zonder een goede ondersteuning. De grote vraag is of deze pagina's in de encyclopedie-ruimte behoren of niet.

De reden voor deze stelling is onder meer de ongebruikelijke constructie waarvoor RonnieV had gekozen, namelijk daar waar er al lijsten bestonden een tweede artikel aan te maken, zoals Lijst_van_personen_overleden_in_1985/Voorstel tegen over het al bestaande Lijst_van_personen_overleden_in_1985.

Een van de stellingen die RonnieV gaf was dat veel oude jaartallen niet zouden zijn aangemaakt als hij niet de bot had gedraaid op Wikidata-informatie. Die stelling gaat voorbij aan de correctheid van de inhoud van die lijst-artikelen. Een voorbeeld, op Lijst_van_personen_overleden_in_320-329 wordt Rausimond een Roemeens Staatshoofd genoemd. Heel Roemenië bestond nog niet. Het artikel geeft aan 'Hoofdeling (hertog) van een aantal Visigotische stammen.'. Lactantius is circa geboren en gestorven gegeven datums op het artikel en de lijst wordt niet gesproken van circa. Alexander van Alexandrië is of gestorven in 326 of 328, in het Nederlandstalige artikel wordt alleen 328 genoemd. De lijst spreekt van 326. Bij hem staat tevens in het Engels ' Patriarch of Alexandria'. Arnobius staat in het artikel gestorven in de 4e eeuw, in het Engelstalig en Duitstalige artikel spreekt van circa 330, en of je hem 'schrijver en filosoof uit het Oude Rome' moet noemen is ook een groot vraagteken. Gregorius de Verlichter is 'Catholicoi of Armenia, Catholicos of All Armenians' volgens de lijst. Uh? De sterfdatum staat in het artikel circa 331 en geboren in circa 257. De lijst zegt '329' en '252'.

Er staan dus op zo'n kleine lijst al enorm veel fouten en dubieuze informatie. Bovenaan de lijsten staat "Als er onvolkomenheden in deze lijst zitten, gelieve dan aldaar de gegevens aan te passen. Achter iedere persoon is hiervoor een link aanwezig met de aanduiding bewerken. Wijzigingen in Wikidata worden met enige (on)regelmatigheid geautomatiseerd overgenomen naar deze pagina." Dit is echter niet het geval (meer), daarnaast is dat enorm veel werk om alles goed te kunnen aanpassen op Wikidata. Ook is het soms onduidelijk hoe de informatie gehaald werd/wordt en dus hoe je van alles moet aanpassen. Daarmee wordt de drempel om de informatie aan te passen ook erg hoog en bovendien is de kans dat alles goed wordt verbeterd en dat deze informatie ook blijvend verbeterd blijft een stuk kleiner. Er is hier en daar wel geprobeerd aan te geven wat er mis is maar de praktijk liet zien dat de informatie die verbeterd werd soms niet goed ging of dat deze niet werden overgenomen.

Een idee is de door alle door RonnieBot aangemaakte te verplaatsen naar de gebruikersruimte van of RonnieBot of RonnieV, en eventueel een soort van nalooplijst aan te maken om de artikelen gefaseerd terug te brengen als de verbeteringen zijn doorgevoerd. Het probleem blijft daarbij dat als men Wikidata gebruikt dat het onduidelijk is of dat de informatie lang goed blijft en/of hoeveelheid manuren die daarin dienen te worden gestoken wel haalbaar zijn. Een idee is natuurlijk om de gebruikers helemaal alleen aan het werk te zetten. Dit is echter ook al een enorme taak. Voor de oudere jaartallen waarbij het om klein aantal gaat gaat dat misschien nog maar de andere. Een ander idee is het verwijderen van deze lijst-artikelen die van de hand zijn van de bot wegens teveel fouten. De kwaliteit van informatie op Wikipedia zal toch voorop moeten staan en niet de kwantiteit. Gezien de andere keren het ook werd besproken in De Kroeg en ook de andere acties hier werd besproken stel ik hier deze open vraag, hoe nu verder. Dagdeel (overleg) 24 sep 2019 11:27 (CEST)[reageren]

Als duidelijk aangetoond kan worden dat deze lijsten fundamenteel onbetrouwbaar zijn, bijv. als gevolg van het klakkeloos kopiëren vanaf Wikidata, lijkt verwijderen mij idd. de enige gezonde weg. We zitten dan dus wel weer zonder overzichten op jaartal, soit. Categoriebomen op jaartal zoals die op andere grote WP's allang gebruikelijk zijn willen we hier immers ook niet (ze zijn er in het verleden wel geweest, maar weer weggegooid door moderatoren die overtuigd waren dat lijsten zoals waar het hier om gaat, beter waren). De Wikischim (overleg) 24 sep 2019 11:41 (CEST)[reageren]
Opmerking Opmerking - RonnieV had zijn bot voor dit project al bewust stilgelegd. Voordat iedereen zich hierop stort, lijkt het me goed om eerst te horen of hij als aanmaker van de lijsten een idee/voorstel had/heeft over dat 'hoe nu verder'. Mvg, Encycloon (overleg) 24 sep 2019 11:42 (CEST)[reageren]
Dit project had eigenlijk moeten beginnen als nalooplijst, met de namen, jaartallen en beschrijvingen gescheiden. –bdijkstra (overleg) 24 sep 2019 11:42 (CEST)[reageren]
Bij Lijst van personen overleden in 690-699 lees ik o.a.
  • Autbodus, Belgische missionaris
  • Chlodulf, Belgische katholiek bisschop
  • Bertuinus van Malonne, Belgische monnik
Die eerste zou afkomstig zijn uit wat nu tot Schotland wordt gerekend, maar is blijkbaar in de 7e eeuw genaturaliseerd tot Belg. De beheerder van de bot die gebruikt is om dergelijke pagina's aan te maken, heeft niet alleen dat project stilgelegd, de bot heeft daarna een OT blok gekregen. De kwaliteit van de artikelen lijkt niet goed genoeg voor de hoofdnaamruimte dus tenzij die artikelen handmatig bijgehouden gaan worden lijkt me verplaatsen naar de gebruikersnaamruimte van RonnieV het meest voor de hand liggen. Als RonnieV ze daar niet wil lijkt me als tweede optie verwijderen. - Robotje (overleg) 24 sep 2019 13:23 (CEST)[reageren]
Toen het project begon was ik een gematigd voorstander. Het leek me wel interessant om te kijken hoe ver we met Wikidata konden komen. Gaandeweg werd ik steeds minder enthousiast. De beknopte biografietjes bevatten te vaak minder relevante details en lieten belangrijke dingen weg. Voor een deel is dat terug te voeren op de manier waarop RonnieBot is geprogrammeerd. Van Vladimir Lenin bakt RonnieBot bijvoorbeeld "politicus, revolutionair, schrijver, econoom, advocaat, journalist, filosoof en politiek theoreticus uit het Keizerrijk Rusland", terwijl in hetzelfde Wikidata-item ook staat dat de goede man "Russisch politicus, revolutionair, marxistisch theoreticus en grondlegger Sovjet-Unie" was - een veel adequatere omschrijving. Voor een ander deel weerspiegelen de tekortkomingen in de lijsten de tekortkomingen van Wikidata. De fouten die Dagdeel hierboven noemt, lijken me niet zomaar op te lossen door een andere selectie uit Wikidata. Kritiek op de lijsten leidde in eerste instantie wel tot kleine verbeteringen, maar in toenemende mate werd de kritiek door RonnieV gebagatelliseerd. En zo werd ik dus gaandeweg een tegenstander.
Mijn oplossing zou zijn: gewoon toegeven dat Wikidata zich momenteel nog niet leent voor dit soort toepassingen, de lijsten maar als mislukt experiment beschouwen en de hele mikmak als zijnde van onvoldoende kwaliteit in zijn totaliteit verwijderen. Naar mijn weten wordt niet naar de lijsten gelinkt, dus het is een pijnloze operatie. Sijtze Reurich (overleg) 24 sep 2019 13:33 (CEST)[reageren]
Hier komt ook nog eens bij dat sommige gebruikers de interne Wikidata-links in de lijsten zelf te onconventioneel vinden. Een paar maanden terug was daarover ook al deze discussie. De Wikischim (overleg) 24 sep 2019 13:45 (CEST)[reageren]
Diverse Wikipedianen hebben in voldoende mate aangetoond dat er nog heel wat schort aan die lijsten. Gewoonlijk wordt informatie eerst van te voren op juistheid gecontroleerd en daarna gepubliceerd. De info op Wikidata daarentegen wordt automatisch zonder enige controle vergaard en ook nog eens deels met gegevens uit Wikipedia, waarvan het hier staande praktijk is dat die onbetrouwbaar is. Eerder heb ik al twee keer voorgesteld om voor de Wikidata-lemma's een eigen website te beginnen - zodat er verder geëxperimenteerd kan worden, dat zou dan wikidata.nl moeten worden, maar heb daar geen enkele reactie op gehad, dus het zal geen goed plan zijn. Dan blijft wat mij betreft verwijderen als enige optie over. Alle - ik geloof - zo'n 1500 lemma's overbrengen naar een gebruikersruimte lijkt mij ongewenst omdat het jaren gaat duren voordat Wikidata op niveau is. Wel zou bekeken moeten worden of ze op de een of andere manier naar de privé-computer van de aanmaker kunnen worden overgezet, mits daarvoor een verzoek komt. HT (overleg) 24 sep 2019 15:08 (CEST)[reageren]
Per Sijtze Reurich, ook ik ben veel te veel fouten en ondeugdelijke zaken tegengekomen. Verwijderen dus. Gouwenaar (overleg) 24 sep 2019 20:40 (CEST)[reageren]
  • Ik heb een tijdje geleden, toen ik aangaf het werk aan deze lijsten voorlopig stil te leggen, al aangegeven dat ik daar in oktober op terug zou komen en het gesprek met de gemeenschap zou aangaan. Ik ben blij dat Encycloon me gewezen heeft op het opnieuw aankaarten van dit onderwerp in deze kroeg, maar ik ga er niet toe laten verleiden nu deze discussie aan te gaan. Enkele van de hier genoemde zaken zijn al uitvoerig aan bod geweest, een deel van de opgemerkte onvolkomenheden is al aangepast in Wikidata en zou zo in de lijst verwerkt kunnen worden. Maar voor de rest: oktober komt steeds dichterbij. Met vriendelijke groet, RonnieV (overleg) 25 sep 2019 02:09 (CEST)[reageren]
    Dank voor de eerste reactie van jouw kant maar ik moet zeggen dat mij die meteen verontrust. Waarom?, omdat blijkbaar niet doordringt dat de artikelen dermate slecht van kwaliteit zijn dat slechts "een deel van de opgemerkte onvolkomenheden is al aangepast in Wikidata" bij lange na niet voldoende is. Je kan niet aan de hand van een paar voorbeelden en die paar gemelde fouten die zijn gedaan verklaren dat het wel goed komt. Zeker omdat je bot ook geblokkeerd is inmiddels. Zoals je misschien aan de reacties hierboven kan lezen is dat het er nu echt omgaat wat te doen met de lijsten, verwijderen of verplaatsen naar je eigen gebruikersruimte, of zoals HT aangeeft voor je eigen computer. Zoals ook aangegeven in de opmerkingen hierboven is het feit dat het onduidelijk is waarom en hoe precies welke informatie werd gepakt door de bot waardoor het aanpassen nog een grotere drempel is. Er werd hierboven een voorbeeld gegeven dat de juistere beschrijving wel op Wikidata staat maar dus niet opgepakt werd door de bot. Dagdeel (overleg) 25 sep 2019 08:48 (CEST)[reageren]
    Ik weet niet of we met 'oktober' moeten denken aan 1 oktober of eerder 25 oktober, maar wat mij betreft zou er in dat tweede geval for the time being een twijfelsjabloon (oid) boven iedere lijst geplaatst kunnen worden. Encycloon (overleg) 25 sep 2019 11:26 (CEST)[reageren]
    Eerlijk gezegd ben ook ik hoogst verbaasd met dit antwoord van @RonnieV: !
    De gehele gemeenschap is in rep en roer geweest door de acties van Ronniebot, en nu moeten we maar wachten tot “oktober” voordat er een reactie komt. Ik vind dit niet getuigen van enige realiteitszin. Hoe moeilijk kan het zijn om de gemeenschap nu in een paar woorden te vertellen wat je intenties zijn met de pagina’s, ik denk dat de gemeenschap daar wel (zonder vertraging!) recht op heeft. Vr groet Saschaporsche (overleg) 25 sep 2019 11:36 (CEST)[reageren]
    Er staat, al geruime tijd, op deze pagina een stuk uitleg, met ook een nadrukkelijke uitnodiging om hierop in te gaan. Tot nu toe heeft niemand van die gelegenheid gebruik gemaakt. De opmerkingen her en der zijn van diverse aard, dat leent zich niet om in enkele woorden af te doen. Bovendien zou dat bijdragen aan een nog verdergaande versnippering van de discussie over deze lijsten, iets waar niemand bij gebaat is. De lijsten geven nog altijd weer wat er staat: datgene wat kort voor aanmaak, bekend was in Wikidata. Ik zal binnen twee weken het gesprek opstarten. Met vriendelijke groet, RonnieV (overleg) 25 sep 2019 11:51 (CEST)[reageren]
    Hoi RonnieV. Zowel in De Kroeg als op je overlegpagina is er genoeg discussie geweest en vragen, deels bleven die vragen vaak onbeantwoord. Een beetje vreemd om dan hier plots te verwijzen naar een pagina nauwelijks verder is genoemd of aangestipt; (verwijzen naar die pagina) en pas sinds 1 augustus bestaat. Het doet voorkomen alsof de gemeenschap niets of nauwelijks iets heeft gedaan/ondernomen terwijl dat helemaal niet het geval is. Bovendien gaat dit voorbij aan de vraag aan de wenselijkheid van deze artikelen in de huidige vorm in de encyclopedie-ruimte. En nogmaals je bot is geblokkeerd, dus ook daar dient rekening mee gehouden worden Dagdeel (overleg) 25 sep 2019 12:05 (CEST)[reageren]
Beste RonnieV, het is nu toch wel duidelijk dat het genereren van biografische lijsten uit wikidata de macht van een robot te boven gaat? Dat is helemaal geen schande, er zitten nu eenmaal te veel onvolkomenheden en ambiguïteiten in wikidata van personen. De voornaamste zijn - zoals door velen geconstateerd - nationaliteit en beroep/bezigheid. Zolang niet iemand handmatig en met kennis van zaken de juiste waardes een prioriteit geeft, waarna dit opgepikt kan worden door een bot, is dit een tot mislukken gedoemd project. Ik raad je echt aan hier mee op te houden. Tekstman (overleg) 25 sep 2019 13:02 (CEST)[reageren]
RonnieV kreeg op 8 september 2019 van Saschaporsche het verzoek om RonnieBot stil te leggen omdat Saschaporsche vond dat de kwalitiet van de artikelen m.b.t die geboren/overleden lijsten te laag was voor de hoofdnaamruimte. In reactie daarop schreef RonnieV o.a. [1] "Bedankt dat je me op de hoogte stelt van dit verzoek. Ik denk dat je een verzoek doet waarvan je de gevolgen niet overziet, maar dat zal ik bij je verzoek aangeven. ... maar dat sommigen de voortgang niet willen zien, of het in hun ogen niet snel genoeg gaat, ooit waren er mensen bang dat de komst van de trein ertoe zou leiden dat de koeien minder melk opbrachten... " Het komt op mij nogal arrogant over om een intussen bewezen techniek als de trein, te vergelijken met zijn eigen project waar nogal wat fout blijft gaat. Wellicht is het beter om te vergelijken met pogingen van Uber, Tesla en Apple om een zelfrijdende auto te maken. Daar zijn al best goede resultaten mee gerealiseerd maar het is nog niet goed genoeg voor massaproductie. In maart 2018 heeft een auto van Uber die gebruikt werd in een R&D project m.b.t. zelfrijdende auto's iemand doodgereden en daarop is besloten om testen op de openbare weg tijdelijk stil te leggen. De problemen bij het project van RonnieV zijn gelukkig niet zo ernstig dat er doden kunnen vallen. Op het eerste gezicht zien de pagina's die RonnieBot produceert er best wel aardig uit, maar het is volgens mij en (gezien de reacties hierboven) nogal wat andere wikipedianen nog niet goed genoeg voor de hoofdnaamruimte. Problemen die maanden geleden al geconstateerd zijn spelen nog steeds. Dan is het volgens mij beter het testen in de hoofdnaamruimte vooralsnog te stoppen, net als Uber begin 2018 besloot om vooralsnog de testen te stoppen op de openbare weg omdat de kwaliteit van hun systeem nog niet goed genoeg was. Voor de vooruitgang van de techniek zal het toch niet zoveel uitmaken of de output van de bot in de hoofdnaamruimte komt of in een gebruikersnaamruimte? Als RonnieV pas in oktober tijd wil maken voor overleg, prima, dan gaat de discussie maar verder zonder hem. Als hij weer tijd heeft, merkt hij wel of er intussen zonder hem al wat besloten is. - Robotje (overleg) 25 sep 2019 16:17 (CEST)[reageren]
Neem jij jezelf nog serieus met dit soort vergelijkingen, Robotje? Ecritures (overleg) 25 sep 2019 21:34 (CEST)[reageren]
Jazeker. Die eerste vergelijking was trouwens van RonnieV en die vergelijking klopt volgens mij niet zo best. Als je aan een nieuw systeem werkt en het in de pratijk gaat testen kan het gebeuren dat je er dan achter komt dat er hardnekkige problemen zijn waar na verloop van tijd nog steeds geen goede oplossing voor bestaat. Dan komt er volgens mij gewoon een moment om te besluiten dat het beter is de praktijktest 'on hold' te zetten om die problemen op te lossen in een omgeving waar anderen (in dit geval de lezers waaronder ook collega's) er minder last van hebben. Dat moment is voor mij echt wel gekomen met die lijsten van RonnieBot. Als jij denkt dat dat moment nooit komt, prima. Maar dan hoef je mij toch niet weg te zetten als iemand die de lezers van de discussie in de maling zit te nemen. Graag iets meer respect voor collega's die met praktijkvoorbeelden dat er nog serieuze kwaliteitsproblemen zijn met de pagina's die RonnieBot produceerde en in de hoofdnaamruimte plaatste. Soms verneem ik van mensen op een feestje, op straat of op een forum die iets zeggen/schrijven in de trand van "Het is echt zo, kijk maar op Wikipedia." Die hebben blijkbaar zo'n vertouwen in Wikipedia. Aan de ene kant maakt me dat blij, maar aan de andere kant vrees ik wel dat we dat enorme vertouwen in de kwaliteit moeilijk waar kunnen maken. Kwaliteit van de artikelen vind ik heel belangrijk en ik steek dan ook veel tijd in het vinden van goede bronnen als ik een artikel aanmaak of aanvul. Daar doe ik echt mijn best voor. Vind jij de kwaliteit van de artikelen dan niet belangrijk? - Robotje (overleg) 25 sep 2019 23:28 (CEST)[reageren]
En zelfde vraag voor @Tekstman: met het is nu toch wel duidelijk dat het genereren van biografische lijsten uit wikidata de macht van een robot te boven gaat?
Ik vraag het omdat ik het moeilijk vind niet te geloven dat jullie de lezers van deze discussie gewoon enorm in de maling zitten te nemen. Ecritures (overleg) 25 sep 2019 21:34 (CEST)[reageren]
Ik neem mezelf serieus ja. Hoe neem ik volgens jou de lezers "enorm in de maling"? (Met dit soort formuleringen is het lastig te geloven dat je van goede wil uitgaat, maar goed.) De zinnen erna leg ik toch uit hoe ik tot die conclusie kom? Mag je best gaten in proberen te schieten. Tekstman (overleg) 25 sep 2019 22:05 (CEST)[reageren]
Dan bied ik direct mijn excuses aan je aan Tekstman. Ik zal het proberen uit te leggen waarom ik (abusievelijk naar nu blijkt) dacht dat je je opmerking niet serieus meende. Je hebt trouwens gelijk wanneer je zegt dat daar slecht AGF uit blijkt. Uit de zin het is nu toch wel duidelijk dat het genereren van biografische lijsten uit wikidata de macht van een robot te boven gaat bleek in mijn ogen een groot onbegrip (kennis?) van hoe een script ( een "bot") te werk gaat. Het feit dat er nog onvolkomenheden in de output zitten heeft meer te maken met de input (in dit geval, hoe staat die data op Wikidata) en de wijze waarop de beschikbare data wordt geïnterpreteerd (noem het vertaald) en getoond. De conclusie die je daar zeker niet uit kunt opmaken is dat 'het genereren van biografische lijsten uit wikidata de macht van een robot te boven gaat'. Het maken van een script om een dergelijke moeilijke output (lijst met biografische gegevens) te creëren waarbij zoveel verschillende facetten komen kijken is per definitie een langdurig, iteratief proces waarbij dus stap voor stap de bouwstenen van het script op elkaar worden gestapeld en in elkaar worden geschoven. Het juist iets waar automatische scripts heel goed voor ingezet kunnen worden: er is zeker geen sprake van dat het genereren van dergelijke overzichten de macht van een bot te boven gaat. Het feit dat er aan het script geschaafd moet worden en stap-voor-stap verder gewerkt kan worden richting een resultaat dat door velen geaccepteerd en uiteindelijk zelfs gewaardeerd wordt, past niet goed in een vastgeroeste gemeenschap/wikipedia waar geen ruimte is voor vooruitgang of nieuwe middelen en mogelijkheden. Je tip voor het aangeven van de juiste prioriteit vind ik een hele goede al zou ik er zelf de voorkeur aangeven een veel beperktere keuze te maken in de lange ritsen 'occupations' die op Wikidata worden gegeven en er slechts maximaal drie ofzo te laten tonen. En zo zijn er nog veel meer wijzigingen, verbeteringen die we gezamenlijk aan dit proces hadden kunnen bijdragen'ik geloof namelijk wel in een positief eindresultaat. Nogmaals excuses, Tekstman, dat ik je opmerking aanzag voor grappenmakerij. Groet, Ecritures (overleg) 26 sep 2019 00:16 (CEST)[reageren]
Dank je wel voor je excuses en natuurlijk geaccepteerd. Ik had ook wel iets nauwkeuriger mogen formuleren. Een gestructureerde database is in principe uitermate geschikt om af laten grazen door een bot, het gaat om acceptabele output. Volgens mij bestaat er zelfs al zoiets als een "hoofdberoep" of "hoofdnationaliteit", ik meen dat eens gelezen te hebben, maar dat weet jij misschien? Ik zie echter meer beren op de weg dan jij, ik ben bang dat een acceptabele output bijna niet haalbaar zal zijn. Het grote probleem is volgens mij dat er op Wikipedia (in bijvoorbeeld de Engelse nog meer dan hier) een cultuur is ontstaan om zoveel mogelijk categorieën aan een artikel te hangen. Als iemand een blauwe maandag vakkenvuller is geweest in zijn puberteit valt hij of zij al in de categorie "supermarket employee" (ik chargeer maar een beetje). Die brij aan categorieën wordt ongefilterd als kenmerken aan een wikidata-item gehangen. Om daar de belangrijke uit te selecteren en te vlaggen is een te grote klus om handmatig uit te zoeken. Je idee om een maximum aan occuaptions te tonen loopt tegen hetzelfde probleem aan, hoe kies je welke daarvoor uit? Tekstman (overleg) 26 sep 2019 10:45 (CEST)[reageren]
@Ecritures, begrijp ik het echt goed dat jij die lijsten helemaal geweldig vindt? Sijtze Reurich (overleg) 25 sep 2019 23:57 (CEST)[reageren]
@Sijtze Reurich: ik zou niet weten waar je die wijsheid vandaan hebt. Ecritures (overleg) 26 sep 2019 00:01 (CEST)[reageren]
Jij vraagt je af of je mensen met kritiek op die lijsten wel serieus moet nemen. Mijn conclusie is dan dat jij die lijsten helemaal geweldig vindt. Sijtze Reurich (overleg) 26 sep 2019 00:09 (CEST)[reageren]
Foute conclusie trouwens dan. Ik vroeg me niet af of ik 'mensen met kritiek op die lijsten wel serieus moest nemen', ik vroeg me dat alleen af bij Tekstman en Robotje. Ik heb in andere discussies juist kritiek op de lijsten (of eigenlijk kritiek op Wikidata op Wikipedia) zoveel mogelijk heel serieus genomen, oplossingen proberen te vinden, verbeteringen aangebracht op Wikidata ed. Ik heb er zelfs een project opgezet (WP:WOW) om meer overleg te kunnen hebben, vragen te kunnen beantwoorden. Van kritiek, vragen en fouten kunnen dergelijke ondernemingen als de biografische lijsten alleen maar beter worden. De conclusie dat ik de lijsten 'helemaal geweldig vind' laat ik helemaal voor jouw rekening. Ecritures (overleg) 26 sep 2019 00:21 (CEST)[reageren]
Als eerder aangegeven, hier wordt door een 'bijdrager' willens en wetens foutieve informatie toegevoegd aan WP:NL (van elders) en dat is op WP:NL reden voor een OT-blokkade. Nu wordt én die foutieve informatie niet verwijderd én de 'bijdrager' wordt ook niet geblokkeerd. Dit begrijp ik niet. Paul Brussel (overleg) 25 sep 2019 21:41 (CEST)[reageren]

Wikidata vs wikipedia[bewerken | brontekst bewerken]

Ik kon even geen beter kopje verzinnen (maar wijzig gerust als je een beter voorstel hebt). Ik vraag me al een tijdje af welke werkwijze bestaat/wordt voorgesteld voor data die op Wikidata correct en/of volledig is terwijl op de Nederlandse wikipedia de informatie incorrect dan wel onvolledig is. Is er een plek waar dit gemeld kan worden? Wordt er gewoon gewacht totdat het een keer "boven komt drijven"? Zijn er andere voorstellen/ideeën die (mij bv) nog niet bekend zijn? Ecritures (overleg) 24 sep 2019 16:52 (CEST)[reageren]

Er zijn volgens mij wel zaken die op Wikipedia verbeterd worden waarbij een verschil met informatie die op Wikidata beschikbaar is, de trigger was om er naar te kijken. Denk bijvoorbeeld aan een afbeelding op Commons die volgens Wikidata relevant is terwijl de infobox in het nl-wiki artikel geen afbeelding heeft. Dat kan een goede reden zijn om uit te zoeken hoe dat zit met soms als positief resultaat een relevante afbeelding bij een artikel wat daarvoor geen enkel plaatje had. Het kan ook zijn dat de afbeelding in Wikidata helemaal niet goed past bij het onderwerp (en dan kan het dus weg uit Wikidata) of dat er buiten de infobox al een relevante afbeelding stond. - Robotje (overleg)
Hoi Robotje, ik bedoel data/informatie die Wikidata-bewerkers tegenkomen tijdens projecten, geheel los van deze geboorte- en sterflijsten. Het kan inderdaad data zijn rondom personen, maar ook rondom andere zaken: van plateelbakkerijen tot natuurreservaten, van schilderijen, standbeelden tot monumenten ror archeologische opgravingen om maar wat sporen/projecten te noemen. Ecritures (overleg) 24 sep 2019 17:46 (CEST)[reageren]
Het subkopje hieronder lijkt mij wel een goed voorbeeld. In wikidata staat de actuele link betreffende Commonscat, maar het lemma in wikipedia kan nog de oude commonscategorie vermeld hebben staan.Ldhank (overleg) 24 sep 2019 18:07 (CEST)[reageren]
Bevolkingsaantallen? Ciell 24 sep 2019 18:08 (CEST)[reageren]
ja er is veel informatie correct/volledig op Wikidata en niet correct/volledig op nl:wiki. De vraag is op welke wijze 'de gemeenschap' graag deze feedback/input wil. Ecritures (overleg) 24 sep 2019 18:45 (CEST)[reageren]
Ook het omgekeerde is waar: veel informatie op Wikidata is incorrect of onvolledig terwijl die op nl:wiki completer is. Wikidata is naar mijn mening nog niet rijp voor automatische overzetting van informatie naar nl:wiki. Quistnix (overleg) 24 sep 2019 19:04 (CEST)[reageren]
In het algemeen zijn er buiten Wikipedia veel bronnen te vinden (niet alleen in wikidata) met kwalitatief betrouwbaarder gegevens. Het blijft mensenwerk om te beoordelen welke gegevens wel en welke niet geschikt zijn om van elders over te nemen. Ik geef toe, dat is zeer, zeer arbeidsintensief werk, maar ik moet er niet aan denken dat een dergelijke beoordeling gaat plaatsvinden op een manier die zich aan de menselijke waarneming onttrekt. Gouwenaar (overleg) 24 sep 2019 20:40 (CEST)[reageren]
(Na BWC) Hoi Quistnix, zeker. Maar dat is ook niet de vraag. De situatie doet zich (zeer) regelmatig voor dat gegevens op WD wel correct/volledig zijn en op Wikipedia niet: welk proces stelt men zich daarvoor voor? kan het ergens gemeld worden? Wachten 'jullie' liever af tot het een keer komt bovendrijven? Ecritures (overleg) 24 sep 2019 20:43 (CEST)[reageren]
Hoi Gouwenaar, dat klopt zeker. Vandaar mijn vraag: als tijdens het plaatsen van dergelijke betrouwbare, bebronde informatie wordt opgemerkt dat de informatie van wikipedia incorrect/onvolledig is, hoe kan dat het best aangekaart worden op nl:wiki? Willen 'jullie' dat het überhaupt aangekaart wordt? (Dat was de laatste poging om deze vraag te verwoorden...) Ecritures (overleg) 24 sep 2019 20:46 (CEST)[reageren]
Het is, lijkt mij, aan degene die constateert dat elders kwalitatief betere/correctere informatie beschikbaar is om die informatie te verwerken in het artikel op wikipedia.nl Gouwenaar (overleg) 24 sep 2019 20:57 (CEST)[reageren]
Want? Als organisaties of personen op welke wijze dan ook hun betrouwbare, bebronde informatie op Wikidata zetten dan is het ook hun verplichting om het op Wikipedia te zetten? Die begrijp ik niet. Ecritures (overleg) 24 sep 2019 21:05 (CEST)[reageren]
Neen mijn optiek is die van de gebruiker van wikipedia, niet die van een gebruiker van wikidata. Organisaties en personen buiten wikipedia kunnen op tal van plaatsen betrouwbare, bebronde informatie plaatsen en dat gebeurt ook (wikidat is slechts een van de vele mogelijkheden, waar informatie te halen is). De keuzes wat wel en niet bruikbaar is uit die veelheid aan bronmateriaal zal toch hier gemaakt moeten worden. Of begrijp ik jou verkeerd? Gouwenaar (overleg) 24 sep 2019 21:14 (CEST)[reageren]
Ik denk inderdaad dat we een klein beetje langs elkaar heen praten :) (niet volledig, gelukkig) Het gaat mij niet om die keuze of het wel of niet op wikipedia mag. Het gaat me erom hoe Wikipedia-bewerkers graag op de hoogte willen zijn (komen?) van fouten/onvolledigheden die op wikipedia nl staan wanneer dit 'boven water' komt via het plaatsen van data op Wikidata (door respectabele organisaties met betrouwbare bronnen). Het is nu niet zo dat organisaties die uitgebreid (meta)data toevoegen aan Wikidata (of Structured data op Commons) daarnaast ook nog uitgebreid Wikipedia gaan bewerken om daar informatie te verbeteren, aan te vullen of die bronnen toe te voegen. Ik zoek eigenlijk een antwoord op de vraag: hoe zouden dergelijke verbeteringen dan wel aanvullingen wel hun weg naar Wikipedia kunnen vinden zodat dergelijke informatie hier niet incorrect of onvolledig blijft. Ecritures (overleg) 24 sep 2019 21:38 (CEST) PS Ik weet niet (meer) hoe ik moet 'terug inspringen' zodat we niet steeds verder aan de rechterkant van de pagina belanden :) [reageren]

────────────────────────────────────────────────────────────────────────────────────────────────────Dat heet {{uitspringen}}. :) Om het misschien wat concreter te maken: doel je dan bijvoorbeeld op een betrouwbaar Wikidata-overzicht van musea in Oost-Vlaanderen, waarmee de Lijst van musea in Oost-Vlaanderen kan worden aangevuld/verbeterd? Encycloon (overleg) 24 sep 2019 21:59 (CEST)[reageren]

Op Wikipedia:Wikiproject/WikidataOpWikipedia/Verbeteringen of Wikipedia:Wikidata-café lijkt mij het meest logisch. Afhankelijk van het onderwerp en de manier van verwerken (is er technische of inhoudelijke kennis nodig?) kan het eventueel vervolgens in een ander café, bij een Wikiproject of in de Kroeg onder de aandacht gebracht worden. Encycloon (overleg) 24 sep 2019 21:12 (CEST)[reageren]
Ik heb nog flink wat vraagtekens bij de structuur achter Wikidata. Ik heb indertijd de categoriestructuur op nl:wikipedia helpen opzetten en ik zie behoorlijk wat parallellen. Hopelijk beseffen de gebruikers van Wikidata wat de omvang is van het project dat ze hebben opgepakt. En verder vraag ik mij af hoeveel van de regelmatige "kroeggangers" nog nooit een bewerking op Wikidata hebben uitgevoerd. Ik zou ook graag van deze mensen zelf willen horen waarom ze dat (nog) niet hebben gedaan. Quistnix (overleg) 24 sep 2019 21:33 (CEST)[reageren]
Wikidata lijkt bedacht voor mensen met een IT-achtergrond. Ik kan nog via de interface hier op Wikipedia artikelen aan elkaar koppelen, maar je moet mij niet vragen wat items, labels, statements en properties zijn. Ik blijf daar dus verre van. Ik begrijp dat men via de Android-app wel zonder technische kennis kan bijdragen, maar die gebruik ik dan weer niet. Jeroen N (overleg) 24 sep 2019 22:17 (CEST)[reageren]
Ik denk dat het antwoord luidt: volkomen klantONvriendelijk. Ik heb een tijdje terug een bron toegevoegd aan een property. Kostte me iets van 15 minuten en een halve zenuwinzinking. The Banner Overleg 24 sep 2019 22:45 (CEST)[reageren]
Het kost mij ook veel te veel tijd om daar wat wijzigingen aan te brengen, maar je kan niet zeggen dat ik het niet geprobeerd heb. Gouwenaar (overleg) 24 sep 2019 22:56 (CEST)[reageren]
@Ecritures, klopt het dat de data van het biografisch portaal op wikidata zijn geplaatst? Is dat een voorbeeld van betrouwbare, bebronde informatie?Gouwenaar (overleg) 24 sep 2019 22:56 (CEST)[reageren]
@Gouwenaar: je mag wat mij betreft bijvoorbeeld het RMO, Naturalis, SAE of de KB als voorbeeld nemen in dit overleg. Mijn vraag lijkt me duidelijk: als er informatie op WD wordt gezet vanuit ene betrouwbare organisatie met betrouwbare bronnen waardoor vervolgens duidelijk wordt dat de informatie op Wikipedia niet correct en/of onvolledig is, hoe zou de 'wikipedia gemeenschap' daarvan op de hoogte willen komen? Hoe stellen jullie dat proces voor? Ecritures (overleg) 24 sep 2019 23:04 (CEST)[reageren]
(Na BWC) Dank Encycloon. Ik zie hier direct boven mijn bericht slechts allemaal zaken die geen antwoord zijn op mijn vraag (mijns inziens toch een hele redelijke vraag). Maar als 'de Wikipedia gemeenschap' niet graag weet dat bepaalde info hier correct of niet volledig is, dan slaap ik er geen nachtje minder om hoor. Het was een serieuze vraag, waarop blijkbaar alleen op gereageerd kan worden met meer gezeur en antwoorden die helemaal nergens over gaan. Het is toch echt niet relevant dat het The Banner niet lukt om een bron toe te voegen aan een statement of dat Wikidata is bedacht "voor mensen met een technische achtergrond" of dat er "vraagtekens zijn over de structuur". De vraag was (okay nog 1 keer dan): "Als er data op Wikidata staat die (in tegenstelling tot dezelfde info op Wikipedia) wel correct of bv volledig is, hoe stellen jullie je voor dat dit 'doorkomt' op Wikipedia?" zodat de informatie hier ook gecorrigeerd of bijvoorbeeld volledig gemaakt kan worden"? Probeer gewoon voor een keer even de vraag te beschouwen en beantwoorden: het zou zo maar de kwaliteit van Wikipedia kunnen verhogen! Daar is het gewoon allemaal om te doen? Ecritures (overleg) 24 sep 2019 23:00 (CEST)[reageren]
Geef dan wat concrete voorbeelden? Om wat voor zaken gaat het? Ik zou me voor kunnen stellen, dat er in bepaalde gevallen een melding gedaan wordt op de overlegpagina van een artikel, om hat artikel te controleren op de juistheid/correctheid vanwege strijdigheid met andere/betere bronnen. Gouwenaar (overleg) 24 sep 2019 23:26 (CEST)[reageren]
Een concreet voorbeeld, als een Nederlands voormalig voetballer onlangs is overleden is dit nieuws in Nederland, en is de kans groot, dat dit door een Nederlandse wikipediaan wordt opgepikt om bij te werken op wpnl en in wikidata. Daarentegen als een van de 1300 Japanse voetballers, die een lemma hebben op wpnl, komt te overlijden zal dit zeker geen nieuws zijn in Nederland. Het wordt in ons taalgebied niet opgemerkt, maar door een Japanse wikipediaan mogelijk wel. De overlijdensdatum (nog beter voorzien van bron) is dan bijwerkt in wikidata, en daardoor kan wikidata betrouwbaarder zijn. Ldhank (overleg) 25 sep 2019 07:31 (CEST)[reageren]
@Ldhank, volgens mij bedoelde Ecritures dit nu juist niet. Ik kan moelijk beoordelen wat de kwaliteit is van bewerkingen van Japanse wikipedianen of die uit welk ander land dan ook. Ik zou beslist geen voorstander zijn van het rondpompen van dergelijke zaken. Maar volgens mij bedoelde Ecritures iets anders, nl. betrouwbare gegevens die door gerenommeerde instellingen op Wikidata zijn geplaatst, zoals bijvoorbeeld door het Rijksmuseum van Oudheden, Naturalis, de Stichting Academisch Erfgoed of de Koninklijke Bibliotheek. Ik kan niet precies inschatten om welke en om hoeveel zaken het gaat, maar een melding op de overlegpagina van het desbetreffende artikel lijkt mij zeker bespreekbaar. Ik maak enig voorbehoud omdat het biografisch portaal - dat ik als voorbeeld noemde - ook onbetrouwbare, minder betrouwbare en/of gedateerde collcties heeft opgenomen. Niet voor niets waarschuwt het biografisch portaal zelf om de gegevens uit dergelijke bronnen niet voetstoots te gebruiken. Als bijvoorbeeld gegevens die afkomstig zijn uit Van der Aa, Weyerman of Wikipedia (om maar wat voorbeelden te noemen) hier gepresenteerd gaan worden als betrouwbaar dan lijkt mij dit geen vooruitgang. Gouwenaar (overleg) 25 sep 2019 12:45 (CEST)[reageren]

Zowel Wikidata als Wikipedia hebben juiste en niet juiste informatie. Het mooiste zou zijn wanneer het beter op elkaar zou zijn afgestemd. Ldhank geeft een mooi voorbeeld hoe dat kan, maar het laat ook zien dat Wikidata ook sterk afhankelijk is van de informatie van Wikipedia of iemand die op Wikidata uit dat land/regio of met die interesse het aanpast of verbeterd. Want inderdaad als een Japanse voetballer overlijdt die slechts een of aantal keer internationaal heeft gespeeld is de kans klein dat het buiten Japan bekend raakt of eventueel gespecialiseerde websites/bladeren. Dus dan moet je iemand in dat veld of land/regio hebben die of op de Japanse Wikipedia aanpast of die het op Wikidata aanpast.

Een aanmeldingspunt voor beide kanten zou handig zijn, zodat het ook gecontroleerd kan worden wie en waar de juiste informatie staat en waar nog eventueel de foute informatie staat. Zo'n aanmeldingspunt zou wel op elke Wikipedia kunnen staan (zoals nu iedere Wikipedia wel een eigen De Kroeg heeft bijvoorbeeld) en eventueel op een algemene pagina. Dagdeel (overleg) 25 sep 2019 09:03 (CEST)[reageren]

Zijn er botruns mogelijk die discrepanties tussen beide aan het licht brengen die dan op een onderhoudspagina getoond worden? BoH (overleg) 25 sep 2019 10:58 (CEST)[reageren]

Ja, discrepanties tussen de Nederlandse wikipedia en wikidata onderzoeken zal verbeteringen opleveren. Ik denk inderdaad dat een locatie buiten de naamruimte inrichten de te bewandelen weg is. PS Juist omdat het zowel een kennisinstituut als een Japanse wikipediaan kan zijn die wijzigingen in wikidata aanbrengt, is deze informatie kritisch beoordelen altijd essentieel. Dat neemt niet weg dat bijvoorbeeld een jaarlijkse update van inwoners van een plaats o.b.v. cijfers van een nationaal statistisch instituut uitstekend botmatig uitgevoerd kan worden. Tekstman (overleg) 25 sep 2019 13:36 (CEST)[reageren]
Hoe zou dat moeten werken? Als in de lopende tekst het inwonertal staat, dan kan een bot toch niet zien dat dat een inwonertal is, laat staan een onjuist inwonertal? Een bot lukt het meestal wel om een juist inwonertal te herkennen, maar een onjuiste wordt toch wel heel lastig. Het wordt makkelijker (voor de robot) als we de lopende tekst volstrooien met code als "Het inwonertal van deze plaats was (in het jaar {{Meetjaar inwonertal}}) {{Inwonertal}}.". Scheelt veel onderhoud, maar velen zullen het onhandig vinden. Over getallen in infoboxen heb ik het nu expres niet, want daar zit wat betreft ik net schreef geen probleem. --Frank Geerlings (overleg) 25 sep 2019 19:17 (CEST)[reageren]
Ik denk dat het met de onhandigheid wel meevalt. Het is even werk om het toe te passen, maar niet meer dan een jaarlijkse update en de jaren daarna heb je dan vrij. :) BoH (overleg) 25 sep 2019 20:13 (CEST)[reageren]
Mijn fout, ik dacht alleen aan infoboxen, hoe je dat in lopende tekst moet aanpassen is wat ingewikkelder. Met het zoeken en vervangen van "<aantal> inwoners" + een extra handmatige check moet je een heel eind kunnen komen. Tekstman (overleg) 26 sep 2019 10:10 (CEST)[reageren]
Slim idee om te kijken naar stukjes als "<getal> inwoners". Misschien kan je zo inderdaad nog best een eind komen. Waar het niet op die manier lukt kan je altijd nog een lijst met artikelen voor handmatige inspectie opstellen. --Frank Geerlings (overleg) 26 sep 2019 10:24 (CEST)[reageren]
Ter info: De optie van in de artikeltekst plaatsen van "Het inwonertal van deze plaats was (in het jaar {{Meetjaar inwonertal}}) {{Inwonertal}}." wordt al vele jaren gedaan en is eigenlijk de enige uitzondering op het verbod om in lopende tekst sjablonen te gebruiken (omdat er geen alternatief is en onvermijdelijk is). Er wordt dan geen gebruik gemaakt van Wikidata, maar van data uit array-sjablonen. (Merk op: de array-sjablonen worden niet rechtstreeks in het artikel geplaatst, maar via een hulp-sjabloon om enkele problemen te vermijden.) Romaine (overleg) 27 sep 2019 18:05 (CEST)[reageren]