Wikipedia:Wikidata-café/Archief/jan 2023

Uit Wikipedia, de vrije encyclopedie

Ik heb deze kerstvakantie OpenRefine weer eens opgepakt, maar ik merk dat het reconciliëren van mijn datasetje wat moeizaam gaat. Weet iemand hier of je nog steeds handmatig een nl-ingang toe moet voegen voor Nederlandstalige datasets...?
@Spinster: jij weet dit waarschijnlijk, maar mss heb je ook vakantie! Ciell need me? ping me! 28 dec 2022 20:40 (CET)[reageren]

Je bedoelt uploaden van Nederlandstalige datasets? Ik hoef daarvoor niks toe te wijzigen... Wat voor set is het? Dajasj (overleg) 28 dec 2022 22:07 (CET)[reageren]
Hi Dajasj, nee, ik bedoel het reconciliëren in OpenRefine, het opschonen en matchen van de set. In OR doe je dit voordat je de data overzet naar WD met behulp van bv Quick Statements. Ben je bekend met OR? Ciell need me? ping me! 29 dec 2022 08:42 (CET)[reageren]
Ik bedoelde eigenlijk ook reconcilen met "uploaden" ;) Ik ben verder ook bekend met OR. Mocht ik kunnen helpen, let me know (bijvoorbeeld op Discord!) Dajasj (overleg) 29 dec 2022 10:16 (CET)[reageren]
Het zou in principe moeten werken met de (default) Engelstalige Wikidata reconciliation service die in OpenRefine zit. Als de data die je wil reconcilen heel divers is (bijvoorbeeld een mix van allerlei verschillende concepten, mensen, plaatsen...), dan gaat het vaak wel wat moeizamer. En uiteraard kan de reconciliation service enkel dingen terugvinden die al een Wikidata item hebben. @Ciell ik heb inderdaad even vakantie maar laat maar weten als je het fijn vindt als ik bvb volgende week (eerste week van januari) even meekijk. Vele groetjes! Spinster (overleg) 29 dec 2022 09:05 (CET)[reageren]
Thanks @Spinster! Ik zou denken dat man/vrouw (P21) bv wel zou lukken, maar dat is er juist eentje die ik niet voor elkaar krijg, en ik herinnerde me dat we in vorige versies van OR die Nederlandse ingang toevoegden, maar ik kan er in de docs niets meer over terugvinden. Ben ik er volgende week nog niet uit kom ik zeker even bij je terug. Ciell need me? ping me! 29 dec 2022 09:22 (CET)[reageren]
Als bij mij OR moeilijk gaat doen en de simpelste dingen niet meer kan reconciliëren dan werk ik vaak met een verouderde versie. Update naar (geloof ik) OR versie 6.2 zou al de problemen kunnen verhinderen. Voor P21 (gender/geslacht) zou het niet nodig moeten zijn om de Nederlandse recon-link te gebruiken. Voor echt Nederlandse zaken kán het wel handig zijn. Maar allereerst de vraag Ciell of je een recente versie van OR gebruikt :) Ecritures (overleg) 30 dec 2022 14:15 (CET)[reageren]
Yes: ik heb 3.6.2 vers gedownload! Ciell need me? ping me! 30 dec 2022 14:32 (CET)[reageren]
En het werkt nog steeds niet okay? Dan checken we of het reconciliëren op de juiste manier verloopt. Stel je hebt een kolom 'gender/geslacht' met in ieder geval twee mogelijkheden, bijvoorbeeld vrouwelijk en mannelijk. Klik op het driehoekje voor de kolomnaam en kies Reconcile > start reconciling. Klik bij Services op de wikidata reconci.link (en) en klik bij 'Reconcile each cell to an entity of one of these types:' het bolletje Q18382802 aan (Q geen P). Staan er heel veel voorstellen van properties begin dan bij 'Reconcile against type: 'sex or gender' in te typen en bevestig dan Q18382802. Lukt het dan? Ecritures (overleg) 1 jan 2023 14:22 (CET)[reageren]

Waarschuwingstekens[bewerken | brontekst bewerken]

Op 15 december jl. merkte GeeJee in De Kroeg het volgende op: "Wikidata geeft waarschuwingen bij sommige info die niet kan kloppen (bv. naar aanleiding van geboortedatum in combinatie met nationaliteit)" Kan hij/zij of iemand anders mij uitleggen hoe dat waarschuwingstekens eruit ziet en waar ik het te zien krijg? Alvast bedankt. HT (overleg) 1 jan 2023 09:15 (CET)[reageren]

wanneer je enigszins bekend bent met wikidata, dan ben je zeker de uitroeptekens al tegengekomen. Het is inderdaad een waarschuwing, en is niet per definitie een foute ingave. Soms is er geen betere keuze. Je kan het bijvoorbeeld naspelen door een geboortedatum van een kind aan te passen die valt nadat de vader is overleden. Daarna draai je de bewerking terug. Zo'n geval kan kloppen, maar komt zelden voor. De uitroeptekens helpen mij vooral om structuur te zien in de opzet van wikidata.
Een ander symbool is een kortsluiting symbool,die verlangt wel een actie. Bijv wanneer een unieke waarde (zoals Isni nummer) aan twee WD elementen is gekoppeld. Ldhank (overleg) 1 jan 2023 09:53 (CET)[reageren]
Ik neem aan dat het ook mogelijk is om systematisch te zoeken op lemma's waar een bepaalde eigenschap een waarschuwing heeft?  →bertux 1 jan 2023 11:09 (CET)[reageren]
De "bliksemschicht"-waarschuwingen komen terecht op een rapportagepagina per property, te vinden via de link "Database reports/Constraint violations" op de overlegpagina. –bdijkstra (overleg) 1 jan 2023 12:40 (CET)[reageren]
Ldhank geeft al een goede uitleg over de basics van deze waarschuwingen. Naast het uitroepteken en het kortsluitingssymbool (een bliksem...) bestaat er ook een vlag. De basis van de waarschuwingen en meldingen van fouten is dat wikidata werkt met zogenaamde 'property constraints'; dit betekent dat er heel veel properties zijn waarbij een waarschuwing of foutmelding komt wanneer bepaalde zaken (mogelijk) njiet correct of juist onwaarschijnlijk zijn. Neem bijvoorbeeld geboortedatum: hierbij is in principe een datum mogelijk. Wanneer er twee verschillende datums worden ingevoerd dan krijg je een melding dat het onwaarschijnlijk (en dus wsl fout is) dat er twee of meer datums vermeld worden. Je kunt beginnen eens te kijken in de 'constraint portal' van waaruit je naar de properties (eigenschappen) kunt kijken die een (of meerdere) constraints hebben. Op de contraints portal mordt allereerst uitgelegd welke constraints er zijn: vervolgens kan je doorklikken naar een overzicht van properties met eenzelfde contraint (bv single value constraint etc).
Als je weet welke property je graag op juistheid (constraints) wilt controleren (bv P21 gender/geslacht of - iets heel anders - dan kun je ook op de OP van een property de zogenaamde 'constraint violations' bekijken. (Dit is een antwoord op jouw vraag @Bertux) Neem bijvoorbeeld de OP van P1006: NTA-identifier. Hierbij staat (niet geheel correct) vermeld dat iedere persoon/auteur maar een enkele NTA-identifier zou mogen hebben. Bij het onderdeel 'constraint violations' kun je dus bekijken welke Wikidata records van een auteur meerdere NTA-identifiers heeft. Of welke wikidata records een NTA-identifier delen.
Voor antwoorden op sommige (samengestelde) vragen als 'welke persoon heeft de waarde 'Koninkrijk der Nederlanden' bij property 'nationaliteit' terwijl diegene voor 1815 geboren is, is het vaak handiger om een specifieke SPARQL-query te schrijven. Als het een niet al te ingewikkelde vraag is dan wil ik best proberen een dergelijke zoekopdracht voor je te maken. Er zijn hier in het wikidata-café echter ook mensen die daar nog veel bedrevener in zijn. Laat weten als je/jullie nog meer specifieke vragen of zoekqueries hebben. Aanvulling: ik zie dat ik zelf op een van mijn wikidata kladblokpagina's die bovenstaande query (geboren voor 1815 maar toch Koninkrijk der Nederlanden bij nationaliteit al heb staan. (Momenteel query nummer 4 op mijn pagina met een paar SPARQL-queries.) Groet, Ecritures (overleg) 1 jan 2023 12:59 (CET)[reageren]

Bronvermelding mbv van Wikidata[bewerken | brontekst bewerken]

Hallo! Ik zet tegenwoordig veel verkiezingsuitslagen (bebrond) op Wikidata, en plaats die vervolgens ook Wikipedia. Maar uit praktische overwegingen laat ik dan de bron vaak weg (het is teveel werk). Het liefst doe ik natuurlijk wel. Ik ben daarom geïnteresseerd in en:Template:Cite Q. Is er iemand die dit kan overzetten naar nlwiki? Dajasj (overleg) 5 jan 2023 14:46 (CET)[reageren]

Ah daar heb ik een jaar (? of wat) geleden inderdaad ook naar gekeken met het idee 'dát zou handig zijn'. Ik plaats namelijk zelf ook veel bronnen die ik gebruik op wikidata. Ik wil er (samen met jou) wel induiken om te kijken in hoeverre we dat voor gebruik op de Nederlandstalige wikipedia kunnen omzetten/inrichten. Ecritures (overleg) 5 jan 2023 17:02 (CET)[reageren]
Leuk om te horen! Twee gebruikers maakt het al meer waard ;) Heb jij al wat meer ervaring met de modules die er bij komen kijken? Ik namelijk niet, maar wil het wel proberen!
Voor de geïnteresseerden; dit is wat ik wil doen: en:Marieke van der Werf#Electoral history. Dajasj (overleg) 5 jan 2023 17:18 (CET)[reageren]
Ik heb er al even naar gekeken, want ik "dacht dat doe ik wel even". Maar het is nog best lastig. Er zijn twee benaderingen: Een is het vrijwel 1‑op‑1 overnemen van de Engelstalige variant, waardoor je weliswaar veel features meekrijgt maar ook héél veel onnodige bagage, die wat moeilijk te onderhouden is.
Een andere manier is om een lokale variant te maken die {{Citeer web}}, {{Citeer journal}} {{Citeer boek}}, etcetera, aanroept. Dit is de benadering die de Fransen en de Italianen hebben gekozen.
Ik ben nog een beetje aan het wikken en wegen, maar ik neig naar het tweede variant. Dit is de weg die denk ik de minste tegenstand zal opleveren. –Frank Geerlings (overleg) 6 jan 2023 00:11 (CET)[reageren]