Overleg gebruiker:Multichill/Archief/dec 2019

Pagina-inhoud wordt niet ondersteund in andere talen.
Uit Wikipedia, de vrije encyclopedie

Wikidata properties[brontekst bewerken]

Hoi Maarten, voor de molens is in Wikidata zijn er twee identificatie-nummers opgenomen. het id van de hollandse molens en van de molendatabase. De molenwereld heeft een paar jaar terug met het allemolens-project het Ten-Bruggecatenummer als leidend gesteld, en dat word nu ook bijgehouden. Ik wil dus het Ten-Bruggecatenummer invoeren, te beginnen op wikidata, en van daaruit naar wikipedia. Maar daar moet een property voor aangevraagd worden, en daar weet ik de weg niet in. Als link erachter zou een link naar alle molens het beste zijn, bijv deze voor Het Pink. Zou jij hiermee kunnen helpen, en het misschien aanvragen? Mijn tweede stap word een lijst opvragen bij een van de molendatabases om de property te vullen. Akoopal overleg 25 dec 2019 12:06 (CET)[reageer]

Opzetje gemaakt: zie hier. Er mogen nog twee voorbeelden extra bij, en mogelijk kunnen er nog wat parameters meer ingevuld. Ook moet het nog worden ingevoegd met de link bovenaan, als het af is. Vul mij gerust aan ;-) Edoderoo (overleg) 25 dec 2019 16:55 (CET)[reageer]
Dank Edo! Een tweede voorbeeld gegeven alvast, die ook laat zien dat het niet altijd nummers is, en dat dus wat aangepast. Ik ga er later beter naar kijken, maar dit is een goede start. Akoopal overleg 26 dec 2019 00:17 (CET)[reageer]
Tussen de bedrijven door afgemaakt, met ook wat mailwisseling met de mensen achter allemolens, die het zeker ook zien zitten om terug te linken maar wikipedia/commons via wikidata. Daar kan ik dan ook wat hulp bij gebruiken. Is een van jullie nog op de nieuwjaarsborrel? Had het nog niet gepland, maar dit is wel een goede reden om te gaan. Akoopal overleg 26 dec 2019 18:38 (CET)[reageer]
Ja, daar heb ik mij voor ingeschreven, dus daar zal ik wel heen gaan. Edoderoo (overleg) 26 dec 2019 23:19 (CET)[reageer]
Ok, dan moet ik daar ook maar beter over nadenken :-) Even over het voorstel, denk je dat het nu goed is? Er was al even door iemand een delete op geplakt, dus heb er maar vaart achter gezet. Akoopal overleg 26 dec 2019 23:27 (CET)[reageer]
@Akoopal, Edoderoo: Ik heb het voorstel nog wat bijgewerkt. Volgens mij kan deze toegevoegd worden. Multichill (overleg) 26 dec 2019 23:32 (CET)[reageer]
Dank. Voorstel toegevoegd. Nu even afwachten. Volgende stap word het vullen. Waarschijnlijk heb ik straks een csv met een ander id en het ten-bruggencatenummer, zijn er tools die daarmee om kunnen gaan of word het botwerk? Akoopal overleg 26 dec 2019 23:45 (CET)[reageer]
Met die csv kan ik waarschijnlijk wel een scriptje maken die dat kan inlezen. Er zullen vast ook tools voor zijn, maar daar heb ik nog steeds geen ervaring mee ;-) Maar we gaan het er sowieso wel inkrijgen. Edoderoo (overleg) 27 dec 2019 00:01 (CET)[reageer]
Wat id's erin schuiven is zo gepiept als je een csv hebt. Denk dat het handig is om het ook meteen aan mix'n'match toe te voegen. Is het trouwens een superset van Nederlandse Molendatabase-identificatiecode (P2863), Hollandsche Molen-identificatiecode (P2866) & Molendatabase verdwenen molens-identificatiecode (P2903)? Dan kunnen we daar wat constraints aan toevoegen. Multichill (overleg) 28 dec 2019 14:09 (CET)[reageer]
────────────────────────────────────────────────────────────────────────────────────────────────────Ik was zelf aan het zoeken, en ik vond openrefine. Dat lijkt mij een zeer krachtige tool waar ik dit mee wil gaan proberen, zojuist gedownload. En ja, het is een superset van de genoemde databases, waarbij allen een Ten-Bruggencatenummer hebben, maar er zijn ook anderen, waarbij het nog niet compleet is. Ik ga een eerste export vragen. Akoopal overleg 29 dec 2019 15:09 (CET)[reageer]
En openrefine werkt leuk. Ik heb een tweede export gevraagd met zowel het hollandse molen-id als het rijksmonumentnummers, ging me in de eerste instantie om meer matches te krijgen, en dat werkt ook. Echter vond ik ook duplicates entries, waarbij de ene het dhm-id had en de ander het rijksmonumentnummer, eentje zelfs waarbij degene met het dhm-id een verouderd rijksmonumentnummer had. Ook heb ik twee verwisselingen van rijksmonumentnummers gevonden gevonden. Eentje die ik nu moet samenvoegen zijn d:Q2067235 en d:Q17434906, maar die hebben een conflicterende commonscat. Die moeten samengevoegd worden, maar kom ik nu even niet aan toe. Als jij of een van de meelezers hier misschien even naar wil kijken, graag. Akoopal overleg 31 dec 2019 12:50 (CET)[reageer]
Openrefine is zeker leuk. Het wordt meer en meer gebruikt en kan ook steeds meer. Zou je nooit rijksmonumentnummers helemaal willen verwijderen zoals je op Molen Herinckhave (Q4488562) hebt gedaan? Het grote verschil tussen Wikipedia en Wikidata is dat we dingen die ooit waar waren niet verwijderen, maar voorzien van qualifiers. Helaas zijn we in de loop der jaren behoorlijk wat nummers kwijtgeraakt door overactieve Wikipedianen....
Ik zou gewoon alle gemakkelijke matches zonder conflicten toevoegen. Daarnaast alles importeren in mix'n'match via https://tools.wmflabs.org/mix-n-match/import.php zodat mensen het kunnen gaan matchen. Zou je nu al kunnen doen, maar dan loop je risico dat mensen dubbel werk doen. Multichill (overleg) 31 dec 2019 13:15 (CET)[reageer]
Hoi Maarten, ik heb ervoor gekozen om toch eerst zelf te matchen via openrefine, deels omdat ik het leuk vind, deels omdat ik dan gevoel van de data krijg. Door dit werk heb ik al snel om een tweede export gevraagd met ook de rijksmonumenten-nummers, zodat ik deels betere kwaliteit had, maar deels ook fouten vond. Tekenend was een rm-nummer verwisseling die ik op Wikipedia in 2013 al verbeterd had, maar toen was ik nog niet echt bewust van wikidata.
Dan voor je opmerking over rijksmonumentnummers, ik zal er rekening mee houden. Welke kwalifiers moet ik toevoegen om aan te geven dat dit een oud rijksmonumentnummer is en niet het huidige?
Om op mijn andere vraag terug te komen, hoe kan ik die twee commons-cat het beste mergen? De foto's kan ik met de hand overzetten, vanaf die met het adres naar 'Tide Mill, Middelburg' lijkt me het beste, zijn het er maar 3, en dan de beschrijving overzetten. Maar dan, nomineren, of kan je er een redirect van maken, of ...? Akoopal overleg 1 jan 2020 12:38 (CET)[reageer]
@Akoopal: Prima dat je zelf matching doet hoor. Zou ik waarschijnlijk ook doen. Als je helemaal klaar mee bent dan kan je de boel nog in Mix'n'Match schuiven voor het laatste stukje.
Ik zou het huidige Rijksmonumentnummer op rank "prefered" zetten en een einddatum aan de oude hangen en start datum aan de nieuwe. Die Commons category moet ik nog even naar kijken.
Ten-Bruggencatenummer (P7789) is nu aangemaakt. Nog wel een paar puntjes:
  • Niet alle links werken, zie bijvoorbeeld op De Huisman (Q5244453) gaat de link "04911 BIS BIS" naar https://zoeken.allemolens.nl/tenbruggencatenummer/04911+BIS+BIS (spatie + html encoding = + natuurlijk). Welllicht dat ze bij allemolens.nl de + in de url als spatie kunnen accepteren?
  • Ik heb een berg constraints toegevoegd. Een aantal zijn wellicht iets te strak. Daar zouden we suggestions van kunnen maken. We moeten even kijken hoe het met aantallen loopt.
  • Misschien aardig om een rondje constraints (kwaliteit) te doen op de bestaande molens? Op d:Wikidata:Database reports/Constraint violations/P2866 en d:Wikidata:Database_reports/Constraint_violations/P2863 staan vrij veel dingen die zo op te lossen zijn.
  • Ik denk dat het ook best de moeite is om wat tijd te steken in het zorgen dat de labels en beschrijvingen erop zitten en kloppen. Dat maakt de molens ook een stuk vindbaarder in talen anders dan Nederlands. Deel valt wel met robot te doen, maar dan moeten we wel de kwaliteit in de gaten houden. Daar heeft Edo wel ervaring mee.
Multichill (overleg) 11 jan 2020 14:23 (CET)[reageer]
Hee, dat is goed nieuws, ik ga met de property aan de slag. Ik kan denk ik een heel hoop gaan vullen. Op je vragen:
  • de encoding van de spatie met een + doorgestuurd naar mijn contact met allemolens. Even afwachten. Als ik trouwens met %20 encode werkt het wel.
  • Constraints zien er logisch uit. Worden constraints afgedwongen of geven ze alleen foutmeldingen? Het viel me op dat je twee type constraints had, 'is een molen' en 'is een (windmolen|watermolen|getijdenmolen|rosmolen)'. Is die eerste dan niet overbodig?
  • De kwaliteit gaan bekijken is zeker een doel. De constraints bekijken is mogelijk een begin, en naar de labels kijken enzo. Ook wil ik gaan kijken naar verdere vulling, van de entries van de molens, maar dan. moet ik even goed denken over structuur. Genoeg te doen.
Mijn eerste actie word nu de nummers zo veel mogelijk invullen. Ik zie dat je al constraints heb gezet, dus dat schoont dan al op.
Ik heb je trouwens gemist vandaag in Tilburg. Akoopal overleg 11 jan 2020 23:28 (CET)[reageer]
Nu ik ermee bezig bent vind ik nog een ander formaat, namelijk '06403-1' dus met een -1. Dus de regexp moet nog iets anders. Akoopal overleg 12 jan 2020 00:51 (CET)[reageer]
Bij een zoekquery is het normaal dat je spaties vervangt door plusjes. Maar je kan het ook met "%20" in Wikidata zetten en in de regexp. –bdijkstra (overleg) 12 jan 2020 10:45 (CET)[reageer]
Hoi André, ik ben benieuwd of ze het kunnen aanpassen, op Wikidata %20 gebruiken vind ik niet kloppen. Constraints geven alleen foutmeldingen. Afhankelijk van het type (mandatory, normaal of suggestion) ziet de melding er iets anders uit. Suggestion wordt geen constraint rapportage voor gemaakt. Die twee was me ook opgevallen. Die heb ik overgenomen van een van de andere properties. Ik vermoed dat we daar nog in een opschoon proces zitten en als dat helemaal schoon is dat de eerste eraf kan. Daar lijkt het in ieder geval wel op.
Qua verdere invulling zou ik graag een standaard manier hebben om aan te geven wat de aandrijving van de molen is (wind, water, paard, etc.) en wat de molen doet (water pomp, hout zagen, etc.). Ik zat al even op Hoover Dam (Q172822) te kijken voor inspiratie. Daar zitten zeker paar dingen tussen die van toepassing. Ik hoop dat het leuk was in Tilburg! Multichill (overleg) 12 jan 2020 11:54 (CET)[reageer]
Hoi Maarten, voor ideeën, mag ik je uitnodigen om op Wikipedia:Wikiproject/Molenproject/Wikidata je ideeën neer te zetten, lijkt me een betere plek. Ik wil ook nog even kijken of er op de Engelse Wikipedia mensen zijn die mee willen denken. Akoopal overleg 12 jan 2020 14:47 (CET)[reageer]