Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Resultaten/KPIs/KPI10: verschil tussen versies
Verwijderde inhoud Toegevoegde inhoud
Regel 50: | Regel 50: | ||
?dbnl owl:sameAs ?nta . |
?dbnl owl:sameAs ?nta . |
||
?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> . |
?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> . |
||
?nta |
?nta schema:sameAs ?wikidata . |
||
FILTER(regex(?wikidata, 'wikidata', 'i')) |
FILTER(regex(?wikidata, 'wikidata', 'i')) |
||
} |
} |
Versie van 10 mei 2021 13:31
Nieuws | Over onze samenwerking met Wikimedia | Projecten | Evenementen & bijeenkomsten | KPIs | Archief (2013-2014) | Alle pagina's |
KPI 10: Het gebruik van KB-identifiers in Wikidata, en vice versa
Wat meten we?
We meten 4 dingen, zowel absoluut als procentueel:
- Het aantal Wikidata-items dat een NTA-identificatiecode (P1006) heeft
- Het aantal links naar Wikidata in de Nederlandse Thesaurus van Auteursnamen (NTA)
- Het aantal Wikidata-items dat een DBNL-identificatiecode voor auteurs (P723) heeft
- Het aantal links naar Wikidata in de Thesaurus Auteurs DBNL
Waarom meten we deze KPI?
We meten deze KPI omdat we willen weten
- Hoe vaak de KB (d.m.v. de NTA- en DBNL-thesauri) optreedt als autoriteit over personen/auteurs in Wikidata (en daardoor ook in Wikipedia)
- Hoe vaak Wikidata gebruikt wordt als autoriteit over personen/auteurs in de twee genoemde KB-thesauri
We meten alleen deze twee, omdat er binnen Wikidata (op dit moment nog) geen andere eigenschappen/identifiers bestaan die 1-op-1 gekoppeld zijn aan KB-diensten.
Hoe meten we?
- 1) Het aantal Wikidata-items dat een NTA-identificatiecode (P1006) heeft
- We gaan er vanuit dat elk Wikidata-item precies 1 link naar de NTA bevat. Waar dit niet het geval is, zal de KB zich actief inzetten om deze afwijkingen strak te trekken.
- Absoluut: In https://www.wikidata.org/wiki/Property_talk:P1006 wordt onderaan de pagina, in het veld "Current uses", het actuele absolute aantal Wikidata-items dat de P1006-eigenschap heeft weergegeven.
- Procentueel: Het actuele totaal aantal Wikidata-items over personen is ook bekend, dus het procentuele cijfer is ook eenvoudig te bepalen.
- 2) Het aantal links naar Wikidata in de Nederlandse Thesaurus van Auteursnamen (NTA)
- We gaan er vanuit dat elk NTA-item precies 1 link naar Wikidata bevat. Waar dit niet het geval is, zal de KB zich actief inzetten om deze afwijkingen strak te trekken.
- Absoluut: we voeren onderstaande query in de SPARQL-zoekinterface van data.bibliotheken.nl uit:
SELECT count(?nta) as ?aantal WHERE { ?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> . ?nta schema:sameAs ?wikidata . FILTER(regex(?wikidata, 'wikidata', 'i')) }
- Procentueel: Het actuele totaal aantal NTA-items is ook bekend (kijk onderaan bij is schema:isPartOf van --> reources), dus het procentuele cijfer is ook eenvoudig te bepalen.
- Om precies te zien welke NTA-items een Wikidata-link bevatten, doen we de volgende query: (we zien de eerste 1000, haal 'LIMIT 1000' weg om alle resultaten te zien, kan dan wel even duren)
SELECT * WHERE { ?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> . ?nta owl:sameAs ?wikidata . FILTER(regex(?wikidata, 'wikidata', 'i')) } LIMIT 1000
- 3) Het aantal Wikidata-items dat een DBNL-identificatiecode voor auteurs (P723) heeft
- We gaan er vanuit dat elk Wikidata-item precies 1 link naar de DBNL-auteursthesaurus bevat. Waar dit niet het geval is, zal de KB zich actief inzetten om deze afwijkingen strak te trekken.
- Absoluut: In https://www.wikidata.org/wiki/Property_talk:P723 wordt onderaan de pagina, in het veld "Current uses", het actuele aantal Wikidata-items dat de P723-eigenschap heeft weergegeven
- Procentueel: Het actuele totaal aantal Wikidata-items over personen is ook bekend, dus het procentuele cijfer is ook eenvoudig te bepalen.
- Noot: er loopt binnen de Wiki-gemeenschap een langdurige campagne om (d.m.v. de zgn. Mix'n'Match-tool) zowel automatisch als handmatig DBNL-auteursidentificatiecodes aan meer Wikidata-items toe te voegen.
- 4) Het aantal links naar Wikidata in de Thesaurus Auteurs DBNL
- We gaan er vanuit dat elk DBNLauteurs-item (via de NTA) precies 1 link naar Wikidata heeft. Waar dit niet het geval is, zal de KB zich actief inzetten om deze afwijkingen strak te trekken.
- Absoluut: De DBNL-auteursthesaurus bevat geen directe links naar Wikidata, maar wel naar de NTA (zie deze sparql-query). De NTA bevat op zijn beurt dan wel directe links naar Wikidata, zie bij 2). M.a.w., we gebruiken de NTA dus als tussenstap om het aantal DBNL-personen met een (indirecte) Wikidata-link te meten. We voeren daartoe onderstaande query in de SPARQL-zoekinterface van data.bibliotheken.nl uit:
SELECT count(?nta) as ?aantal WHERE { ?dbnl foaf:isPrimaryTopicOf/void:inDataset <http://data.bibliotheken.nl/id/dataset/dbnla> . ?dbnl owl:sameAs ?nta . ?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> . ?nta schema:sameAs ?wikidata . FILTER(regex(?wikidata, 'wikidata', 'i')) }
- Procentueel: Het actuele totaal aantal DBNLauteurs-items is ook bekend (kijk onderaan bij Inverse relaties --> is void:inDataset van), dus het procentuele cijfer is ook eenvoudig te bepalen.
- Om de exacte concordantie tussen DBNL, NTA en Wikidata te zien, doen we de volgende query: (we zien de eerste 1000, haal 'LIMIT 1000' weg om alle resultaten te zien, kan dan wel even duren)
SELECT * WHERE { ?dbnl foaf:isPrimaryTopicOf/void:inDataset <http://data.bibliotheken.nl/id/dataset/dbnla> . ?dbnl owl:sameAs ?nta . ?nta schema:mainEntityOfPage/schema:isPartOf <http://data.bibliotheken.nl/id/dataset/persons> . ?nta owl:sameAs ?wikidata . FILTER(regex(?wikidata, 'wikidata', 'i')) } LIMIT 1000
Metingen
- Meting dd 07-02-2020 Op 07-02-2020 hebben we KPI 10 voor het eerst gemeten a.d.h.v. bovenstaande methode. De resultaten vind je op deze aparte pagina
- Update NTA dd 20-05-2020 75K NTA koppelingen aan Wikidata toegevoegd zie https://nl.wikipedia.org/wiki/Overleg_gebruiker:OlafJanssen#Nederlandse_Thesaurus_van_Auteursnamen_Persoon --> nog uitwerken
- Meting dd 07-09-2020
- Meting dd 19-01-2021