Wikipedia:Wikiproject/Procesbeschrijvingen Belgisch-Nederlandse podiumkunsten

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen

Deze pagina documenteert de data-uploads naar aanleiding van het gezamenlijk Vlaams-Nederlandse traject dat PACKED vzw (BE) en DEN (NL) aflegden met de steun van de Nederlandse Taalunie. Daarnaast bevat deze pagina ook de documentatie rond de data-uploads en edit-a-thons die gerealiseerd werden binnen het project van de Belgische podiumkunsten. Dit omdat deze exercities veel inzicht geven op welke manieren het werken met open data binnen de podiumkunsten vorm kunnen krijgen.

Inhoud

Aanleiding[bewerken]

De Commissie Digitaal Erfgoed van de Taalunie, heeft in de afgelopen jaren een aantal activiteiten opgezet om het gebruik van open data te promoten. Een daarvan richt zich specifiek op podiumkunsten en Wikipedia. PACKED vzw en DEN zijn een verkenning gestart naar mogelijkheden om het gebruik van open data voor de podiumkunsten te verbeteren. In Nederland is UvA/ Bijzondere Collecties daarin een belangrijke speler. UvA / Bijzondere Collecties beheert niet alleen een belangrijke collectie van het voormalig Theater Instituut Nederland, maar ook de Adlib (collectie)database en het wiki-platform Theaterencyclopedie (TE). Daarnaast is de nodige ondersteuning geboden door Bart Mulckhuijse (Wikiwerkers) voor de UvA/Bijzondere Collecties de upgrade verzorgt van het MediaWiki-platform en betrokken is bij de ontwikkeling van een verbeterde user-interface. In Vlaanderen vormt Kunstenpunt waar de collectie / database van het Vlaams Theater Instituut is ondergebracht een belangrijke bron van data. In deze procesbeschrijving zijn ook beschrijvingen terug te vinden van eerdere projecten waar PACKED vzw betrokken bij rond Wikipedia en de Vlaamse podiumkunsten. Voor de casus rond TE bleek de know how rond data-uploads buitengewoon relevant.

Waarom?[bewerken]

  • We merken dat het maar pover gesteld is met de aanwezigheid van informatie over de podiumkunsten uit Vlaanderen en Nederland op de Wikimedia platformen. In Vlaanderen blijkt dat van de 419 relevantste gezelschappen uit de recente podiumkunstengeschiedenis slechts 26% een Nederlandstalige en maar 5% een Engelstalige Wikipedia-artikel heeft. Bij de 404 onderzochte personen die in de podiumdatabank van Kunstenpunt het frequentst aan producties gekoppeld zijn (acteurs, regisseurs, dansers, choreografen, scenografen,...) is het iets beter gesteld: 38% heeft een Nederlandstalig Wikipedia-artikel en 9% een Engelstalig. Bij personen is het bovendien erg vaak het geval dat een aantal rollen in films of televisieseries wel goed gedocumenteerd zijn, terwijl dat voor een hele carrière in de podiumkunsten niet of nauwelijks het geval is. Ook veel andere Wikipedia-artikels over podiumkunsten zijn (inhoudelijk) voor verbetering vatbaar.
  • Wikipedia is wereldwijd de vijfde meest bezochte website. Met meer dan 12 miljard pageviews per maand blijkt Wikipedia de plaats bij uitstek waar een zeer grote groep mensen terecht komt wanneer ze naar informatie zoeken. Er ontstaat dus een probleem wanneer de informatie over Belgisch-Nederlandse culturele onderwerpen op Wikipedia van ondermaatse kwaliteit is of gewoonweg ontbreekt. Overigens komen niet enkel mensen op Wikipedia terecht, maar ook de crawlers van zoekmachines die het world wide web indexeren om de aanwezige informatie makkelijk vindbaar te maken. Wikipedia-artikels staan heel hoog in de Google ranking. Google toont bovendien rechts naast de zoekresultaten in een kader informatie die het uit Wikipedia haalt. Aanwezigheid op Wikipedia versterkt dus niet enkel vindbaarheid, maar ook de zichtbaarheid van de podiumkunstensector voor een breed publiek.
  • Het hergebruik van deze informatie door Google (en andere partijen) is mogelijk omwille van de vrije licentie waaronder Wikipedia zijn content via een publieke API publiceert. Dat hergebruik kan bepaalde interne werkprocessen in cultureel-erfgoedorganisaties en kunstenorganisaties verbeteren en efficiënter maken. In plaats van dat iedere organisatie zelf bv. biografische informatie over dezelfde podiumkunstenaars aanmaakt, kan die met behulp van linked open data worden gedeeld en zelfs worden hergebruikt voor de verrijking van de eigen data.
  • Alhoewel het maar pover gesteld is met de aanwezigheid van informatie op Wikimediaplatformen omtrent de podiumkunsten uit Vlaanderen en Nederland, bestaat er elders heel wat goede data over de podiumkunsten. De mate waar in die gegevens open zijn verschilt echter nogal. Tim Berners-Lee maakte een vijfsterrenschaal dat de verschillende gradaties van open data weergeeft. Het streefdoel is om data op het web beschikbaar te maken als Linked Open Data (= vijf sterren). Voor de meeste cultureel-erfgoedorganisaties en podiumkunstenorganisaties is het vandaag onmogelijk om dat niveau, of zelfs dat van vier sterren, op eigen kracht te bereiken. Publicatie van data op Wikidata is een manier om het niveau van de vijf sterren van linked open data te bereiken. Binnen Wikidata wordt de data niet enkel voorzien van URI's, maar ook gekoppeld aan andere open data (zowel uit de verschillende Wikimedia-platformen als uit externe bronnen).
  • Doordat Wikimedia Commons enkel materiaal publiceert onder vrije licentie, en de afspraken omtrent het hergebruik tussen de instelling en de fotograaf of cameraman vaak ontoereikend (of niet bestaande) zijn, is naast het encyclopedische ook het audiovisuele materiaal over de podiumkunsten erg schaars. Materiaal dat nog onder auteursrechtelijke bescherming valt kan niet, zonder de uitdrukkelijke toestemming van de rechthebbende, op Wikimedia Commons worden geplaatst. Het retroactief klaren van de auteursrechten vereist overigens een inspanning die voor veel cultureel-erfgoed- of podiumkunstensorganisaties te groot is om er prioriteit van te maken. Om dit aan te pakken willen we enerzijds podiumkunstenorganisaties (en in het bijzonder gezelschappen) sensibiliseren omtrent het belang van het publiceren van dit beeldmateriaal onder een vrije licentie, en anderzijds onderzoeken waar er zich eventueel rechtenvrij materiaal bevindt.

Literatuuronderzoek[bewerken]

Dit project is niet het eerste dat binnen Wikipedia, Wikidata of Wikimedia Commons aan de slag gaat met culturele content. Hieronder lichten we de belangrijkste lessons learned toe uit voorbije projecten die relevant gebleken zijn voor het gebruik van Wikimediaplatformen in de context van de Vlaams-Nederlandse podiumkunsten.

The value of sharing in Wikimedia - Trilce Navarete
  • Uit het Vlaamse FARO cijferboek 2016 blijkt dat:
    • slechts 5% van de Vlaamse cultureel-erfgoedinstellingen Wikimediakanalen gebruikt om hun digitale collectie te verspreiden. 37% gebruikt Europeana. We kunnen ons de vraag stellen of instellingen daardoor geen grote kansen laten liggen om een grotere zichtbaarheid en (digitaal) publieksbereik te genereren. Binnen sommige Europeanaprojecten wordt content aan Wikimediaplatformen toegevoegd. Europeana's eigen statistieken laten duidelijk zien dat het bereik via Wikimediaplatformen 10x groter is dan dat via het Europeana-platformen: iets meer dan 1 miljoen views per maand op Europeanawebsites tegenover circa 11 miljoen views per maand op de Wikimediaplatformen. Zelf tellen we in januari 2017 meer dan 13 miljoen page views voor pagina's die foto's of video's uit de Wikimedia Commons categorie Europeana bevatten.
    • 28,5% van de cultureel-erfgoedinstellingen zegt open data te voorzien. Met de vijfsterrenschaal voor open data van Tim Berners-Lee in het achterhoofd kunnen we ons echter afvragen op welk niveau die data zich bevindt. Het bestandsformaat, type licentie en de aanspreekbaarheid van de data via een goed gedocumenteerde en publieke API bepalen immers het hergebruiksgemak voor derden.
  • Uit het onderzoek naar Open Data van Nederlandse GLAM instellingen (2016) onthouden we dat:
    • het gebrek aan een heldere definitie van open data, en hoe deze vervolgens geïnterpreteerd wordt door de instelling, een zuivere meting in de weg staat. Cijfers kunnen op die manier zowel een onderschatting als een overschatting inhouden van welke instelling al dan niet bezig is met open data. Het model van Tim-Berners Lee biedt de noodzakelijke houvast om bij toekomstige bevragingen een objectieve weergave te genereren.
    • uit de Nederlandse cijfers blijkt ook dat je met de Wikimediaplatformen potentieel heel veel mensen kan bereiken. Wel blijkt dat de definitie van dat bereik soms problematisch is. Wat willen we meten: een aantal pageviews, interactie met de content, hergebruik in of buiten Wikimediaplatformen,...?
    • enerzijds instellingen beseffen dat het open beschikbaar stellen van data de naamsbekendheid en het bereik van hun collectie kan vergroten. Anderzijds zijn sommigen wel ontgoocheld over het concreet hergebruik van hun als open data ter beschikking gestelde collectie. Een realistisch verwachtingspatroon opstellen is dus belangrijk.
  • Succesfactoren voor Nederlands-Vlaamse samenwerking rond digitaal erfgoed, Lessen voor de toekomst uit Vlaamse en Nederlandse digitaalerfgoedprojecten en Waardeer samenwerking wijzen onder meer op de toenemende aandacht voor open data in het Vlaamse, Nederlandse en Europese beleid. De brede beweging naar open data in de erfgoedsector blijft echter uit. Pagina 8 van het onderzoeksrapport Waardeer samenwerking vermeldt "Dit is deels een kwestie van techniek: het informatiesysteem dat een instelling gebruikt, ondersteunt de publicatie van open data niet. Deels heeft het te maken met auteursrecht: het is niet aan instellingen om de licentievorm van de data die zij beheren te bepalen. Ook het beleid kan hier belemmerend werken: instellingen willen volledige controle houden over hun eigen data ten behoeve van kwaliteitsbewaking en omwille van de profilering, het verdienmodel en/of de afrekenbaarheid van de instelling. Ten slotte werkt het gebrek aan goede voorbeelden van (her)gebruikmodellen het vrijgeven van gegevens tegen." Het gebruik van Wikidata als platform naast het eigen systeem stelt instellingen in staat om (linked) open data te publiceren ondanks de beperking van het eigen systeem (bv. geen JSON, API, of SPARQL endpoint). Door via proeftuinen als dit project ook effectief resultaten af te leveren inzake gepubliceerde content op Wikimediaplatformen, hopen we tegemoet te komen aan de nood aan goede voorbeelden.
  • De visienota ‘een Vlaams cultuurbeleid in het digitale tijdperk’ toont eveneens een toegenomen aandacht in het Vlaamse cultuurbeleid voor open data en zelfs concreet voor de kansen die Wikimediaplatformen de sector bieden:
    • De minister ziet open data niet enkel als een kans en uitdaging voor de museum- en archiefsector, maar als iets dat een cultuurbrede aanpak verdient.
    • De visienota hanteert als uitgangspunt dat digitale culturele content maximaal open moet zijn. Minimaal dient alles wat zich in het publiek domein bevindt ook publiek te blijven. Digitalisering mag dus geen nieuwe rechten creëren. Het is echter niet de bedoeling dat we met het open-principe alle verdienmodellen onderuit halen. Waar een verdienmodel een efficiënte manier is om content bij een grote groep gebruikers te brengen, moet dit mogelijk blijven. Het bereiken van een zo ruim mogelijk publiek moet steeds prioritair zijn. De vraag of het altijd zinvol en haalbaar is om verdienmodellen te bouwen rond culturele content moet steeds gesteld worden.
    • Digitale culturele content moet ook vindbaar en bereikbaar zijn. Het doel moet zijn om tot een genetwerkt geheel te komen waarbij content van verschillende spelers verrijkt wordt.
    • Digitale culturele content moet bruikbaar zijn. Gebruik van open standaarden en authorities leidt tot een betere uitwisselbaarheid. Ook de vorm en kwaliteit van de metadata, persistente identificatie en heldere gebruiksrechten (bijvoorbeeld door Creative Commons licenties) spelen op dit vlak een belangrijke rol.
  • Trilce Navarrete & Karol J. Borowiecki (2016) Changes in cultural consumption: ethnographic collections in Wikipedia, Cultural Trends, 25:4, 233-248
    • Via online raadpleging van collecties, beschikbaar gesteld als open data, bereikten musea op vijf jaar tijd de helft van het aantal mensen dat ze tijdens een hele eeuw aan fysieke bezoekers mochten verwelkomen. Of: gemiddeld geldt dat het online collectiebezoek 18 maal hoger ligt dan het fysieke museumbezoek. Het is dus in het belang van musea - en bij uitbreiding ook voor andere culturele organisaties zoals podiumorganisaties - om buiten de muren te treden en ook daar te zijn waar het publiek is: online. Wikipedia is, als één van de populairste websites wereldwijd, een aantrekkelijke plek om als culturele organisatie op aanwezig te zijn met de content die je te bieden hebt.
    • Niet enkel de verhouding tussen fysiek en online bezoek is interessant, ook die tussen raadplegingen op de eigen website versus raadplegingen op platformen zoals Wikipedia. Uit de gevalstudie van het Tropenmuseum is gebleken dat Wikipedia-artikels die gebruik maken van foto's jaarlijks bijna drie maal meer bezoekers krijgen dan de eigen collectiewebsite. Een belangrijke factor die daarbij niet in rekening wordt genomen is evenwel de positie van de foto in het artikel (soms prominent bovenaan, soms verder weg in een galerij).
    • Wikimediaplatformen bieden een aantal voordelen voor beheerders van digitale culturele content om materiaal publiek te maken:
      • Het gebruik van een bestaand platform vraagt geen financiële inspanning in ontwikkeling/aankoop, noch in onderhoud.
      • Er is een grote gemeenschap van actieve gebruikers en bewerkers die er mee voor zorgt dat de content wordt hergebruikt, verrijkt en up-to-date blijft.
      • Meertaligheid van de platformen brengt een groter potentieel bereik met zich mee. Afbeeldingen kunnen bijvoorbeeld in Wikipedia-artikels in meerdere taalversies worden gebruikt. Ook kunnen ze soms in meerdere artikels worden gebruikt, waardoor ze opduiken in contexten waaraan je oorspronkelijk zelf niet had gedacht.
  • The value of sharing in Wikimedia - Trilce Navarete en Access as generator of value: museum collectons in Wikipedia:
    • Er zijn verschillende manieren om met een cultureel-erfgoedcollectie waarde te creëren. Er zijn ook verschillende vormen van waarde (economisch, moreel, cultureel,...), waarvan de definitie en het belang veranderen doorheen de tijd omwille van veranderende conventies. Onveranderlijk doorheen deze waardeschalen is het belang van goede, betrouwbare informatie. Dat is waar musea, archieven, kennisinstituten,... een rol te spelen hebben.
    • Eén van de doelstellingen van musea is om mensen toegang te bieden tot hun collecties. Digitale technologie kan mensen niet enkel dichter bij het fysieke museum brengen, ze kan ook de museumcollectie dichter bij mensen brengen.
    • De voordelen van Wikipedia zijn:
      • Wikipedia is uitgegroeid tot de ruggengraat van online kennis.
      • Informatie uit Wikipedia kan hergebruikt worden in nieuwe contexten binnen en buiten Wikimediaprojecten (bv. op sociale media).
      • Collecties kunnen nieuwe publieken bereiken. Dat blijkt duidelijk uit onderzoeken waarin gepeild wordt naar het aantal keren dat content op Wikipedia geraadpleegd wordt (zie hierboven).
      • Er ontstaan nieuwe synergieën tussen musea, de collecties en de gebruikers: samenwerking, interactie en cocreatie zijn hierbij de sleutelwoorden.
    • Instellingen die beelden willen vrijgeven over hun collectie worden regelmatig geconfronteerd met auteursrechtelijke bescherming tot zeventig jaar na overlijden van de auteur, waardoor de digitale ontsluiting van recent erfgoed achterop loopt. De grafiek van het Nederlandse Tropenmuseum die aangeeft voor welke schilderijen er ook fotografische reproducties beschikbaar zijn, spreekt boekdelen.
  • De Position paper OpenCultuurData (2013) stelt dat:
    • open data voor de GLAM-sector perfect aansluit bij haar missie om zo veel mogelijk mensen toegang te verlenen tot ons erfgoed. Door aan open data te doen kunnen ze dat niet enkel via hun eigen kanalen, maar kunnen ze ook gebruik maken van de kanalen daarbuiten. Als populair kanaal waar mensen informatie zoeken past Wikipedia dus perfect in dat verhaal.
    • open data samenwerking stimuleert tussen GLAM-instellingen.
  • Maarten Brinkerinks Case Study: Metrics for Measuring the Impact of Cultural Datasets toont onder meer dat:
    • een toename van de beschikbare hoeveelheid open beeldmateriaal ook tot een toenemend gebruik ervan op Wikipedia leidt en dus tot een grotere zichtbaarheid van de ontsloten content.
  • PACKED vzw initieerde projecten rond persistente identificatie:
  • Rapport van Linked Open Data publicatie met Wikidata, waarbij een groep van Vlaamse musea en kunstcollecties metadata over meer dan 30.000 kunstwerken als linked open data beschikbaar maakte via Wikidata. Uit de verdere opvolging blijkt hoe de publicatie van data een verrijkingsproces vanuit de Wikidatagemeenschap in gang zet.
    • Er worden vertaalde titels van kunstwerken in verschillende talen toegevoegd: Engels, Duits, Italiaans, Spaans, Russisch, Grieks, Hongaars, Turks, Arabisch, Japans,..., bv.: Q2459266
    • Er worden genres toegevoegd zoals 'religieus schilderij’ of 'trompe-l’oeil’, bv.: Q21614192
    • Er wordt iconografische informatie toegevoegd (zie het onderdeel 'beeldt af' op Q2480921). Daarnaast worden ook Iconclass codes toegevoegd (zie onderdeel 'representeert Iconclass-term') die men van de RKDimages-website overneemt met bronvermelding.
    • Er worden fotografische reproducties van kunstwerken gepubliceerd op Wikimedia Commons en gekoppeld aan de Wikidatarecords (zoals bijvoorbeeld reproducties van werken van Léon Spillaert van het MuZEE: Q22274279)
    • Er worden delen van eigendomsgeschiedenis toegevoegd, bv.: Q21623469 of Q21614708.
    • Er wordt informatie over de tentoonstellingsgeschiedenis van een werk toegevoegd, bv.: Q2844476 of Q21623469
    • Er worden afmetingen toegevoegd, bv.: Q18177692
    • Er worden Wikipedia-artikels over de kunstwerken geschreven, bv.: en:Self-Portrait at Seventy-Eight (Ingres).
  • Michelle van Lanschot werkt als Wikipedian in Residence bij Erfgoed Gelderland aan het beschikbaar maken van meer Gelders erfgoed via de wereldwijde encyclopedie Wikipedia en daaraan gerelateerde platforms. Zij heeft o.a. een uistekende manual geschreven rond het werken met wikimedia geschreven Handleiding Wikimedia voor Erfgoedinstellingen

PROJECT 1: Theaterencyclopedie & Wikimedia[bewerken]

UvA / Bijzondere Collecties beheert de Adlib (collectie)database en het wiki-platform Theaterencyclopedie (TE). Het vormt daarmee een belangrijke bron van (open)data over de podiumkunsten in Nederland en Vlaanderen. In het kader van dit project is van twee basale vragen uitgegaan en is bekeken hoe dit gerealiseerd kan worden.

  • Hoe kunnen we premiere-gegevens uit TE op Wikipedia publiceren?
  • Hoe kunnen Wikipedia pagina's over acteurs/actrices verrijken met informatie uit TE?

Bart Mulckhuijse heeft voor dit project een aantal semantische queries opgesteld en denkt mee op welke manier (ook in de toekomst) content van de TE verrijkt kan worden met behulp van Wikidata en content op de Wikipedia-pagina´s. Maar ook hoe de beweging andersom gemaakt kan worden en content en links naar TE via de Wikiplatformen onder de aandacht van een breed publiek kan worden gebracht.

Hiermee wordt een basis gelegd om verdere stappen te zetten rond data-uploads naar Wikidata en de uitwisseling van content over en weer tussen TE en Wikipedia.

TE is opgezet mbv Mediawiki[bewerken]

De TE is ontwikkeld op basis van Mediawiki.

Meeschrijven aan TE[bewerken]

Je kunt je aanmelden en registreren als redacteur. Daarmee kun je zelf meeschrijven aan de TE. Zie hiervoor de Basisregels

Auteursrechten[bewerken]

Om gebruik te mogen maken van informatie op TE op bv het Wikiplatform moet dit in een disclaimer op de website van TE vermeld worden. De formulering op de website van TE was wat dit betreft nog niet waterdicht. Inmiddels heeft UvA/TIN [deze tekst aangepast en is deze nu als volgt:

"Data en teksten die op de Theaterencyclopedie staan vallen onder een CC BY_SA licentie. Daarmee kunnen de teksten en de data door iedereen gebruikt en aangepast worden, mits de bron wordt vermeld. (Meer informatie, zie Creative Commons licentie CC BY_SA) Dit geldt niet voor de afbeeldingen, deze zijn auteursrechtelijk beschermd."

De rechten voor gebruik van afbeeldingen op TE zijn afgekocht, maar dit fotomateriaal is dus niét beschikbaar voor ander gebruik.

Export uit de Productiedatabase TE[bewerken]

In de Adlib database worden productiegegevens bijgehouden. Dit deel van Adlib wordt ook wel de Productiedatabase of de premierelijst genoemd. Momenteel voeren redacteuren van Theatermaker deze gegevens in tbv publicatie van de agenda met premiere gegevens.

Selectie 10 Vlaamse gezelschappen[bewerken]

Voor deze pilot kijken we naar gegevens in TE van 10 Vlaamse organisaties die hebben samengewerkt met Nederlandse gezelschappen (sinds 1993):

  1. Kunstenfestivaldesarts
  2. Kaaitheater
  3. NTGent
  4. deSingel
  5. Muziektheater Transparant
  6. Vooruit
  7. STUK Kunstencentrum vzw
  8. TAKT/Dommelhof
  9. Toneelhuis
  10. Cultuurcentrum Hasselt

XML[bewerken]

Voor deze tien Vlaamse gezelschappen is een pointer file in Adlib aangemaakt. Daarna heeft Henny Dolfsma (UvA, adlib beheerder) een Adlib-export gemaakt in het XML formaat, met alle producties waaraan deze 10 Vlaamse gezelschappen hebben gewerkt als producent of co-producent. Het gaat hierbij om ruim 700 producties.

-> Een voorbeeld van zo´n XML export vind je hier in een Google Drive.

Van XML naar Excel[bewerken]

Via een bewerkingsspreadsheet heeft DEN dit opgeknipt in diverse werkbladen.

  • Stap 1: De XML export wordt geïmporteerd in het Excel sheet. Via Gegevens/Van andere bronnen > Kies: Van XML-gegevensimport.
  • Stap 2: [Copieer alle gegevens als platte tekst naar een apart werkblad. Hier ga je de gegevens verder bewerken. Voeg hier twee kolommen toe: Kolom A met Productie ID en Kolom B GROUPING.
  • Stap 3: De gegevens die bij een productie horen hebben allemaal het zelfde productie ID (kolom A). De gegevens per productie staan in een groot aantal rijen. Gegevens over bijvoorbeeld producent en coproducent staan in een aantal rijen waarbij alleen de kolommen D t-m K informatie bevat. Die over de uitvoerenden staan in rijen waarbij alleen gegevens staan in kolommen L t/m AB.
  • Stap 4: In kolom B (GROUPING) neem je een tekstfunctie op die aangeeft wat voor gegevens in deze rij staan:
´=ALS(+E3<>"";"(co)producent";ALS(+L3<>"";"uitvoerenden";ALS(+AC3<>"";"discipline";ALS(+AH3<>"";"beeldmateriaal";ALS(AT3<>"";"andere materialen";ALS(BG3<>"";"premiere";ALS(+CJ3<>"";"titel";ALS(+CR3<>"";"event";ALS(+DE3<>"";"media aandacht";ALS(+DK3<>"";"termen";ALS(+DP3<>"";"venue";"")))))))))))
  • Stap 5: Door kolom GROUPING te filteren op bv "titel", krijg je alleen de rijen te zien waarvoor de kolommen met titelgegevens gevuld zijn. Copieer en plak deze waarden in een apart werkblad Titel. Herhaal dit voor de verschillende typen GROUPING die je nodig hebt.

Zorg wel dat je altijd kolom A met productie ID meeneemt! Omdat je via deze id alle gegevens kunt blijven koppelen.

Op deze manier is de XML met productiegegevens opgeknipt in verschillende werkbladen met per productie (productie id) informatie over:

{werkblad} naam [KOLOM] naam waarde toelichting
table 1 �- �- dit is een zogenaamde table die Excel automatisch aanmaakt als je een XML import doet.
kolomnamen �- �- listing van alle kolomnamen uit {table}. Via: Selecteer (Rij 1) / Copieer / Plakken speciaal (transponeren)
data 1 �- �- platte tekst variant van gegevens in {table}. Selecteer (alle gegevens) / Copieer / Plakken speciaal (waarden). Hieraan zijn nog 2 kolommen toegevoegd. Kolom A met Productie ID en Kolom B Grouping.
data 1 GROUPING - hiermee bepaal je welk type inhoud in de rij staat
toelichting �- �- werkblad met deze toelichtende teksten.
producties en coproducenten GROUPING (co)producent producenten
uitvoerenden GROUPING uitvoerenden diverse functies
discipline GROUPING discipline toneel, dans, muziektheater etc.
beeldmateriaal GROUPING beeldmateriaal verwijzing naar foto's en affiches in collectie
andere materialen GROUPING andere materialen verwijzing naar andere materialen in collectie (bv tekst, programmaboekje)
premiere datum + locatie GROUPING premiere datum + locatie premiere datum en locatie
event GROUPING event in kader van festival?..
titel GROUPING titel titel van de productie
media aandacht GROUPING media aandacht review,?..
termen GROUPING termen tags in adlib
venue GROUPING venues speellocatie en plaats waar de premiere plaatsvond
-> Dit spreadsheet waarmee je een Adlib XML-export kunt opknippen vind je hier. -> Om een tabel uit Excel (csv) naar wiki te exporteren: http://area23.brightbyte.de/csv2wp.php

Wikimedia platformen[bewerken]

Cultureel-erfgoedorganisaties en culturele organisaties in ruimere zin kunnen veel hebben aan de Wikimediaplatformen, niet door raadpleging maar ook door er zelf inhoud aan te leveren. Je kan bv. het schrijven van Wikipedia-artikels faciliteren, foto’s opladen op Wikimedia Commons of datasets op Wikidata. PACKED-medewerkers hebben een reeks presentaties verzorgd over de mogelijkheden voor culturele organisaties om zelf actief aan de slag te gaan. Wat zijn de (on)mogelijkheden van de wereldwijde encyclopedie Wikipedia en haar platforms? Hoe werken die platforms en wat is het potentieel ervan? Welke ervaring hebben (andere) erfgoedinstellingen met Wikipedia? Hoe werken de tools en applicaties die je kunt inzetten? Presentatie over het gebruik van de wikimedia platformen

Wikidata en Q nummers[bewerken]

Wikidata en Q nummers

Open Refine[bewerken]

Belangrijk hierbij is te weten dat er om de Adlib database van TE unieke codes hangen aan producenten, venues, producties en uitvoerenden. Voor de 10 Vlaamse gezelschappen en de Top 15 venues heeft DEN de zogenaamde Q-nummers in Wikidata opgezocht. Daarvoor is gebruik gemaakt van OpenRefine. OpenRefine is een ideale tool om gegevens op te schonen, te bewerking. De standaard voorziening Reconciliate spreekt de Wiki API aan om bij de waarden in een aan te geven kolom te matchen met Wikipedia en terug te geven of bij die entry ook een Wikipagina van beschikbaar is. Ook kun je de Q-nummers opzoeken om vervolgens aanvullende informatie uit Wikidata op te halen. Voor een theater kan dat bijvoorbeeld het adres, plaats, url, geo coordinaten zijn.

  • Stap 0: Maak een project aan en laat je gegevens op naar Open Refine
  • Stap 1: schoon je gegevens op. Zorg dat de kolom waarbij je wiki entries wilt zoeken qua formaat/opmaak overeenkomt. Met Open Refine kun je bv waarden uit kolom <"voornaam"> en kolom <"achternaam"> combineren in een toe te voegen kolom <"Voor & achternaam">.
  • Stap 2: Via edit/kolomtoevoegen/reconciliate : zoek op inhoud kolom geef resultaten met een wikipedia metzelfde naam terug.
  • Stap 3: Geef aan aan welke entry je een record wilt koppelen.
  • Stap 4: Met .... voeg je een kolom toe dat het Q-nummer ophaalt en toevoegd aan je bestand.
  • Stap 5: Verrijk je gegevens door waarden uit Wikidata op te halen. Denk bv aan adresgegevens, geo coordinaten, maar ook geboorte- en sterftdata, etc.
  • Stap 6: Sla je project op, exporteer de resultaten in bv een Excel formaat.
-> Voor het werken met OpenRefine zijn er een aantal goede tutorials te vinden op YouTube. En ook op Github

Wikidata Query Service[bewerken]

Wiki biedt een zogenaamde Wikidata Query Service om gegevens uit het Wikiplatform op te halen. Er is een editor waarmee je queries op basis van SPARQL kunt samenstellen. Zie bijvoorbeeld deze query: welke acteurs er in Wikipedia staan, die geboren zijn in Amsterdam. Op basis van dit query voorbeeld kun je varianten maken.

Verrijken van informatie[bewerken]

Langs deze weg is informatie op TE te verrijken met informatie uit Wikidata en wikipedia .En andersom door zogenaamde triples samen te stellen kun je informatie toevoegen. Door dit in een upload te doen kun je dit systematisch voor een batch gezelschappen, acteurs, podia doen.

Via SPARQL kun je dus ook snel inzicht krijgen in wat er aan gegevens beschikbaar is in Wikipedia / WIkidata. De query op TE voor wat betreft de entries over theaters, laat zien dat van de meeste theaters er geen url naar de website is opgenomen. Via SPARQL kun je snel zien dat of deze bv wel in Wiki te vinden zijn. Via een reconsile in Open Refine, via dumpt met behulp van SPARQL zijn dit soort gegevens op te halen en eventueel aan te vullen. nb. Om gegevens in TE aan te vullen met behulp van gegevevens in bv een Excel bestand met de juiste id´s moet nog bekeken worden.

Gegevens ophalen[bewerken]

Er zijn een aantal manieren om gegevens uit MediaWiki c.q. TheaterEncyclopedie te exporteren. Een korte samenvatting hiervan vindt je op de MediaWikiGids. Na evaluatie zijn er twee methoden gekozen om mee verder te gaan, die het beste aansluiten bij de behoeften rond deze pilot:

  1. Semantische query t.b.v. het exporteren van lijsten en tabellen (“indexen en infoboxen”)
  2. Standaard XML-export functionaliteit van MediaWiki t.b.v. het exporteren van content (“inhoud van pagina’s”)

De redenen voor de keuze van deze methodes zijn:

  • Direct beschikbaar zonder verdere aanpassingen aan de TE
  • Resultaat formaat (XML, CSV/XLS) dat goed verder te bewerken is (in Excel bijvoorbeeld)
  • Scripts en procedures zijn aan te passen en uit te breiden door (geautoriseerde) gebruikers van de TE
  • Export toegankelijk voor (geautoriseerde) gebruikers
  • Technisch goed beheersbare oplossing (voor UvA)
  • Goede mogelijkheid tot documentatie en gebruikershandleidingen

Speciale export voorziening:

  • Stap 1. Ga naar de pagina Speciaal:Exporteren:
  • Stap 2. Typ (copy-paste) een naam, bijv. "uitvoerende Miranda van Kralingen" in het grote venster op deze pagina
  • Stap 3. De-selecteer de optie “Als bestand opslaan” (indien gewenst) en
  • Stap 4. Klik op exporteren en bekijk het resultaat in je browser

Je krijgt nu een XML-file (download) met de inhoud van de betreffende wikipagina. Deze procedure werkt ook met lijsten van pagina-namen, zodat in één keer een serie pagina’s kan worden geëxporteerd. De lijst kunnen we samenstellen op basis van bovengenoemde Semantische query, zodat gegevens goed zijn te koppelen (conventie schrijfwijze, spelling, …) De XML-file kun je importeren in bijv. Excel en zo kun je flexibel gegevens destilleren voor transfer naar Wikipedia.

Lijsten en semantische queries op Theaterencyclopedie[bewerken]

Voor elk van de gezelschappen bestaat een verzameling producties. Deze worden binnen TE als een alfabetische lijst getoond. Zie bijvoorbeeld Producties NTGent (alfabetisch) Met behulp van een semantische query is een aansprekender overzicht te maken. Hierbij worden de producties in een tabel getoond en kun je zelf aangeven welke gegevens je wilt opnemen in deze tabel. Bovendien kun je gegevens in een tabel ook sorteren op bijvoorbeeld premiere datum:

Op deze manier kun je dus een link opnemen op de Wikipedia pagina van een gezelschap die verwijst naar alle producties die in de Productiedatabase staan. voor een lijst ziet die link er als volgt uit

De dynamische query in tabel-vorm (zoals hierboven beschreven) kan ook in statische vorm op een vaste pagina in de TheaterEncyclopedie geplaatst worden, zodat deze beschikbaar ("leesbaar") is voor bezoekers van de TE. Eventueel kan deze statische vorm voorzien worden van een download-link waarmee de gegevens als csv-file beschikbaar worden gesteld.

Voor het werken met een semantische queries zie de website van Semantic MediaWiki.

Bewerken van een semantische query[bewerken]

Onderstaande semantische query geeft alle producties waarin Christina Deutekom heeft opgetreden: http://theaterencyclopedie.nl/w/index.php?title=Speciaal:Vragen&q=%5B%5BCategory%3AUitvoerende+Cristina+Deutekom%5D%5D&p=format%3D-20broadtable&po=%3FDiscipline%0A%3FOnderwerp%0A%3FProducent%0A%3FLocatie%0A%3FPremieredatum%23-%0A&offset=10&limit=10&eq=no

  • Stap 1: Door in bovenstaande string alleen maar "Christina+Deutekom" te vervangen door "Miranda+van+Kralingen" krijg je de tabel voor deze operadiva.
  • Stap 2: Door vervolgens de url te copieren en te plakken kun je een hyperlink aanmaken die deze query aanspreekt en de gegevens in tabel toont.
  • Stap 3: Via "zoekopdracht bewerken" kun je de query op meer manieren aanpassen. En ook bijvoorbeeld andere velden opnemen in de tabel.
Ook kun je aangeven hoeveel zoekresultaten je wilt opnemen in de tabel, en op welke manier deze gesorteerd moet worden.
* http://theaterencyclopedie.nl/w/index.php?title=Speciaal:Vragen&q=%5B%5BCategory%3AUitvoerende+Miranda+van+Kralingen%5D%5D&p=format%3D-20broadtable&po=%3FDiscipline%0A%3FOnderwerp%0A%3FProducent%0A%3FLocatie%0A%3FPremieredatum%23-%0A&&limit=10&eq=no
In bovenstaande query met offset=10 krijg je maar 10 resultaten te zien. In onderstaande is offset=30. Met eq=yes en eq=no wordt de zoekopdracht en overige opties gtoond. In overige opties kun je zaken instellen als offset en hoe je de gegevens wilt sorteren.
* http://theaterencyclopedie.nl/w/index.php?title=Speciaal:Vragen&q=%5B%5BCategory%3AUitvoerende+Miranda+van+Kralingen%5D%5D&p=format%3Dbroadtable%2Flink%3Dall%2Fheaders%3Dshow%2Fsearchlabel%3D%E2%80%A6-20overige-20resultaten%2Fclass%3Dsortable-20wikitable-20smwtable&po=%3FDiscipline%0A%3FOnderwerp%0A%3FProducent%0A%3FLocatie%0A%3FPremieredatum%23-%0A&limit=30&eq=no

De tabel is in statische vorm als voorbeeld opgenomen op de projectpagina op de TE.

Export in csv[bewerken]

In plaats van output van een semantische query in de vorm van een tabel, kun je ook een export in CSV maken.

Andere voorbeelden zijn:

  • Lijst (deel) in CSV-format van Producties door De Nieuw Amsterdam met Adlib-referentie, Discipline, Seizoen, Locatie en Afbeelding:
http://theaterencyclopedie.nl/wiki/Speciaal:Vragen/-5B-5BCategorie:Productie-5D-5D-0A-20-5B-5BProducent::De-20Nieuw-20Amsterdam-5D-5D/-3FAdlib/-3FDiscipline/-3FSeizoen/-3FLocatie/-3FAfbeelding%3DAffiche/format%3Dcsv/limit%3D20/offset%3D0
  • Lijst (deel) in CSV-format van Zangers met Adlib-referentie, Discipline, Geboorte- & overlijden:
http://theaterencyclopedie.nl/wiki/Speciaal:Vragen/-5B-5BCategorie:Persoon-5D-5D-0A-20-5B-5BBeroep::Zanger-5D-5D/-3FDiscipline/-3FAdlib/-3FGeboortedatum/-3FGeboorteplaats/-3FOverlijdensdatum/-3FOverlijdensplaats/format%3Dcsv/limit%3D20/offset%3D0
  • Lijst (deel) in CSV-format van Theaters:
http://theaterencyclopedie.nl/wiki/Speciaal:Vragen/-5B-5BCategorie:Theaters-5D-5D/-3FPlaats/-3FType/-3FWebsite/format%3Dcsv/limit%3D20/offset%3D0

Deze semantische queries maken een exportfile results.csv dat meteen wordt gedownload. Een csv-bestand kun je importeren in Excel, zodat alle gegevens weer netjes in kolommen komen te staan.

nb: In de url worden bepaalde tekens die je normaal gebruikt om gezet in code. Zo is een komma: %2C

https://www.freeformatter.com/url-parser-query-string-splitter.html

Genereren van semantische queries[bewerken]

Wanneer je de goede namen en categorieen weet die in de productiedatabse worden gebruikt, kun je een semantische query vrij eenvoudig voor een bulk gegevens genereren met behulp van tekstfuncties in Excel. Met het eenvoudige commando &"Dit zijn gegevens over "&"http://www.theaterencyclodie.nl/wiki/"&<verwijzing naar een veld> kun je tekststrings aan elkaar knopen én een url genereren.

Op een Wikipedia pagina verwijzen naar de Theaterencyclopedie[bewerken]

Bij Wikipedia pagina´s over gezelschappen en podia zou je een verwijzing kunnen opnemen naar productiegegevens, premierelijsten etc. in de TE. Maar hoe doe je dat het beste? Na een aantal pogingen en reacties vanuit de community is voor de volgende vorm gekozen.

Voor gezelschappen[bewerken]

Als voorbeeld zie NTGent. Onder externe link kun je een link opnemen naar pagina over NTGent in Theaterencyclopedie. En een link naar de tabel met in Nederland gespeelde producties.

Een eerdere poging om in de tekst links naar TE op te nemen, stuitten op reacties vanuit de community.

Onder de kop = Internationale inbedding = neem je een tekst op die nog boven = externe links = komt te staan:
Vele producties van |naam Vlaams gezelschap] ontstaan in samenwerking met andere (internationale) podiumkunstenorganisaties en zijn op internationale podia te zien. Onder meer door regelmatige samenwerkingen met Nederlandse gezelschappen, stonden heel wat producties op Nederlandse podia.[1]

Door deze constructie wordt er een voetnoot geplaatst, en als je de pagina ook afsluit met de juiste appendix-string, verschijnt onderin bij bronnen, referentie, noten de voetnoot met werkende hyperlink. Deze formulering moet je steeds enigszins aanpassen om deze to the point te maken voor de instelling waar je deze toevoeging (link naar TE) wilt opnemen.

Voor podia[bewerken]

Onder het onderdeel Externe link kan een link worden opgenomen naar de pagina van een schouwburg / theater binnen de TE. Onder Stadsschouwburg Groningen zijn onder "Externe link" de twee volgende links opgenomen:

Onderstaande suggesties zijn door de Wikipedia community niet geaccepteerd. Er wordt verkend op welke manier informatie uit TE het beste kan worden opgenomen.

Voor theaters en schouwburgen kun je een verwijzing naar premieres opnemen door een formulering onder de kop ==(=) Vaste bespelers ==(=).

Zie het voorbeeld op Rotterdamse Schouwburg, met een tekst als:
Naast vaste bespelers als het RO Theater is de Rotterdamse Schouwburg het podium voor vaak terugkerende gezelschappen. Er hebben dan ook vele producties van deze gezelschappen hun premiere gehad in de Rotterdamse Schouwburg, waaronder Scapino Ballet.[2]

Deze uitkomst kun je ook nog verfijnen door de `categorie: producent´ toe te voegen aan de query:

Zo is er ook een verwijzing opgenomen naar bespeling door het Noord Nederlands Toneel bij Stadsschouwburg (Groningen).

Uitvoerenden: acteurs, regisseurs, schrijvers[bewerken]

Aan elke productie zijn diverse uitvoerenden verbonden. In de productiedatabase worden verschillende functies benoemd.


Functies A tm D: arrangementen; audiovisueel ontwerp; Audiovisuele registratie; auteur; begeleiding; bewerking; choreografie; decor; dirigent; dramaturge; dramaturgie;

Functies F tm L: Fotografie; geluid; grime; grime, kapwerk; kapwerk; koordirigent; kostuums; licht; liedteksten;

Functies M tm S: maskers; mimografie; muziek; muzikale leiding; naar; naar ... van; poppen; productie; regie; regie-assistentie; samenstelling

Functies U tm Z: uitv. poppenspel; uitvoerende; uitvoerende dans; uitvoerende spel; uitvoerende stem; uitvoerende zang; uitvoering muziek; utivoerende; vertaling; Vormgeving;

In praktijk kan een persoon verschillende functies vervullen. In de database is dit ook per functie uitgesplitst. Er is nog geen mogelijkheid om alle producties in één lijst weer te geven. Kijk je bv. hier bij : http://theaterencyclopedie.nl/wiki/Ilay_den_Boer, vind je aparte links naar:

Er is dus niet echt een overzichtspagina met àlle producties waaraan Ilay den Boer heeft meegewerkt. In plaats van naar de lijst van producties, kun je ook naar de pagina op de Theaterencyclopedie linken, waarop deze apart links staan. pm 1: is hier een script voor om één lijst te maken ? pm 2: overleg met WIkipedia om dit soort links geautomatiseerd op te kunnen nemen.

Digital Humanities[bewerken]

Definitie[bewerken]

En:Digital humanities (DH) is an area of scholarly activity at the intersection of computing or Information technology|digital technologies and the disciplines of the humanities. It includes the systematic use of digital resources in the humanities, as well as the reflection on their application.[3][4] DH can be defined as new ways of doing scholarship that involve collaborative, transdisciplinary, and computationally engaged research, teaching, and publishing.[5] It brings digital tools and methods to the study of the humanities with the recognition that the printed word is no longer the main medium for knowledge production and distribution.[5]

Theaterencyclopedie als bron van data[bewerken]

Open data lenen zich ook uitstekend voor kwantitatief onderzoek. Uit TE (met queries en Excel) kun je op eenvoudige wijze tellingen doen naar bijvoorbeeld: het aantal premieres in per genre in een bepaalde periode. Uit te splitsen naar een stad stad. EN is het nu historisch altijd zo geweest dat de meeste premieres plaatsvonden op de.....? Ook uit Wikidata kun je met bv SPARQL relevante datasets trekken en daarop bv tellingen doen naar de verdeling van de sterrenbeelden en geboorteplaatsen onder acteurs wiens achternaam met een B begint. En wijkt dit of voor degenen wiens achternaam met een L begint? Of wat is de gemiddelde lengte van de voornaam van actrices wier voornaam begint met een K. Dit zijn niet echt heel relevante vragen, maar vanuit de digital humanities formuleren academici interessante onderzoeksvragen en ontwikkelen methodes om diverse soms uiteenlopende datasets aan elkaar te koppelen. Onder de noemer ‘Creative Amsterdam: An E-Humanities Perspective’ is de UvA gestart met Create what-is-epad/ Create. Create is ook betrokken bij EPAD, "a network of scholars investigating the history of European performing arts (theatre, music, cinema) using digital methods and datasets". Tijdens de EPAD conferentie werd oa een onderzoek gepresenteerd dat de samenhang duidelijk maakte tussen vestigingsdatum en spreiding van bioscopen in grote steden in relatie tot de ontwikkeling en uitbreiding van het metro netwerk. De Collectie van UvA-Bijzondere Collecties en TE bevat een schat aan interessante big data voor dit soort onderzoek.

Visualisatie tools[bewerken]

En:Digital_Humanities_Observatory (DHO:Observatory) was een stimuleringsprogramma rond de digitiale erfgoed collecties in Ierland. Ten behoeve van verdere kennisontwikkeling zijn op deze site mooie voorbeelden te vinden van visualisatie-tools die je kunt gebruiken: DHO Discovery

PROJECT 2: Data-upload Kunstenpunt (Wikidata)[bewerken]

Samenwerking van PACKED vzw en Wikimedia België[bewerken]

De samenwerking van PACKED vzw met Wikimedia België situeerde zich op een aantal vlakken:

  • Aanvragen van property. Om het unieke ID (identifier) van een item uit de database van Kunstenpunt mee op te nemen in Wikidata, moest eerst een nieuwe property worden aangevraagd op Wikidata. De procedure hiervoor is om een aanvraag in te dienen op de Property proposal pagina. Hier kan door iedereen van de Wikidatagemeenschap discussie gevoerd worden over de wenselijkheid of de nood van de aangevraagde property. Voor de activiteitenlocaties van Kunstenpunt gebeurde dit hier. Wanneer de gemeenschap overwegend positief staat tegenover de aanvraag, zal een administrator of een gebruiker met het recht om een property te creëren dit doen. Bij deze aanvraag was dat het geval, waardoor de Kunstenpunt-identificatiecode voor activiteitenlocatie een feit werd en de eigenlijke upload van data kon beginnen. Aanvankelijk was deze property enkel in het Nederlands en in het Engels beschreven. Minder dan een jaar na het aanmaken van deze property hebben andere gebruikers op Wikidata labels en beschrijvingen van deze property in het Frans, Deens, Arabisch en Oekraïens toegevoegd.
  • Uittekenen van de workflow voor de data-upload (zie hieronder voor meer details).
  • Mapping van de Kunstenpuntdata naar Wikidataproperties (zie hieronder voor meer details).
  • Data-upload: Vertrekkend van de data-export van de relevante speellocaties (venues) uit de Kunstenpuntdatabank, zorgde Wikimedia België voor de voorbereiding van de data in een spreadsheet. PACKED vzw deed verdere opzoekingen om ontbrekende data aan te vullen en bracht waar nodig correcties aan, waarna Wikimedia België instond voor de upload naar Wikidata met behulp van de tool Quickstatements (zie hieronder voor meer details).

Voorbereiding van de data[bewerken]

Export[bewerken]

Tegelijk met de aanvraag van de property werd begonnen met het voorbereiden van de data. We selecteerden de relevante velden uit de dataset die we wilden opladen in Wikidata en tekenden de onderlinge verbanden tussen deze data uit. Zo konden we een workflow voor de eigenlijke upload bepalen. Om een goed zicht te krijgen op de data die zou worden geüploaded en dus gemapt moest worden naar het datamodel van Wikidata, bezorgde Kunstenpunt een export van de productiegegevens in de vorm van triples. Hieronder een voorbeeld van de relevante data op niveau van een productie als subject.

Kunstenpunt ID (subject) property object
438835 titel Bezonken rood
438835 coproducent_12174 Het Toneelhuis_371481
438835 gezelschap_12173 Ro Theater_360934
438835 naar_11739 Jeroen Brouwers_1891302
438835 regie_11575 Guy Cassiers_1878246
438835 spel_12018 Dirk Roofthooft_1877812
438835 bewerking_11715 Guy Cassiers_1878246
438835 bewerking_11715 Corien Baart_1901663
438835 bewerking_11715 Dirk Roofthooft_1877812
438835 decorontwerp_11710 Peter Missotten_1884365
438835 video_11728 Peter Missotten_1884365
438835 lichtontwerp_11722 Peter Missotten_1884365
438835 geluidsontwerp_12119 Diederik De Cock_1897343
438835 kostuumontwerp_11711 Katelijne Damen_1879633
438835 video realisatie_11625 Arjen Klerkx_1914157
438835 dramaturgie_11543 Erwin Jans_1883376
438835 premiere 2004-10-16T00:00:00 (Ro theater, Rotterdam)
438835 speelperiode 2004-2017

De triples zoals ze hierboven staan zijn, kunnen niet één op één gekopieerd worden naar Wikidata. Daar is een gedetailleerdere mapping voor nodig, maar op zijn minst maken ze helder welke de eigenlijke data zijn die we aan een productie op Wikidata gelinkt willen zien.

We kozen ervoor om met de data te beginnen die het minste relaties met andere items heeft. In dit geval waren dat de speellocaties (in bovenstaand voorbeeld: Ro theater in Rotterdam, waar de première plaatsvond). Die zijn in het datamodel van Kunstenpunt immers enkel aan een specifieke opvoering van een productie gelinkt. Hier beginnen is eenvoudiger dan pakweg de producties, die zowel aan o.a. organisaties, personen en specifieke opvoeringen zijn gelinkt. Over de speellocaties kun je immers al iets zeggen in Wikidata zonder dat alle info over producties in Wikidata zit. Omgekeerd zou dat lastiger zijn.

In de meeste gevallen was de Wikidata property die gebruikt diende te worden vrij vanzelfsprekend (naam, adres, postcode, land, website, geocoördinaten,...). In geval van property P31 (is een) lag dit moeilijker. Niet elke plek waar een podiumkunstenvoorstelling wordt opgevoerd is immers een theater. Potentieel kan overal een voorstelling plaatsvinden. In de dataset van Kunstenpunt staat niet gespecifieerd of een bepaalde locatie een theater, een gemeenschapscentrum, een plein, een supermarkt, een legerbasis of een kasteel is. In het beste geval valt het af te leiden uit de naam, maar soms is dat niet het geval. Een redder in nood was vaak de ietwat vage property Accommodatie voor uitvoerende kunst. Op die manier konden we benoemen dat er een podiumvoorstelling was opgevoerd op een bepaalde locatie, zonder te moeten zeggen dat het een theater, supermarkt, kasteel,... is. Van bovenstaande vier voorbeelden had enkel Theater Malpertuis al een Q-nummer op Wikidata. Daar werden extra gegevens aan toegevoegd op basis van de Kunstenpuntdata. Voor de andere locaties werd een Wikidata-item gecreëerd. Zij kregen dus pas bij de upload een Q-nummer toegekend.

Mapping en voorbereiding in spreadsheet[bewerken]

Specifiek voor de speellocaties werden de relevante velden bepaald en gemapt naar het datamodel van Wikidata. In sommige gevallen moest extra informatie worden opgezocht. Dit gebeurde in een spreadsheet die dienst deed als werkdocument ter voorbereiding van de data-upload. Het vertrekpunt hiervoor was een export van de speellocaties en hun relevante velden in de Kunstenpuntdatabank. Aangevuld met het extra opzoekingswerk zag het voorbereidende document er als volgt uit:

Kunstenpunt-ID venue naam adres stad postcode land Wikidata Q-nummer P31 (is een) website alternatieve naam NL plaats gemeente coördinaten (lat) coördinaten (lon)
130865 Theater Malpertuis Stationstraat 25 Tielt 8700 België Q2573927 http://www.malpertuis.be Q12996 51.225809 2.911109
135082 CC Het Spoor Eilandstraat 6 Harelbeke 8530 België Q1329623 http://www.cchetspoor.be/ Cultureel Centrum Het SPOOR Q478797 50.854273 3.313757
139461 Begraafplaats Steytelinc Dokter Donnyplein Wilrijk 2610 België Q39614 Q2687417 Q12892 51.166982 4.402331
133863 Oude Veeartsenijschool Veeartsenstraat 45 Anderlecht 1070 België Q3914 Les Vétés Q12886 50.83448 4.326264


Datacleaning met OpenRefine[bewerken]

Om uit te zoeken of een item al op Wikidata bestond werd gebruik gemaakt van de tool OpenRefine. Deze tool is bedoeld voor datacleaning. In het kader van deze dataset gebruikten we maar één kleine functionaliteit van de tool, namelijk het aanspreken van de Wikidata-API (zie CEST voor meer technische documentatie). Dit stelde ons in staat om op en eenvoudige manier te achterhalen welke speellocaties uit de Kunstenpuntdatabase al in Wikidata bestonden, en meteen het corresponderende Q-nummer binnen te trekken in de voorbereidende spreadsheet.

Vooreerst kan OpenRefine gebruikt worden om, vertrekkende van de export, de data te schonen. Het is bijvoorbeeld handig om vooraf reeds dubbels te detecteren of ontbrekende info aan te vullen. Het schonen omvat ook het scheiden en/of samenvoegen van informatie in kolommen. Om via de Wikidata-API op te sporen of bepaalde personen al in Wikidata zitten is het bijvoorbeeld nuttig om de namen van personen in het formaat "[voornaam][spatie][familienaam]" te hebben, terwijl voornaam en familienaam in de oorspronkelijke dataset mogelijk in twee velden staan. Een aantal schoningsacties zijn ook perfect mogelijk met een spreadsheetsoftware als Microsoft Excel, Numbers of LibreOffice Calc, maar de mogelijkheden van OpenRefine reiken op dit vlak een stuk verder.

Wikidata reconciliation in OpenRefine screenshot.png

Met behulp van de reconciliation service laat OpenRefine toe om aan de hand van een aantal instelbare parameters in Wikidata op zoek te gaan naar corresponderende items voor bepaalde velden. Vertrekkende van de kolom waarvoor je matches in Wikidata wil zoeken, start je de reconciliation service op en kies je ervoor op de API van Wikidata aan te spreken. Je kunt bijvoorbeeld gericht binnen bepaalde Q-nummers zoeken (bv. mensen, theaters,...), of bepaalde andere velden (locatie, geboorte- en/of sterfdatum,...) meenemen als context voor een query bij Wikidata. Ook kun je aangeven hoeveel suggesties je maximaal wil voor een item en of je bij een hoge probabiliteitsscore een automatische matching wil doorvoeren. In dit geval zochten we specifiek naar de speellocaties in de Kunstenpuntdatabase. Aangezien locaties voor podiumkunstenvoorstellingen zich niet tot theaters beperken en we bovendien niet zeker zijn of alle in Wikdata beschreven theaters wel degelijk aan het Q-nummer voor theater zijn gelinkt, kozen we ervoor om hier geen beperking op te leggen. Dat zorgde voor een aantal waardeloze suggesties en dus meer manueel werk, maar de uiteindelijke resultaten werden er wel positief door beïnvloed. Wanneer OpenRefine de resultaten van de Wikidata-API heeft teruggekregen, zie je voor welke items er een match gesuggereerd wordt. Vervolgens moet je manueel door de lijst om de correcte matches te bevestigen. OpenRefine geeft previews weer van de gesuggereerde matches in Wikidata, zodat je niet elke suggestie in Wikidata zelf hoeft open te klikken.

Op basis van de gematchte items kun je vervolgens het id van het corresponderende Wikidatarecord in OpenRefine binnenhalen. Daarvoor kies je voor Add new column en vervolgens gebruik je de GREL-expression grel:cell.recon.match.id. Tenslotte kun je de geschoonde dataset opnieuw exporteren in het gewenste formaat.

Mapping van properties in Wikidata Schema[bewerken]

Na het opschonen van de data in OpenRefine is het mogelijk om aan de hand van de ingebouwde Wikidata extensie (vanaf versie 3.0) een schema op te stellen die de structuur van een Wikidata record volgt. Dit ook in lijn van de semantische triples gebruikt in QuickStatements. Voor het selecteren van te gebruiken properties werd beroep gedaan op het onderzoek gevoerd in kader van de Zwitserse podiumkunsten. Waaruit de volgende lijst voortkwam:


Bijschrift
Titel ID Gegevenstype Beschrijving Voorbeelden Tegenovergestelde
is een P31 Item beschrijft het type productie La Sylphide is een ballet -
gebaseerd op P144 Item beschrijft waarop het werk gebaseerd is (opgelet: gebruik geïnspireerd door indien het werk sterk verschilt van het originele stuk) La Sylphide (uitvoering Koninklijk Ballet van Vlaanderen) is gebaseerd op het originele ballet La Sylphide -
geïnspireerd door P941 Item beschrijft waarop het werk geïnspireerd is (opgelet indien het werk sterke gelijkenissen vertoont met het origineel gebruikt men beter gebaseerd op.) -
componist P86 Item beschrijft de maker van de muziek. La Sylphide is gecomponeerd door Herman Severin Løvenskiold -
productiebedrijf P272 Item beschrijft de organisatie die de productie produceert. (!) Niet te verwarren met organisator. Welke de productie organiseert. La Sylphide is een productie van het Koninklijk Ballet van Vlaanderen -
begindatum P580 tijdstip beschrijft de periode waarin de productie opgevoerd werd (begin), niet te verwarren met premiere datum. La Sylphide <begindatum> 1989 einddatum
einddatum P582 tijdstip beschrijft de periode waarin de productie opgevoerd werd (einde) La Sylphide <einddatum> 1990 begindatum
choreograaf P1809 Item choreograaf die de uitvoering choreografeerde La Sylphide had als choreograaf Flemming Flindt -
Land P17 Item land waar de opvoering plaatsvond. La Sylphide werd opgevoerd in België -

Het is good practice om aan elk statement ook een bron toe te voegen. Hieronder worden enkele mogelijke properties tot het maken van referenties weergegeven:

Titel ID Beschrijving
URL voor bron P845 beschrijft de referentie URL waarin het statement vermeld staat
URL (gearchiveerd) P1065 beschrijft de gearchiveerde referentie URL waarin het statement vermeld staat
vermeld in P248 beschrijft de referentie waarin het statement vermeld staat. In het geval dat men van vermeld in gebruik maakt moet men eerst ook de betreffende publicatie aanmaken als record in wikidata.

Data-upload met Quickstatements[bewerken]

Na het opschonen van de data en deze voor te bereiden in een spreadsheet, kun je de tool Quickstatements gebruiken om ze in de vorm van triples op te laden in Wikidata. Quickstatements doet wat de naam laat vermoeden: op een snelle manier in bulk statements toevoegen aan Wikidata. Een triple bestaat uit een subject, een predicaat en een object. Het subject is in dit geval steeds het Q-nummer van de locatie, het predicaat de Wikidata property van het statement en het object het Q-nummer dat staat voor datgene wat we over het subject zeggen. Voor speellocaties die reeds in Wikidata zitten, gebruiken we als subject het Q-nummer dat we via Open Refine wisten te vinden. Vervolgens gingen we de property opzoeken van datgene wat we willen zeggen. Als voorbeeld nemen we Theater Malpertuis, dat hierboven reeds vermeld werd. Theater Malpertuis komt in Wikidata overeen met Q2573927. Als we aan het item Theater Malpertuis op Wikidata willen toevoegen dat het in Tielt is gelegen, hebben we dus een property nodig die zegt dat iets ergens is gelegen. Daarnaast hebben we ook het Q-nummer van Tielt nodig. De property die we in dit geval gebruiken is P131 (gelegen in bestuurlijke eenheid). Het Q-nummer van Tielt is Q651811. De triple die we in Quickstatements moeten invoeren is dus Q2573927 P131 Q651811.

Wanneer een subject nog niet bestaat, kunnen we het eerst via Quickstatements creëren. Als we bijvoorbeeld CC Het Spoor (zie voorbeeld bij mapping) willen creëren en vervolgens zeggen dat het een cultureel centrum is, wordt dat:

CREATE

LAST Lnl "CC Het Spoor".

LAST P31 Q1329623

"Lnl" staat hier voor Nederlandstalig label, P31 voor de property "is een" en Q1329623 voor het Wikidata-item "cultureel centrum".

In totaal werden aan de hand van de Kunstenpuntdata de gegevens 2055 speellocaties in Wikidata verrijkt of toegevoegd.

Geplande vervolgstappen[bewerken]

De volgende stap in de data-upload van Kunstenpunt betreft de personen met een artistieke functie (in bovenstaand voorbeeld: Jeroen Brouwers tot en met Erwin Jans). Vervolgens zullen we ons focussen op de organisaties die deze producties produceerden (in bovenstaand voorbeeld: Ro Theater en Toneelhuis). Hier zal soms een overlap blijken tussen speellocaties en producerende organisaties. Ro Theater is in het voorbeeld immers zowel een producerend theatergezelschap als de speelplek waar de première plaatsvond. In deze gevallen zijn er twee opties. Er kan gekozen worden om een Wikidata-item aan te maken voor zowel de speellocatie als voor het theatergezelschap, ofwel worden beide functies te benoemd in eenzelfde item op Wikidata. Als laatste componenten van een productiebeschrijving kunnen tenslotte de productietitel, de premièredatum en de speelperiode aan Wikidata worden toegevoegd met de correcte relaties naar de voorheen geüploade personen, organisaties en speellocaties.

PROJECT 3: Edit-a-thons (Wikipedia)[bewerken]

Samenwerking van PACKED vzw, Het Firmament en Wikimedia België[bewerken]

Uitgeteste formats[bewerken]

  • Aansluiten bij een evenement: in het kader van de Brusselse schrijfweken van 22 april tot 6 mei 2017 kozen we ervoor om twee schrijfsessies te organiseren met als focus 'dans in Brussel'. Dit thema kaderde eveneens in de internationale Dag van de Dans op 29 april 2017. Een voordeel van deze aanpak was dat we gebruik konden maken van de communicatiekanalen van beide initiatieven. We hoopten zo enerzijds mensen aan te spreken die al geïnteresseerd waren in Wikipedia, maar minder affiniteit hadden met dans. Anderzijds hoopten we er ook de dansliefhebber en -professional mee aan te spreken die nog geen ervaring had met Wikipedia. Op 22 april, een week voor de eigenlijke Dag van de Dans, hielden we een eerste schrijfsessie in de Koninklijke Vlaamse Schouwburg, waar we met een rondleiding achter de schermen ook voor een randprogramma zorgden. De sessie van 29 april vond plaats in Brusselse openbare bibliotheek Muntpunt. We vroegen mensen vooraf in te schrijven via een Google Form. Voor beide sessies samen waren er elf externe inschrijvingen. Deelnemers konden ervoor kiezen om zich voor één van beide of voor beide sessies in te schrijven. Helaas kwam een aantal ingeschrevenen niet opdagen. Wie er was, was tevreden en er is ook effectief wel wat geschreven, maar we moeten toegeven dat we op een iets grotere opkomst gehoopt hadden. Beide schrijfsessies zijn gedocumenteerd op de projectpagina. Blijkbaar was de KVS als locatie en de geplande rondleiding onvoldoende als trigger, konden we de bestaande Wikimediagemeenschap niet lokken met een niche-edit-a-thon en hebben we ook de dansgemeenschap in Brussel onvoldoende kunnen bereiken. Wat dat laatste aspect betreft speelt het evenement van de Dag van de Dans waarbij we aansluiting zochten mogelijk ook in het nadeel. Er was die dag immers al een groot aanbod aan activiteiten voor de dansliefhebber.
  • Infiltreren op een festival: Op het Vlaamse TheaterFestival werd gekozen voor een aanpak waarbij drie dagen voor de start van het fesitval een introductiesessie werd gehouden. Vervolgens organiseerden we gedurende de negen daaropvolgende werkdagen schrijfnamiddagen. Mensen die zich inschreven werden verwacht op de introductiesessie en konden vervolgens zelf kiezen op welke dag of dagen ze wilden terugkomen. Elke namiddag was er schrijfbegeleiding voorzien. Er werd ook een gerichte schrijflijst samengesteld die uitging van wat er tijdens het festival op het programma stond. De bedoeling was dat er op elke festivaldag een aantal artikels werden aangemaakt/verbeterd/vertaald met betrekking tot artiesten of gezelschappen die op het festival stonden. Hiervoor werd ook samengewerkt met de Dagkrant van het festival, dat zich engageerde om haar vrijwilligers-journalisten ook minstens één Wikipedia-artikel te laten schrijven. Sommigen deden meer dan van hen verwacht werd, anderen slaagden er niet in om hun belofte na te komen. De deelnemers en resultaten zijn hier raadpleegbaar. Deze formule werd als positief ervaren. Ze betekent wel een grote tijdsinvestering en er was alsnog geen massale opkomst, maar het was wel een aangename samenwerking.
  • Samenwerken met een bibliotheek: Als onderdeel van het traject rond dans in Brussel wilden we ook graag iets buiten het stadscentrum organiseren. Vorst is een Brusselse gemeente met een speciale relatie tot dans. Het is de plaats waar zowel Anne Teresa De Keersmaekers gezelschap Rosas als de dansopleiding P.A.R.T.S. zijn gevestigd. Bovendien zijn er nog heel wat andere culturele hotspots in de directe omgeving. We vonden in de Nederlandstalige openbare bibliotheek van Vorst een partner om deze edit-a-thon te organiseren. We hoopten op deze manier gemakkelijker geïnteresseerden uit de lokale (bibliotheek)gemeenschap aan te trekken dan we bijvoorbeeld konden bij de edit-a-thons in het voorjaar. We wilden met deze edit-a-thon twee klemtonen leggen: enerzijds de geschiedenis en het erfgoed van Vorst, anderzijds de dansscene van Vorst. Ook hier zorgden we voor een schrijflijst op maat. De schrijflijst met betrekking tot dans werd na afloop van de edit-a-thon geïntegreerd in de Wikipedia:Wikiproject/Belgische_podiumkunsten/Dans#Nieuw_artikel_schrijven algemene schrijflijst dans. Er waren acht externe inschrijvingen voor deze edit-a-thon, waarvan opnieuw een aantal mensen niet kwam opdagen. Ook ging niemand in op het fotoluik. Het voordeel van een edit-a-thon in de bibliotheek was dat er gebruik gemaakt kon worden van boeken uit de collectie en computers in de leeszaal. Ook dit was een zeer fijne samenwerking.

Samenwerking met opleidingen[bewerken]

  • Wikipedia inbedden in curriculum: Begin 2017 werd een vijftal praktische en academische podiumkunstenopleidingen samengebracht om te polsen naar de mogelijkheden en interesse om Wikipedia-opdrachten in het curriculum van de studenten te integreren. Met twee ervan konden we in 2017 een stap verder zetten. Voor de internationale dansstudenten van P.A.R.T.S. gaven we een introductiesessie om hen te sensibiliseren rond het belang van goede informatie op Wikimediaplatformen. We wilden hen hiermee ook uitnodigen op de edit-a-thon die we in Vorst organiseerden. Er was wel degelijk interesse, maar helaas resulteerde dat niet in extra aanwezigen op de edit-a-thon zelf. De opleidingsverantwoordelijken van P.A.R.T.S. zagen de meerwaarde en boden de mogelijkheid om studenten aan te sporen tot een vrijwillig engagement, maar zagen het niet haalbaar om het schrijven van Wikipedia-artikels als een verplicht onderdeel in het curriculum in te bedden. Met een kleine groep van 4 studenten dia aan de Vrije Universiteit Brussel een vak over Vlaamse theatergeschiedenis na 1945 volgden konden we wel die stap zetten. Onder impuls van een enthousiaste professor werden de gebruikelijke presentaties die de studenten aan het einde van het semester over een maker of gezelschap geven vervangen door de opdracht om een Wikipedia-artikel te schrijven. De sessie werd over twee momenten gespreid. De eerste week lag de focus op een introductie tot schrijven op Wikipedia, de tweede week op het eigenlijke schrijven en de begeleiding daarbij. In de tussentijd konden de studenten de nodige bronnen bij elkaar zoeken en hun artikel al wat voorbereiden. Ook na afloop van het tweede moment konden studenten hun artikel nog verder afwerken. Binnen deze context werden twee nieuwe artikels geschreven en twee bestaande artikels aanzienlijk verbeterd. Op iets meer dan twee maanden tijd werden deze artikels 476 keer bekeken. De statistiek toont ook dat in deze periode 14 verschillende Wikipediagebruikers 36 bewerkingen deden op de 4 pagina's waarop die binnen dit traject werd gewerkt. Het experiment werd positief geëvalueerd door de docent. Voor de studenten ligt het schrijven van een Wikipedia-artikel in de lijn van het schrijven van een paper of het maken van een presentatie. Het was interessant voor de studenten dat ze meer reactie kregen dan enkel van de docent. Dit aspect van ‘peer reviewing’ werd als verrijkend ervaren. Vanuit deze opleiding is er alvast de bereidheid om een Wikipediatraject in de toekomst verder te zetten.
  • Stageopdrachten: naast het 'inbreken' in een curriculum testten we ook samenwerking in de vorm van stages uit. We dienden bij de Katholieke Universiteit Leuven een stagevoorstel in bij de masteropleidingen Geschiedenis en Culturele Studies. In het najaar van 2017 startte via die weg een Letse studente Culturele Studies, die zich als deel van haar stagepakket toelegde op het vertalen van Nederlandtalige artikels naar het Engels en Duits. We konden op die manier iets meer schrijfcapaciteit genereren naast de output die we van edit-a-thons kunnen verwachten. Tegelijk zorgde het begeleiden van deze studente er ook voor dat we van nabijer kennismaakten met specieke moeilijkheden op de Engelstalige en Duitstalige Wikipedia (zie verderop bij de aandachtspunten en het nieuwsbericht op de website van PACKED vzw).

Aandachtspunten bij het organiseren van een edit-a-thon[bewerken]

  • Word zelf Wikipediaan voor je iets organiseert. Werk je in en ga zelf aan de slag. Zelf tegen een aantal moeilijkheden aanlopen helpt bij je omgang met de bestaande Wikipediagemeenschap. Bovendien bereidt het je goed voor om mensen concreet bij te staan tijdens schrijfsessies.
  • Inschrijving: Inschrijvingen via een Google Form zijn eenvoudig te realiseren en overzichtelijk. In combinatie met andere communicatiekanalen zoals Facebook gebeurt het echter wel dat mensen zich enkel op Facebook aanmelden en niet officieel inschrijven. Vraag mensen bij hun inschrijving ook om vooraf een Wikipediagebruikersaccount aan te maken. Er zit immers een restrictie op het aantal nieuwe accounts dat binnen een beperkte tijd vanaf eenzelfde IP-adres kunnen worden aangemaakt. Vraag hen ook naar hun talenkennis en of ze vegetariër zijn of voedselallergieën hebben (om de catering op voorhand te kunnen organiseren)..
  • Schrijflijst: Het is aan te raden om de focus van een schrijfsessie vooraf te bepalen. Enerzijds helpt dit om het evenement gericht naar bepaalde doelgroepen te communiceren, anderzijds kun je je als organisator ook beter voorbereiden om mensen onderwerpen aan te reiken waarover ze kunnen schrijven. Op basis van vorige ervaringen van Wikimedia België met het organiseren van edit-a-thons, maakten we voor elke edit-a-thon die we organiseerden een gerichte schrijflijst. Voor de focus rond dans in Brussel zag die er bijvoorbeeld anders uit dan voor de edit-a-thon tijdens Het TheaterFestival. Het doel van de schrijflijst is om mensen suggesties aan te reiken. Het is dus geen dwingend lijstje dat moet afgewerkt worden. Het is eerder een soort van menu waaruit mensen naargelang hun interesse kunnen kiezen. Ook kan men ervan uitgaan dat de onderwerpen die op een schrijflijst voorkomen alvast encyclopediewaardig zijn, al moet de schrijver van een artikel dat uiteraard steeds aantonen in het artikel zelf. Binnen het project rond Belgische podiumkunsten werd ervoor gekozen om enerzijds een algemene schrijflijst rond theater en dans te maken en anderzijds specifieke schrijflijsten per edit-a-thons. Na afloop van een edit-a-thon werden de onderwerpen die specifiek betrekking hadden op het thema ervan toegevoegd aan de algemene schrijflijsten. Een schrijflijst is onderdeel van een projectpagina. Doordat die projectpagina ééntalig is, blijft het een uitdaging om met het oog op meertalige edit-a-thons een overzichtelijke meertalige schrijflijst te maken. Sommige onderwerpen hebben immers wel al een artikel in de ene taal, maar nog niet in de andere. Schrijflijsten hoeven overigens niet enkel suggesties voor artikels te bevatten. Voor de edit-a-thon in Vorst plaatsten we ook items op de schrijflijst waarvoor nog geen foto onder een vrije licentie bestond. Deelnemers werden op die manier niet enkel aangemoedigd om te schrijven, maar ook om zelf foto's te nemen en die te uploaden in Wikimedia Commons.
  • Verwachtingspatroon: verwacht geen massale opkomst. De mogelijkheden zitten hem in een volgehouden inspanning die een gemeenschap helpt op te bouwen. De organisatie van een aantal edit-a-thons leerde ons dat dit helemaal niet duur hoeft te zijn, zeker niet wanneer je met partners samenwerkt die een locatie ter beschikking kunnen stellen. Wel vraagt het een aangehouden tijdsinvestering om deze schrijfsessies goed voor te bereiden en op te volgen.
  • Denk goed na over het format, de duur en locatie van een schrijfsessie. Belangrijke aspecten zijn een goede wifi, voldoende werktijd, en wat eten en drank om de deelnemers te verwennen.
  • Zorg voor een goede introductie. Hiervoor kun je samenwerken met het nationale Wikimedia Chapter.
  • Omgang met meertaligheid: meertaligheid is een grote troef binnen het Wikimedia-ecosysteem, maar de stagiaire die voornamelijk op de Engelstalige en Duitstalige versie werkte ondervond ook een aantal moeilijkheden. Elke taalversies heeft immers lichtjes andere regels en gebruiken:
    • Nieuwe gebruikers kunnen op de Engelstalige Wikipedia aanvankelijk enkel bestaande artikels editeren. Om een nieuw artikel te kunnen schrijven moet je een meer ervaren Wikipediaan zijn (minimaal x aantal edits en x maanden gebruiker zijn)
    • In de Duitse versie van Wikipedia kun je wel meteen artikels schrijven, maar krijgen deze artikels een tag mee dat ze door een onervaren gebruiker zijn geschreven.
    • De Duitse Wikipedia heeft vrij strenge richtlijnen in verband met het vertalen van artikels uit andere taalversies. Ofwel dient men een aanvraag in te dienen voor een import met de volledige versiegeschiedenis, ofwel moet men zelf als eerste versie van een nieuw artikel de oorspronkelijke taalversie importeren en dat vermelden. De reden hiervoor is een vrij strakke interpretatie van de CC BY-SA-licentie die op het oorspronkelijke artikel van toepassing is. Zie de:Wikipedia:Übersetzungen.
  • Schrijf niet over jezelf of je eigen organisatie.
  • Gebruik meerdere betrouwbare externe bronnen.
  • Denk vooraf aan het documenteren van een project: wat werd er geschreven, aangepast?

Media-uploads (Wikimedia Commons)[bewerken]

Podiumkunsten zijn een vluchtige kunstvorm. Wanneer de voorstelling afgelopen is, is de essentie zoals die door een publiek in een zaal wordt ervaren onherroepelijk verdwenen. Toch blijven er sporen achter die deze kunstvorm opnieuw scherper in herinnering brengen of ze minstens documenteren. Binnen het universum van Wikimediaplatformen zijn onder meer foto's en video's van belang. Kunstenaars en gezelschappen worden zich langzamerhand bewuster van de potentiële erfgoedwaarde van de foto's en video's die ze creëren. Hun eerste zorg is vaak om dit veelal erg kwetsbare analoog en digitaal materiaal te bewaren en (intern) raadpleegbaar houden. Een stap verder is om dit materiaal ook herbruikbaar te maken voor derden. Wikimedia Commons kan daar een nuttig instrument voor zijn, niet in het minst omdat er een directe koppeling mogelijk is met artikels op Wikipedia die encyclopediewaardige onderwerpen over de podiumkunsten beschrijven. Doordat ten tijde van creatie van het materiaal geen afspraken over auteursrechten werden gemaakt met het oog op later hergebruik, is het vaak erg moeilijk en arbeidsintensief voor een kunstenaar of gezelschap om de juiste toestemmingen te verkrijgen om een afbeelding of videofragment onder een vrije licentie ter beschikking te kunnen stellen. Het is dus een uitdaging op zich om bestaand foto-, audio- en videomateriaal over de podiumkunsten vrij herbruikbaar te maken. Daarom werd gezocht naar alternatieve manieren om nieuwe fotografische content te genereren en zo Wikipedia-artikels van beeldmateriaal te voorzien.

Op zoek naar Akarova[bewerken]

Van 30 april tot 11 juni 2017 organiseerde Ballets Confidentiels, een samenwerkingsverband van de choreografen/danseressen Johanne Saunier en Ine Goris, het project Op zoek naar Akarova. In die periode verzorgden ze iedere zondag en telkens op een andere locatie in Brussel een korte dansperformance. Het parcours van de verschillende locaties was geïnspireerd op het leven van de Belgische avant-garde danseres, choreografe en kunstenares Akarova. Omdat de performances plaats vonden op publieke plaatsen als bv. het Akarovaplein / de Brigitinnenstraat (Brussel), de Kapellemarkt (Brussel) en het Weststation (Sint-Jans-Molenbeek), bood dat een uitgelezen mogelijkheid om ze te fotograferen. Het leverde 29 foto's op van drie verschillende choreografieën. Eens de foto's zijn opgeladen op Wikimedia Commons kunnen ze gekoppeld worden aan bestaande Wikipedia-artikels en Wikidata-items (over bv. Johanne Saunier of Akarova).

Portretfoto's tijdens HetTheaterfestival[bewerken]

Naast de hierboven vermelde Wikipedia-edit-a-thons in het kader van Het TheaterFestival probeerden we tijdens de openingsavond van het festival ook een fotografisch luik uit. Van vele acteurs/regisseurs is geen foto aan het Wikipedia-artikel toegevoegd omdat er geen foto onder een vrije licentie beschikbaar is. Tijdens de openingsreceptie van het festival spraken we mensen met enige encyclopedische relevantie voor de sector aan met de vraag of we hen mochten fotograferen en de foto op Wikimedia Commons konden plaatsen. Er werden 37 foto's geüploadet. We kunnen dit evalueren als een kleine inspanning van enkele uren met een relatief grote uitstraling (zie verderop hoofdstuk over hergebruik). Tegelijk was het ook een manier om mensen uit de sector te sensibiliseren voor open content en het belang van aanwezigheid op Wikimediaplatformen. Binnen het geheel van de podiumkunsten zijn portretfoto's natuurlijk maar één van de vele mogelijkheden. Gelijkaardige acties zijn denkbaar met foto's van theatergebouwen of museale theatercollecties. Ook scènefoto's over de Vlaams-Nederlandse podiumkunsten zijn - vaak om auteursrechtelijke redenen - nauwelijks te vinden in Wikimedia Commons. Om dat mogelijk te maken is het vaak noodzakelijk om rechten te klaren of om (voor producties die vandaag nog reizen) in de contractuele afspraken met een fotograaf proactief om te gaan met de vrijgave van fotografisch materiaal.

Foto's nemen en uploaden als onderdeel van een edit-a-thon[bewerken]

De edit-a-thon in Vorst breidden we uit met een fotografisch luik, waarbij mensen objecten, gebouwen, beschermde bomen, parken,... in Vorst konden mensen zaken gaan fotograferen waarvan nog geen foto onder vrije licentie beschikbaar was. Op de schrijflijst suggereerden we deze items. Analoog aan de test die we op Het TheaterFestival uitvoerden, kunnen die foto's dan op Wikimedia Commons en gekoppeld worden aan bestaande Wikipedia-artikels en Wikidata-items. Er werden foto's gemaakt van:

  • het nabijgelegen kantoorgebouw van dansgezelschap Rosas (1 foto);
  • Blib, de gemeentelijke Nederlandstalige bibliotheek van Vorst (9 foto's);
  • de machinezaal van de vroegere brouwerij Wielemans-Ceuppens in BRASS (12 foto's);
  • de edit-a-thon zelf (8 foto's).

Geteste tools voor media-uploads[bewerken]

  • WDFIST: met de Wikidata Free Image Search Tool kan je voor een selectie van Wikidata-items suggesties voor afbeeldingen uit Wikimedia Commons opvragen. Zo kan je items op Wikidata die nog geen gelinkte afbeelding hebben voorzien van een afbeelding als die voorhanden is in Wikimedia Commons. Voor de geüploade speellocaties uit de Kunstenpuntdatabase bleek dit een heel efficiënte tool. De tool is goed instelbaar en kan zowel aan de hand van een lijst van Q-nummers als op basis van een SPARQL-query voor een bepaalde set aan items suggesties opvragen.
  • Voor gebruikers met smartphones of tablets is er de handige Wikimedia Commons app, die je op basis van je locatiegegevens suggesties geeft van Wikidata-items in je buurt waaraan nog geen foto gekoppeld is. Je kan een foto nemen en die meteen uploaden in Wikimedia Commons. Een nadeel is wel dat je een gemaakte foto in de app niet meteen kunt koppelen aan het corresponderende Wikidata-item. Ook is de app enkel beschikbaar voor Android in de Google Play Store en in F-Droid.

Modellicenties voor samenwerkingen tussen podiumorganisaties en fotografen/videasten[bewerken]

Scènefoto's en audiovisueel materiaal van hedendaagse podiumkunsten zijn zeer schaars in Wikimedia Commons. Vaak is de reden daarvoor dat gezelschappen buiten wat nodig is voor communicatie en promotie geen afspraken maakten met de fotografen en videasten, die vaak als freelancer (of soms in dienstverband) werken. Aangezien Wikimedia Commons als maximale restrictie CC BY-SA (naamsvermelding en gelijk delen) vereist, is dat een punt waar het vaak op botst. Naar aanleiding van dit traject contacteerden we twee Vlaamse en twee Nederlandse gezelschappen. Enerzijds polsten we naar hun huidige manier van werken en afspraken bij het maken van foto's en audiovisuele opnames. Indien de huidige situatie niet toelaat om foto's vrij te geven, boden we hen de nodige (juridische) begeleiding aan om voor volgende producties de contractuele afspraken met een fotografen/videasten zodanig te maken dat een selectie van het werk onder een vrije licentie kan worden gedeeld op Wikimedia Commons. Einde maart werd Joris Deene, advocaat gespecialiseerd in auteursrecht, bereid gevonden om dit luik juridisch te begeleiden. Tg Stan wordt als eerste gezelschap begeleid.

Archiefbeschrijvingen (Archiefbank Vlaanderen / Wikidata)[bewerken]

De Vlaamse overheid verwacht dat de podiumkunstenorganisaties die ze een structurele subsidie toekent, zorg te dragen voor hun eigen archief. Ook andere actoren in de podiumkunstensector (bv. critici) hebben een eigen archief waarvoor ze zorg dragen. In vele gevallen gaat het om archieven met een privaatrechtelijk statuut. Archiefbank Vlaanderen verzamelt gegevens over dergelijke private archieven en erfgoedcollecties in Vlaanderen. Ze brengt de gegevens onder in een onlinedatabank en maakt ze voor iedereen raadpleegbaar via een zoekbox. In Archiefbank Vlaanderen steken dus ook beschrijvingen van archieven die betrekking hebben op podiumkunsten. Enkele voorbeelden:

In 2017 is PACKED vzw gestart met het uniek en persistent identificeren van alle archiefbeschrijvingen uit Archiefbank Vlaanderen, inclusief die betrekking hebben op de podiumkunsten.

Vervolgens zijn PACKED vzw en Wikimedia België gestart met opladen van gegevens over de archieven in Wikidata. Daardoor kan vandaag in de Wikidatarecords over bepaalde organisaties en personen uit podiumkunstensector informatie terugvinden worden over waar hun archief zich bevindt. Bijvoorbeeld:

  • Koninklijke Vlaamse Schouwburg had al een uitgebreidere fiche. Toch konden zowel vanuit de Kunstenpuntdatabank als vanuit Archiefbank Vlaanderen nog data worden toegevoegd. Ook blijkt uit de bewerkingsgeschiedenis dat verschillende andere gebruikers in de Wikidatagemeenschap het item mee verrijkten.
  • Bij’ De Vieze Gasten was al aanwezig op Wikidata. Vanuit de Kunstenpuntdatabank werd dit item verrijkt (zie bewerkingen tussen 27 en 29 maart 2017. Op 5 oktober werden ook de gegevens over de archieflocatie uit Archiefbank Vlaanderen toegevoegd. Ook andere gebruikers zorgden voor verrijking van dit item, bijvoorbeeld door de toevoeging van de MusicBrainz-identificatiecode.

Het gaat in eerste instantie over actoren die via het opladen van data over speellocaties in Wikidata zijn terechtgekomen. Een voorlopig overzicht vind je hier. Het aantal organisaties en personen uit podiumkunstensector waarvan men in de Wikidatarecord informatie terugvindt over waar hun archief zich bevindt, zal in de toekomst verder uitbreiden naarmate dat het opladen van de data van Kunstenpunt wordt voorgezet en ook organisaties en personen aan bod komen.

Mogelijkheden tot verrijking/hergebruik van content[bewerken]

Doordat de inhoud op Wikimediaplatformen beschikbaar is onder een vrije licentie, kan deze gemakkelijk hergebruikt worden. Dat kan zowel binnen het Wikimedia-ecosysteem als daarbuiten. Doordat er geen toestemming noodzakelijk is om materiaal te hergebruiken, is het ook minder eenvoudig om die laatste vormen van hergebruik te monitoren. Hieronder lichten we alvast een aantal gerealiseerde en potentiële vormen van hergebruik binnen en buiten Wikimediaplatformen toe.

Kunstenpuntdata[bewerken]

Louter door data te uploaden ontstaat er al een vorm van verrijking. Een deel van de onderwerpen uit de dataset van Kunstenpunt was reeds aanwezig op Wikidata met een bepaalde hoeveelheid informatie. Door op Wikidata de koppeling te leggen met het corresponderende id bij Kunstenpunt, kan iedereen die dat wil de verrijkte data hergebruiken. Ook voor Kunstenpunt zelf als diegene die data aanlevert is er een directe winst. Neem bijvoorbeeld Q11692081. De Kunstenpuntdatabase bevat de naam van het theater, het land, de postcode, zelfs het precieze adres, maar door de koppeling met Wikidata krijgt Kunstenpunt onder meer de geocoördinaten, een foto van de speellocatie en gekoppelde Wikipedia-artikels aangereikt.

Van de 2058 speellocaties die vanuit de Kunstenpuntdatabank in Wikidata verrijkt of eraan toegevoegd werden, hebben 802 een gelinkte afbeelding in Wikidata. Daar liggen dus directe mogelijkheden tot verrijking. Met de WikiData Free Image Search Tool is het mogelijk om op basis van een SPARQL-query op Wikimedia Commons te zoeken naar afbeeldingen van Wikidata-items die nog geen gelinkte afbeelding hebben:

SELECT ?work ?Flanders_Arts_Institute_venue_ID ?image 
WHERE {
?work wdt:P3820 ?Flanders_Arts_Institute_venue_ID.
OPTIONAL {?work wdt:P18 ?image. }
}

Op die manier kunnen de data nog extra verrijkt worden.

Circa 1.700 van de speellocaties hebben op Wikidata specifieke geocoördinaten, waardoor ze heel precies op een kaart kunnen worden weergegeven. De Wikidata query tool maakt dat ook mogelijk. Ook hier gaat het om een extra verrijking, aangezien deze mate van detail die niet in de Kunstenpuntdata zit.

Venues uit de Kunstenpuntdatabank werden in Wikidata getypeerd met de property P31 (is een). Sommige venues hebben meerdere waarden voor deze property. Ze zijn bijvoorbeeld tegelijk een kerk en een concertzaal, een museum en een monument, of een theater en een theatergezelschap. Een eenvoudige query laat toe om overzichtelijk te visualiseren in welke soorten venues Vlaamse (co-producties) de jongste 25 jaar in première gaan. Evidente categorieën als theater, cultuurcentrum en kunstencentrum vormen duidelijk de grootste groep, maar het is interessant om te zien hoe minder voor de hand liggende categorieën als bioscoop, kerkgebouw, kasteel, (kunst)museum, school, plein of fabriek op deze manier zichtbaar worden.

deSingel[bewerken]

Kunstencentrum deSingel ging aan de slag met het hergebruik van Wikipedia-artikels zelf. deSingel beschikt over een rijke website waarop het veel archiefmateriaal ontsluit over de artiesten die in huis waren. Zo voorzien ze ook biografieën die bezoekers van de website context bieden bij personen en organisaties. Het schrijven en up-to-date houden van die biografieën bleek echter onhaalbaar. Geïnspireerd door voorbeelden als Tate en Muntpunt ging deSingel aan de slag om de personen en organisaties te koppelen aan Wikidata-items. Dat gebeurde door een export uit hun database te importeren in OpenRefine. Deels gelijkaardig aan de voorbereiding voor de data-upload van Kunstenpunt (zie hierboven) werd in OpenRefine met de Wikidata-API gezocht naar matches tussen de namen in de database van deSingel en Wikidata-items. De corresponderende Q-nummers werden vervolgens in een aparte kolom binnengetrokken. Op die manier konden in de backend van de website van deSingel de Q-nummers worden opgenomen. De website van deSingel spreekt op zijn beurt live de Wikidata-API aan om te zoeken naar Nederlandstalige, Engelstalige of Franstalige artikels, naargelang de taal waarin een bezoeker surft. Wanneer iemand vanaf de pagina van een concert met werk van Beethoven doorklikt op de naam Beethoven, krijgt naast de inhoud die van deSingel zelf komt ook het begin van de tekst uit Wikipedia en (indien beschikbaar) een foto te zien. Door de API live aan te spreken worden nieuw aangemaakte artikels ook meteen weergegeven op de website van deSingel. deSingel stelt zich tot doel om zelf ook een rol te spelen in de Wikipediacommunity en waar het kan inhoud toe te voegen. Als eerste test werden 414 Q-nummers geïmporteerd.

Raadpleging en hergebruik van foto's genomen tijdens HetTheaterfestival[bewerken]

Van de 37 foto's die tijdens HetTheaterfestival werden genomen en op Wikimedia Commons kwamen, worden er intussen 15 ook hergebruikt op 22 pagina's van verschillende Wikimediaplatformen. Op deze link is te zien waar in het Wikipedia-ecosysteem de foto's in januari 2018 werden gebruikt en hoe vaak ze werden bekeken. De pagina's waarop de foto's hergebruikt worden halen de jongste maanden samen zo'n 2.000 à 2.200 views per maand. Gezien de vrije licentie waaronder ze zijn gepubliceerd, hebben we geen zicht op eventueel hergebruik contexten buiten de Wikimediaplatformen.

Google[bewerken]

Een belangrijke hergebruiker van Wikipediacontent is Google. Wikipediapagina's komen niet alleen hoog in de Google ranking van een zoekopdracht. Ook wordt aan de rechterkant van de zoekresultaten vaak beknopte info weergegeven die bv. een persoon situeert. We merkten dat Google zeer snel op de bal speelt. Ook voor onderwerpen waarover tijdens een edit-a-thon voor het eerst op Wikipedia werd geschreven, komt Wikipedia zeer hoog binnen in de ranking en in de kadertjes aan de rechterzijde. Een goed voorbeeld is choreografe Christine De Smedt. Zelfs met een geëncrypteerde zoekopdracht in zowel het Nederlands als het Engels zijn de resultaten opvallend.

Raadpleging en hergebruik op Wikipedia[bewerken]

Tijdens en rondom de edit-a-thons over podiumkunsten die plaatsvonden sinds april 2017 werden in totaal 73 nieuwe pagina's aangemaakt (hoofdzakelijk in het Nederlands, maar ook in andere talen). Tot einde januari 2018 werden deze samen 9.519 keer bekeken. Naast de nieuw aangemaakte pagina's werden ook 62 pagina's aangepast en verbeterd. Deze reeds bestaande pagina's werden op dezelfde tijd 175.933 keer bekeken. De Pageviews Analysis Tool laat niet alleen toe om in een grafiek de pageviews van verschillende artikels te vergelijken, de tool laat ook toe om de ruwe data te downloaden om deze meer in detail te bekijken. Daaruit kun je het een en ander afleiden over hoe en wanneer een artikel vaak wordt bekeken. Je ziet in de grafieken dat er een relatief hoog aantal pageviews is op het moment dat een artikel wordt aangemaakt en in de daarop volgende dagen, wanneer het door andere actieve communityleden wordt bekeken, becommentarieerd of aangepast. Daarna verloopt de toename in aantal views gestager, maar het valt wel op dat de groei vrij stabiel is. Waar dat niet zo is, is er meestal een goede reden voor. Pieken in bezoekers kunnen bijna altijd verklaard worden door een bepaalde gebeurtenis:

Wikipediavrijwilligers zijn zelf ook hergebruiker van Wikipediacontent. Het schrijven van een artikel in een bepaalde taal kan ervoor zorgen dat iemand het naar een andere taal vertaalt. Wikipedia heeft daar zelfs een vertaaltool voor. De stagiaire van Culturele Studies ging ook op die manier aan de slag.