Naar inhoud springen

Gebruiker:Beireke1/Kladblok/Procesbeschrijvingen Belgisch-Nederlandse podiumkunsten

Uit Wikipedia, de vrije encyclopedie

Dit is een kladversie. De laatste versie van deze pagina bevindt zich op Procesbeschrijvingen Belgisch-Nederlandse podiumkunsten

Deze pagina documenteert de data-uploads en edit-a-thons die gerealiseerd werden binnnen het project van de Belgische podiumkunsten.

Waarom?[bewerken | brontekst bewerken]

  • We merken dat het maar pover gesteld is met de aanwezigheid van informatie over de podiumkunsten uit Vlaanderen en Nederland op de Wikimedia platformen. In Vlaanderen blijkt dat van de 419 relevantste gezelschappen uit de recente podiumkunstengeschiedenis slechts 26% een Nederlandstalige en maar 5% een Engelstalige Wikipedia-artikel heeft. Bij de 404 onderzochte personen die in de podiumdatabank van Kunstenpunt het frequentst aan producties gekoppeld zijn (acteurs, regisseurs, dansers, choreografen, scenografen,...) is het iets beter gesteld: 38% heeft een Nederlandstalig Wikipedia-artikel en 9% een Engelstalig. Bij personen is het bovendien erg vaak het geval dat een aantal rollen in films of televisieseries wel goed gedocumenteerd zijn, terwijl dat voor een hele carrière in de podiumkunsten niet of nauwelijks het geval is. Ook veel andere Wikipedia-artikels over podiumkunsten zijn (inhoudelijk) voor verbetering vatbaar.
  • Wikipedia is wereldwijd de vijfde meest bezochte website. Met meer dan 12 miljard pageviews per maand blijkt Wikipedia de plaats bij uitstek waar een zeer grote groep mensen terecht komt wanneer ze naar informatie zoeken. Er ontstaat dus een probleem wanneer de informatie over Belgisch-Nederlandse culturele onderwerpen op Wikipedia van ondermaatse kwaliteit is of gewoonweg ontbreekt. Overigens komen niet enkel mensen op Wikipedia terecht, maar ook de crawlers van zoekmachines die het world wide web indexeren om de aanwezige informatie makkelijk vindbaar te maken. Wikipedia-artikels staan heel hoog in de Google ranking. Google toont bovendien rechts naast de zoekresultaten in een kader informatie die het uit Wikipedia haalt. Aanwezigheid op Wikipedia versterkt dus niet enkel vindbaarheid, maar ook de zichtbaarheid van de podiumkunstensector voor een breed publiek.
  • Het hergebruik van deze informatie door Google (en andere partijen) is mogelijk omwille van de vrije licentie waaronder Wikipedia zijn content via een publieke API publiceert. Dat hergebruik kan bepaalde interne werkprocessen in cultureel-erfgoedorganisaties en kunstenorganisaties verbeteren en efficiënter maken. In plaats van dat iedere organisatie zelf bv. biografische informatie over dezelfde podiumkunstenaars aanmaakt, kan die met behulp van linked open data worden gedeeld en zelfs worden hergebruikt voor de verrijking van de eigen data.
  • Alhoewel het maar pover gesteld is met de aanwezigheid van informatie op Wikimediaplatformen omtrent de podiumkunsten uit Vlaanderen en Nederland, bestaat er elders heel wat goede data over de podiumkunsten. De mate waar in die gegevens open zijn verschilt echter nogal. Tim Berners-Lee maakte een vijfsterrenschaal dat de verschillende gradaties van open data weergeeft. Het streefdoel is om data op het web beschikbaar te maken als Linked Open Data (= vijf sterren). Voor de meeste cultureel-erfgoedorganisaties en podiumkunstenorganisaties is het vandaag onmogelijk om dat niveau, of zelfs dat van vier sterren, op eigen kracht te bereiken. Publicatie van data op Wikidata is een manier om het niveau van de vijf sterren van linked open data te bereiken. Binnen Wikidata wordt de data niet enkel voorzien van URI's, maar ook gekoppeld aan andere open data (zowel uit de verschillende Wikimedia-platformen als uit externe bronnen).
  • Doordat Wikimedia Commons enkel materiaal publiceert onder vrije licentie, en de afspraken omtrent het hergebruik tussen de instelling en de fotograaf of cameraman vaak ontoereikend (of niet bestaande) zijn, is naast het encyclopedische ook het audiovisuele materiaal over de podiumkunsten erg schaars. Materiaal dat nog onder auteursrechtelijke bescherming valt kan niet, zonder de uitdrukkelijke toestemming van de rechthebbende, op Wikimedia Commons worden geplaatst. Het retroactief klaren van de auteursrechten vereist overigens een inspanning die voor veel cultureel-erfgoed- of podiumkunstensorganisaties te groot is om er prioriteit van te maken. Om dit aan te pakken willen we enerzijds podiumkunstenorganisaties (en in het bijzonder gezelschappen) sensibiliseren omtrent het belang van het publiceren van dit beeldmateriaal onder een vrije licentie, en anderzijds onderzoeken waar er zich eventueel rechtenvrij materiaal bevindt.

Literatuuronderzoek[bewerken | brontekst bewerken]

Dit project is niet het eerste dat binnen Wikipedia, Wikidata of Wikimedia Commons aan de slag gaat met culturele content. Hieronder lichten we de belangrijkste lessons learned toe uit voorbije projecten die relevant gebleken zijn voor het gebruik van Wikimediaplatformen in de context van de Vlaams-Nederlandse podiumkunsten.

The value of sharing in Wikimedia - Trilce Navarete
  • Uit het Vlaamse FARO cijferboek 2016 blijkt dat:
    • slechts 5% van de Vlaamse cultureel-erfgoedinstellingen Wikimediakanalen gebruikt om hun digitale collectie te verspreiden. 37% gebruikt Europeana. We kunnen ons de vraag stellen of instellingen daardoor geen grote kansen laten liggen om een grotere zichtbaarheid en (digitaal) publieksbereik te genereren. Binnen sommige Europeanaprojecten wordt content aan Wikimediaplatformen toegevoegd. Europeana's eigen statistieken laten duidelijk zien dat het bereik via Wikimediaplatformen 10x groter is dan dat via het Europeana-platformen: iets meer dan 1 miljoen views per maand op Europeanawebsites tegenover circa 11 miljoen views per maand op de Wikimediaplatformen. Zelf tellen we in januari 2017 meer dan 13 miljoen page views voor pagina's die foto's of video's uit de Wikimedia Commons categorie Europeana bevatten.
    • 28,5% van de cultureel-erfgoedinstellingen zegt open data te voorzien. Met de vijfsterrenschaal voor open data van Tim Berners-Lee in het achterhoofd kunnen we ons echter afvragen op welk niveau die data zich bevindt. Het bestandsformaat, type licentie en de aanspreekbaarheid van de data via een goed gedocumenteerde en publieke API bepalen immers het hergebruiksgemak voor derden.
  • Uit het onderzoek naar Open Data van Nederlandse GLAM instellingen (2016) onthouden we dat:
    • het gebrek aan een heldere definitie van open data, en hoe deze vervolgens geïnterpreteerd wordt door de instelling, een zuivere meting in de weg staat. Cijfers kunnen op die manier zowel een onderschatting als een overschatting inhouden van welke instelling al dan niet bezig is met open data. Het model van Tim-Berners Lee biedt de noodzakelijke houvast om bij toekomstige bevragingen een objectieve weergave te genereren.
    • uit de Nederlandse cijfers blijkt ook dat je met de Wikimediaplatformen potentieel heel veel mensen kan bereiken. Wel blijkt dat de definitie van dat bereik soms problematisch is. Wat willen we meten: een aantal pageviews, interactie met de content, hergebruik in of buiten Wikimediaplatformen,...?
    • enerzijds instellingen beseffen dat het open beschikbaar stellen van data de naamsbekendheid en het bereik van hun collectie kan vergroten. Anderzijds zijn sommigen wel ontgoocheld over het concreet hergebruik van hun als open data ter beschikking gestelde collectie. Een realistisch verwachtingspatroon opstellen is dus belangrijk.
  • Succesfactoren voor Nederlands-Vlaamse samenwerking rond digitaal erfgoed, Lessen voor de toekomst uit Vlaamse en Nederlandse digitaalerfgoedprojecten en Waardeer samenwerking wijzen onder meer op de toenemende aandacht voor open data in het Vlaamse, Nederlandse en Europese beleid. De brede beweging naar open data in de erfgoedsector blijft echter uit. Pagina 8 van het onderzoeksrapport Waardeer samenwerking vermeldt "Dit is deels een kwestie van techniek: het informatiesysteem dat een instelling gebruikt, ondersteunt de publicatie van open data niet. Deels heeft het te maken met auteursrecht: het is niet aan instellingen om de licentievorm van de data die zij beheren te bepalen. Ook het beleid kan hier belemmerend werken: instellingen willen volledige controle houden over hun eigen data ten behoeve van kwaliteitsbewaking en omwille van de profilering, het verdienmodel en/of de afrekenbaarheid van de instelling. Ten slotte werkt het gebrek aan goede voorbeelden van (her)gebruikmodellen het vrijgeven van gegevens tegen." Het gebruik van Wikidata als platform naast het eigen systeem stelt instellingen in staat om (linked) open data te publiceren ondanks de beperking van het eigen systeem (bv. geen JSON, API, of SPARQL endpoint). Door via proeftuinen als dit project ook effectief resultaten af te leveren inzake gepubliceerde content op Wikimediaplatformen, hopen we tegemoet te komen aan de nood aan goede voorbeelden.
  • De visienota ‘een Vlaams cultuurbeleid in het digitale tijdperk’ toont eveneens een toegenomen aandacht in het Vlaamse cultuurbeleid voor open data en zelfs concreet voor de kansen die Wikimediaplatformen de sector bieden:
    • De minister ziet open data niet enkel als een kans en uitdaging voor de museum- en archiefsector, maar als iets dat een cultuurbrede aanpak verdient.
    • De visienota hanteert als uitgangspunt dat digitale culturele content maximaal open moet zijn. Minimaal dient alles wat zich in het publiek domein bevindt ook publiek te blijven. Digitalisering mag dus geen nieuwe rechten creëren. Het is echter niet de bedoeling dat we met het open-principe alle verdienmodellen onderuit halen. Waar een verdienmodel een efficiënte manier is om content bij een grote groep gebruikers te brengen, moet dit mogelijk blijven. Het bereiken van een zo ruim mogelijk publiek moet steeds prioritair zijn. De vraag of het altijd zinvol en haalbaar is om verdienmodellen te bouwen rond culturele content moet steeds gesteld worden.
    • Digitale culturele content moet ook vindbaar en bereikbaar zijn. Het doel moet zijn om tot een genetwerkt geheel te komen waarbij content van verschillende spelers verrijkt wordt.
    • Digitale culturele content moet bruikbaar zijn. Gebruik van open standaarden en authorities leidt tot een betere uitwisselbaarheid. Ook de vorm en kwaliteit van de metadata, persistente identificatie en heldere gebruiksrechten (bijvoorbeeld door Creative Commons licenties) spelen op dit vlak een belangrijke rol.
  • Trilce Navarrete & Karol J. Borowiecki (2016) Changes in cultural consumption: ethnographic collections in Wikipedia, Cultural Trends, 25:4, 233-248
    • Via online raadpleging van collecties, beschikbaar gesteld als open data, bereikten musea op vijf jaar tijd de helft van het aantal mensen dat ze tijdens een hele eeuw aan fysieke bezoekers mochten verwelkomen. Of: gemiddeld geldt dat het online collectiebezoek 18 maal hoger ligt dan het fysieke museumbezoek. Het is dus in het belang van musea - en bij uitbreiding ook voor andere culturele organisaties zoals podiumorganisaties - om buiten de muren te treden en ook daar te zijn waar het publiek is: online. Wikipedia is, als één van de populairste websites wereldwijd, een aantrekkelijke plek om als culturele organisatie op aanwezig te zijn met de content die je te bieden hebt.
    • Niet enkel de verhouding tussen fysiek en online bezoek is interessant, ook die tussen raadplegingen op de eigen website versus raadplegingen op platformen zoals Wikipedia. Uit de gevalstudie van het Tropenmuseum is gebleken dat Wikipedia-artikels die gebruik maken van foto's jaarlijks bijna drie maal meer bezoekers krijgen dan de eigen collectiewebsite. Een belangrijke factor die daarbij niet in rekening wordt genomen is evenwel de positie van de foto in het artikel (soms prominent bovenaan, soms verder weg in een galerij).
    • Wikimediaplatformen bieden een aantal voordelen voor beheerders van digitale culturele content om materiaal publiek te maken:
      • Het gebruik van een bestaand platform vraagt geen financiële inspanning in ontwikkeling/aankoop, noch in onderhoud.
      • Er is een grote gemeenschap van actieve gebruikers en bewerkers die er mee voor zorgt dat de content wordt hergebruikt, verrijkt en up-to-date blijft.
      • Meertaligheid van de platformen brengt een groter potentieel bereik met zich mee. Afbeeldingen kunnen bijvoorbeeld in Wikipedia-artikels in meerdere taalversies worden gebruikt. Ook kunnen ze soms in meerdere artikels worden gebruikt, waardoor ze opduiken in contexten waaraan je oorspronkelijk zelf niet had gedacht.
  • The value of sharing in Wikimedia - Trilce Navarete en Access as generator of value: museum collectons in Wikipedia:
    • Er zijn verschillende manieren om met een cultureel-erfgoedcollectie waarde te creëren. Er zijn ook verschillende vormen van waarde (economisch, moreel, cultureel,...), waarvan de definitie en het belang veranderen doorheen de tijd omwille van veranderende conventies. Onveranderlijk doorheen deze waardeschalen is het belang van goede, betrouwbare informatie. Dat is waar musea, archieven, kennisinstituten,... een rol te spelen hebben.
    • Eén van de doelstellingen van musea is om mensen toegang te bieden tot hun collecties. Digitale technologie kan mensen niet enkel dichter bij het fysieke museum brengen, ze kan ook de museumcollectie dichter bij mensen brengen.
    • De voordelen van Wikipedia zijn:
      • Wikipedia is uitgegroeid tot de ruggengraat van online kennis.
      • Informatie uit Wikipedia kan hergebruikt worden in nieuwe contexten binnen en buiten Wikimediaprojecten (bv. op sociale media).
      • Collecties kunnen nieuwe publieken bereiken. Dat blijkt duidelijk uit onderzoeken waarin gepeild wordt naar het aantal keren dat content op Wikipedia geraadpleegd wordt (zie hierboven).
      • Er ontstaan nieuwe synergieën tussen musea, de collecties en de gebruikers: samenwerking, interactie en cocreatie zijn hierbij de sleutelwoorden.
    • Instellingen die beelden willen vrijgeven over hun collectie worden regelmatig geconfronteerd met auteursrechtelijke bescherming tot zeventig jaar na overlijden van de auteur, waardoor de digitale ontsluiting van recent erfgoed achterop loopt. De grafiek van het Nederlandse Tropenmuseum die aangeeft voor welke schilderijen er ook fotografische reproducties beschikbaar zijn, spreekt boekdelen.
  • De Position paper OpenCultuurData (2013) stelt dat:
    • open data voor de GLAM-sector perfect aansluit bij haar missie om zo veel mogelijk mensen toegang te verlenen tot ons erfgoed. Door aan open data te doen kunnen ze dat niet enkel via hun eigen kanalen, maar kunnen ze ook gebruik maken van de kanalen daarbuiten. Als populair kanaal waar mensen informatie zoeken past Wikipedia dus perfect in dat verhaal.
    • open data samenwerking stimuleert tussen GLAM-instellingen.
  • Maarten Brinkerinks Case Study: Metrics for Measuring the Impact of Cultural Datasets toont onder meer dat:
    • een toename van de beschikbare hoeveelheid open beeldmateriaal ook tot een toenemend gebruik ervan op Wikipedia leidt en dus tot een grotere zichtbaarheid van de ontsloten content.
  • PACKED vzw initieerde projecten rond persistente identificatie:
  • Rapport van Linked Open Data publicatie met Wikidata, waarbij een groep van Vlaamse musea en kunstcollecties metadata over meer dan 30.000 kunstwerken als linked open data beschikbaar maakte via Wikidata. Uit de verdere opvolging blijkt hoe de publicatie van data een verrijkingsproces vanuit de Wikidatagemeenschap in gang zet.
    • Er worden vertaalde titels van kunstwerken in verschillende talen toegevoegd: Engels, Duits, Italiaans, Spaans, Russisch, Grieks, Hongaars, Turks, Arabisch, Japans,..., bv.: Q2459266
    • Er worden genres toegevoegd zoals 'religieus schilderij’ of 'trompe-l’oeil’, bv.: Q21614192
    • Er wordt iconografische informatie toegevoegd (zie het onderdeel 'beeldt af' op Q2480921). Daarnaast worden ook Iconclass codes toegevoegd (zie onderdeel 'representeert Iconclass-term') die men van de RKDimages-website overneemt met bronvermelding.
    • Er worden fotografische reproducties van kunstwerken gepubliceerd op Wikimedia Commons en gekoppeld aan de Wikidatarecords (zoals bijvoorbeeld reproducties van werken van Léon Spillaert van het MuZEE: Q22274279)
    • Er worden delen van eigendomsgeschiedenis toegevoegd, bv.: Q21623469 of Q21614708.
    • Er wordt informatie over de tentoonstellingsgeschiedenis van een werk toegevoegd, bv.: Q2844476 of Q21623469
    • Er worden afmetingen toegevoegd, bv.: Q18177692
    • Er worden Wikipedia-artikels over de kunstwerken geschreven, bv.: en:Self-Portrait at Seventy-Eight (Ingres).

Data-upload Kunstenpunt (Wikidata)[bewerken | brontekst bewerken]

Samenwerking van PACKED vzw en Wikimedia België[bewerken | brontekst bewerken]

De samenwerking van PACKED vzw met Wikimedia België situeerde zich op een aantal vlakken:

  • Aanvragen van property. Om het unieke ID (identifier) van een item uit de database van Kunstenpunt mee op te nemen in Wikidata, moest eerst een nieuwe property worden aangevraagd op Wikidata. De procedure hiervoor is om een aanvraag in te dienen op de Property proposal pagina. Hier kan door iedereen van de Wikidatagemeenschap discussie gevoerd worden over de wenselijkheid of de nood van de aangevraagde property. Voor de activiteitenlocaties van Kunstenpunt gebeurde dit hier. Wanneer de gemeenschap overwegend positief staat tegenover de aanvraag, zal een administrator of een gebruiker met het recht om een property te creëren dit doen. Bij deze aanvraag was dat het geval, waardoor de Kunstenpunt-identificatiecode voor activiteitenlocatie een feit werd en de eigenlijke upload van data kon beginnen. Aanvankelijk was deze property enkel in het Nederlands en in het Engels beschreven. Minder dan een jaar na het aanmaken van deze property hebben andere gebruikers op Wikidata labels en beschrijvingen van deze property in het Frans, Deens, Arabisch en Oekraïens toegevoegd.
  • Uittekenen van de workflow voor de data-upload (zie hieronder voor meer details).
  • Mapping van de Kunstenpuntdata naar Wikidataproperties (zie hieronder voor meer details).
  • Data-upload: Vertrekkend van de data-export van de relevante speellocaties (venues) uit de Kunstenpuntdatabank, zorgde Wikimedia België voor de voorbereiding van de data in een spreadsheet. PACKED vzw deed verdere opzoekingen om ontbrekende data aan te vullen en bracht waar nodig correcties aan, waarna Wikimedia België instond voor de upload naar Wikidata met behulp van de tool Quickstatements (zie hieronder voor meer details).

Voorbereiding van de data[bewerken | brontekst bewerken]

Export[bewerken | brontekst bewerken]

Tegelijk met de aanvraag van de property werd begonnen met het voorbereiden van de data. We selecteerden de relevante velden uit de dataset die we wilden opladen in Wikidata en tekenden de onderlinge verbanden tussen deze data uit. Zo konden we een workflow voor de eigenlijke upload bepalen. Om een goed zicht te krijgen op de data die zou worden geüploaded en dus gemapt moest worden naar het datamodel van Wikidata, bezorgde Kunstenpunt een export van de productiegegevens in de vorm van triples. Hieronder een voorbeeld van de relevante data op niveau van een productie als subject.

Kunstenpunt ID (subject) property object
438835 titel Bezonken rood
438835 coproducent_12174 Het Toneelhuis_371481
438835 gezelschap_12173 Ro Theater_360934
438835 naar_11739 Jeroen Brouwers_1891302
438835 regie_11575 Guy Cassiers_1878246
438835 spel_12018 Dirk Roofthooft_1877812
438835 bewerking_11715 Guy Cassiers_1878246
438835 bewerking_11715 Corien Baart_1901663
438835 bewerking_11715 Dirk Roofthooft_1877812
438835 decorontwerp_11710 Peter Missotten_1884365
438835 video_11728 Peter Missotten_1884365
438835 lichtontwerp_11722 Peter Missotten_1884365
438835 geluidsontwerp_12119 Diederik De Cock_1897343
438835 kostuumontwerp_11711 Katelijne Damen_1879633
438835 video realisatie_11625 Arjen Klerkx_1914157
438835 dramaturgie_11543 Erwin Jans_1883376
438835 premiere 2004-10-16T00:00:00 (Ro theater, Rotterdam)
438835 speelperiode 2004-2017

De triples zoals ze hierboven staan zijn, kunnen niet één op één gekopieerd worden naar Wikidata. Daar is een gedetailleerdere mapping voor nodig, maar op zijn minst maken ze helder welke de eigenlijke data zijn die we aan een productie op Wikidata gelinkt willen zien.

We kozen ervoor om met de data te beginnen die het minste relaties met andere items heeft. In dit geval waren dat de speellocaties (in bovenstaand voorbeeld: Ro theater in Rotterdam, waar de première plaatsvond). Die zijn in het datamodel van Kunstenpunt immers enkel aan een specifieke opvoering van een productie gelinkt. Hier beginnen is eenvoudiger dan pakweg de producties, die zowel aan o.a. organisaties, personen en specifieke opvoeringen zijn gelinkt. Over de speellocaties kun je immers al iets zeggen in Wikidata zonder dat alle info over producties in Wikidata zit. Omgekeerd zou dat lastiger zijn.

Mapping en voorbereiding in spreadsheet[bewerken | brontekst bewerken]

Specifiek voor de speellocaties werden de relevante velden bepaald en gemapt naar het datamodel van Wikidata. In sommige gevallen moest extra informatie worden opgezocht. Dit gebeurde in een spreadsheet die dienst deed als werkdocument ter voorbereiding van de data-upload. Het vertrekpunt hiervoor was een export van de speellocaties en hun relevante velden in de Kunstenpuntdatabank. Aangevuld met het extra opzoekingswerk zag het voorbereidende document er als volgt uit:

Kunstenpunt-ID venue naam adres stad postcode land Wikidata Q-nummer P31 (is een) website alternatieve naam NL plaats gemeente coördinaten (lat) coördinaten (lon)
130865 Theater Malpertuis Stationstraat 25 Tielt 8700 België Q2573927 http://www.malpertuis.be Q12996 51.225809 2.911109
135082 CC Het Spoor Eilandstraat 6 Harelbeke 8530 België Q1329623 http://www.cchetspoor.be/ Cultureel Centrum Het SPOOR Q478797 50.854273 3.313757
139461 Begraafplaats Steytelinc Dokter Donnyplein Wilrijk 2610 België Q39614 Q2687417 Q12892 51.166982 4.402331
133863 Oude Veeartsenijschool Veeartsenstraat 45 Anderlecht 1070 België Q3914 Les Vétés Q12886 50.83448 4.326264

In de meeste gevallen was de Wikidata property die gebruikt diende te worden vrij vanzelfsprekend (naam, adres, postcode, land, website, geocoördinaten,...). In geval van property P31 (is een) lag dit moeilijker. Niet elke plek waar een podiumkunstenvoorstelling wordt opgevoerd is immers een theater. Potentieel kan overal een voorstelling plaatsvinden. In de dataset van Kunstenpunt staat niet gespecifieerd of een bepaalde locatie een theater, een gemeenschapscentrum, een plein, een supermarkt, een legerbasis of een kasteel is. In het beste geval valt het af te leiden uit de naam, maar soms is dat niet het geval. Een redder in nood was vaak de ietwat vage property Accommodatie voor uitvoerende kunst. Op die manier konden we benoemen dat er een podiumvoorstelling was opgevoerd op een bepaalde locatie, zonder te moeten zeggen dat het een theater, supermarkt, kasteel,... is. Van bovenstaande vier voorbeelden had enkel Theater Malpertuis al een Q-nummer op Wikidata. Daar werden extra gegevens aan toegevoegd op basis van de Kunstenpuntdata. Voor de andere locaties werd een Wikidata-item gecreëerd. Zij kregen dus pas bij de upload een Q-nummer toegekend.

Datacleaning met OpenRefine[bewerken | brontekst bewerken]

Om uit te zoeken of een item al op Wikidata bestond werd gebruik gemaakt van de tool OpenRefine. Deze tool is bedoeld voor datacleaning. In het kader van deze dataset gebruikten we maar één kleine functionaliteit van de tool, namelijk het aanspreken van de Wikidata-API (zie CEST voor meer technische documentatie). Dit stelde ons in staat om op en eenvoudige manier te achterhalen welke speellocaties uit de Kunstenpuntdatabase al in Wikidata bestonden, en meteen het corresponderende Q-nummer binnen te trekken in de voorbereidende spreadsheet.

Vooreerst kan OpenRefine gebruikt worden om, vertrekkende van de export, de data te schonen. Het is bijvoorbeeld handig om vooraf reeds dubbels te detecteren of ontbrekende info aan te vullen. Het schonen omvat ook het scheiden en/of samenvoegen van informatie in kolommen. Om via de Wikidata-API op te sporen of bepaalde personen al in Wikidata zitten is het bijvoorbeeld nuttig om de namen van personen in het formaat "[voornaam][spatie][familienaam]" te hebben, terwijl voornaam en familienaam in de oorspronkelijke dataset mogelijk in twee velden staan. Een aantal schoningsacties zijn ook perfect mogelijk met een spreadsheetsoftware als Microsoft Excel, Numbers of LibreOffice Calc, maar de mogelijkheden van OpenRefine reiken op dit vlak een stuk verder.

Met behulp van de reconciliation service laat OpenRefine toe om aan de hand van een aantal instelbare parameters in Wikidata op zoek te gaan naar corresponderende items voor bepaalde velden. Vertrekkende van de kolom waarvoor je matches in Wikidata wil zoeken, start je de reconciliation service op en kies je ervoor op de API van Wikidata aan te spreken. Je kunt bijvoorbeeld gericht binnen bepaalde Q-nummers zoeken (bv. mensen, theaters,...), of bepaalde andere velden (locatie, geboorte- en/of sterfdatum,...) meenemen als context voor een query bij Wikidata. Ook kun je aangeven hoeveel suggesties je maximaal wil voor een item en of je bij een hoge probabiliteitsscore een automatische matching wil doorvoeren. In dit geval zochten we specifiek naar de speellocaties in de Kunstenpuntdatabase. Aangezien locaties voor podiumkunstenvoorstellingen zich niet tot theaters beperken en we bovendien niet zeker zijn of alle in Wikdata beschreven theaters wel degelijk aan het Q-nummer voor theater zijn gelinkt, kozen we ervoor om hier geen beperking op te leggen. Dat zorgde voor een aantal waardeloze suggesties en dus meer manueel werk, maar de uiteindelijke resultaten werden er wel positief door beïnvloed. Wanneer OpenRefine de resultaten van de Wikidata-API heeft teruggekregen, zie je voor welke items er een match gesuggereerd wordt. Vervolgens moet je manueel door de lijst om de correcte matches te bevestigen. OpenRefine geeft previews weer van de gesuggereerde matches in Wikidata, zodat je niet elke suggestie in Wikidata zelf hoeft open te klikken.

Op basis van de gematchte items kun je vervolgens het id van het corresponderende Wikidatarecord in OpenRefine binnenhalen. Daarvoor kies je voor Add new column en vervolgens gebruik je de GREL-expression grel:cell.recon.match.id. Tenslotte kun je de geschoonde dataset opnieuw exporteren in het gewenste formaat.

Data-upload met Quickstatements[bewerken | brontekst bewerken]

Na het opschonen van de data en deze voor te bereiden in een spreadsheet, kun je de tool Quickstatements gebruiken om ze in de vorm van triples op te laden in Wikidata. Quickstatements doet wat de naam laat vermoeden: op een snelle manier in bulk statements toevoegen aan Wikidata. Een triple bestaat uit een subject, een predicaat en een object. Het subject is in dit geval steeds het Q-nummer van de locatie, het predicaat de Wikidata property van het statement en het object het Q-nummer dat staat voor datgene wat we over het subject zeggen. Voor speellocaties die reeds in Wikidata zitten, gebruiken we als subject het Q-nummer dat we via Open Refine wisten te vinden. Vervolgens gingen we de property opzoeken van datgene wat we willen zeggen. Als voorbeeld nemen we Theater Malpertuis, dat hierboven reeds vermeld werd. Theater Malpertuis komt in Wikidata overeen met Q2573927. Als we aan het item Theater Malpertuis op Wikidata willen toevoegen dat het in Tielt is gelegen, hebben we dus een property nodig die zegt dat iets ergens is gelegen. Daarnaast hebben we ook het Q-nummer van Tielt nodig. De property die we in dit geval gebruiken is P131 (gelegen in bestuurlijke eenheid). Het Q-nummer van Tielt is Q651811. De triple die we in Quickstatements moeten invoeren is dus Q2573927 P131 Q651811.

Wanneer een subject nog niet bestaat, kunnen we het eerst via Quickstatements creëren. Als we bijvoorbeeld CC Het Spoor (zie voorbeeld bij mapping) willen creëren en vervolgens zeggen dat het een cultureel centrum is, wordt dat:

CREATE

LAST Lnl "CC Het Spoor".

LAST P31 Q1329623

"Lnl" staat hier voor Nederlandstalig label, P31 voor de property "is een" en Q1329623 voor het Wikidata-item "cultureel centrum".

In totaal werden aan de hand van de Kunstenpuntdata de gegevens 2055 speellocaties in Wikidata verrijkt of toegevoegd.

Geplande vervolgstappen[bewerken | brontekst bewerken]

De volgende stap in de data-upload van Kunstenpunt betreft de personen met een artistieke functie (in bovenstaand voorbeeld: Jeroen Brouwers tot en met Erwin Jans). Vervolgens zullen we ons focussen op de organisaties die deze producties produceerden (in bovenstaand voorbeeld: Ro Theater en Toneelhuis). Hier zal soms een overlap blijken tussen speellocaties en producerende organisaties. Ro Theater is in het voorbeeld immers zowel een producerend theatergezelschap als de speelplek waar de première plaatsvond. In deze gevallen zijn er twee opties. Er kan gekozen worden om een Wikidata-item aan te maken voor zowel de speellocatie als voor het theatergezelschap, ofwel worden beide functies te benoemd in eenzelfde item op Wikidata. Als laatste componenten van een productiebeschrijving kunnen tenslotte de productietitel, de premièredatum en de speelperiode aan Wikidata worden toegevoegd met de correcte relaties naar de voorheen geüploade personen, organisaties en speellocaties.

Edit-a-thons (Wikipedia)[bewerken | brontekst bewerken]

Samenwerking van PACKED vzw en Wikimedia België[bewerken | brontekst bewerken]

Uitgeteste formats[bewerken | brontekst bewerken]

  • Aansluiten bij een evenement: in het kader van de Brusselse schrijfweken van 22 april tot 6 mei 2017 kozen we ervoor om twee schrijfsessies te organiseren met als focus 'dans in Brussel'. Dit thema kaderde eveneens in de internationale Dag van de Dans op 29 april 2017. Een voordeel van deze aanpak was dat we gebruik konden maken van de communicatiekanalen van beide initiatieven. We hoopten zo enerzijds mensen aan te spreken die al geïnteresseerd waren in Wikipedia, maar minder affiniteit hadden met dans. Anderzijds hoopten we er ook de dansliefhebber en -professional mee aan te spreken die nog geen ervaring had met Wikipedia. Op 22 april, een week voor de eigenlijke Dag van de Dans, hielden we een eerste schrijfsessie in de Koninklijke Vlaamse Schouwburg, waar we met een rondleiding achter de schermen ook voor een randprogramma zorgden. De sessie van 29 april vond plaats in Brusselse openbare bibliotheek Muntpunt. We vroegen mensen vooraf in te schrijven via een Google Form. Voor beide sessies samen waren er elf externe inschrijvingen. Deelnemers konden ervoor kiezen om zich voor één van beide of voor beide sessies in te schrijven. Helaas kwam een aantal ingeschrevenen niet opdagen. Wie er was, was tevreden en er is ook effectief wel wat geschreven, maar we moeten toegeven dat we op een iets grotere opkomst gehoopt hadden. Beide schrijfsessies zijn gedocumenteerd op de projectpagina. Blijkbaar was de KVS als locatie en de geplande rondleiding onvoldoende als trigger, konden we de bestaande Wikimediagemeenschap niet lokken met een niche-edit-a-thon en hebben we ook de dansgemeenschap in Brussel onvoldoende kunnen bereiken. Wat dat laatste aspect betreft speelt het evenement van de Dag van de Dans waarbij we aansluiting zochten mogelijk ook in het nadeel. Er was die dag immers al een groot aanbod aan activiteiten voor de dansliefhebber.
  • Infiltreren op een festival: Op het Vlaamse TheaterFestival werd gekozen voor een aanpak waarbij drie dagen voor de start van het fesitval een introductiesessie werd gehouden. Vervolgens organiseerden we gedurende de negen daaropvolgende werkdagen schrijfnamiddagen. Mensen die zich inschreven werden verwacht op de introductiesessie en konden vervolgens zelf kiezen op welke dag of dagen ze wilden terugkomen. Elke namiddag was er schrijfbegeleiding voorzien. Er werd ook een gerichte schrijflijst samengesteld die uitging van wat er tijdens het festival op het programma stond. De bedoeling was dat er op elke festivaldag een aantal artikels werden aangemaakt/verbeterd/vertaald met betrekking tot artiesten of gezelschappen die op het festival stonden. Hiervoor werd ook samengewerkt met de Dagkrant van het festival, dat zich engageerde om haar vrijwilligers-journalisten ook minstens één Wikipedia-artikel te laten schrijven. Sommigen deden meer dan van hen verwacht werd, anderen slaagden er niet in om hun belofte na te komen. De deelnemers en resultaten zijn hier raadpleegbaar. Deze formule werd als positief ervaren. Ze betekent wel een grote tijdsinvestering en er was alsnog geen massale opkomst, maar het was wel een aangename samenwerking.
  • Samenwerken met een bibliotheek: Als onderdeel van het traject rond dans in Brussel wilden we ook graag iets buiten het stadscentrum organiseren. Vorst is een Brusselse gemeente met een speciale relatie tot dans. Het is de plaats waar zowel Anne Teresa De Keersmaekers gezelschap Rosas als de dansopleiding P.A.R.T.S. zijn gevestigd. Bovendien zijn er nog heel wat andere culturele hotspots in de directe omgeving. We vonden in de Nederlandstalige openbare bibliotheek van Vorst een partner om deze edit-a-thon te organiseren. We hoopten op deze manier gemakkelijker geïnteresseerden uit de lokale (bibliotheek)gemeenschap aan te trekken dan we bijvoorbeeld konden bij de edit-a-thons in het voorjaar. We wilden met deze edit-a-thon twee klemtonen leggen: enerzijds de geschiedenis en het erfgoed van Vorst, anderzijds de dansscene van Vorst. Ook hier zorgden we voor een schrijflijst op maat. De schrijflijst met betrekking tot dans werd na afloop van de edit-a-thon geïntegreerd in de Wikipedia:Wikiproject/Belgische_podiumkunsten/Dans#Nieuw_artikel_schrijven algemene schrijflijst dans. Er waren acht externe inschrijvingen voor deze edit-a-thon, waarvan opnieuw een aantal mensen niet kwam opdagen. Ook ging niemand in op het fotoluik. Het voordeel van een edit-a-thon in de bibliotheek was dat er gebruik gemaakt kon worden van boeken uit de collectie en computers in de leeszaal. Ook dit was een zeer fijne samenwerking.

Samenwerking met opleidingen[bewerken | brontekst bewerken]

  • Wikipedia inbedden in curriculum: Begin 2017 werd een vijftal praktische en academische podiumkunstenopleidingen samengebracht om te polsen naar de mogelijkheden en interesse om Wikipedia-opdrachten in het curriculum van de studenten te integreren. Met twee ervan konden we in 2017 een stap verder zetten. Voor de internationale dansstudenten van P.A.R.T.S. gaven we een introductiesessie om hen te sensibiliseren rond het belang van goede informatie op Wikimediaplatformen. We wilden hen hiermee ook uitnodigen op de edit-a-thon die we in Vorst organiseerden. Er was wel degelijk interesse, maar helaas resulteerde dat niet in extra aanwezigen op de edit-a-thon zelf. De opleidingsverantwoordelijken van P.A.R.T.S. zagen de meerwaarde en boden de mogelijkheid om studenten aan te sporen tot een vrijwillig engagement, maar zagen het niet haalbaar om het schrijven van Wikipedia-artikels als een verplicht onderdeel in het curriculum in te bedden. Met een kleine groep van 4 studenten dia aan de Vrije Universiteit Brussel een vak over Vlaamse theatergeschiedenis na 1945 volgden konden we wel die stap zetten. Onder impuls van een enthousiaste professor werden de gebruikelijke presentaties die de studenten aan het einde van het semester over een maker of gezelschap geven vervangen door de opdracht om een Wikipedia-artikel te schrijven. De sessie werd over twee momenten gespreid. De eerste week lag de focus op een introductie tot schrijven op Wikipedia, de tweede week op het eigenlijke schrijven en de begeleiding daarbij. In de tussentijd konden de studenten de nodige bronnen bij elkaar zoeken en hun artikel al wat voorbereiden. Ook na afloop van het tweede moment konden studenten hun artikel nog verder afwerken. Binnen deze context werden twee nieuwe artikels geschreven en twee bestaande artikels aanzienlijk verbeterd. Op iets meer dan twee maanden tijd werden deze artikels 476 keer bekeken. De statistiek toont ook dat in deze periode 14 verschillende Wikipediagebruikers 36 bewerkingen deden op de 4 pagina's waarop die binnen dit traject werd gewerkt. Het experiment werd positief geëvalueerd door de docent. Voor de studenten ligt het schrijven van een Wikipedia-artikel in de lijn van het schrijven van een paper of het maken van een presentatie. Het was interessant voor de studenten dat ze meer reactie kregen dan enkel van de docent. Dit aspect van ‘peer reviewing’ werd als verrijkend ervaren. Vanuit deze opleiding is er alvast de bereidheid om een Wikipediatraject in de toekomst verder te zetten.
  • Stageopdrachten: naast het 'inbreken' in een curriculum testten we ook samenwerking in de vorm van stages uit. We dienden bij de Katholieke Universiteit Leuven een stagevoorstel in bij de masteropleidingen Geschiedenis en Culturele Studies. In het najaar van 2017 startte via die weg een Letse studente Culturele Studies, die zich als deel van haar stagepakket toelegde op het vertalen van Nederlandtalige artikels naar het Engels en Duits. We konden op die manier iets meer schrijfcapaciteit genereren naast de output die we van edit-a-thons kunnen verwachten. Tegelijk zorgde het begeleiden van deze studente er ook voor dat we van nabijer kennismaakten met specieke moeilijkheden op de Engelstalige en Duitstalige Wikipedia (zie verderop bij de aandachtspunten en het nieuwsbericht op de website van PACKED vzw).

Aandachtspunten bij het organiseren van een edit-a-thon[bewerken | brontekst bewerken]

  • Word zelf Wikipediaan voor je iets organiseert. Werk je in en ga zelf aan de slag. Zelf tegen een aantal moeilijkheden aanlopen helpt bij je omgang met de bestaande Wikipediagemeenschap. Bovendien bereidt het je goed voorbereid om mensen concreet bij te staan tijdens schrijfsessies.
  • Inschrijving: Inschrijvingen via een Google Form zijn eenvoudig te realiseren en overzichtelijk. In combinatie met andere communicatiekanalen zoals Facebook gebeurt het echter wel dat mensen zich enkel op Facebook aanmelden en niet officieel inschrijven. Vraag mensen bij hun inschrijving ook om vooraf een Wikipediagebruikersaccount aan te maken. Er zit immers een restrictie op het aantal nieuwe accounts dat binnen een beperkte tijd vanaf eenzelfde IP-adres kunnen worden aangemaakt. Vraag hen ook naar hun talenkennis en of ze vegetariër zijn of voedselallergieën hebben (om de catering op voorhand te kunnen organiseren)..
  • Schrijflijst: Het is aan te raden om de focus van een schrijfsessie vooraf te bepalen. Enerzijds helpt dit om het evenement gericht naar bepaalde doelgroepen te communiceren, anderzijds kun je je als organisator ook beter voorbereiden om mensen onderwerpen aan te reiken waarover ze kunnen schrijven. Op basis van vorige ervaringen van Wikimedia België met het organiseren van edit-a-thons, maakten we voor elke edit-a-thon die we organiseerden een gerichte schrijflijst. Voor de focus rond dans in Brussel zag die er bijvoorbeeld anders uit dan voor de edit-a-thon tijdens Het TheaterFestival. Het doel van de schrijflijst is om mensen suggesties aan te reiken. Het is dus geen dwingend lijstje dat moet afgewerkt worden. Het is eerder een soort van menu waaruit mensen naargelang hun interesse kunnen kiezen. Ook kan men ervan uitgaan dat de onderwerpen die op een schrijflijst voorkomen alvast encyclopediewaardig zijn, al moet de schrijver van een artikel dat uiteraard steeds aantonen in het artikel zelf. Binnen het project rond Belgische podiumkunsten werd ervoor gekozen om enerzijds een algemene schrijflijst rond theater en dans te maken en anderzijds specifieke schrijflijsten per edit-a-thons. Na afloop van een edit-a-thon werden de onderwerpen die specifiek betrekking hadden op het thema ervan toegevoegd aan de algemene schrijflijsten. Een schrijflijst is onderdeel van een projectpagina. Doordat die projectpagina ééntalig is, blijft het een uitdaging om met het oog op meertalige edit-a-thons een overzichtelijke meertalige schrijflijst te maken. Sommige onderwerpen hebben immers wel al een artikel in de ene taal, maar nog niet in de andere. Schrijflijsten hoeven overigens niet enkel suggesties voor artikels te bevatten. Voor de edit-a-thon in Vorst plaatsten we ook items op de schrijflijst waarvoor nog geen foto onder een vrije licentie bestond. Deelnemers werden op die manier niet enkel aangemoedigd om te schrijven, maar ook om zelf foto's te nemen en die te uploaden in Wikimedia Commons.
  • Verwachtingspatroon: verwacht geen massale opkomst. De mogelijkheden zitten hem in een volgehouden inspanning die een gemeenschap helpt op te bouwen. De organisatie van een aantal edit-a-thons leerde ons dat dit helemaal niet duur hoeft te zijn, zeker niet wanneer je met partners samenwerkt die een locatie ter beschikking kunnen stellen. Wel vraagt het een aangehouden tijdsinvestering om deze schrijfsessies goed voor te bereiden en op te volgen.
  • Denk goed na over het format, de duur en locatie van een schrijfsessie. Belangrijke aspecten zijn een goede wifi, voldoende werktijd, en wat eten en drank om de deelnemers te verwennen.
  • Zorg voor een goede introductie. Hiervoor kun je samenwerken met het nationale Wikimedia Chapter.
  • Omgang met meertaligheid: meertaligheid is een grote troef binnen het Wikimedia-ecosysteem, maar de stagiaire die voornamelijk op de Engelstalige en Duitstalige versie werkte ondervond ook een aantal moeilijkheden. Elke taalversies heeft immers lichtjes andere regels en gebruiken:
    • Nieuwe gebruikers kunnen op de Engelstalige Wikipedia aanvankelijk enkel bestaande artikels editeren. Om een nieuw artikel te kunnen schrijven moet je een meer ervaren Wikipediaan zijn (minimaal x aantal edits en x maanden gebruiker zijn)
    • In de Duitse versie van Wikipedia kun je wel meteen artikels schrijven, maar krijgen deze artikels een tag mee dat ze door een onervaren gebruiker zijn geschreven.
    • De Duitse Wikipedia heeft vrij strenge richtlijnen in verband met het vertalen van artikels uit andere taalversies. Ofwel dient men een aanvraag in te dienen voor een import met de volledige versiegeschiedenis, ofwel moet men zelf als eerste versie van een nieuw artikel de oorspronkelijke taalversie importeren en dat vermelden. De reden hiervoor is een vrij strakke interpretatie van de CC BY-SA-licentie die op het oorspronkelijke artikel van toepassing is. Zie de:Wikipedia:Übersetzungen.
  • Schrijf niet over jezelf of je eigen organisatie.
  • Gebruik meerdere betrouwbare externe bronnen.
  • Denk vooraf aan het documenteren van een project: wat werd er geschreven, aangepast?

Media-uploads (Wikimedia Commons)[bewerken | brontekst bewerken]

Podiumkunsten zijn een vluchtige kunstvorm. Wanneer de voorstelling afgelopen is, is de essentie zoals die door een publiek in een zaal wordt ervaren onherroepelijk verdwenen. Toch blijven er sporen achter die deze kunstvorm opnieuw scherper in herinnering brengen of ze minstens documenteren. Binnen het universum van Wikimediaplatformen zijn onder meer foto's en video's van belang. Kunstenaars en gezelschappen worden zich langzamerhand bewuster van de potentiële erfgoedwaarde van de foto's en video's die ze creëren. Hun eerste zorg is vaak om dit veelal erg kwetsbare analoog en digitaal materiaal te bewaren en (intern) raadpleegbaar houden. Een stap verder is om dit materiaal ook herbruikbaar te maken voor derden. Wikimedia Commons kan daar een nuttig instrument voor zijn, niet in het minst omdat er een directe koppeling mogelijk is met artikels op Wikipedia die encyclopediewaardige onderwerpen over de podiumkunsten beschrijven. Doordat ten tijde van creatie van het materiaal geen afspraken over auteursrechten werden gemaakt met het oog op later hergebruik, is het vaak erg moeilijk en arbeidsintensief voor een kunstenaar of gezelschap om de juiste toestemmingen te verkrijgen om een afbeelding of videofragment onder een vrije licentie ter beschikking te kunnen stellen. Het is dus een uitdaging op zich om bestaand foto-, audio- en videomateriaal over de podiumkunsten vrij herbruikbaar te maken. Daarom werd gezocht naar alternatieve manieren om nieuwe fotografische content te genereren en zo Wikipedia-artikels van beeldmateriaal te voorzien.

Op zoek naar Akarova[bewerken | brontekst bewerken]

Van 30 april tot 11 juni 2017 organiseerde Ballets Confidentiels, een samenwerkingsverband van de choreografen/danseressen Johanne Saunier en Ine Goris, het project Op zoek naar Akarova. In die periode verzorgden ze iedere zondag en telkens op een andere locatie in Brussel een korte dansperformance. Het parcours van de verschillende locaties was geïnspireerd op het leven van de Belgische avant-garde danseres, choreografe en kunstenares Akarova. Omdat de performances plaats vonden op publieke plaatsen als bv. het Akarovaplein / de Brigitinnenstraat (Brussel), de Kapellemarkt (Brussel) en het Weststation (Sint-Jans-Molenbeek), bood dat een uitgelezen mogelijkheid om ze te fotograferen. Het leverde 29 foto's op van drie verschillende choreografieën. Eens de foto's zijn opgeladen op Wikimedia Commons kunnen ze gekoppeld worden aan bestaande Wikipedia-artikels en Wikidata-items (over bv. Johanne Saunier of Akarova).

Portretfoto's tijdens HetTheaterfestival[bewerken | brontekst bewerken]

Naast de hierboven vermelde Wikipedia-edit-a-thons in het kader van Het TheaterFestival probeerden we tijdens de openingsavond van het festival ook een fotografisch luik uit. Van vele acteurs/regisseurs is geen foto aan het Wikipedia-artikel toegevoegd omdat er geen foto onder een vrije licentie beschikbaar is. Tijdens de openingsreceptie van het festival spraken we mensen met enige encyclopedische relevantie voor de sector aan met de vraag of we hen mochten fotograferen en de foto op Wikimedia Commons konden plaatsen. Er werden 37 foto's geüploadet. We kunnen dit evalueren als een kleine inspanning van enkele uren met een relatief grote uitstraling (zie verderop hoofdstuk over hergebruik). Tegelijk was het ook een manier om mensen uit de sector te sensibiliseren voor open content en het belang van aanwezigheid op Wikimediaplatformen. Binnen het geheel van de podiumkunsten zijn portretfoto's natuurlijk maar één van de vele mogelijkheden. Gelijkaardige acties zijn denkbaar met foto's van theatergebouwen of museale theatercollecties. Ook scènefoto's over de Vlaams-Nederlandse podiumkunsten zijn - vaak om auteursrechtelijke redenen - nauwelijks te vinden in Wikimedia Commons. Om dat mogelijk te maken is het vaak noodzakelijk om rechten te klaren of om (voor producties die vandaag nog reizen) in de contractuele afspraken met een fotograaf proactief om te gaan met de vrijgave van fotografisch materiaal.

Foto's nemen en uploaden als onderdeel van een edit-a-thon[bewerken | brontekst bewerken]

De edit-a-thon in Vorst breidden we uit met een fotografisch luik, waarbij mensen objecten, gebouwen, beschermde bomen, parken,... in Vorst konden gaan fotograferen waarvan nog geen foto onder vrije licentie beschikbaar was. Op de schrijflijst suggereerden we items die mensen konden fotograferen. Analoog aan de test die we op Het TheaterFestival uitvoerden kunnen die foto's dan op Wikimedia Commons kunnen en gekoppeld worden aan bestaande Wikipedia-artikels en Wikidata-items. Er werden foto's gemaakt van:

  • het nabijgelegen kantoorgebouw van dansgezelschap Rosas (1 foto);
  • Blib, de gemeentelijke Nederlandstalige bibliotheek van Vorst (9 foto's);
  • de machinezaal van de vroegere brouwerij Wielemans-Ceuppens in BRASS (12 foto's);
  • de edit-a-thon zelf (8 foto's).

Archiefbeschrijvingen (Archiefbank Vlaanderen / Wikidata)[bewerken | brontekst bewerken]

De Vlaamse overheid verwacht dat de podiumkunstenorganisaties die ze een structurele subsidie toekent, zorg te dragen voor hun eigen archief. Ook andere actoren in de podiumkunstensector (bv. critici) hebben een eigen archief waarvoor ze zorg dragen. In vele gevallen gaat het om archieven met een privaatrechtelijk statuut. Archiefbank Vlaanderen verzamelt gegevens over dergelijke private archieven en erfgoedcollecties in Vlaanderen. Ze brengt de gegevens onder in een onlinedatabank en maakt ze voor iedereen raadpleegbaar via een zoekbox. In Archiefbank Vlaanderen steken dus ook beschrijvingen van archieven die betrekking hebben op podiumkunsten. Enkele voorbeelden:

In 2017 is PACKED vzw gestart met het uniek en persistent identificeren van alle archiefbeschrijvingen uit Archiefbank Vlaanderen, inclusief die betrekking hebben op de podiumkunsten.

Vervolgens zijn PACKED vzw en Wikimedia België gestart met opladen van gegevens over de archieven in Wikidata. Daardoor kan vandaag in de Wikidatarecords over bepaalde organisaties en personen uit podiumkunstensector informatie terugvinden worden over waar hun archief zich bevindt. Bijvoorbeeld:

  • Koninklijke Vlaamse Schouwburg had al een uitgebreidere fiche. Toch konden zowel vanuit de Kunstenpuntdatabank als vanuit Archiefbank Vlaanderen nog data worden toegevoegd. Ook blijkt uit de bewerkingsgeschiedenis dat verschillende andere gebruikers in de Wikidatagemeenschap het item mee verrijkten.
  • Bij’ De Vieze Gasten was al aanwezig op Wikidata. Vanuit de Kunstenpuntdatabank werd dit item verrijkt (zie bewerkingen tussen 27 en 29 maart 2017. Op 5 oktober werden ook de gegevens over de archieflocatie uit Archiefbank Vlaanderen toegevoegd. Ook andere gebruikers zorgden voor verrijking van dit item, bijvoorbeeld door de toevoeging van de MusicBrainz-identificatiecode.

Het gaat in eerste instantie over actoren die via het opladen van data over speellocaties in Wikidata zijn terechtgekomen. Een voorlopig overzicht vind je hier. Het aantal organisaties en personen uit podiumkunstensector waarvan men in de Wikidatarecord informatie terugvindt over waar hun archief zich bevindt, zal in de toekomst verder uitbreiden naarmate dat het opladen van de data van Kunstenpunt wordt voorgezet en ook organisaties en personen aan bod komen.

Mogelijkheden tot verrijking/hergebruik van content[bewerken | brontekst bewerken]

Doordat de inhoud op Wikimediaplatformen beschikbaar is onder een vrije licentie, kan deze gemakkelijk hergebruikt worden. Dat kan zowel binnen het Wikimedia-ecosysteem als daarbuiten. Doordat er geen toestemming noodzakelijk is om materiaal te hergebruiken, is het ook minder eenvoudig om die laatste vormen van hergebruik te monitoren. Hieronder lichten we alvast een aantal gerealiseerde en potentiële vormen van hergebruik binnen en buiten Wikimediaplatformen toe.

Kunstenpuntdata[bewerken | brontekst bewerken]

Louter door data te uploaden ontstaat er al een vorm van verrijking. Een deel van de onderwerpen uit de dataset van Kunstenpunt was reeds aanwezig op Wikidata met een bepaalde hoeveelheid informatie. Door op Wikidata de koppeling te leggen met het corresponderende id bij Kunstenpunt, kan iedereen die dat wil de verrijkte data hergebruiken. Ook voor Kunstenpunt zelf als diegene die data aanlevert is er een directe winst. Neem bijvoorbeeld Q11692081. De Kunstenpuntdatabase bevat de naam van het theater, het land, de postcode, zelfs het precieze adres, maar door de koppeling met Wikidata krijgt Kunstenpunt onder meer de geocoördinaten, een foto van de speellocatie en gekoppelde Wikipedia-artikels aangereikt.

Van de 2055 speellocaties die vanuit de Kunstenpuntdatabank in Wikidata verrijkt of eraan toegevoegd werden, hebben 788 een gelinkte afbeelding in Wikidata. Daar liggen dus directe mogelijkheden tot verrijking. Met de WikiData Free Image Search Tool is het mogelijk om op basis van een SPARQL-query op Wikimedia Commons te zoeken naar afbeeldingen van Wikidata-items die nog geen gelinkte afbeelding hebben:

SELECT ?work ?Flanders_Arts_Institute_venue_ID ?image 
WHERE {
?work wdt:P3820 ?Flanders_Arts_Institute_venue_ID.
OPTIONAL {?work wdt:P18 ?image. }
}

Op die manier kunnen de data nog extra verrijkt worden.

Circa 1.700 van de speellocaties hebben op Wikidata specifieke geocoördinaten, waardoor ze heel precies op een kaart kunnen worden weergegeven. De Wikidata query tool maakt dat ook mogelijk. Ook hier gaat het om een extra verrijking, aangezien deze mate van detail die niet in de Kunstenpuntdata zit.

Venues uit de Kunstenpuntdatabank werden in Wikidata getypeerd met de property P31 (is een). Sommige venues hebben meerdere waarden voor deze property. Ze zijn bijvoorbeeld tegelijk een kerk en een concertzaal, een museum en een monument, of een theater en een theatergezelschap. Een eenvoudige query laat toe om overzichtelijk te visualiseren in welke soorten venues Vlaamse (co-producties) de jongste 25 jaar in première gaan. Evidente categorieën als theater, cultuurcentrum en kunstencentrum vormen duidelijk de grootste groep, maar het is interessant om te zien hoe minder voor de hand liggende categorieën als bioscoop, kerkgebouw, kasteel, (kunst)museum, school, plein of fabriek op deze manier zichtbaar worden.

deSingel[bewerken | brontekst bewerken]

Kunstencentrum deSingel ging aan de slag met het hergebruik van Wikipedia-artikels zelf. deSingel beschikt over een rijke website waarop het veel archiefmateriaal ontsluit over de artiesten die in huis waren. Zo voorzien ze ook biografieën die bezoekers van de website context bieden bij personen en organisaties. Het schrijven en up-to-date houden van die biografieën bleek echter onhaalbaar. Geïnspireerd door voorbeelden als Tate en Muntpunt ging deSingel aan de slag om de personen en organisaties te koppelen aan Wikidata-items. Dat gebeurde door een export uit hun database te importeren in OpenRefine. Deels gelijkaardig aan de voorbereiding voor de data-upload van Kunstenpunt (zie hierboven) werd in OpenRefine met de Wikidata-API gezocht naar matches tussen de namen in de database van deSingel en Wikidata-items. De corresponderende Q-nummers werden vervolgens in een aparte kolom binnengetrokken. Op die manier konden in de backend van de website van deSingel de Q-nummers worden opgenomen. De website van deSingel spreekt op zijn beurt live de Wikidata-API aan om te zoeken naar Nederlandstalige, Engelstalige of Franstalige artikels, naargelang de taal waarin een bezoeker surft. Wanneer iemand vanaf de pagina van een concert met werk van Beethoven doorklikt op de naam Beethoven, krijgt naast de inhoud die van deSingel zelf komt ook het begin van de tekst uit Wikipedia en (indien beschikbaar) een foto te zien. Door de API live aan te spreken worden nieuw aangemaakte artikels ook meteen weergegeven op de website van deSingel. deSingel stelt zich tot doel om zelf ook een rol te spelen in de Wikipediacommunity en waar het kan inhoud toe te voegen. Als eerste test werden 414 Q-nummers geïmporteerd.

Raadpleging en hergebruik van foto's genomen tijdens HetTheaterfestival[bewerken | brontekst bewerken]

Van de 37 foto's die tijdens HetTheaterfestival werden genomen en op Wikimedia Commons kwamen, worden er intussen 15 ook hergebruikt op 22 pagina's van verschillende Wikimediaplatformen. Op deze link is te zien waar in het Wikipedia-ecosysteem de foto's in januari 2018 werden gebruikt en hoe vaak ze werden bekeken. De pagina's waarop de foto's hergebruikt worden halen de jongste maanden samen zo'n 2.000 à 2.200 views per maand. Gezien de vrije licentie waaronder ze zijn gepubliceerd, hebben we geen zicht op eventueel hergebruik contexten buiten de Wikimediaplatformen.

Google[bewerken | brontekst bewerken]

Een belangrijke hergebruiker van Wikipediacontent is Google. Wikipediapagina's komen niet alleen hoog in de Google ranking van een zoekopdracht. Ook wordt aan de rechterkant van de zoekresultaten vaak beknopte info weergegeven die bv. een persoon situeert. We merkten dat Google zeer snel op de bal speelt. Ook voor onderwerpen waarover tijdens een edit-a-thon voor het eerst op Wikipedia werd geschreven, komt Wikipedia zeer hoog binnen in de ranking en in de kadertjes aan de rechterzijde. Een goed voorbeeld is choreografe Christine De Smedt. Zelfs met een geëncrypteerde zoekopdracht in zowel het Nederlands als het Engels zijn de resultaten opvallend.

Raadpleging en hergebruik op Wikipedia[bewerken | brontekst bewerken]

Tijdens en rondom de edit-a-thons over podiumkunsten die plaatsvonden sinds april 2017 werden in totaal 73 nieuwe pagina's aangemaakt. Tot einde januari 2018 werden deze samen 9.519 keer bekeken. Naast de nieuw aangemaakte pagina's werden ook 62 pagina's aangepast en verbeterd. Deze reeds bestaande pagina's werden op dezelfde tijd 175.933 keer bekeken. De Pageviews Analysis Tool laat niet alleen toe om in een grafiek de pageviews van verschillende artikels te vergelijken, de tool laat ook toe om de ruwe data te downloaden om deze meer in detail te bekijken. Daaruit kun je het een en ander afleiden over hoe en wanneer een artikel vaak wordt bekeken. Je ziet in de grafieken dat er een relatief hoog aantal pageviews is op het moment dat een artikel wordt aangemaakt en in de daarop volgende dagen, wanneer het door andere actieve communityleden wordt bekeken, becommentarieerd of aangepast. Daarna verloopt de toename in aantal views gestager, maar het valt wel op dat de groei vrij stabiel is. Waar dat niet zo is, is er meestal een goede reden voor. Pieken in bezoekers kunnen bijna altijd verklaard worden door een bepaalde gebeurtenis:

Wikipediavrijwilligers zijn zelf ook hergebruiker van Wikipediacontent. Het schrijven van een artikel in een bepaalde taal kan ervoor zorgen dat iemand het naar een andere taal vertaalt. Wikipedia heeft daar zelfs een vertaaltool voor. De stagiaire van Culturele Studies ging ook op die manier aan de slag. Ik stel voor hier nog iets toe te voegen over de artikels die we in het Engels hebben geschreven, en over hun bereik. Dat lijkt me relevant als we de Wikipedia-platformen willen inzetten om de podiumkunsten uit Vlaanderen en Nederland internationaal kenbaar te maken.

Monitoring tools[bewerken | brontekst bewerken]