Wikipedia:GLAM/Wikipedians in Special Residence/Metadata Upload
Project | Afrika- Studiecentrum |
Atria | Boekmanstichting | EYE Film Instituut Nederland |
IHLIA | IHS | Kon. Inst. Taal-, Land- en Volkenkunde |
Ned. Kanker Inst. AvL |
NIOD | Rijksdienst Cultureel Erfgoed |
Rijksmuseum | Bibliotheek Vredespaleis |
Auteursrecht | Crash course in English Cours intensif en français |
Metadata Upload |
Personeel en presentaties |
Metadata[bewerken | brontekst bewerken]Metadata zijn de gestandaardiseerde gegevens "naast" (meta) de data, die geschikt zijn om als velden in een relationele databank te dienen en zo terugvinden via diverse trefwoorden vereenvoudigen. Bijvoorbeeld bij een foto van een schilderij details van
Metadatavelden worden gekozen op grond van een toepassing (vraagstelling). De waardes die een veld mag aannemen kunnen beperkt zijn tot een aantal voorgeschreven keuzes. De artikelen Metadataformaat en Metadata standards (Engels) geven lijsten van formats. Bij een donatie van digitale bestanden van een instelling aan Wikimedia Commons dienen de oorspronkelijke metadata omgezet en aangevuld te worden naar een standaard van Wikimedia. Het softwarepakket GLAMTOOLS voor de upload van grote aantallen bestanden naar Wikimedia Commons beoogt dit te vereenvoudigen. Voorbeeld Dublin core[bewerken | brontekst bewerken]The Simple Dublin Core Metadata Element Set (DCMES) bestaat uit 15 metadata elementen (velden):
Code[bewerken | brontekst bewerken]
Voorbereiding opladen: voorbeeld omzetting Excel .xls(x) bestand in een .xml bestand[bewerken | brontekst bewerken]Een manier om de metadata als invoer voor GWToolset aan te maken, is de volgende, zie ook
Verschillende versies van Excel gebruiken verschillende namen voor knopjes enzovoorts, maar het idee is hetzelfde. (Wel kende een Apple-versie van Excel in 2015 de onderstaande methode met het Ontwikkelaars/Developersblok voor xml-uitvoer helaas niet.) De metadata zijn al in Excel ingelezen uit een metadata tekstbestand met een scheider tussen de velden, bijvoorbeeld een komma of een tab enzovoorts. Dus
Uitgaande van de excel-file krijgen we:
B. Schema-file.xml aanmaken
Signatuur Albumnummer Albumtitel Beschrijving/Description 91932 - - Gouvernementshuis te Calcutta in India 91933 - - Ramnath tempel aan de Kali Ghat te Calcutta in India 3. haal gekke tekens uit de veldnamen ("/", "|" (nieuw veld in sjablonen op Commons enz.), eventuele spaties in filenamen vervangen door _, maak er een voorbeeld-xml-file van, een schema voor de omzetting door Excel, a la (twee records dus) <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <je-datafile-bijvoorbeeld-zonder-extensie xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <!-- schema-kitlv-bourne.xml --> <record> <Signatuur>91932</Signatuur> <Albumnummer>-</Albumnummer> <Albumtitel>-</Albumtitel> <Beschrijving>Gouvernementshuis te Calcutta in India</Beschrijving> <!-- en nog veel meer natuurlijk --> </record> <record> <Signatuur>91933</Signatuur> <Albumnummer>-</Albumnummer> <Albumtitel>-</Albumtitel> <Beschrijving>Ramnath tempel aan de Kali Ghat te Calcutta in India</Beschrijving> </record> </je-datafile-bijvoorbeeld-zonder-extensie> 4. sla dit xml-schema uit Notepad op als bijvoorbeeld schema.xml (geen .txt, "Alle bestanden, UTF-8")
Voorbereiding anders: eerst xml-bestand in Excel inlezen, daarna in Excel bewerken, uitvoeren als boven[bewerken | brontekst bewerken]
Problemen met tekens en accenten in Excel[bewerken | brontekst bewerken]
Verboden tekens in (geprobeerde) filenamen[bewerken | brontekst bewerken]
GWToolset voor automatisch toevoegen van bestanden aan Wikimedia Commons[bewerken | brontekst bewerken]GWToolset = GlamWikiToolset = GWT = online programma om vele bestanden te uploaden naar Wikimedia Commons. Voorbereiding[bewerken | brontekst bewerken]Vereisten vooraf:
De volgende files komen voor:
Links upload[bewerken | brontekst bewerken]
Links overig[bewerken | brontekst bewerken]
XML voorbeelden[bewerken | brontekst bewerken] Voor een complex voorbeeld met sjabloon Artwork zie Atlas of Mutual Heritage Hieronder gebruik van sjabloon Information. Bibliotheek Vredespaleis, 2000 50MB foto's van oude prenten, hier upload URL niet getoond <?xml version="1.0" encoding="UTF-8"?> <!-- test Bor foto 9141 --> <batch> <record> <description>{{en|Emmanuel Philibert, Duke of Savoy}}{{nl|Emanuel Filibert van Savoye (1528-1580)}}</description> <date>1621</date> <syntaxhighlight lang="text">Nederlantsche oorloghen, beroerten, ende borgerlijcke oneenicheyden, beginnende mette opdrachte [...] aen [...] Philippus van Spangien, tot de droevige doot van [...] Willem prince van Orangien. By Pieter Bor Christiaensz Oorspronck, begin ende vervolgh der Nederlantsche oorlogen. Part 1 Publisher: Leyden : G. Basson, Amsterdam, M. Colyn Printer: Basson, Govert Leiden, 1612-1630. Colijn, Michiel Amsterdam, 1608-1635 </syntaxhighlight> <author>Pieter Christiaansz Bor (1559-1635). Engraver:.</author> <permission>{{PD-Art-100}}{{D-Vorm Peace Palace Library collection}}</permission> <url-image>http://www.peacepalacelibrary.nl/...../Bor-Nederlantsche-Oorloghen_9141.tif</url-image> <filename>Bor-Nederlantsche-Oorloghen_9141</filename> <!-- Als geheugensteun, kan verwerkt door automatische upload met GWTools: --> <category1>Prints from Pieter Christiaansz Bor Nederlantsche oorloghen</category1> <category2>Images from the Peace Palace Library</category2> <partner>Template:Peace Palace Library</partner> </record> </batch> of Institute for Housing and Urban Development Studies, Erasmus Universiteit~200 dia's van achterbuurten in de Derde Wereld, hier upload URL niet getoond <?xml version="1.0" encoding="UTF-8"?> <!-- Slides-cat89-Baroda-Ahmedabad-PB.xml --> <!-- Slums in Baroda !!!!!!> <!-- Images from the Institute for Housing and Urban Development Studies --> <batch> <record> <description>{{en|Street, goats,tree, Baroda slum, India}}</description> <date>1979</date> <syntaxhighlight lang="text">{{Institute for Housing and Urban Development Studies}}</syntaxhighlight> <author>Pál Baross</author> <permission> {{IHS-license}}</permission> <url-image>http://www.eur.nl/......./Slides-cat89-Baroda-Ahmedabad-PB/Baroda-14.JPG</url-image> <filename>Baroda-India-slums-1979-IHS-89-14-Street</filename> <category>Slums in Baroda</category> </record> </batch> Metadata mapping (*.json) voor Template Information (wordt door GWToolset gegenereerd na keuzemenu) {"author":["author"],"date":["date"],"description":["description"],"other_fields":[""],"other_fields_1":[""],"other_versions":[""],"permission":["permission"],"source":["source"],"gwtoolset-title-identifier":["filename"],"gwtoolset-url-to-the-media-file":["url-image"]} More tricks (well..)[bewerken | brontekst bewerken]Getting rid of spaces in filenames[bewerken | brontekst bewerken]Here with buggy DOS command rename. Can be done easier? dir/b Tydsgn 45 _MG_9471.tif Tydsgn 45 _MG_9472.tif rename Tydsgn?45?_MG* Tydsgn-45_MG* dir/b Tydsgn-45_MGG_9471.tif Tydsgn-45_MGG_9472.tif Yes. Clean alternative say Space-out.cmd. Run in the directory with the files. @echo off setlocal enableextensions enabledelayedexpansion set "ARG=%~1" ren "%ARG%" "%ARG: =%" or use Powershell for Windows. Rename files adding a prefix[bewerken | brontekst bewerken]A similar problem: adding a prefix say "18-" to file names. Enter Windows Dos prompt by typing "cmd" in the search window, go to the directory ("cd") only containing the target files, check the files ("dir/w") and type there the command (small script) for renaming all of the present files for %f in (*.*) DO ren "%f" "18-%f" Excel formulae to create compound columns[bewerken | brontekst bewerken]
="ASC Leiden - NSAG - van Es "&B2&" - "&J2&" - "&O2&" - "&Q2
="{{ar|1="&H2&"}}{{en|1="&I2&"}}{{fr|1="&J2&"}}{{nl|1="&K2&"}}" (Windows: Select all files in a folder, three ways: 1. Cntrl-A 2. click first item, hold Shift-Cntrl-End, 3. click first item, hold Cntrl-Shift, click last item.) Voorbeelden sjabloongebruik[bewerken | brontekst bewerken]
Voorbeelden sjablonen donatieprojecten[bewerken | brontekst bewerken]
Meertalig donatiesjabloon maken[bewerken | brontekst bewerken]bijvoorbeeld w:c:Template:Naturalis donation. Er blijken acht files nodig (!), te weten, het sjabloon zelf dat het sjabloon Autotranslate gebruikt en dan nog documentatie w:c:Template:Naturalis donation/doc, opmaak w:c:Template:Naturalis donation/layout, talenlijst w:c:Template:Naturalis donation/lang, tekst in het Engels w:c:Template:Naturalis donation/en, tekst in het Nederlands w:c:Template:Naturalis donation/nl, tekst in het Frans w:c:Template:Naturalis donation/fr en tekst in het Duits w:c:Template:Naturalis donation/de. Template:Naturalis donation {{Autotranslate|1={{{1|}}}|base=Naturalis donation}}<includeonly>[[Category:Media donated by Naturalis Biodiversity Center|{{PAGENAME}}]]</includeonly><noinclude> --------- {{In category|Media donated by Naturalis Biodiversity Center}} {{documentation}} [[Category:Source templates]] [[Category:GLAM templates]] </noinclude> Template:Naturalis donation/doc The Template:Naturalis donation has no parameters, and only serves to acknowledge the donation. It is used to tag media donated in the GLAM project [[w:en:Wikipedia:GLAM/Naturalis|Wikipedia:GLAM/Naturalis]] ([[w:nl:Wikipedia:GLAM/Naturalis|Dutch version]]). Template:Naturalis donation/layout {| {{Partnership-Layout|lang={{{lang|}}}}} | style="width:100px;" | {{ImageNoteControl|notes=off|img=[[File:Naturalis Biodiversity Center - RMNH.ART.5 - Carcinoplax longimana (De Haan, 1833) - Kawahara Keiga.jpg|100px|link={{Smartlink|Commons:Naturalis Leiden|{{{lang}}}}}|Naturalis|alt=]] }} | {{lang|{{{lang|}}}|{{{text|empty}}} }} ---- {{Naturalis donation/lang}}<br/>{{Copyright-tag-still-required|{{{lang|}}}}} |}<noinclude> [[Category:Layout templates|{{PAGENAME}}]] </noinclude> Template:Naturalis donation/lang <span style="font-size:x-small;line-height:140%" class="plainlinks noprint"><!-- -->[{{fullurl:Template:Naturalis donation/de}} {{ucfirst:{{#language:de}}}}] | <!-- -->[{{fullurl:Template:Naturalis donation/en}} {{ucfirst:{{#language:en}}}}] | <!-- -->[{{fullurl:Template:Naturalis donation/fr}} {{ucfirst:{{#language:fr}}}}] | <!-- -->[{{fullurl:Template:Naturalis donation/nl}} {{ucfirst:{{#language:nl}}}}] | <!-- -->{{edit|Template:Naturalis donation/lang}} </span><noinclude> [[Category:Language link templates|{{PAGENAME}}]] </noinclude> Template:Naturalis donation/nl {{Naturalis donation/layout |text=Dit mediabestand maakt deel uit van de collectie van [http://naturalis.nl Naturalis Biodiversity Center]. Een selectie werd in een samenwerkingsverband met Wikimedia geschonken aan Wikimedia Commons. Vermeld bij gebruik a.u.b. '''Bron: Naturalis Biodiversity Center/Wikimedia Commons'''. |lang=nl }}<noinclude> {{translated tag|marker}} </noinclude> Template:Naturalis donation/en {{Naturalis donation/layout |text=This media file is from [//naturalis.nl Naturalis Biodiversity Center], donated in the context of a partnership program. Please mention as the source: '''Naturalis Biodiversity Center/Wikimedia Commons''' when using this file. |OTRS=[[COM:OTRS|OTRS]] stores a ticket related to this donation at [[OTRS:2015050810012748]]. |lang=en }}<noinclude> {{translated tag|marker}} </noinclude> Attribution[bewerken | brontekst bewerken]Bijvoorbeeld
|