Wikipedia:Aanmelding botgebruikers/Archief/2022

Uit Wikipedia, de vrije encyclopedie

WikiportraitBot[bewerken | brontekst bewerken]

  • Operator: Daniuu (beheerder) - ook gebruikt door het team van Wikiportret (o.m. Ellywa en DutchTina)
  • Function summary: Bot voor gedeeltelijke automatisatie uploadproces Wikiportret
  • Function details: zie hieronder
  • Programming language: Python 3.8 (geen externe frameworks gebruikt)
  • Flag on: Commons, Wikidata
  • Contributions (coupled accounts via SUL)
  • Geef botbit

Ik zou de gemeenschap graag willen inlichten (en simultaan een botbitje aanvragen) over/voor WikiportraitBot, een bot die gebruikt wordt door het team van Wikiportret om een aantal aspecten van het upload- en plaatsingsproces voor afbeeldingen te automatiseren. Momenteel gebruiken we de bot al op Wikidata en Wikimedia Commons voor een aantal taken (zoals het koppelen van de afbeelding en het goedzetten van categoriën en gestructureerde metadata op die projecten). We zouden de werkzaamheden van de bot graag willen uitbreiden naar deze wiki. Meer concreet zouden we de bot graag willen gebruiken om afbeeldingen die geüpload worden automatisch ook in te voegen in de infoboxen bij het artikel (zoals bijvoorbeeld hier gedemonstreerd). De bot is zo geprogrammeerd dat er geen bewerkingen zullen gebeuren wanneer er al een afbeelding in de infobox is geplaatst (in plaats daarvan krijgt de operator een foutmelding in de achterliggende interface). Hetzelfde geldt voor artikelen waarop de afbeelding al op een andere manier zou zijn ingevoerd. De bot kan eventueel ook afbeeldingen invoegen in artikels zonder infobox (zoals hier gedemonstreerd).
De frequentie van deze bewerkingen zou eerder beperkt zijn (zijnde wanneer een afbeelding door het Wikiportretteam wordt geüpload naar Commons).
De broncode bij deze functie kan gevonden worden op Github. Voor dit verzoek is specifiek de functie add_image_to_article relevant. -- Daniuu 11 feb 2022 13:05 (CET)[reageren]

Mordicus tegen (bezwaar weggenomen): Er is in deze encyclopedie al veel te veel desinformatie toegevoegd zonder dat er iemand naar de bewerking keek. Ik heb er dagelijks mee te maken als ik de botmatig aangemaakte lemmata van het dierenproject bekijk en corrigeer. Ik kom stupiditeiten van de oorspronkelijke bots tegen, bijvoorbeeld artikelen aanmaken alsof het soorten betrof, terwijl het in werkelijkheid om ooit gepubliceerde namen ging, of de naam 'Pocock' automatisch linken aan Mary Agard Pocock, een schimmelspecialiste, in artikelen over spinnen, waar naar Reginald Innes Pocock gelinkt had moeten worden. En ik kom ook stupiditeiten tegen van bots die op basis van Wikidata of Commons automatisch afbeeldingen hebben geplaatst. Eén zo'n stommiteit is om bij een artikel over een geslacht of een familie een afbeelding te plaatsen als die in de commons-categorie over het geslacht of de familie staat, en dat betekent vrijwel zonder uitzondering dat het een niet nader gedetermineerde soort is, en dus een afbeelding met een grote kans van onjuiste determinatie. Het toevoegen van een afbeelding is een intellectueel proces, waarbij de bewerker moet checken of de afbeelding wel echt voorstelt wat de metadata suggereren. Een bot kan dat niet.
Een goed alternatief bestaat: laat de bot een item aanmaken op de overlegpagina van het lemma waarvoor mogelijk een afbeelding beschikbaar is, en die OP dan ook opnemen in een categorie zodat de voorstellen door echte mensen met ogen en hersens kunnen worden beoordeeld. Op dit moment loopt er een bot die in oude bewerkingssamenvattingen zoekt naar wat mogelijk bruikbare referenties zijn, en daarover dan een melding maakt op een OP. En dat werkt volgens mij prima. Dat het wellicht jaren kan duren voordat het voorstel beoordeeld wordt, is in mijn optiek nog altijd duizendmaal beter dan dat een voorstel automatisch, dus onbeoordeeld, in een artikel wordt gedumpt. WIKIKLAAS overleg 11 feb 2022 16:44 (CET)[reageren]
Ik zal dit ook even toelichten, want ik gebruik de bot. Het proces verloopt nu als volgt:
1. Er komt een foto binnen via Wikiportret
2. Een mens (een vrijwilliger van het Contactpunt) bekijkt de foto en na correspondentie over de auteursrchten en vrijgave door de maker, bepaalt deze mens bij welk artikel de foto in de infobox kan komen. Indien nodig, want soms gebeurt dat niet. De inzendingen zijn echter meestal portretten bedoeld voor artikelen waar een portret nu ontbreekt.
3. De mens zet het portret op Commons, via het (automatisch gevulde) uploadformulier.
4. De mens geeft opdracht aan Wikportret om de foto op Wikidata neer te zetten en een categorie aan te maken op Commons. Input is de filenaam op Commons en de artikelnaam op NL-Wikipedia. De bot voert dit uit. De foto staat op het juiste item op Wikidata.
5. De mens zet dezelfde afbeelding met de hand in de infobox.
6. De mens heeft extra risico op een muisarm.
Om punt 5 te automatiseren en daarmee de kans op punt 6 te verminderen verzoekt Daniuu nu de bot toegang. Er is dus geen sprake van grootschalig en automatisch toevoegen van afbeeldingen uit Wikidata. Het is dus een vrijwel geheel handmatig proces, waarbij de toetaanslagen Bewerk pagina, Cntr+C, Cnrt+V en opslaan worden overgelaten aan de Wikiportrait bot. Hoop op herziene reactie. Tot nadere toelichting en demonstratie ben ik uiteraard bereid. P.S. Er zijn nu meer dan 5000 portretten met de hand toegevoegd, vanaf het begin van Wikiportret ca. 1 maal per dag. Zo een omvang van edits verwacht ik van de bot. Een botbitje is strikt genomen dan ook niet nodig. Groet, Elly (overleg) 11 feb 2022 17:28 (CET)[reageren]
Twee dingen:
  • Waarom deze bewerkingen niet doen als gebruiker Ellywa? WikiportraitBot klinkt als een handmatig bediend instrument. Is het dan niet eigenlijk een sokpop van Ellywa, of potentieel een sokpop van Daniuu en/of Ellywa? Dat is voor de herleidbaarheid van edits niet heel transparant. Is er een reden om te handelen uit naam van de 'organisatie' Wikiportret? Misschien snap ik niet helemaal hoe stap 4 hierboven gebeurt.
  • Ik zou het niet erg vinden als de bot deze wijzigingen deed zonder de edits te flaggen als bot-edit, want het volume is laag en het kan geen kwaad als een geïnteresseerde in de onderhavige pagina het op zijn volglijst ziet verschijnen dat een afbeelding is toegevoegd. Maar dat is een persoonlijke opvatting. Bij 1 edit per dag kan het ook niet als hinderlijk worden gezien, wat de grootste meerwaarde van het flaggen van edits als bot-edit is.
Het botverzoek, de code en de edits zien er verder netjes uit wat mij betreft (en ik begrijp niets van wat Wikiklaas opmerkt, ik heb kennelijk een heel ander verzoek gelezen). –Frank Geerlings (overleg) 11 feb 2022 18:00 (CET)[reageren]
Eerst en vooral dank ik allen voor de input die reeds is gegeven bij dit verzoek. Ik zal hierna proberen de voornaamste vragen etc. te beantwoorden.
  • @Wikiklaas: het is geenszins de bedoeling om met de bot en masse afbeeldingen te importeren uit Wikidata, zonder enige controle. Het huidige script werkt, zoals Elly terecht aanhaalt, uitsluitend wanneer een VRT-vrijwilliger op het knopje drukt (en verwerkt enkel en alleen die afbeelding die ingevoerd wordt).
  • @Frank Geerlings: dank voor het opwerpen van je bezorgdheden. De bewerkingen gebeuren vanop een afzonderlijk bot account voor de transparantie (om duidelijk aan te geven welke bewerkingen er door een script gebeuren - dat aangestuurd wordt door een vrijwilliger). Een andere reden is meer technisch van aard (zo moet er maar één script voorzien worden en één setje inloggegevens). Het gevaar op sokpoppen is als je het mij vraagt niet anders dan bij eender welk bot account (de API is zééér lomp voor dat doeleinde en om in het account zelf te geraken zou je al haast het wachtwoord moeten resetten - wat direct een melding genereert in onze VRT queue). Het account afvlaggen als bot kan zorgen voor extra transparantie (en heeft als ander voordeel dat er geen meldingen van bedankjes enzovoorts in VRT belanden). Hoewel dit niet zo dikwijls zal voorvallen, kan de bot op die manier ook gebruikt worden om grotere volumes bewerkingen te doen (in geval er bijvoorbeeld een batch upload zou gebeuren van pakweg politici). Wat het verschijnen op volglijsten betreft: normaal gezien worden er met een vlagje als dit nog altijd mailtjes enzovoort uitgestuurd (maar wat de wiki-interface betreft heb je wel een punt). Daniuu 12 feb 2022 11:57 (CET)[reageren]
Als aanvulling: dit verzoek moet ook deels gezien worden als een kennisgeving aan de gemeenschap (zoals die bijvoorbeeld op Wikidata en Commons verplicht is). Daniuu 12 feb 2022 12:00 (CET)[reageren]
Ik ben het met je hele verhaal eens, inclusief het kennisgevings-stukje (heel netjes, dat zou vaker moeten gebeuren) en ik ben helemaal tevreden. Het was meer een 'journalistieke' vraag naar de bekende weg dan een bezorgdheid. Een bot met een duidelijke doelstelling en beperkte scope waarvan het bekend is wie er achter zit, dat is deze bot en dat is nu helder. Scepsis was niet mijn insteek, het ging me om aanvullende helderheid. Mordicus voor. –Frank Geerlings (overleg) 12 feb 2022 13:15 (CET)[reageren]
In het oorspronkelijke verzoek stond niet beschreven wat de procedure precies is, wat Ellywa daarna nog heeft goedgemaakt. Het ging me er niet om of er al dan niet en masse bewerkingen zouden worden gedaan, maar uitsluitend om de controle door een denkend en kijkend mens. En ik begrijp nu dat in het project Wikiportret die controle al vooraf wordt gedaan. En in dat geval trek ik mijn bezwaar in. WIKIKLAAS overleg 12 feb 2022 14:34 (CET)[reageren]
Als aanvulling: wanneer er een foto geplaatst wordt (dus na het controleproces door de VRT vrijwilliger) zou de bot ook het {{fotogewenst}}-sjabloon van de pagina verwijderen (omdat dit uiteraard niet meer nodig is. Dit is hierzo getest. Ik hoor graag feedback vanuit de gemeenschap over deze additionele functionaliteit. Daniuu 14 feb 2022 12:15 (CET)[reageren]
Je zou hetzelfde kunnen doen met {{afbeelding gewenst}} en {{verzoek om afbeelding}}. –bdijkstra (overleg) 14 feb 2022 12:34 (CET)[reageren]
@Bdijkstra:: wordt aangepast. Dank voor de suggestie. Daniuu 14 feb 2022 12:35 (CET)[reageren]
Voor Voor, al zou ik het wel op prijs stellen als het script meteen werk maakt van het onderschrift, bijvoorbeeld 'Robert Giebels in juli 2021'. Met vriendelijke groet, RonnieV (overleg) 14 feb 2022 12:30 (CET)[reageren]
@RonnieV: dank voor je suggestie. Ik had daar ook al aan zitten denken. Dit implementeren is iets ingewikkelder dan wat ik tot nu toe heb geïmplementeerd (al is het zeker niet onmogelijk). Een mogelijk risico bij deze functionaliteit is dat de functie moet vertrouwen op metadata bij de afbeelding (en de ervaring leert dat die niet altijd 100% betrouwbaar is). Ik zal er zeker eens voor kijken om te implementeren. Daniuu 14 feb 2022 12:34 (CET)[reageren]
De foto is in dezelfde run geplaatst op Commons, dus deze waarde is hetzij meegegeven door de gebruiker, hetzij daar niet bekend. Uitlezen van de Meta-data is inderdaad lastiger en wellicht ook riskanter. De gebruiker dit laten invoeren is een veilige optie. Succes net dit script. Met vriendelijke groet, RonnieV (overleg) 14 feb 2022 12:42 (CET)[reageren]
Normaal gezien worden de metadata die meegegeven worden aan Commons meteen ook ingeladen in het script. Het enige ambetante is dat ook die datum niet altijd betrouwbaar is. Gelukkig had ik al een script dat iets gelijkaardigs deed op Wikidata en dat kan nu goed van pas komen. Daniuu 14 feb 2022 13:03 (CET)[reageren]
  • Uitgevoerd Uitgevoerd wat betreft het "goedkeuren" van de bottask. Niet uitgevoerd Niet uitgevoerd wat betreft het botbitje. De bot zal weinig edits per minuut maken en het is voor auteurs van artikelen mogelijk fijn wanneer ze kunnen zien dat een foto toegevoegd is aan het artikel ongeacht of botbewerkingen verborgen worden of niet. Mochten er telkens grotere hoeveelheden edits per minuut gemaakt moeten worden kan er altijd opnieuw om een botbitje gevraagd worden natuurlijk. Natuur12 (overleg) 14 feb 2022 20:19 (CET)[reageren]

Bot61[bewerken | brontekst bewerken]

-- ✔ Rots61 Overleg 7 sep 2022 21:37 (CEST)[reageren]

Steun Steun. Bedankt voor het op je nemen van deze stierlijk vervelende klus. De edits zien er goed uit. Vraag: Ben je van plan na deze Dierenrijk-klus nog andere dingen met deze bot te gaan doen, bijvoorbeeld andere nog komende en dus nu nog onbekende WP:VPB-klussen? Of is dit echt een one-off account zoals je suggereert? Ik hoop natuurlijk het eerste, maar het is m.i. wel handig daar in je aanvraag helder over te zijn. –Frank Geerlings (overleg) 8 sep 2022 21:54 (CEST)[reageren]
Op dit moment zal hij alleen gebruikt worden voor "Dierenrijk". Dat is relatief makkelijk te doen. Maar ik zal zeker WP:VVB in de gaten houden. ✔ Rots61 Overleg 9 sep 2022 10:20 (CEST)[reageren]
Steun Steun, maar ik zou graag willen weten wat de afweging is bij bijna in 'van plan om bijna alle links naar Dierenrijk te veranderne naar Dieren (biologie).' Welke ga je negeren, en is er een bepaalde reden om die te negeren? Met vriendelijke groet, RonnieV (overleg) 9 sep 2022 01:14 (CEST)[reageren]
De bot vervangt = [[Dierenrijk|. Dus alle links in een infobox worden vervangen. Er zijn ook links in de lopende tekst, soms verwijst die naar Dieren, maar soms is dat ook een link naar een liedje. Vandaar dat ik alleen de links vervang waarvan zeker is dat ze naar Dieren verwijzen. ✔ Rots61 Overleg 9 sep 2022 10:20 (CEST)[reageren]
(Na aanpassing van de aanhalingstekens) Dit lijkt me inderdaad een goed eerste begin. Eerst maar eens kijken hoeveel er dan overblijven, misschien dat er nog een tweede run gedaan kan worden waarbij er gezocht wordt op 0 of meer spaties (of nog beter: white space characters) tussen het =-teken en de linktekst [[Dierenrijk|. Dat meenemen van het =-teken is inderdaad heel belangrijk voor de automatische verwerking. Ga zo voort, en voorlopig mag je opschakelen naar 12 bewerkingen per minuut. Met vriendelijke groet, RonnieV (overleg) 9 sep 2022 13:20 (CEST)[reageren]
  • Uitgevoerd Uitgevoerd Gezien het om een verzoek met een beperkte scope gaat, toegekend voor 3 maanden en specifiek voor deze task. Zijn er meer taken die je op wil pakken, dien dan gerust een nieuw verzoek in. Natuur12 (overleg) 9 sep 2022 10:58 (CEST)[reageren]