Wikipedia:Verzoekpagina voor bots

Uit Wikipedia, de vrije encyclopedie
Dit is een oude versie van deze pagina, bewerkt door ErikvanB (overleg | bijdragen) op 27 mei 2022 om 13:22. (→‎Nieuwe verzoeken)
Deze versie kan sterk verschillen van de huidige versie van deze pagina.
Nieuwe verzoeken graag in de eerste sectie toevoegen: afgehandelde verzoeken graag verplaatsen naar onderen.
Zie WP:VPB
Op deze pagina kunnen de gebruikers verzoeken plaatsen aan eigenaren van bots. Bijvoorbeeld om een bepaalde categorie van een heleboel pagina's te verwijderen.

Gelieve uw verzoek te ondertekenen met vier tildes: ~~~~.

Een verzoek toevoegen...

Verzoeken voor een botbitje kunnen worden geplaatst op Wikipedia:Aanmelding botgebruikers.

Meldingen van grootschalige botimport van nieuwe artikelen kunnen op Wikipedia:Meldingen botimport nieuwe artikelen geplaatst worden.

Afgehandelde verzoeken mogen na verloop van tijd worden verplaatst naar het archief.

Overzicht beheerpagina's

Verzoeken

Nieuwe verzoeken

aan weerszijde > aan weerszijden

150 keer is me iets te veel. Zie Woordenlijst en Team Taaladvies. Maar pas op: natuurlijk geen citaten aanpassen. Vooral bij veel stadswapens staat "aan weerszijde" omdat het citaten zijn.

PS: Van weerszijde heb ik al nagelopen, aan weerskante en van weerskante komen niet voor. ErikvanB (overleg) 27 mei 2022 13:22 (CEST)[reageren]

Website Top Notch

De website https://www.top-notch.nl ligt er al een tijdje uit. Is het een idee om de links naar die website botmatig op te halen uit het archief? Zie voor eerder overleg de Helpdesk. Mvg, Ennomien (overleg) 21 mrt 2022 10:39 (CET)[reageren]

Lijkt me een beetje voorbarig. De website staat nog vermeld op hun social media, waar de afgelopen week nog nieuwe berichten verschenen. Misschien beter als iemand even vraagt wat ze van plan zijn met hun website. –bdijkstra (overleg) 21 mrt 2022 11:32 (CET)[reageren]
Nog steeds geen respons van de website. Iemand die weet wat we ermee moeten doen? Ennomien (overleg) 3 apr 2022 15:59 (CEST)[reageren]
Nu komt er helemaal geen respons. Iemand enig idee wat we hiermee moeten? http://www.top-notch.nl (niet https) geeft overigens een ander resultaat (nog wel het venster met de error zoals ik die eerder altijd kreeg), maar kan die nu (2 min later) niet reproduceren. Ennomien (overleg) 22 apr 2022 20:39 (CEST)[reageren]
Waarom hun niet gewoon vragen wat ze van plan zijn met hun website? –bdijkstra (overleg) 22 apr 2022 20:53 (CEST)[reageren]
Waar zou ik dat moeten vragen/regelen? Ennomien (overleg) 22 apr 2022 21:48 (CEST)[reageren]
Mogelijkheden te over: fb tw yt ig tt. –bdijkstra (overleg) 22 apr 2022 22:03 (CEST)[reageren]
Dat was ook een stomme vraag. Ik ga ze een e-mail sturen op het e-mailadres dat gegeven is op YT -> contact. Groet, Ennomien (overleg) 23 apr 2022 11:53 (CEST)[reageren]
"Bericht geblokkeerd
Je bericht aan info-at-top-notch.nl is geblokkeerd. Bekijk de onderstaande technische details voor meer informatie."
Pfff ... Ennomien (overleg) 23 apr 2022 12:08 (CEST)[reageren]
Dan nu maar via Messenger proberen, anders houdt het op. (dit even opslaan). Ennomien (overleg) 23 apr 2022 12:10 (CEST)[reageren]
De gelieerde wepsjop vermeldt een telefoonnummer (link). Wutsje 23 apr 2022 15:33 (CEST)[reageren]
Daar heb ik niet zo'n zin in. Als iemand zich geroepen voelt ... Ennomien (overleg) 23 apr 2022 16:59 (CEST)[reageren]
Ik verveel me nog liever dan dat ik daar tijd in steek. Wutsje 23 apr 2022 19:52 (CEST)[reageren]
Haha. Ik zag later dat het echt om enkele links gaat, ik kijk even of ik reactie ga krijgen en anders archiveer ik die links gewoon maar waar mogelijk. Was het me maar nooit opgevallen ... Ennomien (overleg) 23 apr 2022 20:05 (CEST)[reageren]

SignBot

Op Commons functioneert c:User:SignBot, die automatisch een handtekening plaatst bij ongesigneerde bijdragen op overlegpagina's, de diverse kroegen, helpdesk, etc. Is het een idee dat hier ook in te voeren? Op de Engelstalige WP is er ook een, en:User:SineBot. Groet, Elly (overleg) 24 okt 2021 16:09 (CEST)[reageren]

Voor Voor Tina (overleg) 24 okt 2021 16:23 (CEST)[reageren]
Voor Voor Dajasj (overleg) 24 okt 2021 16:24 (CEST)[reageren]
Voor Voor Ciell need me? ping me! 24 okt 2021 17:18 (CEST)[reageren]
Voor Voor Wikiwerner (overleg) 24 okt 2021 18:05 (CEST)[reageren]
Voor Voor Al het recentelijke werk op Sjabloon:Afzender is dan eigenlijk voor niets geweest, maar prima idee. Ennomien (overleg) 24 okt 2021 18:34 (CEST)[reageren]
Zoals ik het zie, doet die bot juist dat sjabloon plaatsen, maar dan automatisch. Dan is het werk toch niet voor niets geweest? Edoderoo (overleg) 24 okt 2021 18:36 (CEST)[reageren]
Dat eerste klopt. Wat er recentelijk aan veranderd is, is dat de volgorde van parameters voor Sjabloon:Afzender en alle soortgelijke sjablonen niet meer uitmaakt. Dit omdat het vervelend is steeds te moeten zien dat je net verkeerd om gokt. Een bot heeft daar uiteraard geen last van en zal die fouten niet maken en kent niet het begrip gebruiksvriendelijkheid. De bot werkt dus ook prima met de versie vóór alle wijzigingen. Ennomien (overleg) 24 okt 2021 19:25 (CEST)[reageren]

Leuk, iedereen is voor, en nu? Edoderoo (overleg) 5 nov 2021 10:30 (CET)[reageren]

Tja, lees vooral ook en:Wikipedia:Bot requests#Bot to handle unsigned comments. De broncode van hun SignBot is in PHP en is afgeschermd, maar er zijn alternatieven in Python. Wikiwerner (overleg) 5 nov 2021 21:02 (CET)[reageren]

Internetarchive

Hoi,

Met het vertalen zie ik dat op de Engelstalige Wikipedia bij alle links naar bronnen automatisch (?) een link naar een gearchiveerde pagina in de internetarchive wordt gegeven. Toen ik gisteren de bronnen bij het artikel over Prinses Maxima bekeek, zag ik dat in ieder geval de bronnen van de NOS in het artikel dode links zijn, en ik kon de bronnen (artikelen uit 2001, 2007) zelf ook niet meer terugvinden op de nieuwssite. Kunnen wij dit misschien ook botmatig oppakken?
Ik stel me dan voor: een botje dat controleert op het sjabloon {{bron}}, die ervoor zorgt dat als er sprake is van een online bron:

  • dat de bron op de nieuwssite wordt gearchiveerd in archive.org
  • de gearchiveerde link verborgen wordt toegevoegd aan de bronvermelding in het artikel.

Zou zoiets mogelijk zijn? Ciell need me? ping me! 18 nov 2020 15:33 (CET)[reageren]

Even een ping voor @Smile4ever. Akoopal overleg. 18 nov 2020 20:59 (CET)[reageren]
Hallo. Momenteel is het reeds mogelijk om gearchiveerde versies van pagina's toe te voegen als verborgen link. Hiervoor dien je op de cite-sjablonen de parameter dodeurl=nee in te vullen. Je krijgt dan beschikking over de parameters archiefurl en archiefdatum. Wanneer een bron dood wordt, is het dan voldoende om dodeurl=ja te gebruiken ipv dodeurl=nee. Met vriendelijke groeten, 4ever(Overleg) 19 nov 2020 11:15 (CET)[reageren]
Hi @Smile4ever, het gaat om het archiveren van webpagina's die wij gebruiken als referentie in het internetarchief, niet eens zozeer de link hier maken. (Wel handig, maar niet essentieel). Zie ook hier: het blijft een wens en blijkbaar niet alleen van mij. Ik was helemaal vergeten dat ik dit verzoek 4 maand geleden al eens hier had gedaan! Ciell need me? ping me! 1 mrt 2021 20:26 (CET)[reageren]
Iets anders gesteld (en wellicht duidelijker): het is de bedoeling om onze referenties/bronnen aan web.archive.org toe te voegen. Als dat is gelukt, kan de archief-url en datum natuurlijk gelijk in het sjabloon worden ingevuld met dode-url=nee. Op die manier zorgen we ervoor dat onze bronnen (wat volgens de veel gebruikers het belangrijkste van een artikel is) bewaard blijft, waarmee ook WP:VER goed ondersteund wordt. Nu komen we er vaak te laat achter dat er geen archief gemaakt is. Edoderoo (overleg) 2 mrt 2021 08:16 (CET)[reageren]
Je kan deze links zelf actief archiveren. Een bot doet dit niet momenteel. Met vriendelijke groeten, 4ever(Overleg) 2 mrt 2021 17:10 (CET)[reageren]
Ik weet dat ik dat zelf kan, maar ik verzoek dus om een bot die dat doet. Voor 90% (natte vinger) van onze schrijvers is het al een toer om een bron of referentie in te vullen, laat staan dat ze die ook nog zelf invoeren bij archive.org. Ciell need me? ping me! 2 mrt 2021 17:24 (CET)[reageren]
Vanuit de Koninklijke Bibliotheek zijn OlafJanssen en ik samen met 1Veertje (KB) aan het onderzoeken hoe we precies deze (getrapte) vraag kunnen uitvoeren voor linken naar de KB-website; hoe kunnen we een bot 1) de linken op nl:wiki naar de kb-website archiveren in het internet archive en 2) hoe kunnen we de archieflink laten vermelden bij een link naar de KB-website (en 3. hoe kunnen heel regelmatig bekijken welke linken 'dood zijn' en daar de archieflink prominent maken.) Groet, DanielleJWiki (overleg) 3 mrt 2021 09:59 (CET)[reageren]
Ik neem aan dat jullie de API-uitleg dan al gezien hebben? Edoderoo (overleg) 3 mrt 2021 10:54 (CET)[reageren]
Hoogstwaarschijnlijk is het - omdat het voor ons op dit moment alleen om de linken naar de kb-website gaat - een logischere aanpak om eerst te zorgen dat die webpagina's standaard gearchiveerd worden in het internetarchief en vervolgens op nl:wiki de linken naar de website aan te vullen met de archieflink. DanielleJWiki (overleg) 4 mrt 2021 09:53 (CET)[reageren]
Ook dan is een python-scriptje (of PHP of iets anders dat de API aanroept) heel handig, want het invoeren/controleren/terughalen van die URLs kun je middels die API geheel geautomatiseerd uitvoeren. Edoderoo (overleg) 4 mrt 2021 09:58 (CET)[reageren]
@Smile4ever De vraag is dus ook of een bot het zou kunnen doen. Dus voor nieuwe referenties checken of hij in het internetarchive staat en zo niet een save aan te vragen, en mogelijk dan in tweede instantie de parameters aan een cite-sjabloon toe te voegen. Akoopal overleg. 3 mrt 2021 15:09 (CET)[reageren]
Die tweede instantie dient (liefst vooraf) gecontroleerd te worden. Een archiveeractie levert lang niet altijd een bruikbare pagina op. –bdijkstra (overleg) 3 mrt 2021 15:22 (CET)[reageren]
Wellicht niet 100% on-topic hier, maar hier zag ik een interessante opmerking. –bdijkstra (overleg) 2 mrt 2021 11:15 (CET)[reageren]
Dan misschien eerst daar polsen of ze het wel OK vinden dat wij zo massaal archiveringen gaan aanvragen? Wikiwerner (overleg) 1 mei 2021 14:19 (CEST)[reageren]
Archive.is is niet gelijk aan archive.org, wat volgens mij het webarchief is die wij momenteel het meest gebruiken. Het blog van internetarchive.org is deze. Desalniettemin is vragen wel zo netjes, maar laten we vooral een onderzoeken hoe we het archiveren van onze bronnen technisch mogelijk zouden kunnen maken? Ciell need me? ping me! 30 jul 2021 16:55 (CEST)[reageren]

Nav een vraag in de Kroeg

Ter info: het gaat om Wikipedia:De kroeg/Archief/20210814. Wikiwerner (overleg) 26 okt 2021 18:45 (CEST)[reageren]

Misschien begrijp ik het verkeerd, maar is dit niet precies wat InternetArchiveBot kan en doet? Enige verschil is dat je handmatig een pagina moet selecteren om daar de bewerking op te laten doen. Bij wijze van test heb ik het even geprobeerd. Daarboven op heeft het ook een ratelimit, dus je kan niet even alle twee miljoen pagina's in een dag doen. Maar als mensen af en toe hun pagina's hier doorheen halen, zijn we al aardig ver. Helpt dit? Dajasj (overleg) 5 aug 2021 17:06 (CEST)[reageren]
Hey @Ciell:. Ik ben nog beetje aan het rondkijken, maar we kunnen wellicht een bot maken die de API van InternetArchiveBot aanroept. Specifiek dan analyzepage, die voegt dus ook archief links van live urls toe. Dat scheelt het wiel opnieuw uitvinden. Maar goed, ik zal nog even verder onderzoeken wat de mogelijkheden zijn. Dajasj (overleg) 5 aug 2021 18:48 (CEST)[reageren]
Even voor de meelezers: het lijkt erop, maar voor deze bot moet je als gebruiker zelf actief een verzoek bij de bot doen, een pagina per keer, waarna deze het hele proces in werking zet. Dat is inderdaad al wat!, maar niet wat ik hier bedoel. Het gaat me juist om een bot die (eens per dag, eens per 5 dagen, zeg het maar) onze encyclopedie crawlt op zoek naar nieuwe externe links die nog niet opgeslagen zijn in het Internet Archive. Ciell need me? ping me! 5 aug 2021 19:54 (CEST)[reageren]
Ik bedoelde ook niet met het tweede dat IAB de volledige oplossing is, maar door IAB aan te roepen via de API, hoeven we eigenlijk alleen een botje te schrijven dat die pagina's opspoort en doorgeeft aan IAB. Mijn ervaring met botjes is zeer beperkt, maar dat lijkt me een aanzienlijke versimpeling van wat een nieuw botje moet doen. Maar goed, ik ga me hier verder in verdiepen. Dajasj (overleg) 5 aug 2021 21:21 (CEST)[reageren]
Het stappenplan voor de bot moet dus worden als volgt:
Corrigeer me als ik iets mis. Uiteraard kunnen we niet botmatig controleren of de archiefversie goed bruikbaar is, zoals bdijkstra vraagt. Aan de andere kant: hoe erg is dat? De archiefversie staat dan immers zojuist op Archive.org, en de Archivebot zal hem dan toevoegen zodra de originele URL dood wordt. Wikiwerner (overleg) 7 aug 2021 17:55 (CEST)[reageren]
Even geprobeerd met de hand, en dan krijg je zoiets. De archieflink kan bijv. ook aan het eind van de ref-tag, dus vlak voor </ref>. Wikiwerner (overleg) 7 aug 2021 18:07 (CEST)[reageren]
Controleren of een pagina reeds gearchiveerd is, kan via het trucje "2005": https://web.archive.org/web/2005/http://users.pandora.be/brail/lijn/lijn3666.htm redirect niet naar een specifieke pagina, terwijl https://web.archive.org/web/2005/http://users.pandora.be/brail/lijn/lijn36.htm -> https://web.archive.org/web/20050320062031/http://users.pandora.be/brail/lijn/lijn36.htm dat wel doet. Verder eens: als InternetArchiveBot dit via de analyzepage optie al kan, dan moeten we het wiel niet opnieuw uitvinden. Met vriendelijke groeten, 4ever(Overleg) 7 aug 2021 18:13 (CEST)[reageren]
Uiteraard, maar volgens mij missen we dan nog steeds het punt van Ciell: het archiveren van nog actieve URL's die voorkomen in artikelen en waarvan er nog geen archiefversie is. Zoals ik het lees, voegt de analyzepage-optie alleen archieflinks toe van URL's waarvan er al wel een archiefversie is. Wikiwerner (overleg) 14 aug 2021 19:17 (CEST)[reageren]

Eerste versie

Hoi allemaal, ik heb een eerste versie gemaakt. Uitvoerig testen is nog nodig, maar wilde het alvast melden zodat feedback gegeven kan worden. De code staat op Gebruiker:DajasjBot/archivelinks.py. In principe staat de volledige werkende code er, maar op twee plaatsen heb ik iets toegevoegd en verwijderd zodat het voorlopig alleen werkt op mijn kladblok (zodat ik niet per ongeluk over heel Wikipedia heen ga). Kijk dus ook vooral in de bewerkingsgeschiedenis van Gebruiker:DajasjBot/Kladblok.
Het gaat in eerste instantie over de datadump en zoekt naar pagina's met citeersjabloon waar geen archieflink staat. Vervolgens controleert het of dit ook klopt op de live versie. Daarna controleert het of een gearchiveerde versie al bestaat (dit lijkt altijd het geval, een andere bot - waarschijnlijk IAB - doet dit automatisch). Als het wel al bestaat, zoekt het dichtstbijzijnde versie, anders maakt ie een nieuwe aan. Vervolgens wordt het oude citeersjabloon vervangen door het nieuwe, met zo weinig mogelijk wijzigingen verder in de opmaak.
Alle feedback is welkom! Ook kritiek en bezwaren ;) Dajasj (overleg) 26 aug 2021 10:49 (CEST)[reageren]
Ik begin ook Python te ontdekken sinds april, en heb dus weer wat geleerd! Wat mij opvalt is de code voor de snelheidslimiet van 1 bewerking per minuut. Ik regel dit in user-config.py, met de parameter put_throttle. Of heb je een andere reden om dit zo te doen? Reguliere expressies gebruik ik al langer in AWB. Die voor de citeeraanroep kan misschien ruimer met zoiets als \{\{\s*[Cc]ite(er)? [a-z]([^}]|\{\{[^}]*\}\})*\}\}, zodat het script ook werkt op citeeraanroepen die sjablonen bevatten; ik heb dit nog niet getest. Als nieuweling had ik al wel gelezen dat het sneller is om een reguliere expressie te compileren met re.compile(patroon, opties) als je er vaker mee zoekt. En waar haal je de packages bz2file en lxml vandaan? Ze zien er elegant uit. Wikiwerner (overleg) 26 aug 2021 19:41 (CEST)[reageren]
Dank voor het meekijken! Ik had de parameter put_throttle nog niet bestudeerd (eerste week met pywikibot ;)). Ik had wel door dat het zelf pauzeerde, maar dacht, wat extra netheid kan geen kwaad ;) Goede tip voor uitbreiding van de reguliere expressie, ik had nog niet aan Engels sjabloon gedacht, maar zal dat bestuderen. Je hebt ook gelijk over het compilen. Ik vond dit echter nu even makkelijker, maar dat moet ik wel doen ja. Al is die snelheidswinst waarschijnlijk verwaarloosbaar tov de rest. De packages bz2file en lxml kende ik uit het verleden. bz2file is handig om niet het bestand te hoeven "unzippen", lxml om door het xml bestand heen te gaan.
Ik ben nu vooral op zoek naar manieren waarop het fout kan gaan. Dus mocht je suggesties hebben voor dingen om te testen, laat het me weten. Tot nu toe doet het alles goed. Dajasj (overleg) 26 aug 2021 20:09 (CEST)[reageren]

@Dajasj: en anderen: is het wellicht een idee om hier iets over op te nemen op Wikipedia:Onbereikbare externe links en dit in de bewerkingssamenvattingen te linken? Ik merk op verschillende plaatsen dat de achtergrond niet voor iedere gebruiker duidelijk is. Encycloon (overleg) 7 nov 2021 12:08 (CET)[reageren]

Links naar HTTP sites, vervangen voor HTTPS bij gelijke content

Op Wikipedia wordt nog naar een hoop http-sites gelinkt. Om gebruikers van meer privacy te voorzien is het goed om deze links aan te passen naar https, maar natuurlijk alleen als dezelfde content wordt aangeboden over deze verbinding. I-am-will (overleg) 5 jan 2020 19:07 (CET)[reageren]

Ik ben Python nog aan het ontdekken, maar ik zag dit over het openen van websites, incl. de foutcodes zoals 404. Is het veilig genoeg om te controleren of de https-variant een 404 oplevert, en zoniet de https-variant op te nemen? Wikiwerner (overleg) 1 mei 2021 14:19 (CEST)[reageren]
Zorg wel dat je een HEAD-request doet i.p.v. GET. En er zijn meer foutcodes dan 404; sowieso alleen een link opnemen wanneer die 2xx of 3xx oplevert. Ik weet niet of urllib2 het volgen van redirects kan onderdrukken, want als je http wil omzetten in https moet je eigenlijk ook controleren of een eventuele ketting van redirects telkens https blijft gebruiken. –bdijkstra (overleg) 3 mei 2021 11:29 (CEST)[reageren]
Bedankt. Meteen even verder gezocht: lijkt wel te kunnen. Wikiwerner (overleg) 3 mei 2021 22:01 (CEST)[reageren]
Ik heb wat verder gespeeld met de Requests head() Method. "ad = requests.head('http://www.ad.nl')" levert responscode 301. "ad.next.url" levert vervolgens https://www.ad.nl. "ads = requests.head('https://www.ad.nl')" levert echter responscode 403; ik denk vanwege de cookiewall. Is er een manier om daarmee om te gaan? Wikiwerner (overleg) 7 aug 2021 21:12 (CEST)[reageren]
Met curl -I https://www.ad.nl/ krijg ik een 302 naar myprivacy.dpgmedia.nl, de cookiewall. Misschien doe je iets fout, of anders wellicht een beperking van urllib2. –bdijkstra (overleg) 7 aug 2021 21:27 (CEST)[reageren]
O, ik had daar redirects toegestaan. Zonder redirects krijg ik inderdaad een 302 naar de cookiewall. Maar vervolgens levert "requests.head(ads.next.url)" een 403 op. Overigens zitten de commando's in de requests-package. De Urllib2-package kan inderdaad geen redirects onderdrukken, voor zover ik zie. Wikiwerner (overleg) 7 aug 2021 22:00 (CEST)[reageren]
Wanneer de site enkel html gebruikt, kun je met python een eind komen. Maar zodra er java-script op de pagina zit, dan moet je rare trucken uithalen, die mij nog nooit gelukt zijn. Je moet dan via de geinstalleerde browser (FireFox, Chrome, etc) de java-script om laten zetten naar de uiteindelijke html, zonder dat krijg je enkel een regeltje dat de javascript zou aanroepen. Edoderoo (overleg) 7 aug 2021 22:52 (CEST)[reageren]
Een eerste batch zou denk ik prima kunnen worden verbeterd middel een eenvoudig script: als de site waar naar gelinkt wordt zelf al en 30x doet naar dezelfde url op https, dan weet je dat je die link veilig van http naar https kunt zetten.
Een tweede batch zou je dezelfde pagina op zowel http als https kunnen ophalen en simpelweg een simpele compare kunnen doen (99% match is het dezelfde pagina vaak wel), mits het certificaat geldig is.
Alle uitzonderingen die je dan nog overhoud, die worden spannender en zal een geavanceerder botje nodig hebben ;).
Wellicht zijn er in andere wikipedia-landen al bots gemaakt waar een en ander afgekeken kan worden? I-am-will (overleg) 9 aug 2021 12:42 (CEST)[reageren]
Klinkt simpel, maar wat doen we dan met de vraag van bdijkstra? Is het genoeg als de lezer eindigt op een https-site? Met de tussenliggende http-redirects wisselt de lezer immers geen gegevens uit. Wikiwerner (overleg) 10 aug 2021 19:17 (CEST)[reageren]
Stap 1 is denk ik het vinden en omzetten van http-links die een werkende redirect zijn naar een https-link met hetzelfde pad. –bdijkstra (overleg) 10 aug 2021 20:23 (CEST)[reageren]
Daarmee ben ik dan maar eens begonnen. Ik heb alle naamruimtes buiten de artikelnaamruimte gedaan. De artikelnaamruimte kunnen we waarschijnlijk doen tegelijk met het verzoek over Internetarchive direct hierboven. Wikiwerner (overleg) 5 nov 2021 21:02 (CET)[reageren]

Bevolkingsaantallen botmatig aangemaakte gemeenten

Bij buitenlandse dorpen kan het zijn dat een bevolkingsaantal uit 2002 wordt vermeld, dat inmiddels xx% afwijkt van de werkelijkheid. Is dat erg? Zo ja, is het ook mogelijk dat dit botmatig wordt aangepast, gebruik makend van de betreffende taalversie die vrij actueel is? Ik heb geen zicht op de technische mogelijkheden.Koos van den beukel (overleg) 10 jan 2019 12:04 (CET)[reageren]

Weet ik ook niet; misschien dat je het in het Botcafé kunt vragen? Encycloon (overleg) 26 jan 2019 17:12 (CET)[reageren]
Ja, dat is in principe een vrij simpel script. Heb je een voorbeeldcategorie? Geef dan gerust een roep op mijn overlegpagina, of doe een verzoek op WP:VPB. Edoderoo (overleg) 26 jan 2019 18:43 (CET)[reageren]
Een voorbeeld is [1] waarbij onze cijfers uit 2002 dateren en die in de Sloveense versie uit 2018. Kleine verschillen maken me niet uit, maar ik denk dat het goed is op dit gebied 1x per 15-20 jaar onderhoud te plegen, zeker als dat niet moeilijk is. Dobrovo had in 2002 bijvoorbeeld 413 inwoners, nu 336, dat wijkt duidelijk af. Mogelijk zijn inmiddels gemeenten opgeheven of samengevoegd. Koos van den beukel (overleg) 27 jan 2019 14:46 (CET)[reageren]

PS De uitvoering doe ik liever niet zelf.

Dan zou je zo een wijziging krijgen, maar dan automagisch. Edoderoo (overleg) 27 jan 2019 17:01 (CET)[reageren]
Dat is inderdaad de bedoeling. Koos van den beukel (overleg) 29 jan 2019 10:59 (CET)[reageren]
Ik ben bezig iets te bakken dat WikiData bijwerkt, en dan ook nl-wiki kan bijwerken. Het zijn best veel Sloveense gehuchten, dus dat met de hand doen is niet zinvol. Edoderoo (overleg) 29 jan 2019 12:28 (CET)[reageren]
Hoe staat het er voor, Edo? --Frank Geerlings (overleg) 15 sep 2019 00:30 (CEST)[reageren]
Edo geeft aan dat als iemand anders hiermee aan de slag wil hij zich niet gepasseerd voelt. --Frank Geerlings (overleg) 16 sep 2019 16:28 (CEST)[reageren]
Kan het niet op een soortgelijke manier als bij Nederlandse gemeenten, met zoiets als het sjabloon:Statistiek gemeente Nederland inwoners? Wikiwerner (overleg) 4 jan 2020 22:42 (CET)[reageren]

Slovenië

Dit overleg werd geplaatst onder de kop "Plaatsen in Slovenië die deel uitmaken van een Sloveense gemeente", wat echter een geheel ander onderwerp is, daarom heb ik het verplaatst. Apdency (overleg) 23 okt 2020 21:18 (CEST)[reageren]

Zie overigens ook het verzoek Bevolkingsaantallen botmatig aangemaakte gemeenten. Misschien kunnen we deze twee verzoeken combineren? Edoderoo was bezig met een script voor dat verzoek; hoe staat het daarmee? Wikiwerner (overleg) 4 okt 2020 15:31 (CEST)[reageren]
Combineren is niet per se zinvol, want de sjablonen staan heel ergens anders dan de artikelen. Ik was destijds vastgelopen in een eigenaardige bug in PAWS, en had het de laatste tijd relatief druk met zaken buiten Wikipedia, dus dat moet ik binnenkort weer eens oppakken, om die sjablonen te kunnen vullen. Edoderoo (overleg) 4 okt 2020 17:07 (CEST)[reageren]
Maar de aantallen moeten dan toch weg uit de infoboxen in de artikelen, zodat de infobox ze uit Wikidata haalt? Wikiwerner (overleg) 10 okt 2020 13:30 (CEST)[reageren]
Dat zou eventueel ook kunnen, mijn script zou nu die sjablonen bijwerken, maar een alternatief is een Module in Lua schrijven die de aantallen van een gemeentecode ophaalt, samen met de peildatum. Ik zou dat zien als stap 2, maar als er iemand is die dat kan (of een TechStorm/Hackaton weet waar ze dit voor ons kunnen fabrieken), zou dat mooi meegenomen zijn. Edoderoo (overleg) 10 okt 2020 13:38 (CEST)[reageren]
Zo te zien hebben zelfs de Slovenen dat niet. Misschien kunnen we samenwerken, zodat zij ook makkelijker hun inwonertallen kunnen bijwerken? Wikiwerner (overleg) 17 okt 2020 21:52 (CEST)[reageren]
Ik zie nu dat de Slovenen hun data botmatig bijwerken. Zij zijn inmiddels bij 2020. Ook zag ik Havest Templates op de Wikidata-gebruikerspagina van Edoderoo. Kunnen we daarmee Wikidata bijwerken? En vervolgens onze handmatige inwonertallen weghalen, zodat deze geïmporteerd kunnen worden van Wikidata? Wikiwerner (overleg) 14 feb 2021 21:17 (CET)[reageren]
Voor de reizigersaantallen van de Belgische stations is dit inmiddels geregeld. De aantallen worden uit een CSV-bestand gelezen, en toegevoegd aan het betreffende Wikidata-item. Daarna roept het {{tl:Infobox spoorwegstation België}}-sjabloon een Lua-module aan die deze gegevens ophaalt (de meest recente gegevens) en zorgt dat deze getoond worden, compleet met de bijbehorende bron. Als er een bestand is met deze gegevens voor de Sloveense gemeenten, dan kan dat opgepakt worden. Wel moeten deze echt aan iets unieks herkenbaar zijn. Ik wil ook best het daarvoor geldende stappenplan beschrijven tijdens de uitvoering. Met vriendelijke groet, RonnieV (overleg) 1 mrt 2021 19:35 (CET)[reageren]
Misschien hebben de Slovenen wel zo'n csv-bestand. Of kunnen we anders Harvest Templates gebruiken? Wikiwerner (overleg) 1 mrt 2021 21:48 (CET)[reageren]
Het Sloveense statistiek-bureau heeft die gegevens vast wel, maar als je pech hebt moet je Sloveens spreken om dat terug te vinden. Edoderoo (overleg) 1 mrt 2021 21:59 (CET)[reageren]
Nee hoor: gewoon in het Engels. We kunnen zo'n beetje elk bestandstype kiezen dat we willen. RonnieV, kun je daarmee uit de voeten? Wikiwerner (overleg) 17 apr 2021 16:39 (CEST)[reageren]
Hoi Wikiwerner, ja dat kan ik. Ik was er eerder al eens naar aan het kijken, maar ben er gisteravond maar eens voor gaan zitten om de match te kunnen maken. De gemeentenaam is niet altijd onderscheidend genoeg. Vanmorgen heb ik de meest recente gegevens naar Wikidata gebracht, en voor een gemeente ook oudere. Ik ben nu in de Sloveense Kroeg aan het vragen of ik goed met de data om ga, daarna maak ik een LUA-scriptje (of kijk of er al eentje is) of de gegevens netjes beschikbaar te stellen voor de infobox en de tekst. Met vriendelijke groet, RonnieV (overleg) 19 apr 2021 12:51 (CEST)[reageren]
Goed bezig! Stapje voor stapje komen we er wel ... Wikiwerner (overleg) 19 apr 2021 21:10 (CEST)[reageren]
Het blijkt nog iets makkelijker te kunnen, namelijk met gebruik van Module:Wd. Zie Gebruiker:RonnieV/Slovenië voor enkele voorbeelden van gebruik van de gegevens. Zo kunnen we direct de data (aantal, peildatum en bron) naar een infobox brengen, en in een ander sjabloon een zin maken voor het inwonertal van een plaats, die altijd compleet met datum en bron komt. Met vriendelijke groet, RonnieV (overleg) 23 apr 2021 00:49 (CEST)[reageren]
Wederom mooi! Verder spelen met de moduleaanroep levert voor de infobox het volgende:
inwoners = {{#invoke:wd|property|qualifier|references|Q394087|P1082}}: 4.952[1]
census = {{#invoke:wd|property|qualifier|Q394087|P1082|P585|format=%q}}: 1 juli 2020.
Voor gebruik op andere artikelen moeten we "Q394087" nog vervangen door {{#invoke:wd|label|raw}}. Een alternatief is dat we een eigen {{Infobox plaats in Slovenië}} aanmaken; dit is nu een doorverwijzing naar {{Infobox plaats in land}}. De eerste kan dan de laatste aanroepen met de inwoners en de census ingevuld met de moduleaanroepen. Ook moeten de artikelen een {{Appendix}} of {{References}} krijgen, indien nog niet aanwezig. In de lopende tekst worden veel verschillende formuleringen gebruikt, dus daar is handwerk nodig naast het invoegen van een van de muduleaanroepen. Dan lijkt mij het logischer om de infoboxaanroep ook handmatig aan te passen. Bij de plaatsen is de formulering vaak wel identiek, maar dan hebben we andere gegevens nodig van het statistiekbureau. Wikiwerner (overleg) 27 apr 2021 19:05 (CEST)[reageren]
Gevonden. Wikiwerner (overleg) 2 mei 2021 19:34 (CEST)[reageren]
Dank je, die link had ik al gekregen van onze Sloveense collega's. De import naar Wikidata loopt nu, met bewerkingen als deze. Nog een 5500 plaatsen, dan zijn de aantallen voor de gemeenten (al gedaan) en voor de plaatsen bijgewerkt. Daarna kunnen we ze hier, en op alle andere Wikipedia's gebruiken. De infobox voor Sloveense plaatsen {{Infobox plaats in Slovenië}} zal ik daarna aanpassen, zodat al onze artikelen het meest recente aantal kunnen tonen. Het volstaat om het Q-nummer weg te laten, bijvoorbeeld in het sjabloon, omdat dan de informatie uit het gekoppelde Wikidata-item gebruikt wordt.
Ik zou zeggen: op naar het volgende land, met natuurlijk een oogje op SiStat en het vrijkomen van nieuwe informatie. Met vriendelijke groet, RonnieV (overleg) 3 mei 2021 17:51 (CEST)[reageren]
Wederom goed bezig! Geef maar een seintje als je zover bent. Dan kunnen we daarna zoiets doen voor de lopende tekst, en daarmee tevens de handmatige inwonertallen en jaartallen weghalen. Dat moet me wel lukken met AutoWikiBrowser. Wikiwerner (overleg) 6 mei 2021 20:52 (CEST)[reageren]
Hoi Wikiwerner, bedankt voor je enthousiasme. De infobox is aangemaakt, en ik ben zo vrij geweest om het sjabloon {{Inwonertal}} aan te maken. Dit biedt de mogelijkheid om verschillende waarden op te roepen, in verschillende verschijningsvormen. Voor gebruik op de meeste plaatspagina's werkt {{Inwonertal|soort=zin}}, voor gemeentepagina's {{Inwonertal|soort=zin|locatie=gemeente}}. Voor jouw voorgestelde bewerking kan het dus naar deze vorm, voor de totale wijziging is deze wijziging gewenst. Wil je echt een vrije formulering, dan zijn de verschillende onderdelen beschikbaar vanuit dit sjabloon. Als we er dan ook nog op letten dat er een Appendix/References-blok aanwezig is, dan wordt het wat mij betreft helemaal mooi! Als jij zin hebt om met AWB aan de slag te gaan, leef je uit! Daar ben ik dan weer wat minder ervaren in. Met vriendelijke groet, RonnieV (overleg) 7 mei 2021 01:48 (CEST)[reageren]
Tja, ieder zijn meug. Het leuke van Wikipedia is dan dat we er samen wel uit komen. Ik heb alvast het sjabloon gecategoriseerd in de categorie:Wikipedia:Sjablonen indeling land. In het weekend zal ik kijken hoever ik kom. Wikiwerner (overleg) 7 mei 2021 21:51 (CEST)[reageren]
Ik zie nu dat de oppervlakte niet meer wordt opgegeven als parameter, maar ook uit Wikidata komt. Zal ik daarom alles van de vorm "| oppervlakte =" ook weghalen? Wikiwerner (overleg) 14 mei 2021 21:16 (CEST)[reageren]
Hoi Wikiwerner, als je dat wil meenemen, graag! Wel zo mooi als dat ook uit Wikidata komt en de bevolkingsdichtheid (dus) ook ter plekke berekend wordt aan de hand van de nieuwste cijfers. Met vriendelijke groet, RonnieV (overleg) 18 mei 2021 00:20 (CEST)[reageren]
Mee bezig Mee bezig Bot loopt. Wikiwerner (overleg) 24 mei 2021 17:22 (CEST)[reageren]
Top, ik zag al wat resultaten! Ziet er goed uit! Betekent dat we dit verzoek kunnen afsluiten, nog mooi binnen de tweeënhalf jaar ;)
Zijn er nog meer landen waarvoor we op een vergelijkbare wijze informatie beschikbaar hebben en we het meest recente inwonertal willen laten zien? Ik zal Sijtze Reurich eens vragen of dit bijvoorbeeld iets is voor Letland of andere landen waar hij veel mee bezig is. Als er maar betrouwbare bronnen zijn, die we kunnen gebruiken. Voor (onder meer) Nederland, Frankrijk en Duitsland gebruiken we nu arrays, die kunnen op dezelfde wijze vervangen worden. Met vriendelijke groet, RonnieV (overleg) 25 mei 2021 13:37 (CEST)[reageren]

Estland

Van Letland weet ik het niet, maar bij Estland besteed ik nadat het Estische Bureau voor de Statistiek nieuwe cijfers heeft gepubliceerd altijd een paar dagen aan het invoeren van die cijfers op alle artikelen over Estische plaatsen. Wikidata houdt die cijfers ook bij en beschikt een paar dagen na de publicatie ook al over de meest actuele cijfers. Ik heb de gegevens van Wikidata meermalen gecontroleerd, maar het klopt altijd. Dan ligt het voor de hand om Wikidata ook de inwonertallen van Estische plaatsen en gemeenten te laten bijhouden. Het aanpassen van de sjablonen "Infobox plaats in Estland" en "Infobox gemeente Estland" gaat mijn technische vaardigheden helaas te boven, maar naar mijn idee is het wel te doen. Dan kan ik die paar dagen besteden aan andere dingen die ook nuttig zijn. Sijtze Reurich (overleg) 27 mei 2021 23:20 (CEST)[reageren]
Excuses voor de verschrijving in je naam, Sijtze Reurich. Bedankt voor je snelle en duidelijke, maar ook instemmende reactie. Voor de gemeenten kan het voor de infobox snel geregeld worden, met dien verstande dat we nog even terugvallen op de cijfers van 2019. Bij de laatste update is de voorkeurswaarde niet ingesteld op de nieuwste waarde, maar dat kan geregeld worden. Ik zie trouwens dat de cijfers van 2021 beschikbaar zijn, dus even kijken of we dit meteen mee kunnen nemen...
De plaatsen is iets lastiger, omdat deze gebruik maken van de standaard infobox voor plaatsen (zij het onder de naam '...in Estland'). Het is echter niet moeilijk om een kopietje te maken van het sjabloon en daarin deze zaken te regelen. Als Wikiwerner daarna nog eens zijn botje wil laten lopen over deze pagina's om daar de tekst aan te passen en de parameters uit de infoboxen te halen, zou dat helemaal top zijn. Met vriendelijke groet, RonnieV (overleg) 28 mei 2021 00:22 (CEST)[reageren]
Misschien is het toch verstandig om nog even wat opmerkingen te maken:
  1. De database van het Estische Bureau voor de Statistiek heeft misschien nog meer ingangen, maar ik gebruik de interactieve kaart op https://estat.stat.ee/StatistikaKaart/VKR. Als een plaatsje minder dan 4 inwoners heeft, geeft die database dat aan als --4. Daarmee wordt dus bedoeld: < 4. Dat mag wat mij betreft best als < 4 in de infobox.
  2. We hebben een paar artikelen over plaatsen in Estland die niet meer bestaan. Een voorbeeld is Pärsikivi. Die plaatsen kunnen beter niet meegenomen worden als Wikidata de inwonertallen gaat aanpassen. Anders krijg je misschien allerlei foutmeldingen. Doorgaans is bij die plaatsen het inwonertal op de datum van opheffing vermeld; dat kan gewoon zo blijven. Er is trouwens een speciale categorie voor: "Voormalige plaats in Estland".
  3. Het is misschien de moeite waard om eens te kijken hoe de Franstalige Wikipedia het doet. Die geeft in de infobox het inwonertal van 2019 en ik vermoed dat het wordt geleverd door Wikidata. Als je kijkt bij w:fr:Kadrina (Pala) zie je iets dat komisch aandoet: in de tekst wordt nog steeds uitgegaan van de situatie in 2011, toen Kadrina in de gemeente Pala lag en 52 inwoners had. Pala is in 2017 opgegaan in de gemeente Peipsiääre. Dat zie je in de infobox, die de situatie anno 2019 beschrijft: een dorpje in de gemeente Peipsiääre met 45 inwoners. Sijtze Reurich (overleg) 28 mei 2021 13:18 (CEST)[reageren]
Het klopt wat je zegt over de Franse wiki. Vergelijkbaar bij ons is de eigen {{Infobox plaats in Slovenië}}, die RonnieV gemaakt heeft (dit was een doorverwijzing naar de {{Infobox plaats in land}}). Voor de lopende tekst heeft RonnieV het sjabloon:Inwonertal gemaakt, zodat tekst en infobox gelijke cijfers geven. Kijk maar eens hoe het nu gaat bij de Sloveense plaatsen. Voor het invoegen was wel een botrun nodig mijnerzijds. Dit wil ik met liefde doen voor meer landen. Een knelpunt wordt dan nog wel de waarden "< 4": we zouden het sjabloon:Inwonertal kunnen aanpassen zodat er dan "minder dan 4 inwoners" in de lopende tekst komt te staan. Wikiwerner (overleg) 28 mei 2021 20:57 (CEST)[reageren]
Staat er bij dergelijke plaatsjes nu ook in. Zie bijvoorbeeld Väikeheinamaa. Sijtze Reurich (overleg) 28 mei 2021 23:51 (CEST)[reageren]
Natuurlijk is het prima om een aantal opmerkingen te maken, zeker als je -zoals jij- al uitgebreid inhoudelijk naar de materie gekeken hebt.
  1. Ik probeer altijd aan gegevens in een tabelvorm te komen, omdat ik die makkelijker (met een bot) kan verwerken. Zo kan ik vanaf [2] de inwonertallen van de settlements binnenhalen. Dat kan voor alle 246 onderscheiden eenheden in een keer binnengehaald worden, en betreft desgewenst de cijfers 2015 tot en met 2021 (per 1 januari). Maar ben ik er met ongeveer 180 'places of residence', of heb ik nu de verkeerde pagina te pakken? Ik kan 'Väikeheinamaa' hier in ieder geval niet vinden.
  2. Wikidata staat niet toe om iets anders in te voeren dan een heel getal voor Property:P1082. Met iets als dit kunnen we aangeven dat 4 het maximum is. Dat houdt de systematiek universeel, ook als het Estse statistiekbureau besluit dat ze aantallen onder de 10 niet langer precies doorgeven, of als de Zuid-Soedanese collega's het houden op '<20'. {{Inwonertal}} kan aangepast worden, zodat de kwalificatie 'maximum' wordt opgepikt en het inwonertal dan wordt aangegeven als '<..'. Moeten we er bij de verwerking wel aan denken dat '--4' omgezet moet worden in de waarde '3' met deze kwalificatie.
  3. De oplossing voor het probleem met leeggelopen plaatsen ligt een beetje aan wat wij willen en aan wat het landelijke statistiekbureau doet. Een gemeente die niet meer bestaat (herindeling) zal niet opeens een 0 als inwonertal krijgen, maar normaliter niet meer meegegeven worden in de cijfers. Dan is er niets aan de hand, wordt er geen nieuw aantal gevonden en toegevoegd en zal de markering van voorkeursrang ook bij de oudste wel bekende waarde moeten blijven staan. Deze waarde wordt dan gevonden en getoond, met de datum van toen. Een plaats die formeel nog wel bestaat, maar geen inwoners meer heeft, zal waarschijnlijk met een 0-waarde worden opgenomen. Dat is dan ook het correcte aantal inwoners voor de betreffende datum. Een plaats die niet meer onderscheiden wordt, zal gewoonlijk niet meer in de statistieken worden meegenomen. Is er geen inwonertal bekend voor (zeg) 1-1-2021, dan wordt er niets toegevoegd en zal het inwonertal van 1-1-2020 als meest recente getoond worden. Dat blijft ook zo als de aantallen van 2022-2030 niet worden toegevoegd. Komt er alsnog een inwonertal per 2031, dan wordt dat het meest recente.
  4. Ik ben al even aan het stoeien geweest met een automatisch gegenereerd grafiekje met het verloop van het inwonertal. Dat is in deze gevallen juist goed, want de 0-lijn wordt daadwerkelijk bereikt. Ik heb geprobeerd om de minimale waarde aan te passen, zodat er wel enige wijzigen zichtbaar is bij een plaats waar het inwonertal varieert tussen (zeg) 4500 en 4700. Dan wil je eigenlijk niet een grafiekje met een heel stuk lege ruimte (y-as van 0 tot 5000 of zo), maar liever een y-as tussen 4400 en 4800. Al kan het zijn dat een enkele snelle kijker dan weer denkt dat de verschillen gigantisch zijn... Vooralsnog bied ik deze niet aan om te gebruiken.
  5. Zoals Wikiwerner al schreef, ben ik aan de slag gegaan om het getoonde inwonertal in de tekst ook meteen aan te kunnen passen. Deze wijziging heeft dat voor Võru geregeld, waarbij ik de bestaande tekstconstructie heb gehandhaafd.
Als je nog meer opmerkingen, suggesties,... hebt, ik sta altijd open voor positieve input. Met vriendelijke groet, RonnieV (overleg) 29 mei 2021 01:48 (CEST)[reageren]
Ik heb een paar resultaten bekeken. Het ziet er doorgaans goed uit. Alleen bij Kohtla-Järve zag ik dat in de infobox nu wordt teruggegrepen op de cijfers van 2016. In Wikidata zitten in elk geval ook de cijfers van 2017 t/m 2020. Sijtze Reurich (overleg) 29 mei 2021 08:37 (CEST)[reageren]
Kohtla-Järve is aangepast en daarna bijgewerkt voor 2021 voor Wikidata. In het artikel heb ik het zo opgelost. Met vriendelijke groet, RonnieV (overleg) 29 mei 2021 11:46 (CEST)[reageren]
Dank je, zo is het goed. O ja, die database die jij noemt onder punt 1 ken ik ook en heb ik ook een paar keer gebruikt. Die gaat niet dieper dan het niveau van gemeente, en dan eventueel binnen de gemeente de aantallen inwoners van het stedelijk en het landelijk gebied. Dus spannende plaatsen als Väikeheinamaa, Kaukvere en Palli (Hiiumaa) zul je hier niet vinden. Dan weer wel de aantallen inwoners van de stadsdistricten van Tallinn en Kohtla-Järve. (Dat zijn er bij elkaar trouwens 13, dus lijkt het me niet echt nodig om bij het onderhoud een bot in te schakelen.) Sijtze Reurich (overleg) 29 mei 2021 12:42 (CEST)[reageren]

Frankrijk

Voor Frankrijk zijn er arrays, maar bij heel veel gemeenten komen er nog handmatige getallen voor. Zie ook Wikipedia:De Nulmeridiaan/Archief/2019-1#Inwonertallen in infobox bewerken. –bdijkstra (overleg) 25 mei 2021 13:58 (CEST)[reageren]

Ik zie dat Albertvillanovadelmoral met AVMBot de Franse bevolkingscijfers allemaal redelijk up to date heeft gebracht. Dat zou betekenen dat we dit eenvoudig ook kunnen overnemen. Met oppervlakte en berekende bevolkingsdichtheid. Even goed onderzoeken? Met vriendelijke groet, RonnieV (overleg) 25 mei 2021 19:57 (CEST)[reageren]
Hierover loopt sinds maart overleg op Overleg sjabloon:Grafiek inwonertal gemeente Frankrijk#Stappenplan. Als Wikidata aangevuld is, dan kunnen we ook Frankrijk botmatig langslopen. Wikiwerner (overleg) 19 jun 2021 22:22 (CEST)[reageren]

Italië

Naar aanleiding van deze vraag van VanBuren, zou bekeken kunnen worden of we ook Italiaanse plaatsen van een vergelijkbare oplossing kunnen voorzien. De cijfers per 1 januari 2021 zijn beschikbaar via iStat. Met vriendelijke groet, RonnieV (overleg) 23 feb 2022 18:19 (CET)[reageren]

Dan moeten toch eerst die getallen in Wikidata staan? Wikiwerner (overleg) 23 feb 2022 20:48 (CET)[reageren]

Niet-uitgevoerde verzoeken

1Veertje (KB)

Dit is mijn betaald-werk-account voor werkzaamheden namens de Koninklijke Bibliotheek. Zoals je in de recente edits kunt zien ben ik van plan verwijzingen naar http://kb.nl te vervangen voor https://kb.nl. Er gaan delen van kb.nl offline gehaald worden dus er zijn ook plannen Internet Archive links toe te voegen aan referenties naar die delen verwijzen.1Veertje (KB) (overleg) 17 dec 2021 15:51 (CET)[reageren]

Verzoek deze aanvraag te laten vervallen; het is nog onduidelijk met welk account de KB botbewerkingen wil gaan uitvoeren op wikimedia-projecten. @OlafJanssen:. Groet, DanielleJWiki (overleg) 17 dec 2021 17:02 (CET)[reageren]
Je bent toch hopelijk wel van plan om die vervangingen met een botbitje te doen? –bdijkstra (overleg) 17 dec 2021 16:14 (CET)[reageren]
@Wikiwerner is trouwens bezig met beide componenten, het toevoegen van archieflinks en het vervangen van http door https. Misschien is het simpeler om beide taken te laten doen door Wikiwerner, misschien met voorrang? Dajasj (overleg) 17 dec 2021 17:33 (CET)[reageren]
Inderdaad ben ik bezig met beide tegelijk: zie de betreffende verzoeken op deze pagina. Als er nog geen archieflink bij staat én er nog geen archief aanwezig is in Archive.org, dan laat mijn bot de pagina opslaan in Archive.org. Als er haast bij is, dan kan ik wel voorrang geven aan artikelen die linken naar kb.nl. Wikiwerner (overleg) 17 dec 2021 19:41 (CET)[reageren]
Dit project ligt (intern) bij @OlafJanssen:: ik denk dat hij heel blij is met het werk dat jij al uitvoert mbt het webarchiveren van pagina's. Ik zal hem op de hoogte brengen van dit overleg. Het verzoek van 1Veertje (KB) kan bij deze (onuitgevoerd) naar afgehandeld verplaatst worden. Groet, DanielleJWiki (overleg) 17 dec 2021 20:18 (CET)[reageren]
Ik zie nu dat de URL's naar de KB-site die beginnen met http//: (dus niet https://), doorverwijzen naar de variant met https:// met HTML-statuscode 302: tijdelijke doorverwijzing. Mijn huidige script zet dit alleen om als de statuscode 301 ("Definitief verplaatst") is en het gedeelte na de dubbele slash gelijk is. Misschien is het ook voor andere bezoekers van de KB-site duidelijker als dit 301 wordt. Wikiwerner (overleg) 18 dec 2021 12:31 (CET)[reageren]

ik zie dat ik mijn verzoek op de verkeerde plek had gezet, had Wikipedia:Aanmelding botgebruikers moeten zijn. Maar er is nog intern overleg over welk account dat botbitje moet gaan krijgen. Vera (talk) 18 dec 2021 08:40 (CET)[reageren]

Ongearchiveerd oud overleg op Wikipedia:Taalcafé

Op Wikipedia:Taalcafé staat nog steeds overleg van inmiddels bijna twee jaar oud, boven het recente overleg. Is er hier iets mis met de archiveerbot? De Wikischim (overleg) 12 dec 2021 19:14 (CET)[reageren]

Er is niets mis met de archiveerbot. Een aantal kopjes hebben de instructie <!-- noarchive --> die niet gearchiveerd worden. –bdijkstra (overleg) 12 dec 2021 19:26 (CET)[reageren]
Hmm, wel vreemd. Is er een speciale reden dat dit overleg blijkbaar voor eeuwig ongearchiveerd moet blijven? De Wikischim (overleg) 12 dec 2021 19:39 (CET)[reageren]
Waarschijnlijk niet. Ik denk dat je de eerste bent die het opvalt, aangezien collega Martix, die de instructies geplaatst heeft, niet meer actief is. –bdijkstra (overleg) 12 dec 2021 20:02 (CET)[reageren]
Maar dan begrijp ik nog steeds niet waarom specifiek dit overleg blijft staan. De nominale archiveertermijn voor het Taalcafé is twee weken. Kan het niet gewoon destijds per vergissing onder <!-- noarchive --> zijn beland? De Wikischim (overleg) 12 dec 2021 21:02 (CET)[reageren]
Specifiek dat overleg blijft staan omdat er onder specifiek die kopjes een noarchive-instructie staat. Martix heeft overigens niet beide instructies geplaatst, zie hier en hier. –bdijkstra (overleg) 12 dec 2021 21:18 (CET)[reageren]

Uitgevoerde verzoeken

Referrer Google

Misschien kan er eens een bot lopen om overal het URL-aanhangsel ?referrer=https%3A%2F%2Fwww.google.com%2F te verwijderen.
Idem voor google.nl en google.be (maar dat zijn er niet veel). ErikvanB (overleg) 1 okt 2021 15:10 (CEST)[reageren]

Goede, ik loop dit wel eens handmatig langs. Ik wil er wel voor botje maken! :) Dajasj (overleg) 1 okt 2021 15:36 (CEST)[reageren]
Ik heb eerder weleens honderden van dergelijke tags weggehaald met AutoWikiBrowser. Ik heb de betreffende reguliere expressie nog wel staan in een bestand met opgeslagen instellingen. Of bedoel je een bot die dit automatisch een keer in de zoveel dagen doet? Wikiwerner (overleg) 1 okt 2021 19:39 (CEST)[reageren]
Ik heb hem gevonden. Wel bekeek en bekijk ik elke edit voor het opslaan, want een reguliere expressie is altijd tricky. Of ik dat zou durven met Pywikibot... Wikiwerner (overleg) 2 okt 2021 14:56 (CEST)[reageren]
Hier is alvast een Quarry-query. –bdijkstra (overleg) 1 okt 2021 19:49 (CEST)[reageren]
Uitgevoerd Uitgevoerd Opgeruimd wederom, voor nu dan. Wikiwerner (overleg) 2 okt 2021 17:41 (CEST)[reageren]
Dit verzoek viel mij toevallig weer op, is dit er niet iets voor een misbruikfilteren? Desnoods alleen labelen, maar dat je dan bijv eens per maand die labels kan langslopen (kan autowikibrowser op label filteren?), dan is het mogelijk redelijk bij te houden. Dan wel even kijken naar ook anderen, zoals utm_source. Akoopal overleg. 31 okt 2021 11:10 (CET)[reageren]
AutoWikiBrowser kan niet filteren op label. Gewoon af en toe zoeken met insource doet echter wonderen. Wikiwerner (overleg) 31 okt 2021 12:51 (CET)[reageren]

Handtekeningen

Ik keek door de 'hoge prioriteit' lintfouten heen, en zag dat nogal wat font-fouten met de handtekening van bijvoorbeeld OSeveno, Bemoeial en Gidonb te maken hebben. Zou deze kunnen worden vervangen? Het gaat om:

  • Alleen overleg-naamruimtes en Wikipedia-naamruimte
  • Voorbeelden:
    • Vervang
      <font color="darkgreen">[https://nl.wikipedia.org/wiki/Gebruiker:OSeveno '''oSeveno''']</font>
      door
      [https://nl.wikipedia.org/wiki/Gebruiker:OSeveno <font color="darkgreen">'''oSeveno'''</font>]
    • Vervang
      <font color="darkcyan">[[Overleg gebruiker:Bemoeial| ''B.E. Moeial'']]</font>
      door
      [[Overleg gebruiker:Bemoeial|<font color="darkcyan"> ''B.E. Moeial''</font>]]
    • Vervang
      <font color="green">[[gebruiker:gidonb|gidon]]</font><font color="red">[[Overleg gebruiker:gidonb|<sup>b</sup>]]</font>
      door
      [[gebruiker:gidonb|<font color="green">gidon</font>]][[Overleg gebruiker:gidonb|<font color="red"><sup>b</sup></font>]]
  • Markeer als kleine wijziging en botwijziging

Dit heeft volgens mij ermee te maken dat de parser is veranderd, dus de nieuwe vormgeving lijkt meer in lijn met hoe de handtekening bedoeld was. Daarnaast is er sprake van een aanzienlijke daling van lintfouten (ik heb niet geteld). @OSeveno: courtesy ping, ik ga er gemakshalve vanuit dat jij hier geen bezwaar tegen zult hebben. -- Effeietsanders (overleg) 9 sep 2021 22:18 (CEST)[reageren]

  • @Effeietsanders: Geen probleem, ik ben er niet om problemen te veroorzaken. Wel heb ik e.e.a. iets aangepast naar mijn huidige smaak. Is het zo conform hedendaagse standaard?
[[gebruiker:OSeveno|<font color="green">oSeveno</font>]][[Overleg gebruiker:OSeveno| <font color="darkgreen"><small><i>(overleg)</i></small></font>]]
Groeten, oSeveno (overleg) 10 sep 2021 12:53 (CEST)[reageren]
@OSeveno: Dit was niet bedoeld om jou op de vingers te tikken, maar vooral om een oude set handtekeningen te fiksen. De externe link die je had was niet mijn persoonlijke voorkeur, maar op zich prima. Het ging me er vooral om dat de nesting juist moet zijn (font binnen de link, niet eromheen) omdat je oude handtekeningen nu allemaal blauw zijn :) -- Effeietsanders (overleg) 10 sep 2021 17:15 (CEST)[reageren]
Verzoek licht uitgebreid om de algemene fout op te pakken. Het patroon is dus dat de font tags rondom de links zijn geplaatst, en dit moet binnen de link, rondom de weergavetekst zijn. Het lijkt vooral om oudere handtekeningen te gaan. @Gidonb, Bemoeial: ook een courtesy ping. -- Effeietsanders (overleg) 9 sep 2021 22:30 (CEST)[reageren]
Ik was ook al eens terechtgekomen op die lintfouten, dus ik had nog een setje instellingen klaaarstaan. Zojuist heb ik het weer opgepakt. Ik vervang tegelijk de font-tags door span-tags, want font wordt beschouwd als verouderd, hoewel browsers het nog wel ondersteunen. Wikiwerner (overleg) 2 okt 2021 21:13 (CEST)[reageren]
Fijn, dank je wel! -- Effeietsanders (overleg) 2 okt 2021 21:18 (CEST)[reageren]
Uitgevoerd Uitgevoerd behalve enkele beveiligde pagina's. Wikiwerner (overleg) 9 okt 2021 20:39 (CEST)[reageren]

73 linken

Een link naar de Surinaamse sportencyclopedie werkt niet meer en is 73 keer gebruikt. DBNL heeft hem wel online. Kan iemand met een bot deze linken 73x omzetten naar deze link? Deze link werkt vele malen sneller dan wanneer hij uit Archive.org (ArchiverBot) komt. Alvast bedankt! Ymnes (overleg) 31 okt 2021 08:29 (CET)[reageren]

Uitgevoerd Uitgevoerd. Graag gedaan Japiot (overleg) 31 okt 2021 10:17 (CET)[reageren]
Great, dank je! Ymnes (overleg) 31 okt 2021 10:26 (CET)[reageren]

Lijst van spelers van Fortuna Sittard naar Lijst van spelers van Fortuna Sittard (mannen)

Uitgevoerd Uitgevoerd Japiot (overleg) 8 feb 2022 13:07 (CET)[reageren]

Categorie:Wikipedia:Sjablonen selectie wielerploeg

Ik wilde bovenstaande categorie opdelen naar jaar want ik kon niets meer terugvinden. Ik heb handmatig al een deel gedaan. De reden dat ik er voor koos om per jaar te ordenen en niet per ploeg is omdat dit voor veel meer ondercategoriën zou zorgen die soms maar 1-5 artikels zouden bevatten en ik heb begrepen van andere gebruikers dat dat niet aangewezen is. Themanwithnowifi (overleg) 3 mrt 2022 22:00 (CET)[reageren]

Ter verduidelijking, aan alle sjablonen hierin moeten een extra /jaartal in hun categorie krijgen. Themanwithnowifi (overleg) 3 mrt 2022 22:11 (CET)[reageren]
ik wilde voor bv enkele ploegen hun sjabloon opzoeken van 2020 om te kijken of de stagairs al waren toegevoegd. Maar dat is onbegonnen werk om die artikelen te zoeken in 1800 sjablonen. Ik ken bv niet alle ploegen die actief waren in een bepaald seizoen en zeker de oudere seizoenen niet om dan de selecties van deze ploegen op te zoeken die ik niet ken maar wel wil controleren of aanpassen. Themanwithnowifi (overleg) 3 mrt 2022 22:23 (CET)[reageren]
Ik zie dat de jaren 70 en 80 ook sjablonen hebben, maar niet veel. Als ik 10 sjablonen als minimum neem, blijven er 30 over zonder jaarcategorie. Is dat acceptabel? –bdijkstra (overleg) 3 mrt 2022 22:46 (CET)[reageren]
Mee bezig Mee bezig met 2010-2021, omdat die categorieën al bestaan. –bdijkstra (overleg) 3 mrt 2022 22:48 (CET)[reageren]
@bdijkstra moet ik de andere categorieën zelf nog aanmaken of doe jij dat? Dat er 30 nog niet ingedeeld zijn is geen probleem. Dat kan later handmatig als er meer dan 10 zijn om in zo'n categorie te plaatsen. Themanwithnowifi (overleg) 4 mrt 2022 08:45 (CET)[reageren]
Doe ik wel. Inmiddels bezig met 2000-2009. –bdijkstra (overleg) 4 mrt 2022 10:59 (CET)[reageren]
Bedankt voor je tijd en moeite! Themanwithnowifi (overleg) 4 mrt 2022 12:36 (CET)[reageren]
Uitgevoerd Uitgevoerd Een kleine moeite dankzij automatisering. –bdijkstra (overleg) 7 mrt 2022 09:54 (CET)[reageren]

Defaultsort Franse stations

Hai, ik heb geen eenvoudige manier gevonden om dit in AWB te doen, maar er zijn vast meerdere manieren om dit aan te pakken: Ik zou graag willen dat alle honderden stations in de subcategorien van Categorie:Spoorwegstation in Frankrijk een defaultsort krijgen, en wel de naam van het artikel minus de prefix "station " (in de prefix zit ook een spatie ná het woord station). Ook wel benieuwd naar methodologie. Milliped (overleg) 15 mrt 2022 18:20 (CET)[reageren]

Áls je zoiets doet moet je ook nog de lidwoorden eraf halen. Bovendien lijkt het me niet gewenst dat stations een defaultsort krijgen. Het is gebruikelijk dat die bij de S staan in niet-station-categorieën. –bdijkstra (overleg) 15 mrt 2022 19:47 (CET)[reageren]
Lidwoorden zijn om vigerende redenen wat minder een probleem, maar ik snap je punt waarom een defaultsort ongewenst is. In dat geval, is er een methode in AWB om een sorting key mee te geven bij het toevoegen van categorieën? Milliped (overleg) 15 mrt 2022 20:20 (CET)[reageren]
De tekst na "Station " krijg je met {{subst:#invoke:String|replace|source={{subst:PAGENAME}}|pattern=Station (.)|replace=%1|count=1|plain=false}}. Hetzelfde zonder Frans lidwoord krijg je met {{subst:#invoke:String|replace|source={{subst:PAGENAME}}|pattern=Station (L?['ae]?s? ?)(.)|replace=%2|count=1|plain=false}}. –bdijkstra (overleg) 15 mrt 2022 20:59 (CET)[reageren]
(bwc) Niet op een manier die vergelijkbaar is met het tabblad More, bij Categories. Je kunt wel de bovenste categorie vervangen door een defaultsort gevolgd door de zoektekst. In de defaultsort kun je dan bijv. {{Subst:Str right|{{PAGENAME}}|8}} plaatsen. Wikiwerner (overleg) 15 mrt 2022 21:04 (CET)[reageren]
Na wat inlezen blijkt dat AWB de bijzonder nuttige mogelijkheid biedt om categorieën als "categorienaam|%%key%%" in te geven. Dat keyword is eigenlijk bedoeld om persoonsnamen om te draaien (Rutte, Mark), maar Douai, Station werkt ook prima, en ik zag dat zelfs de lidwoorden keurig meegenomen worden. Ik zou nog een tweede run kunnen doen om , Station]] te vervangen door ]] om het echt keurig te krijgen, maar nu werkt het feitelijk ook al. Milliped (overleg) 15 mrt 2022 23:41 (CET)[reageren]

Parameter "bevolkingspiramide" weghalen

Wil iemand op gemeentepagina's de bovenstaande parameter weghalen? De bevolkingspiramide gebeurt allemaal via het sjabloon en het opgeven van een parameter zorgt ervoor dat het niet correct werkt. Natuurlijk kan de code met die parameter dan weggehaald worden, maar het is wel zo gebruiksvriendelijk voor toekomstige gebruikers dat er geen dode parameters in de artikeltekst staan. Mvg, Ennomien (overleg) 3 apr 2022 15:59 (CEST)[reageren]

Gisteren zelf opgelost. Ennomien (overleg) 9 apr 2022 10:42 (CEST)[reageren]

was/is een [[Nederlands]]+spatie > was/is een [[Nederland]]s+spatie

Op veel pagina's wordt naar de Nederlandse taal verwezen in plaats van het land. Zie hier en hier. De spatie aan het eind heb ik toegevoegd om is een [[Nederlands]]talig in de zoekresultaten uit te sluiten. Er kunnen gevallen zijn waar verwijzing naar de taal wél goed is, bijvoorbeeld: is een [[Nederlands]] werkwoord.
Overigens kwam is een voormalig [[Nederlands]] ook voor, maar die gevallen heb ik al verbeterd. ErikvanB (overleg) 3 nov 2021 12:54 (CET)[reageren]

Mee bezig Mee bezig, met meer correcte link naar Nederland (hoofdbetekenis). –bdijkstra (overleg) 3 nov 2021 13:59 (CET)[reageren]

Het komt trouwens ook voor bij andere verkeerd gelinkte homoniemen, zoals Spaans, Frans en Duits. Afzonderlijk zijn het veel kleinere aantallen dan bij Nederlands, maar alles bij elkaar wel significant. Apdency (overleg) 3 nov 2021 14:15 (CET)[reageren]

En er schiet me nog te binnen dat bij "Vlaams" hetzelfde probleem kan optreden:
een [[Vlaams]] (de taal) in plaats van een [[Vlaanderen|Vlaams]]. ErikvanB (overleg) 3 nov 2021 14:24 (CET)[reageren]
Nederlands, Spaans, Frans, Duits en Vlaams gedaan, uitgezonderd talige zaken (liedjes, leenwoorden) en twijfelgevallen. Nog meer gevallen met meer dan een handvol hits? –bdijkstra (overleg) 12 nov 2021 11:54 (CET)[reageren]
@Bdijkstra:: Niet vergeten (maar neem de tijd). ErikvanB (overleg) 16 nov 2021 06:14 (CET)[reageren]
Ehm, wat moet ik niet vergeten, en waarvoor moet ik de tijd nemen? –bdijkstra (overleg) 16 nov 2021 08:34 (CET)[reageren]
Uitgevoerd Uitgevoerd Ik heb zojuist ook "Russisch" nagelopen. Wikiwerner (overleg) 30 apr 2022 21:17 (CEST)[reageren]

sjabloon Link FISA-profiel

In het verleden heb ik veel roeiers aangemaakt. In deze artikelen gebruike ik dan dit sjabloon, ondertussen heeft de mondiale roeibond de website weer verbouwd. Veel links werken niet meer. Het sjabloon is zo aangepast dat de link gebaseerd wordt op het ID op wikidata. Is het mogelijk dat het ID uit het sjabloon op de pagina’s wordt gehaald? Dus Link FISA-profiel|id=833ce69e-6eb4-453d-b46d-2ca437d0c69a|label=Robert Morey vervangen door Link FISA-profiel|label=Robert Morey? Label wordt gebruikt bij artikelen met een naam … (roeier). Alvast bedankt Micnl (overleg) 15 jan 2022 08:07 (CET)[reageren]

Dus het label kan ook weggehaald en in het sjabloon vervangen door {{PAGENAMEBASE}}. –bdijkstra (overleg) 15 jan 2022 11:14 (CET)[reageren]
Het sjabloon roept nu het wikidata item met het ID op en gebruikt PAGENAMEBASE voor weergave op de pagina. Beiden zaken zijn nu nutteloos. Dus het verzoek om deze op te schonen. Micnl (overleg) 15 jan 2022 17:35 (CET)[reageren]
Links naar FISA-profielen met alleen een id (dat was de meerderheid, denk ik) heb ik een tijdje terug al ogperuimd met AWB. Wat resteert zijn degene met zowel een label als een id, en degene met alleen een label. –Frank Geerlings (overleg) 13 feb 2022 16:30 (CET)[reageren]
@Micnl is het nu voldoende opgeruimd? –bdijkstra (overleg) 15 mrt 2022 16:28 (CET)[reageren]
Moeten ze überhaupt per se weg? Sjabloon:IMDb haalt immers ook zijn gegevens op uit Wikidata, waardoor je geen parameters meer hoeft op te geven, en toch staan deze nog vaak wel opgegeven in artikelen. Wikiwerner (overleg) 30 apr 2022 21:17 (CEST)[reageren]
Hier ging het erom dat de id's die in de wikitekst stonden, verouderd en onbruikbaar waren, en dat de nieuwe id's inmiddels op Wikidata stonden. Althans, voor de meeste personen; voor sommige heb ik het ontbrekende id toegevoegd. Het opruimen van de oude id's leverde weliswaar niets zichtbaars op, maar het laten staan van oude id's kan verwarrend zijn en het maakte ruimte voor het handmatig invullen van een id in complexe gevallen (wat bv. bij IMDb wel degelijk gebruikt wordt). –bdijkstra (overleg) 1 mei 2022 00:11 (CEST)[reageren]
Nu staan alleen de 'label'-parameters er nog in. Ook die doen niks meer, maar geven ook geen verwarring. Als die kunnen blijven staan, dan is dit verzoek afgehandeld. Wikiwerner (overleg) 3 mei 2022 16:16 (CEST)[reageren]
Dat was eigenlijk mijn vraag aan Micnl. –bdijkstra (overleg) 3 mei 2022 17:41 (CEST)[reageren]
Het verzoek heb ik gedaan omdat er nog oude ID’s instonden. Volgens mij heeft de mondiale roeibond al drie verschillende ID’s gebruikt in zes jaar tijd. Een koppeling met wikidata lijkt mij het beste. Een vermeld ID kan zo weer onbruikbaar zijn. Als het label niks toevoegt mag die wat mij betreft ook weg. Bedankt voor de moeite. Micnl (overleg) 3 mei 2022 17:52 (CEST)[reageren]

Bronvermeldingen uit artikelgeschiedenis halen

Hallo allemaal,

Nav de huidige bronnendiscussie in de Kroeg: zou het mogelijk zijn om bronvermeldingen die de afgelopen 20 jaar middels bewerkingssamenvatting bij artikelen zijn gedaan (vrij standaard gebruik tot een jaar of 6 geleden: "vertaald van", "bron:..") op te lepelen en op de overlegpagina's van de artikelen te zetten, zodat we ze na kunnen kijken en kunnen zien of we ze in een {{references}} onderaan het artikel kunnen verwerken?

Vanuit de samenwerking voor de kwaliteitsschaal voor artikelen weet ik dat je geautomatiseerd een databasedump kunt doorzoeken (eventueel kan ik die verstrekken denk ik) op de bewerkingssamenvatting die bij een bewerking is gedaan. Vinden we dat interessant, en zou iemand het leuk vinden om hier eens in te duiken? Of misschien kunnen we het meenemen als taak die wij als gemeenschap zouden waarderen naar de aankomende hackathon tijdens Wikimania in augustus? Dit soort taken zijn volgens mij wel interessant voor mensen die hun bot-beheersing willen oefenen? Ciell need me? ping me! 17 jun 2021 19:48 (CEST)[reageren]

Is dat dan een andere dump dan die genoemd staan op Wikipedia:AutoWikiBrowser#Wiki Data Dump Searcher? Die dumps bevatten namelijk alleen de laatste versies van de artikelen, zonder de geschiedenis. Of ik moet iets missen ... Wikiwerner (overleg) 19 jun 2021 16:27 (CEST)[reageren]
Op deze pagina vind je niet alleen bestanden met de (toen) actuele versie van het artikel, maar ook bestanden waarin 'All pages with complete page edit history' beschikbaar zijn, in .7z- en in .bz2-formaat. Er zijn (voorbeelden van) scripts om deze bestanden te doorlopen. Met wat aanpassingen zijn hierin ongetwijfeld ook de bewerkingssamenvattingen te lezen, zijn hieruit de regels te halen waarin iets als 'http://' of 'https://' staat en zijn die gegevens ook bijeen te brengen. Het is een kleine moeite om daarbij ook een verwijzing op te nemen naar de specifieke bewerking, zodat makkelijk te zien is wat er met die bws ondersteund is. Eventueel kan nog in beeld gebracht worden wie de bewerking deed en of deze met de eerstvolgende bewerking ongedaan is gemaakt.
Dat zal dan resulteren in iets als (op de overlegpagina van Kabinetsformatie Nederland 2021):
In de bewerkingssamenvattingen aangetroffen bronnen:
Bedenk wel dat het over 2 miljoen artikelen gaat. Stel dat bij 1% een of meer bronnen worden aangetroffen in de bewerkingssamenvattingen, dan zijn dat 20.000 bewerkingen op overlegpagina's. Met 10 bewerkingen per minuut is dat anderhalve dag aan bewerkingen, met wellicht nog wat meer tijd omdat het lezen van de paginageschiedenis wat tijd kan kosten. Maar ik schat in dat de tijd meer opgaat aan het wachten tussen opeenvolgende bewerkingen dan aan het daadwerkelijke zoekwerk.
Met vriendelijke groet, RonnieV (overleg) 19 jun 2021 17:38 (CEST)[reageren]
Dank voor de toelichting Ronnie. Ik snap dat het veel werk zou gaan zijn: ik zou ook nog eens voor willen stellen om als die overlegpagina's in een onderhoudscategorie te plaatsen zodat we ze na kunnen lopen. Ik denk wel dat we hiermee misschien toch een flink aantal artikelen ineens van een bron kunnen gaan voorzien, iets waar we nu in dit soort discussies als die in de Kroeg wel vaak tegenaan lopen. Want dat zou betekenen dat duizenden artikelen ineens hun (misschien wel eerste!) bron krijgt. Dat is toch super in anderhalve dag? Oke, misschien willen we de bot alleen 's nachts laten lopen, maar dan nog, in een week...! Ciell need me? ping me! 19 jun 2021 22:58 (CEST)[reageren]
Even los van het botgebeuren: qua dumps zou de "stub-meta-history" (ca. 4GB) de relevante informatie moeten bezitten (zie https://dumps.wikimedia.org/nlwiki/20210620/). Ik zal vanavond even kijken of ik op tool labs een ruwe schatting kan maken van hoeveel revisies er met commentaar 'bron' + een url zijn. Een snelle database-check (https://quarry.wmflabs.org/query/56133) suggereert dat er ongeveer 13000 revisies met het woord 'bron' zijn. Dat is inclusief revisies met commentaar als 'bron ontbreekt', dus dat valt alleszins mee (of tegen, als het doel is om snel veel bronvermeldingen toe te voegen ;-)) valhallasw (overleg) 20 jun 2021 19:04 (CEST)[reageren]
Mooi begin denk ik! Ik weet dat ik niet altijd een link plaatste, maar bijvoorbeeld ook een artikel startte met bv "vertaald van en", en volgens mij was ik daar niet de enige in. Dan zou in theorie nagenoeg altijd de revision-id die op dat moment het meest recent was op de Engelstalige Wikipedia de bron zijn geweest, een enkele keer misschien een versie ervoor. Oa Clara (neushoorn) (start vertaling van de:) en Douwe Mout van der Meer (Start vertaling duits artikel) heb ik destijds zo "bebrond", ik vermoed nadat ik dit door anderen zo had zien doen. Ciell need me? ping me! 20 jun 2021 19:44 (CEST)[reageren]
Een eerste voorzetje om mee te spelen: https://valhallasw-testing-tool.toolforge.org/nlwiki_broncomment/
Dit zijn bewerkingscommentaren met 'bron' (bron.out), 'vertaald' of 'vertaling' (vertaald.out) en vervolgens gefilterd op 'http' of 'www' (de _met_url varianten) danwel op '[[XX:' (de _wikilink varianten). Het gaat ca. 15000 entries met 'bron' (12000 met url, 2500 met wikilink), ca. 1750 met 'vertaald' of 'vertaling' (1250 met url en 450 met wikilink). De link met de daadwerkelijke revisie is hier kwijt (het was een snelle test ;-)) maar het lijkt kwalitatief redelijk bruikbaar. Ik denk dat er wel een menselijke check overheen moet aangezien het geregeld ook links zijn die er juist niet inmoeten (bv: "revert: letterlijke vertaling https://www.dominican.edu/athletics/recsports/activities/leisure/croquet.html").
Merk op dat er in de grote 'vertaald.out' dataset ook een groot aantal beschrijvingen als 'vertaald uit engelse wp' zijn. Maargoed, ook als die niet worden meegenomen zijn de extra wél gevonden links nuttig. valhallasw (overleg) 20 jun 2021 20:48 (CEST)[reageren]
Volgende stapje: Gebruiker:Valhallasw/bronlinks. valhallasw (overleg) 22 jun 2021 22:14 (CEST)[reageren]

Inmiddels ben ik hier weer wat verder mee gekomen: wat extra filters om botbewerkingen uit te filteren helpt een hoop voor de signaal-ruisverhouding. @Ciell:, zou je een kijkje kunnen nemen op Gebruiker:Valhallasw/bronlinks om te kijken of dit inderdaad is wat je zoekt? (ik snap dat je het later nog graag op de overlegpagina's uitgesplitst ziet ;-)). valhallasw (overleg) 24 jul 2021 22:17 (CEST)[reageren]

@Valhallasw Dit is inderdaad precies wat ik bedoel! Die melding kan dan op de overlegpagina geplaatst worden, met als verzoek om te controleren of de informatie nog in het artikel aanwezig is en zoja, de referentie op de correcte manier in te voegen, plus eventueel een {{appendix}}. Na controle en verwerking kan de pagina voorgedragen worden voor nuweg, of de opmerking weer van de pagina verwijderd. Alle overlegpagina's samen in een onderhoudscategorie lijkt me behulpzaam om zicht te houden op wat er nog ligt. Eigenlijk volgens mij dus een procedure gelijk aan 'onbereikbare bron' en in het verleden de 'afbeeldingssuggestie'.
Dank Valhallasw, voor het uitwerken van dit idee! Ciell need me? ping me! 30 jul 2021 16:49 (CEST)[reageren]
Top! Zou jij na kunnen denken over een sjabloon wat ik daar voor kan gebruiken (met wat uitleg, de onderhoudscat, etc... kan als echt sjabloon of gewoon als stukje wikitext dat ik aan elkaar kan plakken)? Dan kan ik vervolgens zorgen dat het op de diverse pagina's terecht komt. valhallasw (overleg) 3 aug 2021 18:54 (CEST)[reageren]
Hi @Valhallasw, is dit een goed voorstel? Laat maar weten als ik ergens nog niet aan dacht, en ik help je uiteraard graag met het schrijven van een FAQ. Ciell need me? ping me! 5 aug 2021 15:32 (CEST)[reageren]
Even geprobeerd, dat ziet er volgens mij prima uit:Gebruiker:Valhallasw/bronlinks/Sjabloon#Voorbeeldtekst voor op overleg 2. Ik ga even puzzelen wat ookalweer de handigste manier is om een paar duizend pagina's een sectie toe te voegen!
Pagina's negeren: Pywikibot zal {{nobots}} netjes volgen, maar verder dan dat is het denk ik niet de moeite; het is immers een eenmalige botrun. Als het gaat om herhaalde checks dan moeten we denk ik meer richting een web-systeem kijken waar edits echt 'afgevinkt' kunnen worden (anders is het onderscheid tussen 'nieuw' en 'al gecheckt maar niet relevant' lastig te maken). Maar dan wordt het wel meteen een stuk complexer... valhallasw (overleg) 11 aug 2021 20:09 (CEST)[reageren]
Aantal testbewerkingen: Speciaal:Bijdragen/Valhallasw-toolserver-botje valhallasw (overleg) 11 aug 2021 21:00 (CEST)[reageren]
Lijkt me goed @Valhallasw:! Ik heb een start gemaakt met een kleine FAQ: Gebruiker:Valhallasw/bronlinks/faq. Ciell need me? ping me! 27 aug 2021 09:35 (CEST)[reageren]
Hoi @Ciell, ik denk dat we nog iets aan de uitleg moeten schaven; het was in ieder geval @Saschaporsche niet duidelijk wat we proberen te bereiken (zie Overleg:Toepolev_Tu-95). valhallasw (overleg) 3 okt 2021 12:40 (CEST)[reageren]
Lijkt me een goede verbetering @Valhallasw! Ciell need me? ping me! 10 okt 2021 16:08 (CEST)[reageren]
Het heeft weer even geduurd voordat ik weer tijd had. Ik heb de faq iets uitgebreid, een verse export gepakt, en doe nu een eerste run van 100 pagina's. Als er morgenmiddag dan nog geen boze emails in mijn inbox liggen dan start ik de rest van de batch gaat de rest (8592 pagina's) er in de loop van ca. 24 uur uit. Dan staat alles er dinsdag op. valhallasw (overleg) 2 okt 2021 20:03 (CEST)[reageren]
Voor de volgers van die 8592 pagina's zou het wel prettig zijn als je een bot met botbit zou gebruiken. –bdijkstra (overleg) 2 okt 2021 21:34 (CEST)[reageren]
Dank voor je feedback. Dat zou inderdaad kunnen, maar het idee is hier juist dat een menselijke gebruiker de informatie ziet en daar actie op onderneemt (de bot voegt geen bronvermelding aan de pagina toe, maar commentaar op een overlegpagina). Misschien dat het een betere aanpak is om het commentaar over een langere periode op de diverse overlegpagina's achter te laten? Dus niet 6 per minuut (het 'algemeen geaccepteerde maximum' van bewerkingen zonder botbit) maar 50 of 100 per dag. valhallasw (overleg) 3 okt 2021 12:37 (CEST)[reageren]

Is dit een goed idee...?

Weghalen lijkt mij geen goed idee. Kopiëren kan wel. En wat mij betreft worden de huidige vertaalsjabloons in een bws nu al in de hoofdnaamruimte geplaatst. Er gaat namelijk (vrijwel) niemand de moeite doen om vertaalsjabloons handmatig te verhuizen. Het controleren of een van de versies van een lemma een vertaling is, neemt veel te veel werk in beslag. En het zou ook een goed idee zijn te verplichten om bij het aanmaken van een lemma "vertaalsjabloons" meteen in de hoofdnaamruimte te plaatsen. Net schiet mij een recente discussie te binnen. Ik vroeg aan een Wikipediaan of hij van één lemma voor de duidelijkheid aan de lezer het vertaalsjabloon uit de bws in de hoofdnaamruimte wilde zetten. Dat leverde meteen kritiek op van een andere gebruiker die schreef dat het plaatsen in de hoofdnaamruimte niet verplicht was en daarom onnodig. Uiteindelijk is het ook niet gebeurd. Om dit soort discussies te vermijden, zou je eerst verplicht moeten stellen om ze in een hoofdnaamruimte weer te geven, want anders blijven gebruikers de vertaalsjablonen in de bws zetten en blijf je bezig met overplaatsen naar een OP, controle etc. HT (overleg) 12 aug 2021 07:40 (CEST)[reageren]
ter info: Vertaalsjablonen komen automatisch in de BWS bij gebruik van de vertaaltool. En dat is volkomen logisch, want daar staan alle bijdragers en via dat sjabloon kan je de bijdragers vinden in de andere taal. De andere taalversie is dus geen bron, maar de vertaling is voortborduren op CCBYSA. Om mij onnavolgbare reden willen we hier een extra sjabloon dat dus onnodig is imho. Elly (overleg) 12 aug 2021 09:27 (CEST)[reageren]
Ik kan deze discussie niet helemaal plaatsen. Het botverzoek gaat over een lijst met mogelijke bronnen op een overlegpagina, niet over het automatisch plaatsen van vertaalsjablonen op een artikelpagina. Is dit een vervolg op een discussie die op een andere pagina gevoerd is? valhallasw (overleg) 12 aug 2021 16:39 (CEST)[reageren]
@Valhallasw: Ik las hierboven: "vertaald van", "bron:.." en concludeerde dat het om een vertaling van een lemma ging. Blijkbaar niet. Ik begrijp verder niet het nut van een weergave zoals Dajasj die op 19 juni 2021 09:51 hierboven aangeeft. OP's zijn bedoeld voor overleg tussen gebruikers. Ze lijken mij niet bedoeld om te verduidelijken dat in een bws een bron vermeld wordt. HT (overleg) 13 aug 2021 19:07 (CEST)[reageren]
Ik zie geen bijdrage in dit overleg van Dajasj HT? Inderdaad is het wel mijn idee om de bronvermedling anderstalige Wikipedia in te voegen, en je hebt gelijk dat dit niet verplicht is, maar bronvermelding in de geschiedenis is eigenlijk heel erg verborgen, dus ik zie dit meer als een service naar enerzijds de lezer, en anderzijds ook als een duidelijkere manier om tegemoet te komen aan de voorwaarden van de CC BY-SA. Ciell need me? ping me! 27 aug 2021 09:39 (CEST)[reageren]
Verwezen wordt naar deze bewerking die RonnieV hierboven als voorbeeld gebruikt. Even ter context, ik zette de referentie bij hoge uitzondering in de bewerkingssamenvatting omdat het alleen ging om het bijwerken van de tijdlijn, wat na paar dagen alweer verouderd is. Toevoegen op andere plek lijkt me in dit geval in ieder geval niet nodig. Dajasj (overleg) 27 aug 2021 11:23 (CEST)[reageren]

Huidige opzet

Vandaag heb ik een nieuwe versie van het databestand gemaakt; naast de laatste updates is deze ook iets kritischer over wat een 'interwikilink' is (wp:GOO _lijkt_ er wel op maar 'wp' is vooralsnog geen taal). Ik heb de bot zo ingesteld dat deze midden in de nacht (5 uur UTC) steeds een batch van 50 pagina's online zet, waarbij de volgorde willekeurig is (en dus niet bijvoorbeeld op alfabet). Op die manier komen we langzaam door alle pagina's heen (gaat een half jaar duren), waarbij een gemiddelde bewerker elke paar dagen een berichtje ziet. Pagina's waar al eerder geplaatst is worden overgeslagen (ook als de tekst inmiddels verwijderd is). Dit alles draait nu onder het 'nlwiki-bronlinks' account op Toolforce -- sourcecode is hier beschikbaar: https://phabricator.wikimedia.org/source/tool-nlwiki-bronlinks/browse/master/ valhallasw (overleg) 24 okt 2021 14:51 (CEST)[reageren]

Lijkt mij een mooi plan! Zal ik het nog even in de Kroeg gooien, of wil je dat misschien zelf doen? (Of misschien helemaal niet doen, vind je dat onnodig...?) Ciell need me? ping me! 24 okt 2021 17:34 (CEST)[reageren]
Hi @Valhallasw, zullen we dit nog even in de groep (Kroeg) gooien? Ik doe het graag even hoor, als aanvrager van de botactie. Ciell need me? ping me! 31 okt 2021 09:57 (CET)[reageren]
Ik heb ook nog twee vraagjes hierover. Ik mis eigenlijk een ondertekening onder het botbericht en in het geval van dit bericht is de link onbereikbaar. Heeft het dan wel nut om het op de overlegpagina te vermelden? Ennomien (overleg) 31 okt 2021 11:02 (CET)[reageren]
Hoi @Ennomien, de ondertekening heb ik gefixt; dat was een letterlijke 'valhallasw-toolserver-botje' in plaats van viermaal een tilde. De overlegpagina van de bot redirect naar die van mij, dus dat zou naar behoren moeten werken.
Goed controleren op bereikbaarheid is minder makkelijk dan het lijkt omdat er een hoop varianten zijn die dan netjes afgehandeld moeten worden (domein bestaat niet meer, pagina 'not found', pagina 'found' maar met een foutmelding, etc.). Toch is het vervelend als er een suggestie wordt geplaatst die door de onbereikbaarheid onbruikbaar is. Ik denk dat de beste oplossing misschien is om in het bericht of de FAQ uit te leggen hoe archive.org gebruikt kan worden om verdwenen pagina's weer op te zoeken. Daar zal ik even naar gaan kijken. valhallasw (overleg) 31 okt 2021 15:38 (CET)[reageren]
Top! Oh ja, snap ik. Als je dat toevoegt en het laat weten ga ik ook kijken of ik bij Glennis Grace (en even later kwam ik ook Guus Meeuwis tegen op m'n volglijst) de link nog ergens terug kan vinden met archive.org. Ik typ dit dan ook vooral zodat ik dat niet vergeet. :) Ennomien (overleg) 31 okt 2021 17:13 (CET)[reageren]
@Valhallasw had je hier nog naar gekeken (onbereikbare links)? Groet, Ennomien (overleg) 30 jan 2022 22:38 (CET)[reageren]
@Valhallasw dit is ook vreemd: hier lijkt hij 'www' te lezen. Groet, Ennomien (overleg) 22 feb 2022 09:17 (CET)[reageren]
Hoi Ennomien, dan voor de melding! Inderdaad, foutje van de bot. Nouja, foutje van mij -- ik heb in de artikelgeschiedenis gezocht op 'www' in plaats van 'www.'. Dat lijkt helaas wel nog meer voor te komen, dus die ga ik er iets netter uitfilteren.
Informatie over onbereikbare links heb ik toegevoegd aan de FAQ (dat testen en uitfilteren is een vrij complexe zaak -- het is niet voor niets dat er een losse InternetArchiveBot is :-)). valhallasw (overleg) 23 feb 2022 17:35 (CET)[reageren]
Prima! Snap ik hoor, prima als je het op een andere manier oplost. Groet, Ennomien (overleg) 23 feb 2022 20:44 (CET)[reageren]
@Valhallasw en nu zoekt hij op "http://". Maar ik denk dat we dat voor lief moeten nemen. Gr, Ennomien (overleg) 6 apr 2022 09:45 (CEST)[reageren]
@Valhallasw en misschien zou je ook kunnen oplossen dat de "reageer"-knop onder alle tekst van de bot staat, nu staat die knop niet helemaal onderaan. Ennomien (overleg) 1 mei 2022 10:46 (CEST)[reageren]
Dat wil ik best, maar ik heb geen idee hoe. Het lijkt door de wiki-software zelf toegevoegd te worden na de handtekening. valhallasw (overleg) 2 mei 2022 22:45 (CEST)[reageren]
Je zou de laatste 2 regels kunnen omwisselen. –bdijkstra (overleg) 2 mei 2022 22:51 (CEST)[reageren]
D'oh. Dat lijkt inderdaad prima te werken. Komt voor alle opkomende edits goed. valhallasw (overleg) 4 mei 2022 21:48 (CEST)[reageren]
Mooi zo! Had je nog gekeken naar mijn feedback van 6 april? Ik weet niet of je daar iets mee kunt en zo belangrijk is het ook niet denk ik. Ennomien (overleg) 5 mei 2022 10:53 (CEST)[reageren]
Tsja, je kunt niet alles eruit filteren :-). Dat "komt voor alle opkomende edits" valt trouwens nog wat tegen... de lijst was op 1 mei al volledig afgerond! valhallasw (overleg) 6 mei 2022 19:57 (CEST)[reageren]
Dat is goed nieuws! Mooi zo. Ennomien (overleg) 7 mei 2022 10:26 (CEST)[reageren]

Tijdelijk gepauzeerd

Op verzoek van @Hannolans: heb ik een botbitverzoek ingediend zodat het gemakkelijker wordt om de wijzigingen uit de volglijst weg te filteren. (botbewerkingen worden standaard alleen weggefilterd op Special:RecentChanges). Dat lijkt wat langer te duren dan verwacht, dus de bot is voorlopig even gepauzeerd. valhallasw (overleg) 13 dec 2021 08:04 (CET)[reageren]

Dit soort bewerkingen moet toch bij uitstek zonder botbit gebeuren? Als niemand het op zijn volglijst ziet dan gebeurt er ook niets mee. Als je bots wel wil tonen op je volglijst dan zit het tussen allerlei bewerkingen die niet relevant zijn, dus dan wordt het moeilijker. Het lijkt mij het beste om door te gaan zonder botbit. — Zanaq (?) 13 dec 2021 09:45 (CET)[reageren]
Kleine update hierop. Het botbitje is inmiddels geplaatst, dus er is in ieder geval nu de mogelijkheid om de wijzigingen met botbitje te doen.
Zoals opgemerkt op Wikipedia:Aanmelding botgebruikers ben ik het in beginsel met je eens: deze run is een stuk effectiever als mensen de edits op de volglijst zien. Dat levert alleen ook zoveel wrijving op dat het op dat moment ook niet meer effectief is. Ik heb dan liever een optie die wat minder efficiënt is maar die ook een hoop minder gedoe oplevert :-). Daar komt nog bij dat er niet heel veel mensen op basis van de volglijst edits doorvoeren. Dat gebeurt zeker wel af en toe, maar uiteindelijk is het meerendeel van de edits een 'voeg toe aan cat'-edit (plus: wellicht dat iemand het in de toekomst op de overlegpagina ziet staan).
Samengevat: mijn (pragmatische) voorkeur is om met botbitje door te gaan. valhallasw (overleg) 18 dec 2021 14:10 (CET)[reageren]

Biografieën in Etalage-artikelen

Is er iemand die een lijstje kan maken met de biografieën die op dit moment in onze Etalage staan? Ik ben erg benieuwd naar de man/vrouw verhouding, maar omdat wij niet categoriseren naar geslacht en de Etalage daarnaast geen aparte categorie voor artikelen over personen heeft, zou dit met de hand een tijdrovend klusje zijn. Misschien is zo een overzichtje met een botje zo gepiept? Ciell need me? ping me! 7 mei 2022 20:49 (CEST)[reageren]

Zoiets? https://w.wiki/58qP .
Dat levert de volgende 14 artikelen over vrouwen op: Æthelflæd, Aphrodite, Aspasia, Bette Davis, Eleonora van Aquitanië, Huda Sha'arawi, Julia Agrippina minor, Lise Meitner, Livia Drusilla II, Madame de Staël, Madame Roland, Maria Aletta Hulshoff, Mary Pickford en Ranavalona I van Madagaskar. Daar staan dan 68 artikelen over mannen tegenover. valhallasw (overleg) 8 mei 2022 11:47 (CEST)[reageren]
Dank!! Ciell need me? ping me! 8 mei 2022 20:30 (CEST)[reageren]
  1. "Prebivalstvo po starosti in spolu, občine, Slovenija, polletno". Statistični urad Republike Slovenije. Geraadpleegd op 18 april 2021.