Naar inhoud springen

Wikipedia:Botcafé

Onderwerp toevoegen
Uit Wikipedia, de vrije encyclopedie
Dit is een oude versie van deze pagina, bewerkt door Wikiwerner (overleg | bijdragen) op 1 mei 2023 om 18:45. (→‎Spoorlijnen in Duitsland: Reactie)
Deze versie kan sterk verschillen van de huidige versie van deze pagina.

Laatste reactie: 1 jaar geleden door Wikiwerner in het onderwerp Spoorlijnen in Duitsland
WP:BC verwijst door naar deze pagina. Voor informatie over bureaucraten op dit project, zie Wikipedia:Bureaucraat.

Sjabloon:Wikipedia:Navigatie bots

welkom in het Botcafé van Wikipedia,

een centraal punt voor overleg over alle zaken op Wikipedia die met bots te maken hebben

Gebruik de chat!, kanaal pywikipediabot (Engels) of wikipedia-nl (Nederlands)

Als je een bot-probleem hebt, geef dan een uitgebreide beschrijving van het probleem, alsook de volledige foutmeldingen: dit vergemakkelijkt het opsporen van de oorzaak en versnelt het zoeken naar een oplossing.

Spoorlijnen in Duitsland

Ik heb voor twee vragen. Beide hebben betrekking op de spoorlijnen in Duitsland. De Categorie:Spoorlijn in Duitsland is een zeer grote vrij onoverzichtelijke categorie met op het moment van dit schrijven 2.561 artikelen en groene links.

Vraag 1: Is hier iemand bereid de honderden groene links die bestaan uit niets meer dan de letters DB en een getal van 1 tot 4 cijfers (bijvoorbeeld DB 1413) in een tabel te zetten? Zodat een overzicht ontstaat met het DB nummer en daarachter de spoorlijn waar dat nummer naar verwijst? De groene links zijn dan in principe overbodig en zouden uit de categorie verwijderd kunnen worden.

Vraag 2: Is er iemand bereid de spoorlijnen in de categorie te verplaatsen naar subcategorieën per deelstaat? Ik heb dat voor enkele deelstaten al gedaan op basis van de inhoud van de categorieën voor infrastructuur naar deelstaat, waar de spoorlijnen ook in staan maar voor alle artikelen in deze categorie is het wat veel werk om dat handmatig te doen. Bij voorbaat dank, LeeGer 28 mrt 2023 00:12 (CEST)Reageren

@Vraag 1: Waar wil je die tabel hebben? We hebben al de Lijst van spoorlijnen in Duitsland. Wikiwerner (overleg) 28 mrt 2023 10:30 (CEST)Reageren
Als er een kolom met de betreffende deelstaten bij gezet kan worden, dan kan de tabel in principe die lijst grotendeels vervangen. Alleen de verbindingen met Nederland en België zou ik dan laten staan. LeeGer 28 mrt 2023 10:51 (CEST)Reageren
Daarbij ga ik er dan vanuit dat men ervoor kan kiezen om de tabel te sorteren op nummer en op deelstaat. LeeGer 28 mrt 2023 10:53 (CEST)Reageren
Dat moet wel lukken, met "class=wikitable sortable":
Deelstaat Lijnnummer Traject
Berlijn DB 6024 Stadtbahn (Berlijn)
Bremen DB 1310 Bremerhaven - Cuxhaven
Nedersaksen DB 1310 Bremerhaven - Cuxhaven
Noordrijn-Westfalen DB 10 Siegburg - Friedrich-Wilhelms-Hütte
Zoiets? Wikiwerner (overleg) 28 mrt 2023 21:06 (CEST)Reageren
Is het niet logischer om links met het nummer te beginnen? LeeGer 29 mrt 2023 00:04 (CEST)Reageren
Mij leek het logisch om standaard te sorteren op deelstaat, uiteraard te overrulen door de lezer met de pijltjes. Anders krijg je dat dubbele nummers op opeenvolgende regels staan. Ik heb expres een voorbeeld toegevoegd dat door twee deelstaten loopt. Of wil je standaard sorteren op deelstaat, maar het lijnnummer links? Wikiwerner (overleg) 29 mrt 2023 20:27 (CEST)Reageren
Zo kan het ook. LeeGer 5 apr 2023 09:50 (CEST)Reageren
Ik heb zojuist de lijst helemaal bijgewerkt. Ook heb ik de spoorlijnen die er al stonden erin geïntegreerd. De volgende stap is het vergelijken van de lijst en de categorie om te kijken welke DB-nummers nog ontbreken in de lijst. De doelartikelen van die DB-redirects kunnen we dan tegelijk voorzien van categorieën naar deelstaat. Als dat klaar is, dan kunnen we de redirects ontdoen van de categorieën. In dezelfde botrun kan ik dan de niet-redirects dieper categoriseren, zoals gevraagd in vraag 2. Wikiwerner (overleg) 16 apr 2023 18:13 (CEST)Reageren
Bedankt! Ik heb zelf geen inzicht in wat er hiervan botmatig gedaan kan worden en wat er met de hand zal moeten gebeuren dus dat hoor ik graag. LeeGer 16 apr 2023 23:29 (CEST)Reageren
Het eerste actiepunt, dus mijn derde en vierde zin, moet handmatig. Mijn bot kon hier niks mee, want de doelartikelen van die DB-redirects bevatten geen categorieën naar deelstaat. Wikiwerner (overleg) 17 apr 2023 19:28 (CEST)Reageren
Ik heb een klein aantal nu gecontroleerd maar ben helaas nu ook druk met analoge bezigheden. Moet ook eens kijken of ik binnenkort toch eens op een groter scherm kan werken. Dat werkt efficiënter maar daar kom ik meestal niet aan toe. Maar dit heeft geen grote haast. LeeGer 20 apr 2023 23:17 (CEST)Reageren
@Vraag 2: Een bot is een dom ding. Bij bijv. Spoorlijn Bazel - Konstanz raakt hij de weg kwijt, want die heeft geen categorie naar deelstaat. Die blijven dan vanzelf over in de categorie:Spoorlijn in Duitsland. Wikiwerner (overleg) 28 mrt 2023 21:06 (CEST)Reageren
Die heb ik zelf net verplaatst. Ik heb geen idee wat er nog overblijft nadat de bot zijn werk heeft gedaan maar dat wachten we maar af. LeeGer 29 mrt 2023 00:03 (CEST)Reageren
Vraag 2 is nu ook klaar. De categorie bevat nu alleen nog pagina's zonder categorieën naar deelstaat en zonder inkomende DB-redirect, en redirects. Die laatste zijn vaak deeltrajecten van het doelartikel, dus het is gevaarlijk om die zomaar in dezelfde categorieën te zetten als het doelartikel. Wikiwerner (overleg) 1 mei 2023 18:45 (CEST)Reageren

Top 100 ontbrekende interwiki's?

Naar aanleiding van Wikipedia:Artikelen in veel andere talen maar niet in het Nederlands vroeg Erik Wannee zich af of het botmatig mogelijk zou zijn om de Wikidata-items langs te lopen, en periodiek een lijst te laten genereren van de (pakweg 100) items waarover geen NL-talig artikel bestaat maar wel de meeste anderstalige versies. Dat lijkt me een prima suggestie, als zoiets zou kunnen? Karmakolle (overleg) 30 apr 2023 15:35 (CEST)Reageren

Nog wat verduidelijking: ik bedoel dus een lijstje in volgorde van het aantal anderstalige versies van een bepaald artikel waarvan de NL-talige versie ontbreekt. Er zijn momenteel 322 taal-edities; artikelen die in 321 edities maar niet in NL voorkomt, komen dus helemaal bovenaan de lijst te staan; dan volgen artikelen die in 320 edities voorkomen maar niet in NL, enzovoorts.
Ter inspiratie: en:Wikipedia:Articles in many other languages but not on English Wikipedia.
Ik zie trouwens dat de lijst en:Wikipedia:Articles in many other languages but not on English Wikipedia/Update een grote tekortkoming heeft: daar staan enorm veel Duitstalige termen in, en die artikelen hebben wel degelijk een Engelstalige editie. Kennelijk is daar een programmeerfoutje gemaakt. Erik Wannee (overleg) 30 apr 2023 15:56 (CEST)Reageren
Ik weet niet of de software van Wikidata al bepaalde faciliteiten heeft; zo niet dan wordt het een pittige klus om de ruim 102.870.000 items langs te lopen. Maar in principe zou het eenvoudig te programmeren moeten zijn:
  1. Neem een Wikidata-item.
  2. Heeft dat item een Nederlandstalig artikel? Zo ja, ga terug naar 1 en neem het volgende wikidata-item.
  3. Tel het aantal taal-versies van dat item en onthoud het getal.
  4. Als dat getal kleiner is dan het kleinste van de huidige 100 opgeslagen getallen in de lijst, ga dan terug naar 1 en neem het volgende item.
  5. Sla dit getal op en verwijder het item met het kleinste getal uit de lijst.
  6. Ga door tot alle items doorlopen zijn; dan bevat de lijst de 100 gewenste items.
Eventueel kan het script tegelijkertijd hetzelfde kunstje doen voor meer taalversies.
Erik Wannee (overleg) 30 apr 2023 16:28 (CEST)Reageren
Wikidata heeft al wel bepaalde faciliteiten, want Wikidata is een database. Onderaan de genoemde Engelse equivalent staat een link naar een subpagina en:Wikipedia:Articles in many other languages but not on English Wikipedia/30 or more versions. De geschiedenis daarvan brengt me op een query-request op Wikidata. Als n00b op het gebied van Sparql vervang ik "en" door "nl", maar dan krijg ik een time-out. Met ">60" in plaats van ">40" lukt het wel: 105 resultaten in een halve minuut (klik nog even op de grote pijl in de linkermarge). Wikiwerner (overleg) 30 apr 2023 18:22 (CEST)Reageren
Fantastisch! Ik vroeg me af of we er boven de 100 zouden hebben, en jawel hoor, zes keer. Waaronder de tekenfilm Go, Dog, Go! Glimlach Ik ga de lijst aanvullen en dit elk jaar draaien. Veel dank! Karmakolle (overleg) 30 apr 2023 18:43 (CEST)Reageren
Het lijkt er wel op dat de query systematisch meer resultaten oplevert dan er interwiki's zijn. Bv. voor het eerste item en:Food: 215 vs 178; voor en:Liturgy: 61 vs 56. Enig idee waaraan dit ligt? Karmakolle (overleg) 30 apr 2023 19:01 (CEST)Reageren
De query telt alle sitelinks, dus niet alleen Wikipedia-sitelinks. –bdijkstra (overleg) 30 apr 2023 19:14 (CEST)Reageren
Als ik bijv voor Food de interwiki's tel, en alle projecten bij elkaar optel dan kom ik op 215, er word dus geen onderscheid gemaakt tussen interwiki's naar wikipedia, of naar wikinews of wikisource oid.
En nog een klein hint, een link naar wikidata kan je met d:Q2095 leggen, hoef je geen externe link voor te gebruiken.
Is elk jaar niet mogelijk wat weinig trouwens? Akoopal overleg. 30 apr 2023 19:16 (CEST)Reageren
Laat ons zeggen dat een hogere frequentie zinvol is als er veel respons komt. Want het blijft een uithoekje in onze gigantische website he. Ik ga eens nadenken hoe ik dit best onder de aandacht houd. Karmakolle (overleg) 30 apr 2023 19:20 (CEST)Reageren
Ik heb dit lijstje - rauw en onbewerkt - onderaan Wikipedia:Artikelen in veel andere talen maar niet in het Nederlands gezet. Waarschijnlijk zit er veel tussen dat meteen afgevoerd kan worden; we moeten er nog kritisch naar kijken. Maar het beginnetje is er! Erik Wannee (overleg) 30 apr 2023 19:07 (CEST)Reageren
Ja, vaak is de oplossing niet een nieuw artikel maar een andere match op Wikidata. Ik ga er nog eens met de kam door wanneer ik tijd heb (straks snooker, sorry ;-)) Karmakolle (overleg) 30 apr 2023 19:10 (CEST)Reageren
Ik zag er een heleboel waarover wel een NL-artikel bestaat, maar dan onder een iets andere naam, zoals dat we geen artikel Homo sapiens hebben, maar het bestaat wel als redirect, naar Mens. Dit soort items kunnen dus allemaal uit de lijst verwijderd worden. Wel leuk trouwens dat we kennelijk tot nu toe te lui zijn geweest om een artikel Luiheid te schrijven. Glimlach Erik Wannee (overleg) 30 apr 2023 19:22 (CEST)Reageren
Zeker, hopelijk veel zulke gevallen. Maar soms is het ook subtiel. We hebben natuurlijk voedsel, maar gekoppeld aan en:nutrition terwijl en:food leeg is. Dan denk ik dat er een nuance is die we niet capteren. Zie ook het verwarwoordenboek voeding/voedsel. Karmakolle (overleg) 30 apr 2023 19:29 (CEST)Reageren
Zou wellicht anders gekoppeld moeten worden: en:nutrition gaat over een proces, nl:voedsel over materiaal. –bdijkstra (overleg) 30 apr 2023 19:31 (CEST)Reageren
Het artikel Burgerlijk recht is op wikidata gekoppeld aan privaatrecht en niet aan burgerlijk recht waardoor het lijkt alsof daar geen artikel over is. TheGoodEndedHappily (overleg) 30 apr 2023 19:48 (CEST)Reageren
Niet mee eens. Homo sapiens is een biologische soort, 'mens' is een iets ruimer begrip waaronder ook andere soorten vallen. –bdijkstra (overleg) 30 apr 2023 19:29 (CEST)Reageren
Toch kon ik met een snelle zoektocht geen taal vinden waarin er twee afzonderlijke artikelen over deze diersoort bestaan; steeds bleek een van beiden een redirect. Maar misschien zocht ik niet goed genoeg. Overigens: we hebben wel het artikel Homo (geslacht), waar ook veel uitgestorven mensensoorten worden gerekend. Eigenlijk zou dàt dus moeten redirecten van of naar Mens; niet Homo sapiens. Lastige materie... (En dan hebben we het nog niet eens over homo stupidus.) Erik Wannee (overleg) 30 apr 2023 19:33 (CEST)Reageren
Dat zijn al twee gevallen die direct de nodige discussie oproepen. Er zal dus regelmatig overleg nodig zijn, maar het is in elk geval een lijst die interessante vragen oproept. Karmakolle (overleg) 30 apr 2023 19:38 (CEST)Reageren
Mooie lijst, wat veel werk zeg. Het kan ook automatisch via wikidata, maar dan is er geen controle. Zo heeft HenkvD voor mij de query "Nederlandse vrouwen zonder artikel op NL met veel interwiki links" gemaakt. Klik op de link en dan op de blauwe pijl. Af en toe "doe" ik er een die mij interesseert. De sportvrouwen heb ik tot nog toe overgeslagen. Hier de link. Met zoete (itt zure) groet, Elly (overleg) 30 apr 2023 19:46 (CEST)Reageren
De Wikidata query die hierboven door (n00b?) Wikiwerner is genoemd is inderdaad correct. Timeout komt door het enorme aantal entries die verwerkt moeten worden. Limiteren tot 60 lijkt me ruim voldoende voor deze lijst. Er is echter geen garantie dat deze query volgend jaar niet opnieuw een timout geeft. En inderdaad het aantal sitelinks bevat ook links naar ander projecten als wikinews en wikiquote. Voor een artikel als Food levert dat een groot verschil op, voor de meeste anderen zal het maar een heel klein verschil wezen. HenkvD (overleg) 30 apr 2023 20:18 (CEST)Reageren