Wikipedia:Botcafé/Archief/2010-10

Uit Wikipedia, de vrije encyclopedie

Verder verloop[bewerken | brontekst bewerken]

Wiki Aantal dp's Aantal links Links/dp
nl-wp (2-10) 47685 27049 0,56
de-wp (2-10) 125658 188988 1,50
fr-wp (2-8) 57997 576109 9,93

Het gaat met het aantal links naar dp's steeds verder de goede kant op zoals iedereen hierboven kan zien. Hopelijk blijft dit zo en schiet het aantal binnenkort niet weer heel hard omhoog. Feit is wel dat we er nu goed voorstaan, maar dat het toch ook steeds lastiger wordt om de overgebleven links op te lossen. Dit komt enerzijds doordat, heel logisch, de simpelere links naar doorverwijspagina's sneller worden opgepakt en hersteld en de lastigere maar blijven staan. Anderzijds doordat de links die niet op te lossen zijn, steeds meer onderdeel van de data-lijst gaan uitmaken. Het zou wenselijk zijn als deze onoplosbare links niet in de lijsten zouden voorkomen (zoals middels de filter bij de artikelen-lijst) en evt. ook wel fijn als dit aantal niet meegeteld zouden worden.

Ik heb laatst al even met Bryan, de botbeheerder van de data-lijst, gemaild of er filters mogelijk zijn bij de data-lijst. Hij gaf aan dat hijzelf evt. wel filters in wilde bouwen, zoals:

  • Een lijst van pagina's die überhaupt niet meegeteld moeten worden
  • Een lijst van disambig pagina's die niet in de lijst voor moeten kommen en eventuele andere, simpele filters.

Ingewikkelde filters zijn ook mogelijk, maar daar heeft hij niet de tijd voor om die te bouwen. Voor diegene die wel daar tijd voor heeft, en kennis van heeft, heeft hij mij de code gemaild. Bij de filters is het dan de vraag: wat kunnen we gebruiken, hoe gebruiken we die en hoe krijgen we deze?

Mijn vraag is daarnaast aan jullie hoe jullie over het verder verloop van aanpakken van links naar doorverwijspagina's denken om zo nuttig mogelijk onze tijd daaraan te besteden en het totaal aantal steeds meer omlaag gaat. Pompidom 2 okt 2010 18:55 (CEST)[reageer]

Ik heb, zonder dit te weten van je, Bryan een paar dagen geleden gemaild met exact dezelfde vraag m.b.t. het filteren d.m.v. een filterpagina.... erg toevallig! Voor de rest weet ik ook niet hoe het sneller/beter kan, ik check veel nieuwe artikelen en pik gewoon af en toe een paar van de 2 lijsten: Wikipedia:Links naar doorverwijspagina's/data en Wikipedia:Links naar doorverwijspagina's/Artikelen. Goudsbloem 2 okt 2010 20:41 (CEST)[reageer]
Toevallig dat ik dit hier lees. Ik zie zelf een oplossing door een andere constructie te maken. in het geval Jezus bijvoorbeeld, wordt deze doorverwezen naar Jezus van Nazareth. Dit is een dp en daarom willen we er niet naar linken natuurlijk. Je kan dan kiezen uit bijvoorbeeld (meest voorkomend) Jezus (traditioneel-christelijk). Daar dat te omslachtig is, vullen de meeste gewoon Jezus in, en laten het aan anderen over om het op te lossen. Maar als we bijvoorbeeld schrijven over moslim-christenen, willen we natuurlijk niet dat er verwezen gaat worden naar de traditioneel-christelijke Jezus. Zo zijn er meerdere voorbeelden.
Bij Overleg gewenst, is daar al eens over gesproken en ik heb het toen opgenomen een oplossing te maken. Op Gebruiker:Rodejong/Jezus (nog niet helemaal af) heb ik een opzet gemaakt, waarin de meest voorkomende vormen worden ingeleid. wie dan verder wil lezen wordt verwezen naar het lemma dat daar dieper op in gaat. Dat zou dan een goede oplossing zijn. Het behoud voor een deel de functie van een dp, maar is tegelijkertijd toch ook een artikel waardoor het niet bij de dp's gerekend hoeft te worden. Deze manier zou dan een aantal lastige dp's kunnen opruimen.
Ik hoor graag jullie mening hierover, of suggesties natuurlijk. Met vriendelijke groeten, -- Kind regards,   Rodejong   💬 Talk ✉️ Email  📝 Edits  👀 Auth  🕘 →  2 okt 2010 21:01 (CEST)[reageer]
Meer helpers, de "4 tjes" zijn al opgerukt naar nummer 38, vaker verversen betekent meer regelmaat, de semi-automatisch AWB werpen hun vruchten af. Jullie snappen wel dat ik erg tevreden ben. Om de lol er in te blijven houden is het inderdaad wenselijk om een aantal dp niet meer terug te zien. Het is niet eenvoudig en ik denk er verder over na. groet Japiot 2 okt 2010 21:55 (CEST)[reageer]
Inderdaad niet eenvoudig. Ik denk er ook verder over na hoe dit het best aangepakt moet worden. Sonuwe () 3 okt 2010 10:48 (CEST)[reageer]


LOL, ik ben dus niet de enige die kijkt naar het volgnummer waar de "viertjes" en "drietjes" beginnen. Ik ben daar een tabel voor aan het knutselen. Met drie verversingen per week gaat het wat langzaam (ik ben nu gevorderd tot eind mei). Voornaamste wat je uit die tabel kan lezen is hoe slordig sommige mensen werken.
De wijze waarop ik, als fanatiek artikel-lezer, werk sluit perfect aan op de lijst van artikelen. In de praktijk komt het er op neer dat ik met name nieuwe (of recent sterk uitgebreide) artikelen aanpak terwijl de mensen op de links-lijst (naar mijn gevoel) met name al wat langer bestaande artikelen aanpakken. Waar ik de lijst "kort" houd, snoeien zij vanaf de zijkant de dp-linkjes weg. Die samenwerking werkt uitstekend.
Tegenvaller is inderdaad de "Wet van de kleine getallen". Voorheen had je met een doelwit van 50 dp-linkjes per sessie slechts een paar items nodig om dit te bereiken, nu moet je er aanzienlijk meer aanpakken.
Meer filteren is misschien een goed idee. Daar kunnen echter wat haken en ogen aan zitten. Wat nu naar de filterlijst verdwijnt wordt volgens mij in zijn geheel niet meer gecontroleerd (of is dat schijn, werkt dat alleen zo qua artikelen?). Het is inderdaad zo dat ik tegenwoordig vaker moeilijke links tegen komt. Dan ben ik soms drie hubs verder voor ik het antwoord heb. Maar kom ik er zelfs met een paar hubs niet uit, dan ontlink ik of pas zodanig aan dat het een rode link wordt. (voorbeeld: kunstenaarscollectief Jade bewerkt tot [[Jade (kunstenaarscollectief)|Jade]]) Links van de ene dp naar de andere dp en terug mogen van mij direct uitgefilterd worden. Over het algemeen zijn zij zinvol en niet te vermijden. In andere gevallen kan filteren dienen als tussenstap. Hiermee bedoel ik dat zij in eerste instantie terzijde geplaatst worden om later nogmaals bekeken te worden. Als voorbeeld noem ik hierbij de Amerikaanse marineschepen, die vaak een dp-link hebben naar andere schepen met dezelfde naam. Eerst maar even parkeren, later kan dan alsnog bekeken worden of de dp omzeilt kan worden door een zie ook-verwijzing naar maximaal vier of vijf andere schepen.
Met een beetje geluk hebben wij binnenkort ook de eerste "eentjes" in beeld. Om die aan te pakken zijn er vier mogelijkheden: oplossen, rood linken, ontlinken en plaatsing op de filterlijst. Met name bij rood linken (zinvolle maar niet bestaande link) en ontlinken (onoplosbaar) moet genadeloos opgetreden worden. Eddy Landzaat 3 okt 2010 16:50 (CEST)[reageer]
Het gaat zover ik kan zien om twee groepen links.
  • Enerzijds de links vanaf een doorverwijspagina naar een andere doorverwijspagina.
  • Anderzijds de links met de sjablonen Zie artikel (deels) en Zie dp.
Die eerste groep is relatief eenvoudig, alle links van een dp naar een andere dp kunnen weggelaten worden.
Die tweede groep is lastig, aangezien we niet hele pagina's moeten uitsluiten van checken op links naar doorverwijspagina's maar alleen een bepaalde link in dat sjabloon. Misschien is het voldoende om de link op pagina A naar pagina B uit te sluiten in een filter, terwijl de overige links op die pagina A dan wel gewoon worden gecheckt. (De doorverwijspagina's van de eerste groep kunnen volgens diezelfde manier worden uitgesloten.) Ik wil wel dit filter bijhouden en uitbreiden zodat de lijst redelijk verschoond blijft. Het zou mooi zijn als iemand zo'n filter kon opzetten, lijkt me de enige oplossing om de situatie werkbaar te houden. Groetjes - Romaine (overleg) 3 okt 2010 16:56 (CEST)[reageer]
Dit vind ik een goed idee. Want het is natuurlijk best mogelijk dat er een link verschijnt die wel gewoon gefixt moet worden. En aangezien niemand echt naar de artikelen op de filterlijst kijkt, kan met behulp van zo'n filter die links ook nog gefixt worden. YNhuis 3 okt 2010 19:14 (CEST)[reageer]
We hebben nog een flink aantal mogelijke dp's die nog aangemaakt moeten worden. Op Gebruiker:MrBlueSky/haakjes/ZonderHaakjesGeenDP1 en zijn drie jongere broertjes (2 t/m 4) staan naast een aantal "moeilijke gevallen" ook heel veel voor de hand liggende dp's. Misschien kunnen we die eerst aanpakken voordat we ons met de tweetjes en de eentjes gaan bezighouden - Quistnix 3 okt 2010 19:26 (CEST)[reageer]
Volgens mij kan dat gewoon en-en. Ik voel zelf absoluut niet de behoefte dit soort zaken aan te pakken maar wel om gewoon door te gaan met de artikelen. Ik denk dat de onjuiste disambudingessen wel prioriteit hebben. Dat dat mijn inspanningen op de artikellijst in de wielen rijdt is jammer, maar niet onoverkomelijk (in ieder geval voor mij, als ik weet waar de voorraad vandaan komt vind ik het niet zo erg om tegen de bierkaai op te boksen). Eddy Landzaat 4 okt 2010 01:04 (CEST)[reageer]
Heb zelf geen verstand van bots en filters, maar kan zo een paar gevallen noemen die ik graag uit de datalijst zie verdwijnen, bijvoorbeeld Heilig Kruis of Kapelle. Zou deze dan wel nog laten meetellen in het totaal aantal links naar doorverwijspagina's. Deze filter zie ik niet als oplossing om een eventuele dichtslippende lijst tegen te gaan, want dit vind ik reuze mee vallen gezien het grote aantal "4tjes" dat ook nog gedaan kan worden, maar puur om het leuk te houden voor de vaste dp fixers. Als we klaar zijn met de "4tjes", verwacht ik aardig wat "3tjes". Genoeg om de 20.000 te halen schat ik.
Ik zelf probeer zowel oude bekende op de lijst weg te halen, al is het maar 1 linkje minder (zodat het bijv. van 6 naar 5 gaat), als de makkelijke "4tjes". Gezien het redelijk grote aantal vaste medewerkers die aardig wat werk verzetten en de vernieuwingen van de lijst om de 2-3 dagen, denk ik dat we de komende maanden zeker niet vast komen te zitten. Jarune 3 okt 2010 19:53 (CEST)[reageer]
Wat ik dus uit de verhalen hierboven uit kan maken is dus, wat mij niet verwonderd, dat we op deze manier nog steeds op de goede weg zijn. Enkel is er wel een behoefte aan een persoon met kennis van programmeren die waar mogelijk de bot verder kan perfectioneren, zodat er minder onoplosbare doorverwijspagina's op de lijst staat. In principe luxeproblemen, want vele andere projecten kunnen jaloers zijn op het lage aantal links naar dp's dat wij hier hebben. Pompidom 17 okt 2010 16:16 (CEST)[reageer]
Ziet er inderdaad erg goed uit. Binnenkort komt misschien het aantal van 20.000 al in zicht.... Dennis P:TW 17 okt 2010 16:35 (CEST)[reageer]