Wikipedia:De kroeg/Archief 20081110

Uit Wikipedia, de vrije encyclopedie

Externe links zonder omschrijving[bewerken | brontekst bewerken]

Besten,

Ik dacht er goed aan te doen een bot over alle artikelen te laten gaan die aan externe links zonder omschrijving een omschrijving toevoegt. Daardoor worden onbegrijpelijke links zoals "[http://www.pwfc.org/]" geconverteerd naar begrijpelijke verwijzingen zoals "[http://www.pwfc.org/ The Official Peter Wingfield Fan Club]" en "[http://www.showbizzsite.be/nieuws/detail.asp?iImsNid=40120]" naar "[http://www.showbizzsite.be/nieuws/detail.asp?iImsNid=40120 Showbizzsite.be: Cherry Jones is nieuwe 24-presidente]". Bovendien maakt het botje indien nodig een aantal syntactische correcties. Dat leidt dus tot correcties zoals deze. Maar, aangezien de bot de paginatitels van de betreffende sites gebruikt, ook soms tot mindere elegante verwijzingen zoals deze. Mijn redenering is dan dat het in ieder geval een kleine verbetering is, die mogelijkerwijs collegae stimuleert een betere omschrijving toe te voegen. Al vrij snel had een collega echter mijn overlegpagina gevonden om deze soort wijzigingen in het algemeen te kritiseren: een link zonder omschrijving zou volgens hem voldoende zijn, terwijl ik een verzameling onbegrijpelijke links onbruikbaar vind. Ik wil aan een omschrijving kunnen aflezen of een bron de moeite van het klikken waard is (academische bronnen en nieuwssites) of niet (het merendeel van de rest) en bovendien wil ik er direct aan kunnen aflezen wat het onderwerp van het gelinkte artikel is. Ik heb het botje voorlopig even rust gegeven, omdat ik benieuwd ben naar uw meningen hierover. Doorgaan of stoppen? Vriendelijke groet, --Maurits 31 okt 2008 02:23 (CET)[reageren]

Het gaat natuurlijk niet om losse externe links, maar wel om referenties, dus deze waar met <ref> naar verwezen wordt. Losse externe links zijn natuurlijk altijd veel duidelijker als er een tekstje boven staat. Immers, bij losse externe links weet je natuurlijk wel graag wat ze daar staan te doen, en wat je zal aantreffen achter die link. Bij referenties ként de lezer natuurlijk al de context, want hij heeft zonet de zinnen in de artikeltekst gelezen waarop deze referentie slaat; hij weet dus al wat er achter die link zal zitten. Ik vermoed dat het daarom is dat men ze zonder problemen plaatst in referentielijstjes ;-) Wat betreft die referenties; mijn persoonlijk idee:
  • Ideale links en referenties vermelden netjes de titel v/e artikel (of hoofdstuk en pagina's v/e boek), eventueel de auteur, het tijdschrift of de krant waaruit iets kwam, de datum (erg belangrijk om iets offline terug te vinden), ISBN, etc. Als daar dan een URL achter steekt, dan kan je natuurlijk handig meteen doorklikken naar een online versie er van. Maar, zolang je op de Wikipedia-website zelf zit, dan hoef je inderdaad de achterliggende URL niet te zien; je klikt gewoon als je er naartoe wil surfen hé.
  • Maar : een URL op zich is niet "fout". Het is wel zo dat dit niet altijd zo netjes oogt; anderzijds is die wel correct. In referentielijsten van bv. wetenschappelijke artikelen staan ook vaak gewoon URL's volledig uitgetypt vermeld [1]. Wél staat er dan normaalgezien een nette omschrijving voor. Zie [2] en [3] Even terzijde: voor wie wat nodig heeft uit wikipedia, en een stukje even kopieert of print is de URL-vorm soms zelfs handiger; je kan de URL dan immers nog lezen.. Dit maar om aan te geven dat een URL-vorm op zich nu nog geen ramp is. Het kan netter met een omschrijving, maar op zich is die URL dus informatief en wat dat betreft even "leesbaar" als een ISBN-nummer.
  • Je geeft zelf aan dat de bot niet altijd alles perfect kan doen. Ook zijn er gevallen waar m.i. de plaatser v/d referenties net de bedoeling heeft gehad om de URL-vorm of de echte naam website zelf te tonen ?? Zie hier [4], waar hetgeen de bot er van gemaakt heeft niet echt een verbetering is; de maker wou waarschijnlijk gewoon de adressen van die sites refereren??
Een botje kan inderdaad dingen verbeteren, maar zoals bij zovele bots bestaat misschien het gevaar dat de balans weer naar de andere kant overslaat ? De URL's verdwijnen dan wel, de bot vindt vaak zinvolle titels, maar er komen ook soms nietszeggende dingen in de plaats, zie [5], of zelfs onzinnige (zie [6]). Daarom is het misschien een idee het botje halfautomatisch te laten draaien ? Dan kunnen zo'n vreemde gevallen of uitzonderingen opgevangen worden, en kan men er handmatig iets zinniger of netter van maken waar nodig...? --LimoWreck 31 okt 2008 03:36 (CET)[reageren]
  • Het gaat om zowel "externe links" en om "referenties".
  • Een URL is inderdaad op zich niet fout. Een omschrijving is wel beter dan een URL. Een URL is vaak even onleesbaar als een ISBN-nummer. In de door jou gelinkte papers staan overigens bij alle verwijzingen omschrijvingen die even veelzeggend zijn als de omschrijvingen die door de bot worden gegenereerd.
  • Ik ben niet zo'n voorstander van halfautomatisch werk. Dat is bijna hetzelfde als niet-automatisch, ofwel, vele uren of zelfs dagen werk in plaats van één minuut om een programmaatje op te starten. Hoewel sommige correcties niet perfect zijn, is het in bijna alle gevallen wel een verbetering. De bot kopiëert overigens de titels van de websites; als die slordig zijn, dan is de website waarschijnlijk ook te slordig om op wikipedia te vermelden.
  • Bij het printen van artikelen worden inderdaad geen links weergegeven. De vraag is natuurlijk hoe erg dat is. Van papier kun je niet naar de link surfen. Als men toch de website wil bezoeken, dan kan men via de meest actuele versie op wikipedia dat doen. Bovendien is het behoorlijk algemeen op Wikipedia om omschrijvingen in plaats van URL's weer te geven.
  • Je geeft zelf al aan dat een omschrijving netter is (hoewel een URL geen "ramp" is). Dan is voor mij duidelijk wat te prefereren is. --Maurits 31 okt 2008 04:01 (CET)[reageren]
Nochtans verwees de bewerkingssamenvatting die de bot plaatste expliciet naar het woord "referenties" ;-)
Trouwens, ik denk dat "slordigheid v/e site" geen criterium is voor de waarde v/e referentie/bron. Als iemand zijn info uit een "slordige" site heeft moeten halen, dan is dat daarom geen minderwaardige site. Bron blijft bron. Trouwens, zelfs een site als in dit eerder aangehaald [7] voorbeeld lijkt me niets mis mee; het ís tenslotte de bron. Maar in dit geval lijkt de URL me zelfs veel leesbaarder en veelbetekenender dan wat er door de bot van gemaakt is. Zo'n rariteiten zou je alvast met half-automatisch werk vermijden (er worden dingen voor minder op de wiu-lijst gezet) --LimoWreck 31 okt 2008 04:25 (CET)[reageren]
Ik vind dit wel een goed initiatief, maar het blijft altijd gevaarlijk een bot aan het werk te zetten. Er zijn altijd situaties die de bot verkeerd afhandelt. Nu zullen dat er in dit geval niet zo veel zijn maar eigenlijk blijft het wel nodig om de zaak na te lopen (en om heel zorgvuldig met aan de bel trekkende gebruikers om te gaan). - Brya 31 okt 2008 05:49 (CET)[reageren]
Wel ja, over het gevaar van een bot: kort daarna heb ik prompt een stuk of 15 opeenvolgende dp's moeten reverten omdat de bot correcte interwiki's aan het weghalen was. Een anoniempje krijgt bij zijn eerste foute edit prompt een {zb} sjabloon op zijn overleg, en wanneer hij een uur later nog iets doet, slaan we hem prompt met een {ws} om de oren. Wanneer een bot in een paar minuten tijd 20 gelijkaardige dingen doet, moeten we dit toejuichen ? Of sterker nog, we zouden onze volglijst zo moeten instellen dat botbewerkingen niet zichtbaar zijn ?? Vandaar dus mijn terughoudende houding t.o.v. volautomatische bots: botbewerkingen hebben me gisteren dus meer revert-tijd gekost dan anoniem geklieder... en dat kan niet de bedoeling zijn ;-) De mooiste botresultaten zie ik eigenlijk van gebruikers die ze halfautomatisch draaien of zo. Of soms zie ik nadat een volautomatische bot gepasseerd is de achterliggende gebruiker zelf die reeks artikelen overlopen en correcties aanbrengen waar nodig. Dan weet je 95% zeker dat de correctie inhoudelijk en voor de mens ook steek houdt. Zo'n werkwijzen heb ik de voorbije jaren eigenlijk tot de meest bevredigende resultaten zien leiden... --LimoWreck 31 okt 2008 13:31 (CET)[reageren]
PS: voor alle duidelijkheid: het initiatief vind ik natuurlijk wel goed; alleen mogen we onze lat wel hoog genoeg leggen, en voor onszelf voldoende eisen stellen qua correctheid en/of kwaliteit; nietwaar ? ;-) --LimoWreck 31 okt 2008 17:16 (CET)[reageren]
Als je een wikipagina afdrukt wordt bij sommige browsers (in ieder geval Firefox) wél de volledige link gegeven. Jelte (WebBoy) 31 okt 2008 13:12 (CET)[reageren]
Cool, de browsers blijven me verbazen :-) --LimoWreck 31 okt 2008 13:31 (CET)[reageren]
Het is een functie van de MediaWiki-software. Bij andere sites werkt het dus niet. Jelte (WebBoy) 1 nov 2008 13:05 (CET)[reageren]

Bedankt voor de reacties en adviezen. Ik zal het botje in ieder geval voorlopig alleen semi-automatisch draaien. Vriendelijke groet, --Maurits 1 nov 2008 05:58 (CET) N.B. Overigens is een "verkeerde" beslissing van een bot op grond van foutieve data in een lemma natuurlijk wel iets anders dan vandalisme. Waarschijnlijk bedoel je dat de kwaliteit van de wijzigingen gegarandeerd moet zijn ;).[reageren]

Misschien is een andere oplossing nog om de bot een logfile te laten genereren met daarin pagina en url die is aangepast met nieuwe omschrijving. Dat is vrij snel door te lopen op rare omschrijvingen. Akoopal 1 nov 2008 21:09 (CET)[reageren]
Dat is nog gemakkelijker. Ik zal eens kijken of ik dat kan realiseren. Vriendelijke groet, --Maurits 5 nov 2008 01:14 (CET)[reageren]

tooltje gezocht[bewerken | brontekst bewerken]

Hoi, Ik ben op zoek naar een tooltje dat me het aantal (of nog beter een lijstje ) artikelen kan geven dat in twee (door de gebruiker te specificeren) categorieën voorkomt. Wie kan me hiermee helpen? Magalhães 5 nov 2008 09:47 (CET)[reageren]

Ik heb het antwoord inmiddels zelf al gevonden. Het kan met catscan. Magalhães 5 nov 2008 10:15 (CET)[reageren]