Wikipedia:De kroeg/Archief/20220117

Uit Wikipedia, de vrije encyclopedie

Ik ben begonnen de laatst gepubliceerde bevolkingscijfers van plaatsen in Estland te verwerken. Daarbij zag ik dat bots bezig zijn archieflinks toe te voegen aan de bronnen die genoemd worden in de artikelen over Estische plaatsen. Op zich best nuttig, maar ik zie dat ze ook archieflinks hebben proberen te creëren voor de website van het Estische Bureau voor de Statistiek met de meest recente cijfers en de website met de resultaten van de volkstelling van 2011. Dit heeft geen enkele zin. Kijk zelf maar. De gearchiveerde versie van de website met resultaten van de volkstelling lijkt beter, maar je kunt er niets in opzoeken. Probeer maar. Sijtze Reurich (overleg) 9 jan 2022 19:05 (CET)[reageer]

In het artikel Austla trof ik trouwens naast de bovengenoemde onbruikbare archieflink ook nog twee archieflinks aan naar de verkeerde webpagina's. Ik hoop toch niet dat al het werk van de bots gecontroleerd moet worden... Sijtze Reurich (overleg) 9 jan 2022 19:59 (CET)[reageer]
Zo te zien gaat het om de bot van mij. Inderdaad is het onmogelijk om 100% te controleren op bruikbare archieflinks, zoals ik ook opmerkte bij het botverzoek dat ik aanhaal in de botbewerkingen: "Uiteraard kunnen we niet botmatig controleren of de archiefversie goed bruikbaar is, zoals bdijkstra vraagt. Aan de andere kant: hoe erg is dat? De archiefversie staat dan immers zojuist op Archive.org, en de Archivebot zal hem dan toevoegen zodra de originele URL dood wordt." Als het om veel pagina's gaat, dan kan ik misschien groepen URL's laten overslaan, bijv. alles met www.saaremaa.ee erin.
Het voorbeeld in Austla lijkt op een fout in de API van Archive.org: het lijkt alsof hij het stukje 'ItemID=2953' ziet als een parameter van Archive.org zelf, i.p.v. als deel van de URL. Wikiwerner (overleg) 9 jan 2022 21:17 (CET)[reageer]
Zoiets zal het inderdaad wel zijn. Maar het is nu in orde. Met die andere link is iets nog veel ingewikkelders aan de hand. De archieflink verwijst naar de verkeerde pagina, maar de originele pagina is intussen doorgekoppeld naar een soort portal en verwijst dus nu naar een andere verkeerde pagina. Gelukkig heb ik ooit een keer een archiefversie van de originele pagina gemaakt, zij het dan op Archive.today in plaats van op Archive.org. Die staat dus nu in het artikel. Archiveren loont, dat blijkt maar weer eens. Sijtze Reurich (overleg) 9 jan 2022 22:21 (CET)[reageer]
Gelukkig maar dan! Ik heb het script zojuist iets aangepast. De hele originele URL moet nu terugkomen in de archief-URL, anders wordt de laatste niet geplaatst in het artikel. Wikiwerner (overleg) 9 jan 2022 22:42 (CET)[reageer]
(na bws) Eigenlijk zouden we bij dit soort gegevens niet moeten verwijzen naar de ingangspagina van de statistiekgenerator , maar naar de resultaatpagina. Maar open ik die URL van de resultaatpagina in een andere browser (of anderszins zonder daaraan voorafgaand de ingangspagina te bezoeken), dan wordt er geen resultaat getoond, maar de... ingangspagina. Vanaf de resultaatpagina kan ik wel de gegevens opslaan, bijvoorbeeld als CSV-bestand. Dat bestand zou ik zelfs kunnen uploaden naar Commons. Maar gelooft iedereen dan dat het daar opgeslagen bestand daadwerkelijk direct gegenereerd is uit de betreffende statistiekbron?
Er zijn meer statistiekbureaus die (nagenoeg) dezelfde ingangspagina gebruiken, wat het erg prettig werken maakt als je gegevens uit andere landen wil benaderen. Maar het direct weer beschikbaar maken, is best lastig.
Wikiwerner vraagt of dat erg is. Ik denk dat er, als er een archieflink ingevoerd is, weinigen de moeite zullen doen om te gaan zoeken naar een betere archieflink. Op termijn kan de huidige link vervallen (ook bij nationale statistiekbureaus verandert wel eens wat) en dan vertrouwen we op die archieflink. Is dat een onbruikbare link, dan hebben we daar niets aan. Dat zou dan kunnen betekenen dat we over vijf, tien of vijftig jaar niet meer kunnen controleren wat het inwonertal van Atla (Saaremaa) was per 1 januari 2021, door linkrot.
Het niet beschikbaar stellen van archieflinks zou anderen eerder kunnen prikkelen om te zoeken naar een betere oplossing, bijvoorbeeld Statistics Estonia vragen of het ook mogelijk is om de gegevens in een 'gewaarmerkt' PDF-bestand te verkrijgen, dat in Commons kan worden vastgelegd. Vanuit dat oogpunt voel ik meer voor het negeren van links als 'andmed.stat.ee', dan voor het overspoelen van Archive.org met duizenden verzoeken om deze verder nutteloze ingangspagina op te slaan. Is ook beter voor de goodwill van Archive.org.
Het lijkt verstandig om te inventariseren of er meer van dit soort pagina's zijn. Wellicht zou de bot kunnen tellen hoe vaak bepaalde links in Wikipedia gebruikt worden en als dat meer dan tien (vijftig? honderd? duizend?) keer is, deze negeren en vragen of deze alsnog gelinkt moeten worden. Met vriendelijke groet, RonnieV (overleg) 9 jan 2022 22:43 (CET)[reageer]
Overigens speelt dit probleem ook op Wikidata, dus wellicht kunnen we meer mensen vragen mee te denken. Met vriendelijke groet, RonnieV (overleg) 9 jan 2022 22:45 (CET)[reageer]
Bij artikelen over spinnen, waarbij de World Spider Catalog als referentie voor de taxonomie was gebruikt, zie ik regelmatig dat InternetArchiveBot een oudere versie van die Catalog als archieflink toevoegt, terwijl er dan wel een gearchiveerde versie bestaat die van net na het gebruik van de Catalog voor ons artikel dateert. Dat is ronduit onhandig. En tot mijn verbazing zag ik dat diezelfde bot nu ook Archive.org links geeft naar pagina's die wij uit de Biodiversity Heritage Library (BHL) halen. Die twee projecten zijn twee handen op één buik. Als de ene omvalt, valt de andere ook om, dus wat voor nut heeft het dan om er een extra archieflink aan toe te voegen? Te weinig nuttig werk te doen? WIKIKLAAS overleg 10 jan 2022 03:16 (CET)[reageer]

Wikipedia wordt genoemd! (Met etymologische nonsens)[bewerken | brontekst bewerken]

Ik word niet blij van de manier waarop Nicoline van der Sijs, Nederlands bekendste etymologe, ons moet noemen in verband met Huzarensalade: Etymologica: de huzarensalade.

En we hebben het verdiend, want een groot deel van onze etymologische informatie is bagger als er geen betrouwbare bron bij staat.

Oproep: wees extra kritisch op zulke info, vooral als er een uitgesponnen verhaal bijhoort. Woordkunde leent zich nu eenmaal voor snelle gevolgtrekkingen en fraaie anekdotes. Bij twijfel schrappen! Ook Hugo de Groot ging de mist in (onderaan)  →bertux 10 jan 2022 09:37 (CET)[reageer]

Maar we kunnen nu wél met z’n allen de kracht van wikipedia laten zien, door het artikel samen binnen een dag te verbouwen tot een verhaal dat wél klopt. Mét bronnen. Sietske | Reageren? 10 jan 2022 10:28 (CET)[reageer]
We waren er inmiddels al voortvarend mee begonnen - alleen zaten we elkaar wat in de weg :-) Thieu1972 (overleg) 10 jan 2022 12:04 (CET)[reageer]
Ik heb Nicoline van der Sijs in de commentaarsectie van haar artikel al terugkoppeling gegeven over de bewerkingswoede die is losgebarsten over dit gerecht  →bertux 10 jan 2022 18:01 (CET)[reageer]
Ik heb het op de ENWP ook even aangepast, want daar beweerden ze nog doodleuk dat het met Hongaarse huzaren van doen had! Tsssss..... Thieu1972 (overleg) 10 jan 2022 18:06 (CET)[reageer]
Wat mij overigens niet duidelijk is: is een russisch ei hetzelfde als een russische salade? Want dan kunnen al die afbeeldingen van salades op huzarensalade daarheen verplaatst worden. Sietske | Reageren? 10 jan 2022 11:54 (CET)[reageer]

Loskoppeling[bewerken | brontekst bewerken]

  • Zou ons artikel huzarensalade niet losgekkopeld worden van het huidige wikidata-item aangezien Van der Sijs stelt dat de huzarensalade en de Russische of Oliviers salade allebei een aparte oorspong hebben? Nu is het artikel Huzarensalade dus aan deze Russische salade gekoppeld. Melvinvk (overleg) 10 jan 2022 12:57 (CET)[reageer]
Dat bedoel ik idd: is een russisch ei hetzelfde als een russische salade? Want dan kan dat omgegooid worden. Sietske | Reageren? 10 jan 2022 13:15 (CET)[reageer]
Geen ei te zien in de Russische salade? Hobbema (overleg) 10 jan 2022 13:20 (CET)[reageer]
Ik heb 'm aan een nieuw wikidata-item gekoppeld. Het is inmiddels wel duidelijk dat de huzarensalade een op zichzelf staand gerecht is. Thieu1972 (overleg) 10 jan 2022 17:41 (CET)[reageer]
Bij de Jumbo hebben ze huzarensalade met paardenvlees. Hobbema (overleg) 10 jan 2022 17:51 (CET)[reageer]