Wikipedia:De kroeg/Archief/20210812

Uit Wikipedia, de vrije encyclopedie

Hallo allemaal,

Dankzij de hulp van verschillende Wikipedianen schiet het eigenlijk al best op met het ontwikkelen van een kwaliteitsschaal voor de Nederlandstalige Wikipedia op basis van de kunstmatige intelligentie van WP:ORES. De grootste vertragingen zitten in een overgang van het Machine Learning Team en de overgang naar een nieuw softwaremodel genaamd Lift Wing dat de ORES functionaliteiten in de toekomst zal overnemen.

Graag wil ik aan jullie de nieuwste versie van de voorgestelde kwaliteitsschaal voorleggen, ik noem het "1c". Na de eerste twee ruwe modellen is het nu de bedoeling om verder te gaan verfijnen. In de kwaliteitsschaal zien jullie 5 categorieën kwaliteitsstandaard, A= Etalage, E= minimumkwaliteit. Vooral de verschillen tussen B, C, en D vind ik wat moeilijker om te duiden, dus ik ben erg benieuwd naar jullie inbreng hiervoor.

Vriendelijke groet, Ciell need me? ping me! 30 jul 2021 10:26 (CEST)[reageren]

Kleine suggestie (als die nog op tijd komt): nummer de kwaliteit andersom: A=Aanzetje (minimum/beginnetje); E=Etalage. Je hebt dan altijd nog de ruimte om met F verder te gaan als er een nóg betere klasse bij komt. (Ik refereer aan de fout die gemaakt werd bij de energielabels. Al snel was A niet zuinig genoeg meer en werd het A+, A++, A+++ enzovoorts. Tot ze alles noodgedwongen moesten herdefiniëren omdat het aantal plusjes uit de hand liep. Dat probleem had er nooit geweest als ze de andere kant uit hadden genummerd.) Erik Wannee (overleg) 30 jul 2021 11:44 (CEST)[reageren]
Dat is een interessante suggestie Erik, die neem ik zeker mee! Ciell need me? ping me! 30 jul 2021 11:47 (CEST)[reageren]
Hoewel ik de suggestie inderdaad interessant vind, zou ik hier niet voor gaan. Het sluit niet aan bij de gebruiken op andere Wikipedia's. Als we vinden dat we van een vijfpuntsschaal naar een zes-, zeven- of tien-puntsschaal willen gaan, is het weinig werk om deze nieuwe schalen toe te voegen en er hoeft niets aan de beoordeelde artikelen zelf te gebeuren om de artikelen die nu een A-classificatie hebben, straks als B aan te duiden (mochten we ooit nog iets boven de Etalage gaan instellen) of de E-artikelen als F (of G, H, Z...) aan te duiden als we schalen tussenvoegen. Bij de energielabels was het label gekoppeld aan een bepaald energieverbruik voor een bepaalde dienst (een schone was kost .. kWh met deze machine bij deze temperatuur of een lamp geeft xx lumen voor dit .. Watt). Onze schalen zijn relatief en kijken naar de stand van zaken volgens de huidige normen. Dat revisie x van artikel y op dit moment als D geclassificeerd wordt en over een jaar met de dan ingevoerde zevenpuntsschaal als E of F is geen probleem: de classificatie wordt gewoon opnieuw berekend volgens de dan geldende schaal. Met vriendelijke groet, RonnieV (overleg) 30 jul 2021 12:48 (CEST)[reageren]
Mag ik alvast de hoop uitspreken dat die kwaliteitsschaal op de overlegpagina van het artikel blijft en niet resulteert in de zeursjablonen die op zowat een derde van de artikelen in de Engelse Wikipedia prominent op de pagina zelf staan? Sijtze Reurich (overleg) 30 jul 2021 12:03 (CEST)[reageren]
Nee, daar zie ik geen reden toe: het zal, als het aan mij ligt, een uitbreiding worden van mogelijkheden die je via de persoonlijke voorkeuren toe kunt voegen aan je scherm, zoals nu ook bijvoorbeeld al met Twinkle het geval is. Handig voor Wikimedianen of bv partners die een lijst willen hebben voor een project ter verbetering van de encyclopedie op artikelniveau, en voor andere geïnteresseerden. Voor de 'gewone voorbijganger' heeft het verder weinig meerwaarde, en het zal ook niet de officiële Etalage kunnen vervangen.
Op dit moment kun je al wel meekijken met de scores: door onderstaande code toe te voegen aan je persoonlijke common.js kan deze extensie geactiveerd worden, de waardering zie je dan bovenin je scherm net onder de paginatitel. Ciell need me? ping me! 30 jul 2021 12:37 (CEST) importScript("User:EpochFail/ArticleQuality.js");[reageren]
Aanzetten is, dankzij Bas deHaan, nu ook mogelijk via je voorkeuren onder "hulpmiddelen" -> Deze extensie kan worden geactiveerd door "Toon ORES-kwaliteitsschaal boven artikelen." in te schakelen op het uitbreidingen tabblad van de gebruikersvoorkeuren. Ciell need me? ping me! 31 jul 2021 15:06 (CEST)[reageren]
Hiernaast zie je een voorbeeldje van hoe het eruit ziet. Het neemt dus niet een groot deel van de ruimte voor een artikel in gebruik, Sijtze Reurich. Met vriendelijke groet, RonnieV (overleg) 30 jul 2021 13:31 (CEST)[reageren]
Dank! Zo is het inderdaad niet opdringerig. Sijtze Reurich (overleg) 30 jul 2021 13:40 (CEST)[reageren]
Steun Steun Een voorstel om iets als dit in te voeren is er lang geleden al eens geweest, zie Wikipedia:Stemlokaal/Aanbevolen artikel (destijds op touw gezet door gebruiker:Heinonlein), maar zoals het gaat met zoveel serieuze initiatieven werd ook dit weer afgeschoten. Overigens lijkt dit nieuwe systeem me ook zeker niet verkeerd, wellicht zelfs beter dan het oude voorstel aangezien het alle artikelen betreft, niet alleen de crème de la crème (of wat dan daarvoor moet doorgaan). De Wikischim (overleg) 30 jul 2021 12:06 (CEST)[reageren]
Mooi idee. uigaande van de conventies van wikipedia en de eisen van een etalage-artikel zou je aan iets als het volgende kunnen denken, hgHenriDuvent 30 jul 2021 12:54 (CEST)[reageren]
  • Etalage: Voldoende uitgebreid (+++), Juist/verifieerbaar (++), neutraal (++), stabiel (++), juiste structuur WP (++), Goede illustraties (++), Goed geschreven (+++)
  • Heel goed: Voldoende uitgebreid (++), Juist/verifieerbaar (++), neutraal (++), stabiel (++), juiste structuur WP (++), Goede illustraties (+), Goed geschreven (++)
  • Goed: Voldoende uitgebreid (+), Juist/verifieerbaar (++), neutraal (++), stabiel (+), juiste structuur WP (+), Goede illustraties (-), Goed geschreven (+)
  • Matig: Voldoende uitgebreid (-), Juist/verifieerbaar (+), neutraal (+), stabiel (+), juiste structuur WP (+), Goede illustraties (-), Goed geschreven (+)
  • Minimum: Voldoende uitgebreid (-), Juist/verifieerbaar (+), neutraal (+), stabiel (-), juiste structuur WP (-), Goede illustraties (-), Goed geschreven (-)
Bovenstaande samenvatting van HenriDuvent komt aardig overeen met de (voorgestelde) lijst eisen hier. Met vriendelijke groet, RonnieV (overleg) 30 jul 2021 13:19 (CEST)[reageren]
hoe kan kunstmatige intelligentie de juistheid beoordelen? Rwzi (overleg) 30 jul 2021 13:10 (CEST)[reageren]
Niet. Het systeem kijkt wat de overeenkomsten zijn tussen bewerkingen die teruggedraaid zijn en maakt daaruit een inschatting wat goede tekst is en wat niet. Ook spelfouten en andere taalfouten kunnen een rol spelen in die beoordeling. Mijn persoonlijke ervaring is, dat een slecht geschreven tekst bijna altijd ook inhoudelijke fouten bevat of niet onderbouwd is  →bertux 30 jul 2021 16:01 (CEST)[reageren]
Wat je zegt klopt voor de revision-scoring (=wijzigingscontrole), maar dat is niet hetzelfde als wat er nu getraind wordt met de artikelkwaliteit: dit is een tweede element van de AI (=Artificial Intelligence die ORES heet) die hier getraind wordt. Nu is "juistheid" al iets wat voor ons mensen moeilijk te beoordelen is, maar we zijn het systeem zeker het kwalitatieve verschil aan het leren tussen bijvoorbeeld nationale kranten en persoonlijke blogs. Ciell need me? ping me! 30 jul 2021 16:31 (CEST)[reageren]

@ Ciell: moet er niet een puntkomma achter je code? Mijn syntaxcontrole dringt daarop aan en in elk geval werkt hij met de puntkomma goed

Alles beschouwend denk ik dat het kwaliteitskeurmerk slechts zin heeft voor een zeer kleine doelgroep, namelijk mensen die artikelen van slechte kwaliteit willen verbeteren. Ook voor die doelgroep is het nut beperkt, want nu is er ook al ruimschoots toegang tot slechte artikelen; kijk alleen al op de beoordelingslijst en WP:Dit kan beter. Ik zelf zal het in mijn voorkeuren niet aan zetten, dat weet ik nu al.
Voor de gewone lezer heeft het geen enkel nut: iemand die wil weten wat een stokschroef is, typt dat woord in in het zoekregeltje, en krijgt een artikel onder ogen dat uitleg geeft. De lezer zou heus niet besluiten om het artikel niet te lezen als er twee sterren bij staan en wel als er drie sterren bij staan. Erik Wannee (overleg) 30 jul 2021 16:16 (CEST)[reageren]
Volgens mij moet de puntkomma erachter als je daarna nog andere scriptjes inlaadt inderdaad, als ik jouw en mijn common.js vergelijk. Ciell need me? ping me! 30 jul 2021 16:35 (CEST)[reageren]
Voorbeeld van een lijstje artikelen met ORES-scores
Verder: dit is op dit moment echt een van de weinige manieren om een globaal overzicht te krijgen in de artikelkwaliteit van een bepaalde categorie, zonder alle artikelen in die categorie handmatig na te moeten lopen. Misschien voor jou als wijzigingencontroleur inderdaad niet interessant, maar er zijn genoeg mensen die er wel wat aan zullen hebben. Ciell need me? ping me! 30 jul 2021 16:39 (CEST)[reageren]
Ik heb wat zitten experimenteren met het kwaliteitskeurmerk. Het doet me genoegen dat ik diverse artikelen van de B-categorie heb aangemaakt en tenminste één van de A-categorie: Estische Onafhankelijkheidsoorlog. Sommige artikelen had ik wat hoger en andere wat lager ingeschat, maar dat is onvermijdelijk. Sijtze Reurich (overleg) 30 jul 2021 18:24 (CEST)[reageren]
Een kleine afwijking kan inderdaad, maar als je werkelijk uitwassen tegenkomt of gewoon al zaken waarvan je wenkbrauwen omhoog gaan, laat ze gerust achter voor de ontwikkelaars in de vreemde eendensectie. Ciell need me? ping me! 30 jul 2021 22:10 (CEST)[reageren]
Het ORES is gestart als een test. Ik lees niets meer over een test. Het wordt hierboven gebracht als iets definitiefs, zo lijkt het. Heb ik iets gemist? HT (overleg) 30 jul 2021 18:27 (CEST)[reageren]
Hoe definieer jij een test? Zonder training en ontwikkeling door een groep mensen werkt kunstmatige intelligentie namelijk niet? Dat stadium zijn we zeker nog niet voorbij. Ciell need me? ping me! 30 jul 2021 22:12 (CEST)[reageren]
Idem dito. Ik vroeg me al af of werkelijk iedereen dit ding vertrouwt. Kijk alleen al de discussies over de import vanuit Wikidata. Wat is in dit geval kwaliteit?, als inhoudelijke beoordeling buiten het logaritme zal moeten worden gehouden, omdat die praktisch gezien niet uitvoerbaar kan zijn. Dit is naar mijn idee geen tool voor in de header maar met goede wil voor in de footer. Hellup. Ymnes (overleg) 30 jul 2021 20:52 (CEST)[reageren]
ORES, Wikidatalink en categorieën staan bij mij bij elkaar bovenaan de pagina
Zolang het niet in de centrale common.js komt, is de beoordeling alleen te zien voor wie het bewust aanzet. Ik heb bv ook een Wikidata samenvatting onder alle paginatitels staan, ik vind dat soort informatie in mijn onderhoudswerk handig. Verder is 'vertrouwen' niet het doel van de ORES-kwaliteitsschaal, daar werken mensenogen echt het beste voor. Maar als jij wilt weten wat de huidige dekking is van de 100 belangrijkste onderwerpen op de Baskische Wikipedia, kun je dat in een oogopslag zien in hun lijst. (De eu-wikipedia heeft er wel voor gekozen om de code in hun algemene common.js te zetten, vandaar dat iedereen die de wiki bezoekt het daar wel gelijk ziet.) Ciell need me? ping me! 30 jul 2021 22:22 (CEST)[reageren]
Ik vind het wel een handig hulpmiddel, maar volmaakt is het niet. Twee duidelijke verbeteringen leverden mij als beloning een lagere score op, vermoedelijk doordat ik bytes verwijderde  →bertux 30 jul 2021 21:26 (CEST)[reageren]
Klopt, een redelijk belangrijk deel van de berekening is de lengte van het artikel. Mijn ervaring is wel dat dit eindig is, de langste pagina's op Wikipedia zijn zelden geclassificeerd als A-kwaliteit Dajasj (overleg) 30 jul 2021 21:30 (CEST)[reageren]
@Bertux, zie ik het goed dat de waardering van een artikel omlaag ging nadat je categorieën verwijderde? Ben jij daar echt voor? Ymnes (overleg) 30 jul 2021 21:40 (CEST)[reageren]
(na bwc) Er staat dat een A-artikel "feitelijk juist" moet zijn. Als uitleg staat er: "feitelijk juist" omvat het verifieerbaar maken van feiten door het citeren van bronnen in een sectie bronvermelding. Ook kan waar relevant gebruik gemaakt worden van referenties en voetnoten." Dus in elk geval een sectie bronvermelding en eventueel referenties en voetnoten. Een sectie bronvermelding geeft echter geen enkele garantie dat de tekst automatisch correct is. Een dergelijke opsomming geeft verder alleen een momentopname. Bij elke aanvulling van de tekst, zonder referentie, is het al onduidelijk wat de bron is en of de sectie nog wel voldoet. Hoe meer aanvullingen, hoe onzekerder die sectie wordt. Een lemma kan daardoor alleen als Goed worden beoordeeld als er voldoende referenties zijn. En dan wordt het nog steeds lastig classificeren, want de meeste lemma's zijn deels of helemaal bronloos. Maar een bronloos lemma hoeft niet onjuist te zijn. Verder blijkt uit de praktijk dat veel te vaak de bronnen niet goed in een lemma verwoord worden, waardoor er onjuistheden in lemma's staan of dat naast een sectie bronvermelding ook WP:GOO is toegepast. Ten tweede, ik zou in elk geval geen vergelijkingen gaan maken met wat hier doorgaat als de Etalage. Lezers gaan het niet begrijpen als er een apart ORES-systeem is voor etalage-aanduidingen en een 'eigen' Etalage van Wikipedia. Ik zou ook niet veel klassen introduceren. Iets als Goed is meer dan genoeg, en de rest krijgt gewoon geen waardering. Ik begrijp verder dat de lemma's handmatig een classificatie krijgen, dus beoordeeld worden door Wikipedianen. Het gaat dan sowieso niet lukken om allerlei classificaties te creëren. Als we dat handmatig moeten gaan doen, wordt het véél te ingewikkeld. De jury's van de WP-Schrijfwedstrijd gaven altijd al aan dat het ondoenlijk is om een lemma dat aan de schrijfwedstrijd meedoet op juistheid te controleren. En dan zijn ze met zijn vijven, gaat het om een zeer beperkt aantal lemma's en er is liefst twee maanden de tijd. Maar het lukt ze niet. HT (overleg) 30 jul 2021 21:53 (CEST)[reageren]
Hi HT: "feitelijk juist" is overgenomen van de Etalage-criteria (zoals onder punt 5 staat beschreven): suggereer je dat dit onderdeel voor de A-klasse in ORES zou moeten vervallen? Computers zijn vrij slim en de ontwikkelaars verzoeken juist ook om dit soort "subjectieve" criteria op te nemen. ORES kan dit in potentie aanleren namelijk.
Verder wordt ORES inderdaad nu getraind door Wikipedianen, en in het nieuwe systeem van Lift Wing zal zelfs een cyclische controle zitten: als jij deze instelling aan hebt staan, zal het systeem af en toe bij jouw checken om te zien wat jij van de inschatting vond, waardoor de training van het systeem regelmatig aangepast wordt. Ciell need me? ping me! 30 jul 2021 22:08 (CEST)[reageren]
Uit Ik begrijp verder dat de lemma's handmatig een classificatie krijgen, dus beoordeeld worden door Wikipedianen lijkt het alsof HT denkt dat de beoordelingen handmatig ingevoerd worden? Dat is niet het geval, ieder artikel(versie) krijgt wat dat betreft 'automatisch' een oordeel. Momenteel worden die oordelen dus steekproefsgewijs beoordeeld door Wikipedia-gebruikers, maar het is in eerste instantie geen mensenwerk (dat zou inderdaad ondoenlijk zijn en is juist de reden om de 'ORES-machine' in te zetten). Encycloon (overleg) 30 jul 2021 22:46 (CEST)[reageren]
Ymnes, zie de eerste van de twee links. Die categorieën waren fout, dus verwijdering was een overduidelijke verbetering. In het algemeen ben ik voor royaal categoriseren  →bertux 30 jul 2021 23:21 (CEST)[reageren]
En vinden jullie het correct als de score van ORES omhoog of omlaag gaat bij meer of minder categorieën? Moet het anders, is er een minimum, maximum? Of moeten categorieën helemaal niet meewegen? Ciell need me? ping me! 30 jul 2021 23:36 (CEST)[reageren]
@Ciell Wat betreft je vraag hierboven over de categorieën, het aantal daarvan in de tekst is niet relevant voor de kwaliteit van een lemma en zouden dus niet mee moeten wegen. Je vraagt mij ook of ik vind dat het onderdeel dat een lemma "feitelijk juist" moet zijn, voor de A-klasse dient te vervallen. Nee hoor, maar wel dat de definitie daarvan aangepast wordt. HT (overleg) 31 jul 2021 07:46 (CEST)[reageren]
En waar denk je dan aan? En, klein zijspoortje, zou dit dan ook aangepast moeten worden in de huidige criteria voor een etalage-artikel misschien? Ciell need me? ping me! 31 jul 2021 09:06 (CEST)[reageren]
Wil je de relevantie van een lemma meewegen bij de beoordeling? René Descartes, die zijn eigen categorie heeft en nog een zwik categorieën die hoog in de boom zitten, is ongetwijfeld relevanter dan iets uit de Lijsten van personages uit stripverhalen. (Descartes heeft trouwens A (4.69), hoger dan ik me kan herinneren van de tientallen etalageartikelen waar ik de scores van bekeken heb. Wie?)
4,69 is zeker een mooie score! Er is hier vast iemand die de etalagegang van Descartes wil begeleiden. Overigens heb ik enkele (etalage)artikelen gevonden met een rating van 4,73: Beleg van Breda (1624-1625), Decamerone, Heiligdomsvaart van Maastricht, Oud-Griekse astronomie, Paus Johannes Paulus I en Qanat. Met vriendelijke groet, RonnieV (overleg) 2 aug 2021 23:10 (CEST)[reageren]
Relevantie is een soort externe kwaliteit, dus ik ben er niet meteen tegen om dat aspect mee te wegen – eventueel via de categorieboom – maar dat vraagt wel om bezinning over de ontwerpfilosofie van ORES. Daar weet jij vast veel meer van dan ik, maar meestal kun je schoenen beter afwerken op de leest waar je mee begon. Eventueel zou een relevantiebeoordeling een eigen traject kunnen zijn, zie ook de Engelse Wikipedia, waar kwaliteit en 'importance' elk een beoordeling krijgen.
Eens met HT dat categorieën weinig zeggen over de kwaliteit (de interne kwaliteit) van een lemma  →bertux 31 jul 2021 10:49 (CEST)[reageren]
Wat betreft de weergave zou ik alleen gaan voor het icoontje. De omschrijving "Kwaliteitsinschatting door ORES" is overbodig, lelijk en onnodige promotie voor het systeem zelf. Ten tweede: het ORES-systeem heeft zijn beperkingen. Inhoudelijke fouten en omissies kunnen bijvoorbeeld niet geconstateerd worden. Het heeft daarom geen nut om specificaties tot twee cijfers achter de komma te geven. Als ik op het icoontje klik, word ik doorverwezen naar een pagina met technische uitleg, deels in het Engels en zelfs Russisch. Het lijkt mij dat dit geen toegevoegde waarde heeft. Ik word er namelijk niet wijzer van. Als ORES een A-waardering geeft, en ik klik op de A, dan kom ik terecht op de pagina Wikipedia:Etalage, terwijl het lemma helemaal niet in de Etalage hoeft te staan. Hier word ik op het verkeerde been gezet. Wat ik zou voorstellen is om alleen het icoontje te plaatsen. In het icoontje komt de letter te staan. Is het icoon daarvoor te klein, dan wordt het gewoon groter afgebeeld. En er komen geen verwijzingen naar een A-status voor lemma's die niet daadwerkelijk in de Etalage staan. En als ik op een icoon klik, word ik gewoon doorverwezen naar een pagina met fatsoenlijke uitleg over de kwaliteitsstatus, zonder Engels of andere vreemde taal, waarbij ook de beperkingen van het ORES-systeem worden geduid én dat het hele project zich nog in een testfase bevindt. De ORES-gegevens in de geschiedenis van de lemma's zou ik schrappen omdat het niet relevant is (het is geen gezaghebbende bron: het kan nog niet één fout traceren) en is vooral lelijk en storend met al die kleurtjes. In dp-pagina's en lijst-pagina's zou ik de ORES-kwalificering schrappen. Die komen verre van overeen met de kwaliteit daarvan. HT (overleg) 1 aug 2021 09:08 (CEST)[reageren]
my 2 cents. De twee decimalen achter de komma is een prima keus. Dus aub zo laten. Zo kan ieder namelijk het effect zien van een wijziging. Vooral nu het systeem nog in ontwikkeling is erg nuttig. Zie vragen hieronder. Maar wellicht worden in de toekomst persoonlijke instellingen mogelijk gemaakt. Elly (overleg) 1 aug 2021 10:03 (CEST)[reageren]
Niet goed gekeken, zie dat de icoontjes vanaf B al een letter hebben, dan is de toevoeging met dezelfde letter ernaast helemaal overbodig. Ik zou dan het sterretje aanpassen naar een icoontje met een A erin en de lemma's met een ster voorbehouden aan die in de Etalage staan. Die hebben al een ster en daar hoeft dus via de ORES-kwalificering geen tweede bij te komen. HT (overleg) 1 aug 2021 12:53 (CEST)[reageren]
HT: "De omschrijving "Kwaliteitsinschatting door ORES" is overbodig,.." Ik denk dat het juist goed is om ORES daar te noemen, om het onderscheid te maken met bv de sterren en FA-links die we in de linkerkolom naast de interwikilinks hebben staan. Dát zijn namelijk wel menselijke beoordeling. De tekst "Kwaliteitsinschatting door ORES" is bedoeld om een voorbehoud voor de inschatting te geven.
De link naar Wikipedia:Etalage vanuit de A-kwalificatie is in die zin dus inderdaad ook niet correct: @RonnieV, zou jij dit misschien aan willen passen in het sjabloon? Ciell need me? ping me! 2 aug 2021 08:48 (CEST)[reageren]
U vraagt, wij draaien ;) Het verwijst nu naar de omschrijving.
Waar Happytravels een deels Russische tekst meent te zien, weet ik niet. Wie weet wil hij de pagina zelf aangeven.
Ik ben het met Ciell eens dat de tekst wel degelijk toegevoegde waarde heeft. We kunnen niet van willekeurige lezers verwachten dat zij weten waar een los sterretje (of welk ander symbool dan ook) voor staat. De huidige symbolen zijn overgenomen van de Engelse collega's, maar kunnen desgewenst vervangen worden door iets anders. De aanduiding in twee decimalen geeft meer informatie dan alleen de vijf (nu) onderscheiden klassen. Wat mij betreft houden we dat erin. Met vriendelijke groet, RonnieV (overleg) 2 aug 2021 11:10 (CEST)[reageren]
@RonnieV:. In antwoord op je vraag: als je op de ster klikt komt onder meer de volgende Russische tekst tevoorschijn: "Русский: Иконка для Избранных статей Википедии". mvg. HT (overleg) 2 aug 2021 11:59 (CEST)[reageren]
@RonnieV: Wat betreft mijn voorkeur voor het alleen plaatsen van een icoontje. Een lezer heeft al heel snel in de gaten waar ze voor staan. Je kunt er namelijk op klikken. Vrijwel iedereen zal dit begrijpen, ook omdat internet sowieso al werkt met interne links, zoals Wikipedia. Het heeft echter geen zin om de lezer tot het eind van hun leven bij elk lemma voor te schotelen dat het icoontje staat voor 'kwaliteitsinschatting door ORES'. Al bij het tweede lemma vond ik dat irritant worden. Wat ORES dan weer is, wordt verder niet duidelijk, want daar kan je dan weer niet op klikken. Hoe dan ook heeft de weergave geen professionele uitstraling. Overigens lukt het mij niet ze ook op mijn mobieltje zichtbaar te krijgen. HT (overleg) 2 aug 2021 12:13 (CEST)[reageren]
(na bwc) @Happytravels:, bij iedere afbeelding op Wikipedia is het gebruikelijk dat klikken op de afbeelding je naar de afbeelding en de informatie erover op Commons brengt. In dit geval is bij de afbeelding een Engelse en een Russische omschrijving aanwezig, en nu ook een Nederlandse.
Fijn dat je aangeeft waarom jij het icoontje vindt volstaan. Vooralsnog trekt Wikipedia dagelijks nieuwe lezers, en daar zitten ook mensen bij die niet meteen begrijpen hoe dit zit en werkt. De tip om ORES ook te linken vind ik wel een goede, daar ga ik zo even naar kijken. Dat jij het niet professioneel vindt, is je goed recht. Een afbeelding op Wikipedia mag formeel geen link zijn, omdat de informatie over de afbeelding te vinden moet zijn. Met vriendelijke groet, RonnieV (overleg) 2 aug 2021 12:24 (CEST)[reageren]
@RonnieV: De Engelstalige Wikipedia geeft ook alleen maar met een icoontje de belangrijkheid van de lemma's aan. Zie bijvoorbeeld de lemma's die beoordeeld worden als een 'good article'. Zie bijvoorbeeld en:Agriculture. Het icoontje staat helemaal rechts, wat ik ook zou voorstellen voor de Nederlandstalige Wikipedia, minder storend dan nu aan de linkerkant. Klik ik op dat icoontje, dan kom ik niet uit op een soort commonspagina, maar word ik direct doorgeleid naar een pagina met goede uitleg over wat dit icoontje inhoudt (zie en:Wikipedia:Good articles). Hetzelfde geldt voor de etalage-artikelen (en:Wikipedia:Featured_articles). Iets dergelijks lijkt mij ook geschikt voor de Nederlandse Wikipedia, dus geen aparte etalage-divisie naast de huidige. HT (overleg) 2 aug 2021 18:43 (CEST)[reageren]
Voorbeeld van Agriculture, met Good Article aanduiding (rechts) en ORES-inschatting (links)
@Happytravels:, zoals je hiernaast kunt zien, verwar je twee kwalificaties. Rechts staat de handmatige beoordeling door bewerkers van de Engelstalige Wikipedia, links de inschatting door ORES. Het eerste wordt verzorgd door het sjabloon {{:en:tl|good article}}, het tweede door ORES. Met vriendelijke groet, RonnieV (overleg) 2 aug 2021 19:30 (CEST)[reageren]
@RonnieV: Mijn voorstel blijft om bij de informatie over de ORES-kwaliteit de weergave aan te houden van de Engelstalige Wikipedia voor 'good article'. Het blijkt dat alleen een icoontje plaatsen met een interne link naar een pagina met fatsoenlijke uitleg op Wikipedia gewoon kan. Dat die ook aan een linkerkant van de pagina een ellenlange regel heeft voor de ORES-gegevens doet daar niet aan af. That's it. mvg. HT (overleg) 2 aug 2021 19:40 (CEST)[reageren]
Het staat je vrij om wat dan ook voor te stellen. Er kan technisch van alles. Maar zoals je hierboven kan lezen sta jij (voorlopig) alleen in je opvatting. Daarbij is het niet handig om op de ene Wiki een handmatige beoordeling rechtsboven te zetten en op een andere een ORES-inschatting zonder enige toelichting op die plek. Daarnaast is het volgens mij verplicht om bij gebruik van een afbeelding informatie over die afbeelding te geven, wat haaks staat op het gebruik van een afbeelding als link. Met opmerkingen als ellenlange regel voor drie woorden van bij elkaar 32 tekens maak je het moeilijk jouw opmerking serieus te nemen. Groet, RonnieV (overleg) 2 aug 2021 23:27 (CEST)[reageren]
Het is niet heel raar om het icoontje aanklikbaar te maken denk ik, en ook technisch makkelijk te doen. Ik denk dat het hier geen meerwaarde biedt omdat de letter er ook al naast staat. Het voordeel van het gebruik van èn het icoon èn de letter boven een artikel is dat het bij artikelen het handigst is om de letter te zien, en in overzichtslijsten de meeste mensen een makkelijker overzicht hebben met kleuren en symbolen. Op de Engelse Wikipedia zie ik trouwens dat het icoontje ook gewoon de bestandslink naar de afbeelding heeft, de tekst van de categorie leidt naar de Wikipedia-categorie met alle artikelen die deze classificering heeft. Ciell need me? ping me! 3 aug 2021 07:18 (CEST)[reageren]
Hi, nog even ter verduidelijking
we werken nu nog met het getrainde model van versie 1b, de hierboven door mij gelinkte 1c wil ik aan jullie voorleggen voordat we het systeem weer verder gaan trainen. Zoals je ziet is 1c een stuk specifieker dan 1b was, en inderdaad is de C-klasse in eerste instantie enkel getraind op lengte van een artikel in bytes. Dus hierbij misschien nog even voor de duidelijkheid de vraag: waar liggen volgens jullie de grenzen? Wat zijn de minimumeisen voor een klasse, en waar ligt de grens met de volgende? Ciell need me? ping me! 30 jul 2021 22:08 (CEST)[reageren]
Is er ook overwogen om de lengte in aantal woorden te meten, met uitsluiting van de infobox? Dat lijkt me zinniger dan bytes  →bertux 31 jul 2021 10:54 (CEST)[reageren]
Op suggestie van Effeietsanders gaan we nu inderdaad spreken van 'geschoonde tekst', de inhoud van een pagina zonder sjablonen en tabellen. Ciell need me? ping me! 2 aug 2021 08:49 (CEST)[reageren]

Versiegeschiedenis![bewerken | brontekst bewerken]

Weet je wat echt leuk is? Met de code die Ciell hierboven gaf, zie je ook de kwaliteit van elke versie in de geschiedenis! Na het opslaan zie je dus meteen een inschatting van de waarde van je inspanningen! Langere artikelen waar ik veel werk in heb gestoken komen daardoor altijd op of boven de 4 in de kwaliteitsschaal (Ruwe diamanten). Zelfs Fysiologische veranderingen tijdens de zwangerschap, waar nog best wat aan gedaan moet worden, maar waar ik tijdens het werk fysiek ziek werd van de artikelzwangerschap  →bertux 30 jul 2021 16:19 (CEST)[reageren]

Doe dat voor de aardigheid eens met Värska (plaats). De versie van 3 aug 2021 10:49 scoort C (2.9), de verder uitgebreide versie van 3 aug 2021 14:42 scoort C (2.74), de nog verder uitgebreide versie van 3 aug 2021 15:53 scoort nog steeds C (2.74). Dan krijgen we op 3 aug 2021 19:00 een flinke uitbreiding en is de score ineens D (2.8). Hogere score, lagere waardering. Er moet dus nog wat gesleuteld worden aan het beoordelingssysteem. Sijtze Reurich (overleg) 5 aug 2021 07:52 (CEST)[reageren]
@Ciell: inderdaad, werk aan de winkel, veel werk. Ook apart: het toevoegen van een infobox laat de score kelderen van 2,13 naar 1,52, wat des te raarder is omdat meer bytes een hogere score geven. In de volgende versie brengt een update met bronvermelding de score dan op 2,17, marginaal beter dan de inboxloze, bronloze versie met verouderde gegevens  →bertux 5 aug 2021 08:26 (CEST)[reageren]
Hi Bertux, ik zag dit de afgelopen week vaker, en vermoed dat dit gedrag komt doordat er een sjabloon wordt toegevoegd met veel lege velden. Ciell need me? ping me! 5 aug 2021 09:12 (CEST)[reageren]

vragen[bewerken | brontekst bewerken]

Een fraaie uitbreiding, dank aan allen die hieraan hebben gewerkt! De versiegeschiedenis is inderdaad ook interessant. Het lijkt mij dat veel mensen vragen hebben. Hier de eerste van mij (ellywa).

  1. Hoe wordt de aanwezigheid van afbeeldingen gewaardeerd? Ik vind het zelf erg belangrijk... dat is ook de reden dat ik zoveel werk aan wikiportret. Ik vind artikelen zonder afbeelding veel minder aantrekkelijk en minder prettig om te lezen (mijn POV). Maar ik zie dat toevoegen van een afbeelding heel weinig effect heeft op de score. Bijv. de score van De Ploeg (Groningen) gaat door het toevoegen van het logo omhoog van 3.88 naar 3.89, minder dan 1%. Het aantal afbeeldingen ging van 0 naar 1. Hoe worden afbeeldingen gewaardeerd in dit systeem? Wat vinden anderen van zo een klein effect? Hoe is de waardering eventueel aan te passen? Elly (overleg) 31 jul 2021 11:30 (CEST)[reageren]
@Elly: in versie 1b, waar je nu de uitslag van ziet, zijn afbeeldingen nog niet meegenomen in de training van het model. Het kan dus kloppen dat dit weinig invloed heeft, ORES telt waarschijnlijk alleen de wijziging in bytes. Voor het nieuwe model (versie 1c) stel ik voor dat alle artikelen op A en B niveau een of meerdere afbeeldingen hebben: zou jij het daarmee eens zijn? Ciell need me? ping me! 31 jul 2021 13:53 (CEST)[reageren]
Hi @Ciell:. Zou ik het zeker mee eens zijn. Sterker, ik zou qua kwaliteit een relatie zien tussen de lengte van een artikel en het aantal afbeeldingen. Zo heeft Geschiedenis van Groningen ca 16 afbeeldingen. Gezien het aantal kopjes zou dat nog wel wat meer mogen zijn. Maar meer afbeeldingen dan kopjes wordt mogelijk weer teveel van het goede. En soms zijn er geen afbeeldingen mogelijk (bijv bij artikelen over hedendaagse kunstenaars. Dat zij dan zo. Die artikelen zijn niet optimaal. Elly (overleg) 31 jul 2021 17:49 (CEST)[reageren]


Er zitten toch nog wel haken en ogen aan. Een categorie toevoegen, bronnen toevoegen, opmaak toevoegen, en toch zakt de score als een pudding ineen. Je zou bijna denken dat mijn edit een vandalistische bewerking is. Edoderoo (overleg) 31 jul 2021 13:10 (CEST)[reageren]
En lege velden uit de infobox wissen verdubbelt de score? Vandalisme wordt blijkbaar echt beloond. Er is nog wel veel werk aan de winkel. Edoderoo (overleg) 31 jul 2021 13:14 (CEST)[reageren]
Bedankt Edo, dit ga ik zeker meenemen naar de ontwikkelaars. Ik kan me inderdaad voorstellen dat de initiële afname komt omdat er lege velden aan het artikel werden toegevoegd, maar het is interessant gedrag van ORES. Ciell need me? ping me! 31 jul 2021 13:57 (CEST)[reageren]
Als je toch naar de ontwikkelaars gaat, een praktisch punt dat niet met het vorige te maken heeft: Bij een drievoudige klik op een artikeltitel, om die te kopiëren, wordt de ORES-waardering meegekopieerd. Vervelend, en ik geef je op een briefje dat daardoor ook andere problemen zullen ontstaan. Achter de titel of voor de waardering moet een regelsprong, of een div-scheiding, of wat voor scheiding dan ook komen.
Het kan overigens ook aan het scriptje liggen, dat kan ik niet beoordelen  →bertux 31 jul 2021 14:55 (CEST)[reageren]
Het lag aan het scriptje; bij activering via de voorkeuren doet het zich niet voor →bertux 31 jul 2021 20:09 (CEST)[reageren]
Nog een aparte: oplossen van een dp-melding doet de score zakken: hier. Edoderoo (overleg) 31 jul 2021 15:02 (CEST)[reageren]
Even met 2 van 'mijn' artikelen getest. Het ene krijgt een B, het andere een D. Maar die lage score valt niet te verbeteren, want over de betreffende historische figuur is gewoonweg niets méér te vertellen dan er al staat. Apart: zelfs een op TBP genomineerd artikel met tikfouten, een copyvio en nul bronnen levert een hogere score op... Thieu1972 (overleg) 31 jul 2021 15:07 (CEST)[reageren]
Niet alle artikelen hoeven een B of A te worden, analoog aan dat niet alle artikelen in de etalage passen. Voor veel artikelen kan een B best voldoende zijn. Maar het systeem is nu nog vaak wat duister, en edits die het verbeteren maken de score slechter. Het is duidelijk nog geen systeem dat helemaal uitgekristalliseerd is ;-) Edoderoo (overleg) 31 jul 2021 16:14 (CEST)[reageren]
@Thieu1972: ik heb aan beide artikelen geknutseld. Het jouwe staat nu een twintigste punt hoger, het scoort nu 2,1.
Het andere heb ik ruim een tiende punt omlaag gekregen, goed van mij, er is weer wat meer rechtvaardigheid in de wereld! Van dat artikel, Moordcast, heeft de oudste versie de hoogste waardering 2,57, de latere toevoegingen werden overwegend negatief beoordeeld, met uitzondering van de verwijdernominatie. Het staat nu op 2,27  →bertux 31 jul 2021 16:48 (CEST)[reageren]
Dank je Bertux, dit komt mijn nachtrust ten goede ;-) Wel apart dat jouw aanpassingen aan het genomineerde artikel eigenlijk alleen maar verbeteringen zijn, maar kennelijk door ORES als verslechtering worden beschouwd? In ieder geval ga ik ORES snel weer uitzetten, want het leidt enorm af, die scores bovenaan de artikelen (en de kleurtjes in de geschiedenis), zonder dat het voor mij een toegevoegde waarde heeft. Thieu1972 (overleg) 31 jul 2021 17:11 (CEST)[reageren]

Ik heb er wat mee zitten spelen, en mijn eerste indruk is dat dit zeker nuttig is. Ik denk dat we dit heel goed kunnen gebruiken als "eerste indruk", en dat we vanzelf op een hoop "vreemde eenden" zullen stuiten. Begrijp ik goed dat ik dergelijke eenden in de eendenkooi op Wikipedia:Labels/Kwaliteit van artikelen kan zetten? Dat er een hoop artikeltjes zijn die niet hoog scoren omdat er niet al te veel meer over te vertellen is: het zij zo. Zie bijvoorbeeld Aeroporto (metrostation), dat met een D (2.1), als je de criteria er bij haalt, met dit cijfer nog gematst is. Het toevoegen van plaatjes lijkt overigens positief beoordeeld te worden: de naastgelegen stations Encarnação (metrostation) en Moscavide (metrostation) zitten op 1.91 en 1.98. Ik denk overigens dat we ons niet teveel moeten laten leiden door dit cijfer(tje), en het moeten zien als een handvat om nog wat meer greep te krijgen om het glibberige begrip "kwaliteit". En laten we vooral niet gaan zitten klooien met "als ik dit doe, wat gebeurt er dan met mijn score?". Dit is een encyclopedie, geen wielerwedstrijd. Ciell en haar collega's die dit (tussen)resultaat hebben neergezet: veel dank en complimenten! Mvg, MartinD (overleg) 4 aug 2021 14:58 (CEST)[reageren]

En het niet zeer druk bezochte Spoorwegen en oorlogvoering krijgt een vleiende doch onbegrijpelijke 4.48. Dat mag de machine die dit berekend heeft me nog eens achter een glaasje nullen en een schaaltje enen uitleggen.;) MartinD (overleg) 4 aug 2021 15:41 (CEST)[reageren]
Dank je Martin. Inderdaad mag je vreemde eenden daar toe blijven voegen, en het ORES-kwaliteitsysteem is bedoeld als handvat. Vandaar dat ik zelf een voorstander ben om bij de A-E aanduiding te benadrukken dat dit een uitkomst is van een beoordeling is door een computersysteem, en dat het los blijft staan van bv de Etalage. Wel kun je als schrijver overwegen om een artikel dat volgens ORES al een A-beoordeling krijgt, eens door te lopen en voor te leggen aan collega's in de Wikipedia:Review, en dus als een hulpmiddel voor het proces naar de Etalage.
Verder kunnen wij bv in de voorbereidingen voor schrijfweken, of partners voor hun activiteiten, of onderzoekers in het algemeen, nu met lijsten gebaseerd op categorieën (makkelijk te maken met de Petscan-tool, die verschillende lagen van ondercategorieën mee kan nemen bij het maken van een lijst) de dekking inzichtelijk kunnen krijgen van een bepaald onderwerpgebied, door in die lijst {{ORES schaal}} te gebruiken.
Ik hoop vandaag de ontwikkelaar weer te spreken, en de stap kunnen te gaan maken met een training op basis van de nieuwe versie 1c van de kwaliteitsschaal Ciell need me? ping me! 5 aug 2021 08:59 (CEST)[reageren]