Overleg Wikipedia:Labels/Kwaliteit van artikelen/Vreemde eenden 2022

Pagina-inhoud wordt niet ondersteund in andere talen.
Onderwerp toevoegen
Uit Wikipedia, de vrije encyclopedie

re: Beleg van Leiden[brontekst bewerken]

@StuivertjeWisselen: je zegt "Etalage-artikel waarvan voor mij niet duidelijk is waarom het niet de A-status krijgt." Ik zou graag de vraag om willen draaien: waarom vind jij dat het artikel een A beoordeling moet krijgen in plaats van de B-beoordeling? Als ik het artikel handmatig door de api haal is ORES met 99% vrij zeker van de B-beoordeling. Voldoet het artikel echt aan alle in E t/m A genoemde punten? Ciell need me? ping me! 2 mrt 2022 20:55 (CET)Reageren

De criteria die A-artikelen onderscheiden van B-artikelen zijn natuurlijk wel minder hard, en laten meer ruimte voor eigen interpretatie t.o.v. de lagere schalen. Als ik het artikel Beleg van Leiden (1573-1574) doorlees en de checklist erbij pak dan kan ik ze in mijn ogen allemaal wel afvinken, waarmee ik een A-beoordeling terecht zou vinden:
  • Het artikel is goed geschreven, wat inhoudt dat de geschoonde tekst informatief en duidelijk is, zonder doublures en overbodige woorden en zoveel mogelijk in de actieve vorm. Vinkje
  • Het artikel is logisch van opbouw, en geeft een volledig en evenwichtig beeld van de belangrijkste aspecten van het onderwerp Vinkje
  • Het artikel focust op het hoofdonderwerp en is niet tè uitgebreid: hoofd- en bijzaken worden gescheiden aan de hand van gezaghebbende overzichtsliteratuur. Vinkje
  • De hoofdtekst kent een juist detailniveau, waarbij de geïnteresseerde leek niet wordt afgeschrikt door specialistische verfijning, maar waar een deskundig ingestelde lezer wel iets aan heeft. Vinkje
  • Het artikel bevat afbeeldingen met verduidelijkende onderschriften, indien beschikbaar op Wikimedia Commons. Vinkje
Het artikel krijgt de maximale B-score, waarmee ik aanneem dat er in het artikel iets staat (of mist) wat zodanig absoluut is dat er niet aan een van de A-criteria wordt voldaan. Ik kan alleen niet bedenken wat dat dan is. StuivertjeWisselen (overleg) 2 mrt 2022 21:07 (CET)Reageren
@StuivertjeWisselen. Je schrijft: "Het artikel focust op het hoofdonderwerp". Dat zou ik niet durven te onderschrijven. Er is best wel veel informatie over randzaken, waardoor ik ook het juiste detailniveau betwijfel. Het meest storende voor mij is dat de informatie ontbreekt dat het "Beleg van Leiden" militair-technisch gezien helemaal geen beleg was. Op de OP van het lemma wordt dat met drie gezaghebbende bronnen duidelijk uitgelegd. In het lemma staat dat de stad niet actief belegerd werd, maar dat is mij niet duidelijk genoeg. Ik ken dat onderscheid uit de literatuur - actief en niet-actief belegeren - helemaal niet. Er zijn wel meer zaken die voor mij beter kunnen. Zoals dat er staat dat "Buren, Oudewater, Schoonhoven en Bommenede" werden veroverd. Dat klopt, maar de toegevoegde bron noemt alleen de namen van twee van de vier plaatsen. Dus er ontbreekt een extra bron, maar men wil er niet aan. Al met al lijkt mij een B-categorie dan aannemelijker. HT (overleg) 2 mrt 2022 21:51 (CET)Reageren
Happytravels, ik ben me bewust van de discussie en kan me deels vinden in je bezwaren. Laat ik het dan zo stellen dat het me mateloos fascineert dat een algoritme de tekst op dat inhoudelijke niveau kan interpreteren. StuivertjeWisselen (overleg) 2 mrt 2022 22:20 (CET)Reageren
Helaas, het ORES-systeem kan een lemma inhoudelijk niet beoordelen. Neem het lemma Neutraal Moresnet. Dat zou een onafhankelijke staat zijn geweest met een eigen volkslied en nationale munt. Niets van dat alles. Er stonden tal van andere inhoudelijke fouten in, maar kreeg wel een A (4,87). Nu de fouten eruit gehaald zijn, heeft het een 4,86. En zo zijn er meer voorbeelden. Eigenlijk heb je niets aan het ORES-systeem. Het geeft een schijnkwaliteit. Het programma komt niet veel verder dan een waardering uit te spreken over de aanwezigheid van tabellen en plaatjes en dat soort dingen, maar inhoudelijke fouten of iets als volledige informatie kunnen niet aangetoond worden. Ik denk dat Beleg van Leiden een B heeft, omdat er vooral onderin blijkbaar te weinig plaatjes staan. HT (overleg) 3 mrt 2022 06:35 (CET)Reageren
Het leek me al onwaarschijnlijk dat het ORES-systeem al zo geavanceerd was – ik ben beroepshalve bekend met de mogelijkheden AI – maar ik las in je eerdere reactie een verklaring waarom ORES het artikel een B-label gekregen heeft. Maar je zegt eigenlijk dat het B-label bij Beleg van Leiden (1573-1574) passend is op basis van jouw analyse van het artikel. Vanuit het verbeteren van ORES zou ik dan inderdaad nog wel willen begrijpen wat er aan het artikel schort t.o.v. andere A-artikelen, gegeven de criteria hierboven. Ik ben overigens wat positiever over ORES dan jij, ik denk dat het zeker toegevoegde waarde biedt, al was het maar omdat het een goede eerste slag is om artikelen te kunnen categoriseren op kwaliteit. Je voorkomt daarmee zeker niet alle problemen (zoals je in je voorbeeld terecht aanhaalt) maar het maakt het weldegelijk makkelijker om aandacht van de gemeenschap gerichter te kunnen sturen, wat ons een stuk effectiever zou moeten kunnen maken. StuivertjeWisselen (overleg) 3 mrt 2022 09:09 (CET)Reageren

Links naar de artikelschaal in de classificering[brontekst bewerken]

Dank voor de opmerking StuivertjeWisselen, dit moet inderdaad nog bijgewerkt worden, ik ga erachteraan! Ciell need me? ping me! 2 mrt 2022 21:08 (CET)Reageren

Geen cijfers achter de komma meer?[brontekst bewerken]

Klopt het dat de rapportcijfers nu zonder decimalen worden uitgedeeld? Niet dat ik daar mee zit, maar het viel me op. MartinD (overleg) 2 mrt 2022 21:35 (CET)Reageren

Zie de lijst met vreemde eenden in de bijt, er zijn daar artikelen met een rapportcijfer met twee decimalen. StuivertjeWisselen (overleg) 2 mrt 2022 21:37 (CET)Reageren
Klopt, ze worden nu wat vaker afgerond, dat viel mij ook op. Misschien als de inschattingen zekerder zijn? Ciell need me? ping me! 2 mrt 2022 21:54 (CET)Reageren
Mijn hypothese is dat als het artikel aan de criteria voldoet van een niveau hoger behalve een (of meer), het de maximale score krijgt van het niveau eronder. Het zal in aanleg een lineaire schaal zijn, maar doordat er categorisering is aangebracht met harde grenzen krijg je afgeronde scores. Dat betekent ook dat als een enkel hiaat wordt dichtgelopen de score waarschijnlijk vrij sterk kan stijgen. StuivertjeWisselen (overleg) 2 mrt 2022 22:02 (CET)Reageren
Zoals je hier (voorbeeld is de beoordeling van Sergio Vyent) volgens mij kunt zien is er weinig 'hard', maar is het een procentuele beoordeling. Misschien bedoel je het anders dan ik je begrijp? Ciell need me? ping me! 2 mrt 2022 22:04 (CET)Reageren
Wat ik bedoel is dat mijn hypothese is dat bijvoorbeeld het Beleg van Leiden (1573-1574) op basis van alle criteria een hogere score krijgt dan precies 4, maar deze op 4 is gezet (de maximale B-score) omdat niet voldaan wordt een absoluut A-criterium. Maar wat jij me hier vertelt is dat het gewoon een procentuele beoordeling is die voor dit artikel op precies 4 is uitgekomen. Ik kan in dat geval niet verklaren waarom er vaker cijfers zonder decimalen naar boven komen. StuivertjeWisselen (overleg) 2 mrt 2022 22:14 (CET)Reageren
ORES is wel 99% zeker over de B-beoordeling van het artikel over het Beleg van Leiden. Ik denk dat het te maken heeft met, zoals HT ook al aangeeft, de hoeveelheid tekst, hoofd- en bijzaken, het detailniveau, en de stijl van het artikel, maar zal dit zeker ook voorleggen aan de ontwikkelaars. Ciell need me? ping me! 2 mrt 2022 22:35 (CET)Reageren
Het ging me hier even niet om het specifieke artikel Glimlach. Dus for arguments sake een ander voorbeeld, het artikel Pieter Schelte Heerema heeft een C-beoordeling met een score van exact een 3. Mijn vraag is eigenlijk wat er met de beoordeling exact gebeurt. Is het zo dat het artikel in deze staat niet hoger kan scoren dan een drie omdat het volgens de checklijst van criteria een C-artikel is, of is het zo dat de score exact op 3 uitkomt en het om die reden het stempel van een C-artikel krijgt. Ik weet even niet hoe ik dit helderder kan uitleggen... StuivertjeWisselen (overleg) 2 mrt 2022 23:03 (CET)Reageren
Hi Stuivertje, ik kan je hier niet exact antwoord op geven, maar kan je gerust een keer uitnodigen voor de wekelijkse call met de ontwikkelaars op dinsdag (17 uur NL-tijd), ze pluizen dit soort dingen graag samen uit om zo tot een fijnere afstemming van het model te komen voor de eindgebruiker van het model! Aankomende dinsdag 8 maart ben ik er zelf niet bij ivm activiteiten rondom Internationale Vrouwendag, en de week erop ben ik er 'misschien', maar @EpochFail is er bijna altijd, en ook @RonnieV is er soms bij. Hoe meer zielen, hoe meer vreugd. Glimlach Ciell need me? ping me! 3 mrt 2022 12:48 (CET)Reageren

Ik heb wederom in mijn onschuld weer heel wat overhoop gehaald...;) MartinD (overleg) 4 mrt 2022 14:33 (CET)Reageren

Toch even melden: Saint-Cyprien (Pyrénées-Orientales) krijgt een D en een 2, en Argelès-sur-Mer een C en een 2,98. Het verschil is een hele lijst met burgemeesters van de laatste Franse badplaats, wat tot een hogere score kan leiden. Maar dan zou ik hier een afronding tot 3 verwacht hebben. MartinD (overleg) 4 mrt 2022 16:25 (CET)Reageren

re: Sergio Vyent[brontekst bewerken]

Hi @StuivertjeWisselen, het artikel heeft slechts 1 echte paragraaf tekst, en wordt daarom als E ingeschaald vermoed ik. Voor een D-waardering moet een artikel volgens het huidige model twee paragrafen tekst hebben. Ciell need me? ping me! 2 mrt 2022 21:53 (CET)Reageren

Hi Ciell, het vreemde is alleen dat deze versie op dat vlak niet beter is, maar wel een D-waardering krijgt. Het artikel zakt van 1.98 naar 1.31. StuivertjeWisselen (overleg) 2 mrt 2022 21:55 (CET)Reageren
Eén zin opgedeeld in twee zinnen verbetert de leesbaarheid, en passief taalgebruik omgezet in actief taalgebruik. Deze worden beiden hoger gewaardeerd door ORES blijkbaar. Ciell need me? ping me! 2 mrt 2022 21:59 (CET)Reageren
Iets wat staat te gebeuren (een première) is herschreven naar de verleden tijd omdat het ondertussen plaatsgevonden heeft. Ook hebben we het hier natuurlijk niet over forse alinea's, maar twee losse zinnen die bij elkaar horen en denk ik prettiger lezen doordat ze bij elkaar gezet zijn. De vertaling in de score lijkt me wat dat betreft niet ideaal, maar is natuurlijk geen halszaak. StuivertjeWisselen (overleg) 2 mrt 2022 22:09 (CET)Reageren

Hi @StuivertjeWisselen, ik zou me niet teveel richten op de nieuwe artikelen voor het vinden van 'vreemde eenden'. Ik snap dat deze snel in het oog springen en de afwijkingen zijn zeker interessant, maar anderzijds zijn deze als de versies worden verwijderd voor ons niet meer te gebruiken om verder te trainen. Ciell need me? ping me! 2 mrt 2022 21:57 (CET)Reageren

Hi Ciell, dat laatste snap ik. Maar beide voorbeelden zijn wat mij betreft wel duidelijke (en vrij sterke) afwijkingen van hoe het algoritme zou moeten werken, dus kunnen we daar wat van leren. Maar zal me verder richten op artikelen die al langer in de encyclopedie staan. StuivertjeWisselen (overleg) 2 mrt 2022 22:25 (CET)Reageren
Hi Ciell, toch een nieuw artikel wat nogal opvalt, zie Michiel de Nooij. Het bestaat uit maar liefst acht woorden, en krijgt van ORES een score van D (1.77). Ik heb het artikel vanwege je opmerking maar niet in de tabel gezet, maar vreemd is het wel. Volgens ORES is dit blijkbaar een beter lemma dan Sergio Vyent Knipoog. StuivertjeWisselen (overleg) 4 mrt 2022 22:33 (CET)Reageren

Doorverwijzingen[brontekst bewerken]

Per toeval ontdekte ik, dat doorverwijzingen absurd hoog gewaardeerd worden. Waarschijnlijk een weeffoutje in het systeem. Zie o.a. Hiltermann en Pelorus Jill met resp. 3,96 en 4,00. Maasje 7 mrt 2022 19:06 (CET)Reageren

Is nu opgelost. Ciell need me? ping me! 26 mrt 2022 13:37 (CET)Reageren

re: Stamboom Johan VII van Nassau-Siegen[brontekst bewerken]

@Roelof Hendrickx: er is, in overleg, voor gekozen om het model 'opgeschoonde tekst' in een artikel hoger te laten waarderen dan teksten in tabellen, lijsten, referenties en sjablonen. Procentueel wordt de hoeveelheid opgeschoonde tekst in het artikel dus lager door je uitbreidingen van de tabellen, en daarmee is het denk ik verklaarbaar dat de ORES-score iets zakt. Ciell need me? ping me! 26 mrt 2022 11:05 (CET)Reageren

Stambomen als die van Roelof Hendrickx hoeven wat mij betreft geen ORES-kwalificatie te krijgen. De kwalificatie die er nu staat doet geen recht aan de kwaliteit van het lemma. Stambomen hebben namelijk meestal geen plaatjes en dan kan je nooit hoog eindigen op de ORES-schaal. Je daalt zelfs standaard als je de stamboom uitbreidt. HT (overleg) 26 mrt 2022 13:21 (CET)Reageren
Technisch zou het denk ik kunnen om de voorspelling voor alle artikelen in Categorie:Stamboom uit te schakelen. Ciell need me? ping me! 26 mrt 2022 13:37 (CET)Reageren
Dank voor de heldere uitleg. Mvg, Roelof Hendrickx (overleg) 26 mrt 2022 13:43 (CET)Reageren