Wikipedia:De kroeg/Archief 20080313

Uit Wikipedia, de vrije encyclopedie

Wikipedia article traffic statistics[bewerken | brontekst bewerken]

w:en:User:Henrik heeft een tool geschreven waarmee je kunt zien hoe vaak een pagina wordt bekeken, zie http://stats.grok.se. --Erwin(85) 6 mrt 2008 15:40 (CET)[reageren]

Interessant. Standaardvraag: hoe betrouwbaar is dit? Rubietje88 6 mrt 2008 15:52 (CET)[reageren]
Inderdaad interessant. Leuke ontwikkelingen zoals hier Simon(neushorn) 6 mrt 2008 16:37 (CET)[reageren]
Uitstekend tooltje wanneer je jezelf afvraagt waarvoor je het allemaal doet. Artikelen van mijn hand waarvan ik dacht dat ze hooguit één keer per maand werden opgevraagd blijken per dag zo al 4 hits te halen. Hiephoi, mijn leven heeft weer zin! Luctor 6 mrt 2008 16:45 (CET)[reageren]
En dan je eigen er af halen ;)
Maar nogmaals, hoe nauwkeurig zijn deze gegevens? Want met WikiCharts kun je natuurlijk niets... Rubietje88 6 mrt 2008 16:46 (CET)[reageren]
Bij Fitna (film), waarom heeft daar niemand gekeken op drie en vier maart? ;) Erwin1990 6 mrt 2008 17:17 (CET)[reageren]
Edit: Oh zie net dat 3 en 4 maart bij alle artikelen op 0 pageviews staat. Dan zal hij er toen wel uitgelegen hebben ofzo... Erwin1990 6 mrt 2008 17:18 (CET)[reageren]
Leuke tool. Of het nauwkeurig is weet ik niet maar het geeft me een handvat welke van 'mijn' onaffe pagina's prioriteit hebben om aan te werken. Het viel me wel op dat bij het opvragen van Peringia ulvae kennelijk alleen de totalen van deze pagina gegeven werden en dat geen rekening wordt gehouden dat deze pagina doorverwijst naar Wadslakje. Of het totaal van de laatste inclusief het aantal is wat bij de redirect wordt opgegeven (wat naar mijn smaak zou moeten) dat weet ik niet.Tom Meijer MOP 6 mrt 2008 17:24 (CET)[reageren]
Henrik heeft aangegeven dat de data gebaseerd is op dammit.lt/wikistats en dat is real, accurate hourly snapshot data on the access to Wikipedia captured from the Wikimedia Squid servers - Erik Moeller, Wiki-research-l, Feb 18 2008. --Erwin(85) 6 mrt 2008 17:53 (CET)[reageren]
Tnx, is dus zeer betrouwbaar. Mooi, da's geweldig ;) Rubietje88 6 mrt 2008 18:03 (CET)[reageren]
Tellen ze ook de hits van de zoekrobots mee? LeRoc 6 mrt 2008 21:30 (CET)[reageren]
De nauwkeurigheid van dit soort tools wordt in hoge mate beinvloed door het feit dat de servers niet iedere pageview loggen. Dat zou veel te veel zijn, een kwart miljard per dag of zo (midden 2007 waren het er 7 miljard per maand voor alle WMF wiki's).
In plaats daarvan worden een uit honderd (of meer?) pageviews gelogd. Bij dit soort tools moet je dat dus terugrekenen. Bij zeer frequent bezochte pagina's komen daar dan wel statistisch relevante getallen uit, maar bij minder frequent bezochte pagina's kan je met dat terugrekenen eigenlijk niet veel.
Als voorbeeld een extreem geval van 1 gesamplede hit bij een samplefrequentie van 1 op 100. De teruggerekende echte hitrate kan 1 zijn, maar ook 100 (of beduidend meer) omdat die andere 99 pageviews toevallig niet gesampled werden. In dit voorbeeld wordt het terugrekenen van pagina's met >1000 echte hits (per dag) pas een beetje betrouwbaar. - mvg RonaldB 7 mrt 2008 02:04 (CET)[reageren]
Het zou wel goed zijn als die uitleg bij de tool zou worden vermeld voordat er ergens misverstanden ontstaan. groetjes --joep zander 7 mrt 2008 09:43 (CET)[reageren]
Ik maak hieruit op dat dit toch een minder aardige tool is dan ik in eerste instantie dacht. Hebben we dus weinig aan. Jammer. Of zit ik helemaal fout? Tom Meijer MOP 7 mrt 2008 10:20 (CET)[reageren]
Met wat basiskennis statistiek vind ik het lastig om hieraan te rekenen. Maar uitgaande van 100 miljoen pageviews per dag, worden er per dag dus miljoen pageviews gelogd. Als een bepaalde pagina 10x gesampled wordt op zo'n dag, dan is het artikel zeker 10 keer bekeken. Het artikel is maximaal 100.000.000-1.000.000+10 = 99.000.010 keer bekeken. Dat is natuurlijk zeer onwaarschijnlijk, want dan zouden alle niet-gelogde pageviews voor de rekening van die ene pagina moeten komen. Maar theoretisch kan het. Ik ben benieuwd hoe de kansverdeling tussen die twee waarden verloopt. Ik denk er nog even over na. Josq 7 mrt 2008 10:41 (CET)[reageren]
Ook een heel mooi voorbeeld: [1]. OekelWm 7 mrt 2008 17:03 (CET)[reageren]

@RonaldB, hoe kan het dan dat hier de getallen zo nauwkeurig zijn... Rubietje88 7 mrt 2008 20:48 (CET)[reageren]

Die getallen zijn dus blijkbaar niet zo nauwkeurig: als er een getal staat (bijv. 3) dan kan het zijn dat er slechts 3 keer een pageview die dag is geweest maar het kan ook zijn dat er meer pageviews zijn geweest en dat er slechts 3 gesampled zijn. Als je een samplefrequentie van 1 op 100 hebt dan wil dat zeggen dat je 1 pageview op de 100 meetelt in de statistieken en aangezien je de andere pageviews niet meetelt, kun je die in de statistieken dus ook niet zien. En daardoor is een getal dus niet nauwkeurig.. je weet hoogstens dat, als er n staat, dat er tenminste n pageviews zijn geweest die dag (zoals Josq al zei). - Simeon 8 mrt 2008 02:46 (CET)[reageren]

Opmaak categorieën?[bewerken | brontekst bewerken]

In mijn css heb ik de opmaak van de categorie-aanduiding in artikelen zodanig gewijzigd dat deze vrijwel onzichtbaar is. Nu valt me op dat die eigen opmaak niet meer werkt. Is er iets veranderd waardoor ik mijn css-instellingen aan moet passen? En zo ja, zou iemand me kunnen vertellen welke code ik moet gebruiken om de opmaak van categorie-aanduidingen weer aan te passen? Fruggo 8 mrt 2008 11:09 (CET)[reageren]

Daar is vzviw niets aan veranderd; jouw code #n-categories {display: none; } is correct; probeer eens Ctrl+Shift+R ? - Erik Baas 8 mrt 2008 14:14 (CET)[reageren]
Die code haalt de categorieën in het menu weg, het gaat om p.catlinks { color: #aaaaaa; font-family: Verdana,sans-serif; font-size:75%; text-align:right; text-indent:0; text-transform: none; white-space:normal; margin: 0.2em;} . Deze code liet de categorieën altijd in kleine grijze letters zien (rechtsonder), nu staan de categorieën echter in een normale blauwe letters (linksonder). Ctrl+Shift+R helpt in ieder geval niet; heb je wellicht een andere suggestie? Fruggo 8 mrt 2008 15:02 (CET)[reageren]
Even in de broncode van de pagina kijken en je zult zien dat de categorieën tegenwoordig in een div staan ipv een p[aragraaf]. - Berkoet (voorheen Dammit) 8 mrt 2008 15:27 (CET)[reageren]
Aha, bedoel je die. Er is geen p-element met die class, wel een div; of dat onlangs veranderd is weet ik niet, maar het zou me niet verbazen (gezien de aanpassingen voor de hidden cat's). Ik neem aan dat als je p.catlinks verandert in div.catlinks , het weer gat werken zoals je wilt. Ik zal later eens precies uitzoeken wat er nog meer mogelijk is, de catbox bestaat nu n.l. uit 3 geneste div's, plus soms nog een div en een p en een span voor de hidden cat's; vraag me niet waarom... ;-) - Erik Baas 8 mrt 2008 15:30 (CET) (na bc)[reageren]