Gebruiker:Hooft/robot/Jaren A.D. Interwiki

Uit Wikipedia, de vrije encyclopedie

Discussie overgenomen van Overleg:883

OK, het lijkt te werken: Ik heb een programma gemaakt om een jaarpagina te bekijken op een stuk of 15 talen wikipedia, en in de nl: alle missende links te maken. Met een kleine aanpassing kan ik ook voor alle andere talen (met de nieuwste wikipedia.org software) die de jaarpagina hebben de links maken. Wat denkt men ervan? Zou dit soort robot-wijzigingen op prijs gesteld worden?

Een erg grote belasting voor de bandbreedte van de server kan het niet zijn, want ik heb zelf maar een traag lijntje.... Verder is het nu ik dit heb niet al te moeilijk om programmaatjes te maken die over een hele serie pagina's gaan om daar op te ruimen. Rob Hooft 14 jun 2003 15:11 (CEST)

Als de aanpassing enkel op Wikipedia NL is zie ik geen probleem. Automatische aanpassingen op andere wikipedia's is iets anders. Daar moet je toch voorzichtig mee zijn. Er is een test-wikipedia http://test.wikipedia.org Als je nog eerst iets zou willen testen kan je het daar doen. Moet je alle wikipedia's appart behandelen of kan je ze allemaal in één keer doen? Hoelang zou het ongeveer duren om het te doen? Als het in een aantal uur kan zou je een bericht kunnen posten op Intlwiki-l om te waarschuwen en het in de nacht doen. De Engelstalige heeft regelgeving over het gebruik van bots op hun Wikipedia http://www.wikipedia.org/wiki/Wikipedia%3ABots Giskart Walter 14 jun 2003 16:41 (CEST)
Het is erg eenvoudig om me tot de NL wikipedia te beperken, is inderdaad beter omdat ik het dan ook goed in de gaten kan houden. Maar dat betekent dus dat ik geen links maak op bijvoorbeeld de EN: wikipedia naar de equivalente NL pagina. Het worden eenrichtingslinks. Nou denk ik ook dat eenrichtingslinks beter zijn dan geenrichtingslinks. Het zou ook mogelijk zijn om de code aan een anderstalige wikipediast te geven en die kan het dan op zijn eigen wikipedia laten gaan. Maar de robot zoals ik hem heb gemaakt is erg krachtig, dus als die code al te bekend wordt kan het door vandalen worden gebruikt. Natuurlijk: een echte vandaal schrijft zijn eigen code, ik heb ook maar een paar uur nodig gehad om de mijne te schrijven.... Om het over alle jaren te laten lopen zal flink wat tijd kosten. De robot moet daarvoor dus alle jaren van alle anderstalige wikipedia's proberen te downloaden. Een enkel jaar zonder pauze's kost ongeveer 22 seconden download, en als er iets moet worden gewijzigd nog een paar seconden upload. Rob Hooft 14 jun 2003 17:05 (CEST)
Vraagje: wordt er alleen een link gecreeerd als op de vremmde wiki al een bladzijde bestaat? In dat geval zou het misschien in de toekomst opnieuw moeten.Jcwf 14 jun 2003 17:09 (CEST)
Dat was inderdaad de bedoeling. Het heeft m.i. weinig zin te linken naar buitenlandse niet bestaande pagina's. fr: en de: doen dat voor de jaren wel. Bah. Rob Hooft 14 jun 2003 17:12 (CEST)
;-) Je hebt gelijk, holle beloftes zijn niet goed. Jcwf 14 jun 2003 17:15 (CEST)
Walter, dat verhaal op de en:wikipedia over bots geeft als belangrijkste bezwaren dat het seriematig aanmaken van artikelen niet encyclopedisch is. Ik wil nog even benadrukken dat nieuwe artikelen maken nooit een reden is geweest om mijn robot te schrijven. Ik ben het daar erg eens met de redenering. Het doel dat ik zie voor de robot is om uitputtingsslagen zoals we ze net voor alle dagen achter de rug hebben te kunnen automatiseren. Natuurlijk is dat anders dan handmatig doen. Bij de handmatige wijziging van de data heb ik op veel pagina's ook andere eigenschappen aangepast. Dat echt encyclopedische werk blijft nodig. Maar bijvoorbeeld het aanpassen van alle series jaartallen onderaan een jaarpagina naar de nieuwste standaard (is dat inderdaad "<- 0 1 2 3 4 5 6 7 8 9 0 ->"?) is VEEL makkelijker automatisch uit te voeren. Rob Hooft 14 jun 2003 17:41 (CEST)


Dan zou je dus om te kunnen beginnen enkel deze wiki doen. Als dat goed is afgelopen is dat trouwens iets om andere wikipedia's te overtuigen dat het geen kwaad kan. Meestal is enkel Jcwf in de nacht actief, en voorlopig blijkbaar even niet, dus dat zou het beste moment kunnen zijn om dit te doen. Het probleem is dan wel dat er waarschijnlijk dan ook niemand aanwezig is om te zien dat er niets misloopt. Overdag dan maar en er een kleine wijziging van maken? Volgens de stats is zaterdag de meest rustige dag op wikipedia. Nu doen? Giskart Walter 14 jun 2003 18:19 (CEST)

Ik zal mijn interwiki script eens loslaten op 800-899. Dan spreken we elkaar daarna weer hier om te zien hoe dat ging. Rob Hooft 14 jun 2003 18:29 (CEST)
Ik heb hem meteen na 800 weer stilgezet. Er worden door de robot een aantal tekens omgezet : < " > Is dat een bezwaar? Ik zal proberen of ik het kan voorkomen. Rob Hooft 14 jun 2003 18:47 (CEST)

Ik vind het allemaal heel erg knap! Elly 14 jun 2003 19:53 (CEST)

Ik sluit me bij de vorige spreekster aan. Veel succes Rob. Jcwf

Ik dacht ergens gelezen te hebben dat de interwikilinks op alfabetische volgorde 'moesten'. Volgens mij doet de robot dat niet (fr-ca-de-en). Is dat ook makkelijk aan te passen? Mtcv 14 jun 2003 20:11 (CEST)

het enige dat de robot nu doet is aan het begin de interwikilinks toevoegen die missen, in willekeurige volgorde. Er blijken uit de huidige run een aantal pagina's te zijn die ten onrechte een pl: link hebben. Als ik het script zo verander dat die eruit gehaald worden, kan ik het ook zo maken dat ze alfabetisch worden. Moeten ze alfabetisch worden op 2-letter code? Je moet er rekening mee houden dat dat de Nederlandse namen van de talen niet alfabetisch zet! Rob Hooft 14 jun 2003 20:21 (CEST)
Ok, het is nu zo veranderd dat alle interwiki links op alfabetische volgorde komen, en ook de verkeerde links worden verwijderd. Ik zal het op 900-999 loslaten om te zien hoe dat gaat. Rob Hooft 14 jun 2003 21:33 (CEST)
Dat gezien hebbende denk ik dat het geen kwaad kan dat vannacht over alle jaren A.D. te draaien. Gaarne bevestiging. Rob Hooft 14 jun 2003 22:17 (CEST)
Deze run is af:
amigo[161]pywikipedia%% python2.3 getlang.py > getlang.log
python2.3 getlang.py > getlang.log  197.52s user 67.63s system 0% cpu 8:46:25.09 total
Ik ben nu alle waarschuwingen die dat heeft opgeleverd aan het nalopen. Rob Hooft 15 jun 2003 08:59 (CEST)