Perl (programmeertaal)

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Perl
Paradigma multi-paradigma
Verschenen in 1987
Ontworpen door Larry Wall
Huidige versie 5.20 (27 mei 2014)
Typesysteem Dynamisch
Beïnvloed door AWK, C, Bourne shell, Lisp
Invloed op Python, PHP, Windows PowerShell
Besturingssysteem Multiplatform
Licentie GNU General Public License, Artistic License
Bestandsextensies .pl, .pm
Website (en) Projectpagina
Portaal  Portaalicoon   Informatica
Bibliotheek van Perl-boeken

Perl is een programmeertaal ontworpen door Larry Wall die eigenschappen van C en UNIX-scripttalen zoals sh, sed en awk in zich verenigt. De afkorting Perl staat voor Practical Extraction and Report Language.

Mogelijkheden en toepassingen[bewerken]

Perl is geschikt als vervanger van traditionele Unix-shell-scripts, die in sh (de Bourne shell) geschreven worden en daarbij allerlei andere utilities aanroepen zoals sed, tr, uniq, sort, expr en awk, terwijl het ook alles kan waarvoor voordien een C-programma geschreven moest worden. Het verenigt niet alleen de mogelijkheden van deze talen maar ook een groot deel van hun manieren van uitdrukken (syntaxis). Daarom wordt het wel the Swiss army knife of programming languages (het Zwitsers zakmes onder de programmeertalen) genoemd.

Perl wordt veel gebruikt voor taken waar voordien shell-scripts voor werden gebruikt, voornamelijk het automatiseren van taken in het systeembeheer; daarbuiten wordt het veel gebruikt voor de bewerking van allerlei soorten bestanden (natuurlijke taal, configuratiebestanden, XML- of HTML-documenten, rasterafbeeldingen, enzovoorts). Ook heeft het goede bibliotheken voor allerlei andere taken, zoals database-toegang en client/servercommunicatie. Perl wordt veel gebruikt in de bio-informatica. In de jaren 90 was het de meestgebruikte taal voor dynamische websites. Daarna is het sterk op Perl lijkende PHP daarvoor populairder geworden.

Perl is een scripttaal met uitgebreide mogelijkheden voor reguliere expressies en er kan met Perl object-georiënteerd, procedureel of zelfs functioneel geprogrammeerd worden.

Modules: CPAN[bewerken]

Tot en met versie 4 werd de kracht van Perl steeds uitgebreid door extra voorgedefinieerde functies in te voegen en de taal zelf uit te breiden. Met Perl 5 ontstond CPAN, een over het Internet installeerbare verzameling modules die allerhande functionaliteit bieden. Voortaan richtte de belangrijkste ontwikkeling zich op het schrijven van modules, en werd er relatief weinig aan de taal zelf doorontwikkeld. Om CPAN goed te laten functioneren ontstonden allerlei conventies voor het aanbieden, organiseren en ontwikkelen van zulke modules (ondersteund door voor dat doel geschreven Perl-modules) die zeer helpen om de kwaliteit te waarborgen; zo is unittesten standaard praktijk. Het principe van CPAN is door veel andere talen overgenomen - zo heeft PHP bijvoorbeeld PEAR en PECL, en heeft Python PyPI.

Documentatie[bewerken]

Perl kent naast gewoon commentaar ook een eenvoudige markuptaal, POD, om gestructureerd commentaar te schrijven, vergelijkbaar met bijvoorbeeld Javadoc voor Java en XML-documentatie voor C♯. Hiermee wordt code gedocumenteerd; standaard tools kunnen deze documentatie tonen en in andere formaten omzetten zoals man-pagina's of HTML-documenten.

Licentie[bewerken]

Perl is vrije software, uitgebracht onder de Artistic License en GPL. Perl draait op de meeste besturingssystemen. Op de meeste UNIX-achtige systemen, zoals Linux, wordt Perl standaard geïnstalleerd. Ook bestaan er versies voor Windows.

De kracht van Perl[bewerken]

Perl is krachtig in het manipuleren van tekstbestanden door middel van korte en bondige opdrachten. In de volgende twee voorbeelden worden tekstbestanden met Perl-oneliners aangepast.

Voorbeeld 1: Converteer file met naam myfile van UNIX- naar DOS-formaat.

perl -i -pe 's/\n/\r\n/' myfile

Voorbeeld 2: Plaats de string "#!/usr/bin/perl" bovenaan iedere file met extensie '.pl'.

perl -i -ple 'print q{#!/usr/bin/perl} if $. == 1; close ARGV if eof' *.pl

Voorbeeld 3: Druk alle regels van de invoer af, maar alleen de eerste keer dat ze voorkomen.

perl -ne 'print unless $seen{$_}++' bestand-met-dubbel-voorkomende-regels

Dit is bijvoorbeeld vaak nuttig om uit logfiles dubbele regels weg te laten.

(De Unix-utility uniq doet dit alleen op gesorteerde invoer.)

In voorbeeld 4 wordt gedemonstreerd hoe er met de uit CPAN afkomstige module LWP (the World Wide Web Library for Perl) een webpagina wordt opgehaald.

Voorbeeld 4: Haal de hoofdpagina van nl.wikipedia.org op.

 use strict;
 use warnings;
 
 use LWP::UserAgent;
 
 my $ua = LWP::UserAgent->new;
 
 #$ua->proxy("http", "http://ProxyIP:ProxyPort/");
 
 my $response = $ua->get('http://nl.wikipedia.org/'); # haal de hoofdpagina op
 
 if ($response->is_success) {
 
    my $html = $response->content;
    print $html;  # produceert de hoofdpagina (in HTML)
    # alternatief:
    #&print_wist_je_dat($html);  # zie volgende voorbeeld
 
 } else {
    die $response->status_line;
 }

Om alleen de weetjes uit de rubriek "Wist je dat..." af te drukken moet een # worden verplaatst van de regel met &print_wist_je_dat naar de regel met print $html; de definitie van print_wist_je_dat kan er dan als volgt uitzien:

Voorbeeld 5: Parse HTML uit de rubriek "Wist je dat...".

 use utf8;   # liefst bovenaan plaatsen voor de duidelijkheid;
 use bytes;  # deze twee statements geven aan dat er UTF-8 in het script zit, namelijk het teken …
 
 use HTML::TokeParser;
 
 sub print_wist_je_dat
 {
    my ($html) = @_;
 
    my $stream = HTML::TokeParser->new( \$html );
 
    my $InListItem = 0;
    my $ListItemStr = '';
 
    while (my $token = $stream->get_token) {
 
        if ($token->[0] eq 'T') { # text
 
            if ($InListItem) {
                $ListItemStr .= $token->[1];
            }
 
        } elsif ($token->[0] eq 'S') { # start-tag
 
            my($tagname, $attr) = @$token[1,2];
 
            if ($tagname eq 'li'){
                $InListItem = 1;
            }
 
        } elsif ($token->[0] eq 'E') { # end-tag
            my $tagname = $token->[1];
 
            if ($tagname eq 'li'){
                if ($ListItemStr =~ /^…/){
                    print $ListItemStr . "\n";
                }
                $InListItem = 0;
                $ListItemStr = '';
            }
        }
    }
 }

Voorbeeld 6: als het vorige, maar dan met de CPAN-module XML::LibXML:

 use utf8;   # liefst bovenaan plaatsen
 use bytes;  # deze zijn voor het matchen van …
 
 use XML::LibXML;
 
 sub print_wist_je_dat
 {
    my ($html) = @_;
 
    my $parser = new XML::LibXML;
    my $root = $parser->parse_html_string($html)->getDocumentElement;
 
    print "$_\n" for
      grep { /^…/ }
        map { join('', $_->findvalue( './/text()')) }
          $root->findnodes( '//li' );
 }

Kritiek op Perl[bewerken]

In Perl wordt heel veel gebruikgemaakt van niet-alfanumerieke symbolen met een voorgedefinieerde betekenis zoals <>, $_ en $/ en de speciale tekens in reguliere expressies. Ook worden accolades en haakjes voor veel verschillende dingen gebruikt. Bovendien hebben veel operaties een default-operator die weggelaten mag worden. Deze voorzieningen maken compacte code mogelijk, maar bemoeilijken de leesbaarheid voor degenen die de notaties nog niet kennen.

Een andere eigenschap van Perl is dat de syntaxis erg flexibel is; Larry Wall heeft dit tot algemeen motto verklaard: There's more than one way to do it. Een voorbeeld van vier manieren om hetzelfde op te schrijven:

  if ($var > 4)
  {
    process($var);
  }
 
  process($var)
    if $var > 4;
 
  $var > 4
    and process($var);
 
  process($var)
    unless !($var > 4);

Veel programmeurs voeren aan dat dit tot moeilijker leesbare code leidt doordat programmeurs hun eigen schrijfstijl ontwikkelen en moeten wennen aan de stijl van een ander.

Daarnaast moet bedacht worden dat een taal als Perl voor veel taken veel expressiever is dan een low-level-taal als C; er staat domweg veel meer per regel, dus is het geen wonder dat het begrijpen per regel meer moeite kost.

Perl leren[bewerken]

Boeken[bewerken]

Larry Wall was vanaf 1995 tot 2003 in dienst bij de uitgever O'Reilly, die enige zeer populaire Perlboeken heeft uitgegeven. Het dier op de kaft van de boeken van O'Reilly geeft het boek ook meteen een bijnaam, zoals het Camel Book voor Programming Perl.

Titel Omschrijving Bijnaam
Learning Perl Voor programmeurs die Perl willen leren Lama
Intermediate Perl Het vervolg op Learning Perl Alpaca
Mastering Perl Recepten voor alledaagse problemen Vicuña
Programming Perl Dit is geen boek voor beginners, maar een volledig naslagwerk Kameel

Andere, recente boeken zijn Modern Perl en Beginning Perl. Eind jaren negentig was Perl bijzonder populair tijdens de Internetzeepbel. In deze periode zijn veel, intussen verouderde, boeken over Perl geschreven, vaak van wisselende kwaliteit.

Perldoc[bewerken]

Iedere Perlinstallatie beschikt over uitgebreide documentatie die wordt opgevraagd met de opdracht perldoc.

Zo wordt bijvoorbeeld de documentatie van de functie reverse() opgeroepen:

perldoc -f reverse

Een introductie met:

perldoc perlintro

En een overzicht van alle geïnstalleerde documentatie met:

perldoc perl

Bijeenkomsten van de Perl Mongers zijn een goede manier om ervaringen met Perlprogrammeurs uit te wisselen. Er wordt jaarlijks een meerdaagse Perlconferentie georganiseerd: YAPC.

Geschiedenis van Perl[bewerken]

Larry Wall, schrijver van Perl.

Perl 1.0[bewerken]

Perl is ontstaan als een rapportagetool: een programma dat informatie uit tekstbestanden haalt en in rapportvorm presenteert. Larry Wall postte versie 1.0 in 1987 in de nieuwsgroep comp.sources.misc.

Perl 2 t/m 4[bewerken]

Al snel groeide Perl uit tot een algemene scripttaal voor Unixsystemen, die voor tekstbewerking de sterke punten van AWK en de Bourne-shell in zich verenigde. Dit was een grote stap vooruit ten opzichte van shellscripts, die voor de meest eenvoudige functies allerlei externe programma's moeten aanroepen. Ook werden de meeste system calls en standard library-functies ingebouwd, zodat Perl qua uitdrukkingskracht vergelijkbaar werd met C: ook het low-level programmeren van bv. multiprocessing en procescommunicatie via sockets en netwerken was nu mogelijk. Ook werd de package ingevoerd, een eenvoudige manier voor namespacing waarmee losse modules gemaakt konden worden. Ondersteuning voor datastructuren bleef beperkt: alleen de array, de associatieve array en globbing, een primitief reference-mechanisme.

De belangrijkste toepassingen bleven batchgewijze tekstbewerking en scripts voor systeembeheer.

Nieuwe releases bleven uitkomen tot 4.036.

Perl 5[bewerken]

De belangrijkste verbeteringen in Perl 5:

  • references, waarmee willekeurige geneste datastructuren gebouwd kunnen worden
  • variabelen met lexicale scope, en
  • modules, objecten en klassen, waarmee het programmeren en gebruiken van herbruikbare softwarebibliotheken veel eenvoudiger werd.

Hierdoor kon CPAN ontstaan, de centrale repository van vrijelijk herbruikbare Perl-bibliotheken. Nieuwe functionaliteit werd nu niet langer aan de taal toegevoegd, maar als CPAN-module beschikbaar gesteld.

Perl werd nu zeer populair als "plak"-taal om systemen met elkaar te verbinden. Vanaf de opkomst van het world wide web tot eind jaren negentig was het de belangrijkste taal voor webapplicaties. Later werd PHP populairder.

In 2000 werd de volgende versie van Perl, versie 6, gestart. Deze maakt onder meer betere (statische) typering mogelijk. Van versie 5 komen jaarlijks onderhoudsreleases uit met kleine verbeteringen. In 5.10 zijn zelfs wat features uit Perl 6 toegevoegd[1]; deze moeten expliciet worden ingeschakeld om de achterwaartse compatibiliteit niet te verbreken.[2]

Perl history.svg

Perl 6[bewerken]

Nuvola single chevron right.svg Zie Perl 6 voor het hoofdartikel over dit onderwerp.

De ontwikkeling van versie 6 is in 2000 begonnen en is in volle gang. De opleverdatum is nog niet bekend, maar

  • Perl 6 zal niet backwards compatible zijn: programma's geschreven onder versie 5 zullen niet onder versie 6 draaien;
  • Perl 6 heeft een hybride typing: er zal static en dynamic typing gebruikt kunnen worden;
  • Perl 6 heeft bij functies standaard formal parameter passing;
  • Perl 6 kent sigil invariance;
  • Perl 6 kent een robuuster objectmodel;
  • Perl 6 kent een uitbreiding op de regular expressions met de nieuwe naam regexes;
  • Perl 6 kent chained comparisons zoals if C(20) <= $temperature <= C(25) { say "Kamertemperatuur!" };
  • Perl 6 kent lazy evaluation;
  • Perl 6 kent junctions;
  • Perl 6 heeft Lisp-achtige macro's;

In plaats van een interpreter zal Perl 6 gebruikmaken van een virtuele machine genaamd Parrot, die ook geschikt is voor andere scripttalen zoals PHP of Ruby.

Perl in actie[bewerken]

Voorbeelden van populaire vrije Perlsoftware:

Externe links[bewerken]

Bronnen, noten en/of referenties