Gebruiker:Chomnapha/Kladblok

Uit Wikipedia, de vrije encyclopedie
Chomnapha/Kladblok
Logo
Ontwerper(s) Matthew Honnibal, Ines Montani
Ontwikkelaar(s) Explosion AI, various
Recentste versie 3.4.1
Website https://spacy.io
Portaal  Portaalicoon   Informatica

spaCy (/speɪˈsiː/ spay-SEE) is een open-source software bibliotheek voor geavanceerde computationele taalkunde, geschreven in de programmeertalen Python en Cython. De bibliotheek wordt uitgegeven onder MIT-licentie en de belangrijkste ontwikkelaars zijn Matthew Honnibal en Ines Montani, de oprichters van het softwarebedrijf Explosion.

In tegenstelling tot NLTK, dat veel wordt gebruikt voor onderwijs en onderzoek, richt spaCy zich op het leveren van software voor productiedoeleinden. spaCy ondersteunt ook deep learning-workflows waarmee statistische modellen die zijn getraind door populaire machine learning-bibliotheken zoals TensorFlow, PyTorch of MXNet, via zijn eigen machine learning-bibliotheek Thinc kunnen worden verbonden. Met Thinc als backend, biedt spaCy convolutionele neurale netwerkmodellen voor part-of-speech tagging een syntaxisboom creeëren, tekstcategorisatie en NER (Named Entity Recognition). Vooraf gebouwde statistische neurale netwerkmodellen om deze taken uit te voeren zijn beschikbaar voor 23 talen, waaronder Engels, Portugees, Spaans, Russisch en Chinees, en er is ook een meertalig NER-model. Dankzij extra ondersteuning voor tokenisatie voor meer dan 65 talen kunnen gebruikers ook aangepaste modellen op hun eigen datasets toepassen.

Belangrijkste kenmerken[bewerken | brontekst bewerken]

  • Non-destructive tokenisatie
  • Ondersteuning voor Alpha tokenisatie in meer dan 65 talen
  • Ingebouwde ondersteuning voor trainbare pipeline componenten zoals NER, part-of-speech-tagging, een syntaxisboom creeëren, tekstclassificatie, named-entity linking(NEL) en meer
  • Statistische modellen voor 19 talen
  • MTL met pretrained transformers zoals BERT
  • Ondersteuning voor aangepaste modellen in PyTorch, TensorFlow en andere frameworks
  • Snelheid en precisie van het allerhoogste niveau[1]
  • Trainingssystemen klaar voor productie
  • Ingebouwde visualizers voor syntax en NER
  • Makkelijke model-packaging, implementatie en workflow management


Referenties[bewerken | brontekst bewerken]

  1. (en) Benchmarks | spaCy Usage Documentation. spacy.io. Geraadpleegd op 30 september 2022.

Dit artikel of een eerdere versie ervan is een (gedeeltelijke) vertaling van het artikel SpaCy op de Engelstalige Wikipedia, dat onder de licentie Creative Commons Naamsvermelding/Gelijk delen valt. Zie de bewerkingsgeschiedenis aldaar.