Textmining

Uit Wikipedia, de vrije encyclopedie
(Doorverwezen vanaf Text mining)
Naar navigatie springen Naar zoeken springen

Textmining, ook wel textdatamining, verwijst naar het proces om met allerhande ICT-technieken waardevolle informatie te halen uit grote hoeveelheden tekstmateriaal. Met deze technieken wordt gepoogd patronen en tendensen te ontwaren. Concreet gaat men teksten softwarematig structureren en ontleden, transformeren, vervolgens inbrengen in databanken, en ten slotte evalueren en interpreteren.

Textmining is verwant aan tekstanalyse; de termen worden vaak door elkaar gebruikt.[1]

Hoewel ook in tekstanalyse kwantitatieve methoden worden gebruikt, verwijst textmining eerder naar analyse op grote schaal: bij ondernemingen in het kader van business intelligence, bijvoorbeeld om feedback van klanten te analyseren, en bijvoorbeeld in de sociale media om de publieke opinie in kaart te brengen (sentiment analysis). In de biotechnologie wordt textmining ingezet om wetenschappelijke informatie te analyseren uit de gigantische hoeveelheid publicaties.[2][3] Textmining wordt ook benut door inlichtingendiensten.[4][5] In die zin kan textmining beschouwd worden als een vorm van datamining. Tekstmining kan daarbij als doel dienen om een dataset te genereren waarop vervolgens statistische analyses worden toegepast.

Tekstmining is een toegankelijker woord voor bepaalde onderdelen uit het brede gebied van computationele taalkunde. Dit kennisgebied houdt zich bezig met het verwerken van menselijke taal door computers.