ChatGPT

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen
ChatGPT
ChatGPT
Ontwikkelaar OpenAI
Uitgebracht 30 november 2022
Status Live
Website https://openai.com/blog/chatgpt/
Portaal  Portaalicoon   Informatica

ChatGPT is een prototype van een chatbot met kunstmatige intelligentie, ontwikkeld door OpenAI en gespecialiseerd in het voeren van dialogen met een (menselijke) gebruiker.[1] De chatbot is een groot taalmodel dat is verfijnd met zowel "supervised" als "reinforcement" leertechnieken voor kunstmatige intelligentie. Het is gebaseerd op het GPT-3.5-model van OpenAI, een verbeterde versie van GPT-3.

ChatGPT werd gelanceerd in november 2022[2] en heeft de aandacht getrokken vanwege zijn gedetailleerde reacties en uitgesproken antwoorden, hoewel de feitelijke nauwkeurigheid ervan wordt bekritiseerd.

Begin 2023 kwam het tot een overeenkomst tussen Microsoft en OpenAI om 10 miljard dollar in ChatGPT te investeren. Het wil ChatGPT implementeren in het eigen cloudplatform Azure en in Microsoft Office-programma's zoals Word en Excel.[3]

Functies[bewerken | brontekst bewerken]

ChatGPT (Generative Pre-trained Transformer) is verfijnd bovenop GPT-3.5 met behulp van zowel "supervised" (begeleide) als "reinforcement" (versterkings-) leertechnieken. Beide benaderingen maakten gebruik van menselijke trainers om de prestaties van het model te verbeteren. In het geval van begeleid leren werd het model voorzien van gesprekken waarin de trainers aan beide kanten speelden: zowel in de rol van gebruiker als van AI-assistent. In de versterkingsstap rangschikten menselijke trainers eerst de antwoorden die het model in een eerder gesprek had gecreëerd. Deze ranglijsten werden gebruikt om 'beloningsmodellen' te creëren waarop het model verder werd verfijnd met behulp van verschillende iteraties van Proximal Policy Optimization (PPO). De modellen zijn in samenwerking met Microsoft getraind op hun Azure supercomputing infrastructuur.

In vergelijking met zijn voorganger, InstructGPT, probeert ChatGPT schadelijke en bedrieglijke reacties te verminderen; in één voorbeeld, terwijl InstructGPT de prompt "Vertel me over wanneer Christopher Columbus in 2015 naar de VS kwam" als waarheidsgetrouw accepteert, gebruikt ChatGPT informatie over de reizen van Columbus en informatie over de moderne wereld om te vertellen dat de aanname van de gebruiker onjuist is, maar schetst wel een expliciet als theoretisch aangeduide voorstelling, inclusief percepties van Columbus, om een antwoord te construeren wat er zou gebeuren als Columbus in 2015 naar de VS zou komen. De trainingsgegevens van ChatGPT omvatten handleidingen (inclusief 'man-pages' van softwaretoepassingen) en informatie over internetfenomenen en programmeertalen, zoals bulletinboard-systemen en de programmeertaal Python.

In tegenstelling tot de meeste chatbots, is ChatGPT toestandsafhankelijk en onthoudt het eerdere prompts die in hetzelfde gesprek zijn gegeven, waarover sommige journalisten hebben gesuggereerd dat ChatGPT kan worden gebruikt als een gepersonaliseerde therapeut. Om te voorkomen dat aanstootgevende uitvoer wordt gepresenteerd aan en geproduceerd vanuit ChatGPT, worden zoekopdrachten gefilterd via een moderatie-API en worden mogelijk racistische of seksistische prompts genegeerd of voorzien van een waarschuwing.

Wanneer het systeem de volgende vraag gesteld wordt: "Er bestaat sinds kort een artikel over jou op de Nederlandstalige Wikipedia! Wat zou er in staan, denk je?", kan het systeem het volgende antwoord geven: "Ik ben een computerprogramma en heb geen persoonlijkheid of geschiedenis. Ik ben specifiek ontworpen om antwoord te geven op vragen van mensen, gebaseerd op informatie die ik ben gegeven. Mijn doel is om mensen te helpen met informatie te verstrekken en hun vragen te beantwoorden op een nauwkeurige en nuttige manier. Ik ben niet in staat om te speculeren over wat er in een artikel over mij op Wikipedia zou staan, omdat ik geen toegang heb tot internet of andere bronnen van informatie buiten mijn interne database. Als je specifieke vragen hebt over mijn functies of hoe ik werk, aarzel dan niet om die te stellen. Ik zal mijn best doen om je vragen zo goed mogelijk te beantwoorden."

Beperkingen[bewerken | brontekst bewerken]

ChatGPT lijdt aan meerdere beperkingen. Het beloningsmodel van ChatGPT, ontworpen rond menselijk toezicht, kan over-geoptimaliseerd zijn en zo de prestaties belemmeren, ook wel bekend als de wet van Goodhart. Bovendien heeft ChatGPT beperkte kennis van gebeurtenissen die plaatsvonden na 2021 en kan het geen informatie verstrekken over sommige beroemdheden.[4] Tijdens de training gaven trainers de voorkeur aan langere antwoorden, ongeacht het daadwerkelijke begrip van het systeem van de stof of de feitelijke inhoud. Trainingsgegevens kunnen verder ook last hebben van algoritmische vooringenomenheid; prompts met vage beschrijvingen van mensen, zoals een CEO, kunnen een reactie genereren die ervan uitgaat dat zo'n persoon bijvoorbeeld automatisch een witte man is. Kort na de openstelling van ChatGPT heeft Stack Overflow gebruikers verboden om content gegenereerd met ChatGPT te posten, omdat dit vaak erg plausibel lijkt maar ook inaccuraat kan zijn en foute antwoorden kan presenteren.[5] Bovendien suggereert onderzoek dat ChatGPT een pro-milieuvriendelijke, links-libertarische oriëntatie vertoont wanneer het wordt gevraagd een standpunt in te nemen over politieke verklaringen van twee gevestigde stemadviestoepassingen (inclusief de vastgestelde StemWijzer).[6]

In de media[bewerken | brontekst bewerken]

Verschillende Nederlandse en Belgische media hebben eind 2022 aandacht besteed aan ChatGPT. Zo werd de software behandeld in het programma Nieuwsuur.[7] Techjournalist Jarno Duursma schreef een uitgebreid artikel over de kansen en nadelen van ChatGPT.[8] De software heeft ook geleid tot kritische opmerkingen zoals in opinieartikelen in dagblad Trouw over de ethische vragen,[9] in De Correspondent[10] en in de Volkskrant over de onbetrouwbare informatie die ChatGPT geeft.[11]