Wouter Hoeffnagel - 15 maart 2023

OpenAI: GPT-4 levert menselijke prestaties in professionele en academische benchmarks

OpenAI: GPT-4 levert menselijke prestaties in professionele en academische benchmarks image

OpenAI kondigt de beschikbaarheid van GPT-4 aan. Het gaat om de nieuwste versie van het deep learning-model van OpenAI. De organisatie claimt dat het model menselijke prestaties kan leveren in diverse professionele en academische benchmarks.

Dit is door OpenAI aangekondigd in een blogpost. Een belangrijke nieuwe mogelijkheid van GPT-4 is onder meer het gebruik van tekst en afbeeldingen als input voor het genereren van content. Ook wijst OpenAI op de nauwkeurigheid van het algoritme. Het stelt onder meer dat GPT-4 zich tijdens het maken van examens kan evenaren met de top 10% van de deelnemers. Ter vergelijking: GPT-3.5 scoorde hierop vergelijkbaar met de 10% examendeelnemers die het slechtst presteerde.

'Ongekend stabiel'

"In de afgelopen twee jaar hebben we onze volledige deep learning-stack opnieuw opgebouwd en hebben we samen met Azure een volledig nieuwe supercomputer ontworpen voor onze workload. Een jaar geleden hebben we GPT-3.5 getraind als eerste 'testrun' van het systeem. We hebben enkele bugs gevonden en opgelost, en onze theoretische basis verbeterd. Als gevolg hiervan was onze GPT-4-trainingsrun (voor ons in ieder geval!) ongekend stabiel en is het ons eerste grote model waarvan we de trainingsprestaties van tevoren nauwkeurig kunnen voorspellen. Terwijl we ons blijven concentreren op betrouwbare schaalvergroting, streven we naar het aanscherpen van onze methodologie om ons te helpen toekomstige capaciteiten steeds verder van tevoren te voorspellen en erop voor te bereiden - iets wat we beschouwen als cruciaal voor de veiligheid", schrijft OpenAI.

GPT-4 is beschikbaar via ChatGPT en de API. "Om de mogelijkheid voor beeldinvoer voor te bereiden op een bredere beschikbaarheid, werken we nauw samen met één enkele partner om te beginnen. We gebruiken ook OpenAI Evalus, ons raamwerk voor geautomatiseerde evaluatie van de prestaties van AI-modellen, zodat iedereen tekortkomingen in onze modellen kan melden om verdere verbeteringen te begeleiden", aldus OpenAI. De partner waarnaar OpenAI hierbij verwijst is Be My Eyes, een gratis mobiele app dat de wereld toegankelijker wil maken voor blinde en slechtziende mensen.