Tool ChatGPT-o4 - IP2024-05

TOOLS SIMON BEEN

Bot als

assistent

persoonlijk

Simon Been
Directeur van het Papieren Tijger Netwerk en spreker/trainer/auteur over AI in het informatiedomein

Sinds de introductie van ChatGPT in november 2022 zijn AI-chatbots aan een opmars bezig bij een breed publiek. De tool van OpenAI draait nu anderhalf jaar; hoe staat het ermee?

ChatGPT (GPT-4)	GPT-1	GPT-2	GPT-3	ChatGPT (GPT-3.5)	ChatGPT (GPT-4)
	Juni 2018	Februari 2019	Juni 2020	November 2022	Maart 2023
Aantal parameters	117 miljoen	1,5 miljard	175 miljard	175 miljard	Onbekend, maar meer dan GPT-3
Contextlengte	Enkele zinnen	Korte paragrafen	Enkele duizenden tokens	Enkele duizenden tokens	Enkele duizenden tokens
Tekstbegrip	Basis	Goed	Zeer goed	Zeer goed	Uitstekend
Conversatiebeheer	Eenvoudig	Matig	Geavanceerd	Zeer geavanceerd	Zeer geavanceerd
Codering	Beperkt	Basis	Goed	Zeer goed	Uitstekend
Creatief schrijven	Beperkt	Basis	Zeer goed	Zeer goed	Uitstekend
Redeneren	Basis	Basis	Goed	Goed	Zeer goed
Taken voltooien	Eenvoudige opdrachten	Complexere opdrachten	Geavanceerde opdrachten	Geavanceerde opdrachten	Complexe en veelzijdige opdrachten
Specialisatie	Algemeen taalmodel	Algemeen taalmodel	Algemeen taalmodel	Gespecialiseerd in conversaties	Gespecialiseerd in conversaties
Foutafhandeling	Basis	Basis	Matig	Goed	Zeer goed

	ChatGPT (GPT-4)	ChatGPT (GPT-4o)
	Maart 2023	Mei 2024
Tekstbegrip	Uitstekend	Verbeterd begrip van complexe en technische teksten
Conversatiebeheer	Zeer geavanceerd	Betere contextbewaking, coherentie en langere dialoogcapaciteit
Codering	Uitstekend	Verbeterde nauwkeurigheid en efficiëntie, ondersteuning voor meer programmeertalen
Creatief schrijven	Uitstekend	Betere creativiteit, stijlvariatie en genrediversiteit
Redeneren	Zeer goed	Betere logische, causale en strategische redenering
Taken voltooien	Complexe en veelzijdige opdrachten	Nog complexere en efficiëntere taakuitvoering
Specialisatie	Gespecialiseerd in conversaties	Nog meer gespecificeerd in verschillende domeinen
Gebruikersfeedback	Sterk geïntegreerd in finetuning	Nog sterker geïntegreerd, snellere aanpassingen door continue feedbackloops
Foutafhandeling	Zeer goed	Snellere en nauwkeurigere foutcorrectie, verbeterde zelfherstelcapaciteit
Multimodaliteit	Beperkt (tekst)	Ondersteuning voor meerdere modaliteiten (tekst, beeld, spraak)
Veiligheid en bias	Verbeterd ten opzichte van eerdere versies	Nog verder verbeterde veiligheid en bias-mitigatie
Interactie met tools	Basisinteractie met enkele tools	Uitgebreide interactie met een breed scala aan externe tools en API's
Emotieherkenning	Niet beschikbaar	Herkenning van stem- en gezichtsuitdrukkingen

Bron: AI Search

Vorige maand introduceerde OpenAI GPT-4o en ChatGPT-4o, waarbij de o staat voor omni omdat de tool tekst, spraak en video integreert, en dat real time. Deze splinternieuwe 4o-versie is deels al beschikbaar voor ChatGPT Plus-abonnees, en het eerste wat opvalt is de snelheid. Beantwoording ging altijd al vlot, maar begon met een pauze, en dat is nu niet meer het geval. De afbeeldingen die worden gegenereerd (dit duurt nog steeds wel even) kun je op onderdelen aanpassen, en als je een afbeelding uploadt, kun je de AI erover bevragen. Verder gaat het maken van grafieken verbazingwekkend goed, is de stem levensecht en kun je om links vragen voor bronvermelding. Andere verbeteringen worden nog uitgerold.

GEZICHTSUITDRUKKING HERKENNEN
OpenAI noemt 4o ‘geen sprong’, maar als je de video’s bekijkt van de lancering – niet gemanipuleerd, alles real time – knipper je wel met je ogen en klapper je met je oren. Wat Google pretendeerde in december 2023 is nu ‘echt’ mogelijk, en meer dan dat:

> De AI herkent aan je stem en/of je gezichtsuitdrukking of er iets aan de hand is, en stelt bijvoorbeeld voor om even diep adem te halen.

> Terwijl ze meekijkt met wat je doet, coacht ze je als een docent om zélf een wiskundig vraagstuk op te lossen.

> Twee AI’s op mobieltjes praten tegen elkaar terwijl de ene kan ‘kijken’ en de andere niet.

> Twee AI-stemmen; de ene stem zingt op verzoek over wat ‘ze’ net heeft meegemaakt en vervolgens zingen ze om en om elk een regel die rijmt op de vorige.

> De AI ‘smelt’ als ze wordt voorgesteld aan een hond.

> De AI ‘ziet’ aan de vlag op Buckingham Palace dat de koning thuis is, en ze attendeert een blinde man erop dat er een taxi komt aanrijden en hij zijn hand moet opsteken om de auto te laten stoppen.

> De AI fungeert als tolk tussen een Engelstalige spreker en een Spaanstalige die zeer rap van de tongriem is gesneden.

GRATIS GEBRUIKERS
Superboeiend, maar het belangrijkste gebeurt natuurlijk onder de motorkap. Hoeveel beter zijn de antwoorden? Hoe zit het met fouten, bias, ‘diepte’ en actualiteit van de kennis? Veel daarvan moet nog blijken in de praktijk. Waarschijnlijk is daar weinig aan veranderd en is dat de reden waarom OpenAI er bescheiden over is. Versie 4o draait om snelheid en de extra modi, hoewel ChatGPT-4o zelf zegt te beschikken over ‘verbeterd contextueel begrip, wat resulteert in nauwkeurigere en relevantere resultaten, vooral in complexe en lange documenten’. Als voorbeeld geeft de tool: ‘Een bibliothecaris kan specifieke zoekopdrachten uitvoeren naar zeldzame boeken of archiefstukken op basis van complexe criteria, zoals historische context, auteurschap en inhoudsthema’s, en ChatGPT-4o levert nauwkeurige en relevante resultaten.’ Ook schijnt de AI een stuk beter te zijn in niet-Engelse talen.

Misschien wel het verbluffendste: al deze 4o-functionaliteiten voor betalende abonnees gaan binnenkort beschikbaar komen voor gratis gebruikers. Dat kan maar een ding betekenen: er is een nieuw model in aantocht voor de betalende gebruikers. Een échte sprong.

TO HYPE OR NOT TO HYPE
Voordat ik word beticht van hypezaaierij: upgrades zijn geen toverstokjes. Sommige beperkingen zijn hardnekkig en elke verandering creëert nieuwe beperkingen. Zo is het fijn dat ChatGPT-4o vrijgeviger is met links, maar de kwaliteit ervan wisselt. Inderdaad, de eerste praktijkervaringen zijn binnen: ik verzamelde achtergrondinformatie voor dit artikel, en ik wilde die natuurlijk checken. De links naar bronnen in een bepaalde chat verwezen ineens allemaal naar één plek, en dat was niet Wikipedia of een andere geloofwaardige bron, maar een artikel in een onbekend tijdschrift. Ik vroeg om betere bronnen, en ik kreeg onder andere een nieuw onbekend tijdschrift met paywall. Een aangepast verzoek om betrouwbare, objectieve openbare bronnen werkte echter goed. Het is maar hoe je het vraagt.

Waarom ik overigens kies voor OpenAI en ChatGPT? Omdat zij de trendsetters zijn en best in class. Het is haasje-over in de AI-race, maar als het stof is neergedaald, lopen zij steeds weer vooraan, en niet alleen vanwege hun prestaties, maar ook vanwege het gebruiksgemak en de taalvaardigheid in het Nederlands. Voorlopig althans. Het is natuurlijk afwachten of dit zo blijft. <

‘Upgrades zijn geen toverstokjes. Sommige beperkingen zijn hardnekkig en elke verandering creëert nieuwe beperkingen’

‘Het is haasje-over in de AI-race, maar als het stof is neergedaald, lopen OpenAI en ChatGPT steeds weer vooraan’

IP | vakblad voor informatieprofessionals | 05 / 2024

Deel 8
artikelenserie over kunstmatige intelligentie

Bot als

persoonlijk

assistent

Simon Been
Directeur van het Papieren Tijger Netwerk en spreker/trainer/auteur over AI in het informatiedomein

TOOLS SIMON BEEN

Sinds de introductie van ChatGPT in november 2022 zijn AI-chatbots aan een opmars bezig bij een breed publiek. De tool van OpenAI draait nu anderhalf jaar; hoe staat het ermee?

Voor tabellen

De lijst is vele malen langer. Wil je weten hoeveel AI-tools er intussen zijn en wat die kunnen, check dan There’s An AI For That (TAAFT) voor een overzicht. Of kijk op AI Search.

OVERZICHT(JE) VAN CHATBOTS

> ChatGPT
> Google Gemini
> Meta AI
> HuggingChat (open source)
> Zapier AI Chatbot
> Microsoft Copilot (met Bing)
> Perplexity
> YouChat
> KoalaChat
> Jasper Chat
> MetaGPT
> Claude
> Ernie Bot
> Bloom
> Character.ai

> De AI herkent aan je stem en/of je gezichtsuitdrukking of er iets aan de hand is, en stelt bijvoorbeeld voor om even diep adem te halen.

> Terwijl ze meekijkt met wat je doet, coacht ze je als een docent om zélf een wiskundig vraagstuk op te lossen.

> Twee AI’s op mobieltjes praten tegen elkaar terwijl de ene kan ‘kijken’ en de andere niet.

> Twee AI-stemmen; de ene stem zingt op verzoek over wat ‘ze’ net heeft meegemaakt en vervolgens zingen ze om en om elk een regel die rijmt op de vorige.

> De AI ‘smelt’ als ze wordt voorgesteld aan een hond.

DE VOORGAANDE DELEN
VAN DEZE SERIE LEZEN?
Je vindt ze in het online archief op
de IP-website. Klik hieronder voor:

> DEEL 1

Je staande houden ‘in de AI Wars’

> DEEL 2

Manusje-van-alles en sparringpartner

> DEEL 3

Impact AI op functies en taken in de informatieprofessie

> DEEL 4

Magistrale magie
– EU versus AI

> DEEL 5

Drie praktijkgevallen:
Interactie, Metadata
en Structurering

Nieuwe ambities en rollen voor de informatieprofessie

> DEEL 6

> DEEL 7

Omgaan met AI
– vier cases

IP | vakblad voor informatieprofessionals | 05 / 2024