TOOLS       SIMON BEEN

Bot als
assistent
persoonlijk

Simon Been
Directeur van het Papieren Tijger Netwerk en spreker/trainer/auteur over AI in het informatiedomein

Sinds de introductie van ChatGPT in november 2022 zijn AI-chatbots aan een opmars bezig bij een breed publiek. De tool van OpenAI draait nu anderhalf jaar; hoe staat het ermee?

ChatGPT (GPT-4)

GPT-1

GPT-2

GPT-3

ChatGPT (GPT-3.5)

ChatGPT (GPT-4)

Juni 2018

Februari 2019

Juni 2020

November 2022

Maart 2023

Aantal parameters

117 miljoen

1,5 miljard

175 miljard

175 miljard

Onbekend, maar meer dan GPT-3

Contextlengte

Enkele zinnen

Korte paragrafen

Enkele duizenden tokens

Enkele duizenden tokens

Enkele duizenden tokens

Tekstbegrip

Basis

Goed

Zeer goed

Zeer goed

Uitstekend

Conversatiebeheer

Eenvoudig

Matig

Geavanceerd

Zeer geavanceerd

Zeer geavanceerd

Codering

Beperkt

Basis

Goed

Zeer goed

Uitstekend

Creatief schrijven

Beperkt

Basis

Zeer goed

Zeer goed

Uitstekend

Redeneren

Basis

Basis

Goed

Goed

Zeer goed

Taken voltooien

Eenvoudige opdrachten

Complexere opdrachten

Geavanceerde opdrachten

Geavanceerde opdrachten

Complexe en veelzijdige opdrachten

Specialisatie

Algemeen taalmodel

Algemeen taalmodel

Algemeen taalmodel

Gespecialiseerd in conversaties

Gespecialiseerd in conversaties

Foutafhandeling

Basis

Basis

Matig

Goed

Zeer goed

ChatGPT (GPT-4)

ChatGPT (GPT-4o)

Maart 2023

Mei 2024

Tekstbegrip

Uitstekend

Verbeterd begrip van complexe en technische teksten

Conversatiebeheer

Zeer geavanceerd

Betere contextbewaking, coherentie en langere dialoogcapaciteit

Codering

Uitstekend

Verbeterde nauwkeurigheid en efficiëntie, ondersteuning voor meer programmeertalen

Creatief schrijven

Uitstekend

Betere creativiteit, stijlvariatie en genrediversiteit

Redeneren

Zeer goed

Betere logische, causale en strategische redenering

Taken voltooien

Complexe en veelzijdige opdrachten

Nog complexere en efficiëntere taakuitvoering

Specialisatie

Gespecialiseerd in conversaties

Nog meer gespecificeerd in verschillende domeinen

Gebruikersfeedback

Sterk geïntegreerd in finetuning

Nog sterker geïntegreerd, snellere aanpassingen door continue feedbackloops

Foutafhandeling

Zeer goed

Snellere en nauwkeurigere foutcorrectie, verbeterde zelfherstelcapaciteit

Multimodaliteit

Beperkt (tekst)

Ondersteuning voor meerdere modaliteiten (tekst, beeld, spraak)

Veiligheid en bias

Verbeterd ten opzichte van eerdere versies

Nog verder verbeterde veiligheid en bias-mitigatie

Interactie met tools

Basisinteractie met enkele tools

Uitgebreide interactie met een breed scala aan externe tools en API's

Emotieherkenning

Niet beschikbaar

Herkenning van stem- en gezichtsuitdrukkingen

Bron: AI Search

Vorige maand introduceerde OpenAI GPT-4o en ChatGPT-4o, waarbij de o staat voor omni omdat de tool tekst, spraak en video integreert, en dat real time. Deze splinternieuwe 4o-versie is deels al beschikbaar voor ChatGPT Plus-abonnees, en het eerste wat opvalt is de snelheid. Beantwoording ging altijd al vlot, maar begon met een pauze, en dat is nu niet meer het geval. De afbeeldingen die worden gegenereerd (dit duurt nog steeds wel even) kun je op onderdelen aanpassen, en als je een afbeelding uploadt, kun je de AI erover bevragen. Verder gaat het maken van grafieken verbazingwekkend goed, is de stem levensecht en kun je om links vragen voor bronvermelding. Andere verbeteringen worden nog uitgerold.

GEZICHTSUITDRUKKING HERKENNEN
OpenAI noemt 4o ‘geen sprong’, maar als je de video’s bekijkt van de lancering – niet gemanipuleerd, alles real time – knipper je wel met je ogen en klapper je met je oren. Wat Google pretendeerde in december 2023 is nu ‘echt’ mogelijk, en meer dan dat:

> De AI herkent aan je stem en/of je gezichtsuitdrukking of er iets aan de hand is, en stelt bijvoorbeeld voor om even diep adem te halen. 

> Terwijl ze meekijkt met wat je doet, coacht ze je als een docent om zélf een wiskundig vraagstuk op te lossen. 

> Twee AI’s op mobieltjes praten tegen elkaar terwijl de ene kan ‘kijken’ en de andere niet.

> Twee AI-stemmen; de ene stem zingt op verzoek over wat ‘ze’ net heeft meegemaakt en vervolgens zingen ze om en om elk een regel die rijmt op de vorige. 

> De AI ‘smelt’ als ze wordt voorgesteld aan een hond. 

> De AI ‘ziet’ aan de vlag op Buckingham Palace dat de koning thuis is, en ze attendeert een blinde man erop dat er een taxi komt aanrijden en hij zijn hand moet opsteken om de auto te laten stoppen. 

> De AI fungeert als tolk tussen een Engelstalige spreker en een Spaanstalige die zeer rap van de tongriem is gesneden.


GRATIS GEBRUIKERS
Superboeiend, maar het belangrijkste gebeurt natuurlijk onder de motorkap. Hoeveel beter zijn de antwoorden? Hoe zit het met fouten, bias, ‘diepte’ en actualiteit van de kennis? Veel daarvan moet nog blijken in de praktijk. Waarschijnlijk is daar weinig aan veranderd en is dat de reden waarom OpenAI er bescheiden over is. Versie 4o draait om snelheid en de extra modi, hoewel ChatGPT-4o zelf zegt te beschikken over ‘verbeterd contextueel begrip, wat resulteert in nauwkeurigere en relevantere resultaten, vooral in complexe en lange documenten’. Als voorbeeld geeft de tool: ‘Een bibliothecaris kan specifieke zoekopdrachten uitvoeren naar zeldzame boeken of archiefstukken op basis van complexe criteria, zoals historische context, auteurschap en inhoudsthema’s, en ChatGPT-4o levert nauwkeurige en relevante resultaten.’ Ook schijnt de AI een stuk beter te zijn in niet-Engelse talen.

Misschien wel het verbluffendste: al deze 4o-functionaliteiten voor betalende abonnees gaan binnenkort beschikbaar komen voor gratis gebruikers. Dat kan maar een ding betekenen: er is een nieuw model in aantocht voor de betalende gebruikers. Een échte sprong.

TO HYPE OR NOT TO HYPE
Voordat ik word beticht van hypezaaierij: upgrades zijn geen toverstokjes. Sommige beperkingen zijn hardnekkig en elke verandering creëert nieuwe beperkingen. Zo is het fijn dat ChatGPT-4o vrijgeviger is met links, maar de kwaliteit ervan wisselt. Inderdaad, de eerste praktijkervaringen zijn binnen: ik verzamelde achtergrondinformatie voor dit artikel, en ik wilde die natuurlijk checken. De links naar bronnen in een bepaalde chat verwezen ineens allemaal naar één plek, en dat was niet Wikipedia of een andere geloofwaardige bron, maar een artikel in een onbekend tijdschrift. Ik vroeg om betere bronnen, en ik kreeg onder andere een nieuw onbekend tijdschrift met paywall. Een aangepast verzoek om betrouwbare, objectieve openbare bronnen werkte echter goed. Het is maar hoe je het vraagt.

Waarom ik overigens kies voor OpenAI en ChatGPT? Omdat zij de trendsetters zijn en best in class. Het is haasje-over in de AI-race, maar als het stof is neergedaald, lopen zij steeds weer vooraan, en niet alleen vanwege hun prestaties, maar ook vanwege het gebruiksgemak en de taalvaardigheid in het Nederlands. Voorlopig althans. Het is natuurlijk afwachten of dit zo blijft. <

‘Upgrades zijn geen toverstokjes. Sommige beperkingen zijn hardnekkig en elke verandering creëert nieuwe beperkingen’

‘Het is haasje-over in de AI-race, maar als het stof is neergedaald, lopen OpenAI en ChatGPT steeds weer vooraan’

IP | vakblad voor informatieprofessionals | 05 / 2024

Deel 8
artikelenserie over kunstmatige intelligentie

Bot als
persoonlijk
assistent

Simon Been
Directeur van het Papieren Tijger Netwerk en spreker/trainer/auteur over AI in het informatiedomein

TOOLS       SIMON BEEN

Sinds de introductie van ChatGPT in november 2022 zijn AI-chatbots aan een opmars bezig bij een breed publiek. De tool van OpenAI draait nu anderhalf jaar; hoe staat het ermee?

Voor tabellen

De lijst is vele malen langer. Wil je weten hoeveel AI-tools er intussen zijn en wat die kunnen, check dan There’s An AI For That (TAAFT) voor een overzicht. Of kijk op AI Search.

OVERZICHT(JE) VAN CHATBOTS

> ChatGPT
> 
Google Gemini
> 
Meta AI
> 
HuggingChat (open source)
> 
Zapier AI Chatbot
> 
Microsoft Copilot (met Bing)
> 
Perplexity
> 
YouChat
> 
KoalaChat
> 
Jasper Chat
> 
MetaGPT
> 
Claude
> 
Ernie Bot
> 
Bloom
> 
Character.ai

Vorige maand introduceerde OpenAI GPT-4o en ChatGPT-4o, waarbij de o staat voor omni omdat de tool tekst, spraak en video integreert, en dat real time. Deze splinternieuwe 4o-versie is deels al beschikbaar voor ChatGPT Plus-abonnees, en het eerste wat opvalt is de snelheid. Beantwoording ging altijd al vlot, maar begon met een pauze, en dat is nu niet meer het geval. De afbeeldingen die worden gegenereerd (dit duurt nog steeds wel even) kun je op onderdelen aanpassen, en als je een afbeelding uploadt, kun je de AI erover bevragen. Verder gaat het maken van grafieken verbazingwekkend goed, is de stem levensecht en kun je om links vragen voor bronvermelding. Andere verbeteringen worden nog uitgerold.

GEZICHTSUITDRUKKING HERKENNEN
OpenAI noemt 4o ‘geen sprong’, maar als je de video’s bekijkt van de lancering – niet gemanipuleerd, alles real time – knipper je wel met je ogen en klapper je met je oren. Wat Google pretendeerde in december 2023 is nu ‘echt’ mogelijk, en meer dan dat:

> De AI herkent aan je stem en/of je gezichtsuitdrukking of er iets aan de hand is, en stelt bijvoorbeeld voor om even diep adem te halen. 

> Terwijl ze meekijkt met wat je doet, coacht ze je als een docent om zélf een wiskundig vraagstuk op te lossen. 

> Twee AI’s op mobieltjes praten tegen elkaar terwijl de ene kan ‘kijken’ en de andere niet.

> Twee AI-stemmen; de ene stem zingt op verzoek over wat ‘ze’ net heeft meegemaakt en vervolgens zingen ze om en om elk een regel die rijmt op de vorige. 

> De AI ‘smelt’ als ze wordt voorgesteld aan een hond. 

> De AI ‘ziet’ aan de vlag op Buckingham Palace dat de koning thuis is, en ze attendeert een blinde man erop dat er een taxi komt aanrijden en hij zijn hand moet opsteken om de auto te laten stoppen. 

> De AI fungeert als tolk tussen een Engelstalige spreker en een Spaanstalige die zeer rap van de tongriem is gesneden.


GRATIS GEBRUIKERS
Superboeiend, maar het belangrijkste gebeurt natuurlijk onder de motorkap. Hoeveel beter zijn de antwoorden? Hoe zit het met fouten, bias, ‘diepte’ en actualiteit van de kennis? Veel daarvan moet nog blijken in de praktijk. Waarschijnlijk is daar weinig aan veranderd en is dat de reden waarom OpenAI er bescheiden over is. Versie 4o draait om snelheid en de extra modi, hoewel ChatGPT-4o zelf zegt te beschikken over ‘verbeterd contextueel begrip, wat resulteert in nauwkeurigere en relevantere resultaten, vooral in complexe en lange documenten’. Als voorbeeld geeft de tool: ‘Een bibliothecaris kan specifieke zoekopdrachten uitvoeren naar zeldzame boeken of archiefstukken op basis van complexe criteria, zoals historische context, auteurschap en inhoudsthema’s, en ChatGPT-4o levert nauwkeurige en relevante resultaten.’ Ook schijnt de AI een stuk beter te zijn in niet-Engelse talen.

Misschien wel het verbluffendste: al deze 4o-functionaliteiten voor betalende abonnees gaan binnenkort beschikbaar komen voor gratis gebruikers. Dat kan maar een ding betekenen: er is een nieuw model in aantocht voor de betalende gebruikers. Een échte sprong.

TO HYPE OR NOT TO HYPE
Voordat ik word beticht van hypezaaierij: upgrades zijn geen toverstokjes. Sommige beperkingen zijn hardnekkig en elke verandering creëert nieuwe beperkingen. Zo is het fijn dat ChatGPT-4o vrijgeviger is met links, maar de kwaliteit ervan wisselt. Inderdaad, de eerste praktijkervaringen zijn binnen: ik verzamelde achtergrondinformatie voor dit artikel, en ik wilde die natuurlijk checken. De links naar bronnen in een bepaalde chat verwezen ineens allemaal naar één plek, en dat was niet Wikipedia of een andere geloofwaardige bron, maar een artikel in een onbekend tijdschrift. Ik vroeg om betere bronnen, en ik kreeg onder andere een nieuw onbekend tijdschrift met paywall. Een aangepast verzoek om betrouwbare, objectieve openbare bronnen werkte echter goed. Het is maar hoe je het vraagt.

Waarom ik overigens kies voor OpenAI en ChatGPT? Omdat zij de trendsetters zijn en best in class. Het is haasje-over in de AI-race, maar als het stof is neergedaald, lopen zij steeds weer vooraan, en niet alleen vanwege hun prestaties, maar ook vanwege het gebruiksgemak en de taalvaardigheid in het Nederlands. Voorlopig althans. Het is natuurlijk afwachten of dit zo blijft. <

IP | vakblad voor informatieprofessionals | 05 / 2024