HP's AI weekly - week 23

Verzonden op 05-06-2026 07:44

Claude Opus 4.8 denkt hardop na over zijn onzekerheid

Anthropic heeft Claude Opus 4.8 uitgebracht, met een opvallende toevoeging: zogeheten effort controls waarmee het model zijn eigen onzekerheid kan communiceren. Het idee: een model dat weet wanneer het twijfelt, is betrouwbaarder voor autonome taken dan een model dat altijd met volle overtuiging antwoordt.

Dat maakt deze release relevant voor iedereen die agents bouwt. Hoe meer werk je aan een AI-systeem delegeert, hoe groter de kans op stille fouten. Een model dat zijn eigen grenzen signaleert, maakt human-in-the-loop-design makkelijker.

De keerzijde: het is nog onduidelijk hoe goed die onzekerheid in de praktijk gekalibreerd is. Vertrouwen op zelfrapportage brengt risico's mee als het model zijn eigen beperkingen verkeerd inschat.

Test het in een workflow waarin je nu handmatig controleert of outputs kloppen. Kijk of Opus 4.8 die controles kan vervangen, of op zijn minst beter kan aangeven wanneer ze nodig zijn.

anthropic

AI Forward Deployed Engineer: het nieuwe profiel dat klanten willen

In Silicon Valley groeit de vraag naar een specifiek type AI-professional: de Forward Deployed Engineer (FDE). Dit is een engineer die langdurig bij een klantorganisatie wordt ingebed om AI-oplossingen te bouwen en af te stemmen op de specifieke context van die organisatie, inclusief agentic workflows.

Dat zegt iets over hoe AI-adoptie in de praktijk verloopt. Generieke modellen werken zelden zonder aanpassing. Organisaties die AI serieus inzetten, hebben mensen nodig die de kloof overbruggen tussen wat een model kan en wat een organisatie nodig heeft.

Voor bedrijven die AI willen opschalen betekent dit: investeer in tools én in mensen die weten hoe je die tools aan de specifieke bedrijfscontext koppelt. Of zoek externe partners die deze rol kunnen invullen.

De realiteit is dat FDE's schaars zijn en de vraag snel groeit. Begin alvast met in kaart te brengen welke interne processen het meest gebaat zijn bij agentic automatisering. Dat is de input die een FDE nodig heeft om snel waarde te leveren.

AI-agents zorgen voor meetbare groei in online traffic

Volgens The Batch jagen AI-agents steeds meer online traffic aan. Die verschuiving heeft gevolgen voor hoe je meet of je digitale aanwezigheid werkt.

Waar eerder mensen de primaire gebruikers waren van websites en API's, zijn het nu steeds vaker geautomatiseerde agents die namens gebruikers content opvragen, acties uitvoeren of beslissingen nemen. Als je analytics alleen menselijk gedrag meten, mis je een groeiend deel van het echte gebruik.

Dit raakt aan SEO, API-ontwerp en autorisatiemodellen. Een site die goed vindbaar is voor mensen, hoeft niet optimaal te werken voor agents, en andersom.

Bekijk je huidige analytics en controleer of je bot-traffic eruit filtert of juist meeneemt. Maak een bewuste keuze: wil je agents faciliteren, en zo ja, is je infrastructuur daar klaar voor?

EU AI Act loopt vertraging op in implementatie

De invoering van de EU AI Act verloopt trager dan gepland, meldt The Batch. De precieze oorzaken blijven onbenoemd, maar vertragingen in Europese regelgeving raken organisaties die hun complianceplanning op de eerder aangekondigde tijdlijn hadden afgestemd.

Voor bedrijven die AI-systemen bouwen of inzetten in de hogere risicocategorieën betekent dit even adem. Toch is dat geen reden om compliancewerk uit te stellen. De eisen zelf veranderen niet door de vertraging, alleen de deadline schuift op.

Gebruik de extra tijd om je AI-systemen nu al te documenteren en risicocategorieën vast te stellen. Wie nu ordentelijk documenteert, staat straks niet voor verrassingen.

Gemini Flash wordt duurder voor zware gebruikers

Google heeft de prijsstructuur van Gemini Flash aangepast, waardoor de kosten voor intensief gebruik omhoog gaan. Flash was populair vanwege de combinatie van snelheid en lage prijs, en dat maakt deze wijziging relevant voor iedereen die Flash-workflows op schaal draait.

Gebruik je Gemini Flash in productieomgevingen, dan is dit het moment om je kostenmodel opnieuw te berekenen. Hoeveel calls maak je per dag, en wat betekent de nieuwe prijsstelling voor je maandelijkse API-rekening?

Alternatieven als Claude Haiku of GPT-4o Mini opereren in vergelijkbaar gebied en zijn een benchmark waard als Flash te duur wordt. Vergelijk op prijs per token en latentie voor jouw specifieke use case.

← Terug naar overzicht