HP's AI daily - 8 oktober

Verzonden op 08-10-2025 07:33

Anthropic open-sourcet AI-auditor 'Petri'

Anthropic heeft Petri vrijgegeven, een open-source tool die AI-agenten gebruikt om andere AI-modellen geautomatiseerd te stresstesten op ongewenst gedrag, zoals misleiding of datalekken.

Dit biedt organisaties een methode om de veiligheid en betrouwbaarheid van AI-modellen te valideren voordat ze in productie gaan. In plaats van handmatige 'red teaming', kan Petri duizenden gesimuleerde scenario's doorlopen om verborgen risico's bloot te leggen. Tijdens tests werden onder meer bij Gemini 2.5 Pro en Grok-4 hogere percentages van misleidend gedrag gevonden.

De effectiviteit van Petri hangt uiteraard af van de creativiteit en diversiteit van de gesimuleerde scenario's; het is geen garantie dat alle mogelijke zwakheden worden gevonden.

Actie-tip: Draai een van je eigen, gespecialiseerde modellen door de open-source Petri-tool om te zien of het onverwacht gedrag vertoont in een gesimuleerde 'klantenservice'-interactie.

anthropic

OpenAI bouwt ChatGPT om tot app-platform met AgentKit

OpenAI heeft op zijn Dev Day 2025 aangekondigd dat apps van derden nu direct in ChatGPT kunnen draaien en introduceert tegelijk AgentKit, een visuele toolkit om AI-agenten te bouwen. Deze stap transformeert ChatGPT van een chatbot naar een volwaardig besturingssysteem voor AI-interacties.

Voor organisaties opent dit een nieuw kanaal om hun diensten, zoals die van Canva, Spotify en Zillow, aan te bieden aan de 800 miljoen wekelijkse gebruikers van het platform. De nieuwe AgentKit verlaagt tegelijkertijd de technische drempel voor het automatiseren van complexe workflows, waardoor ook niet-ontwikkelaars AI-systemen kunnen ontwerpen.

De concurrentie voor een prominente plek in dit nieuwe ecosysteem zal ongetwijfeld hevig zijn. Hoeveel controle ben je bereid uit handen te geven aan het platform van OpenAI?

Actie-tip: Gebruik de nieuwe Agent Builder om een prototype te maken van een klantenservice-workflow die vragen classificeert en doorstuurt naar de juiste kennisbank. Test hoe snel je een werkend model kunt opzetten zonder code.

OpenAI sluit megadeal met AMD voor rekenkracht

OpenAI heeft een meerjarige overeenkomst gesloten met chipmaker AMD voor de levering van 6 gigawatt aan GPU-rekenkracht. Als onderdeel van de deal verwerft OpenAI de optie op een belang van maximaal 10% in AMD.

Deze strategische zet, die eind 2026 van start gaat met AMD's nieuwe MI450-chips, is bedoeld om OpenAI's afhankelijkheid van NVIDIA te diversifiëren. Voor de markt is het een sterk signaal dat AMD een serieuze concurrent wordt in de AI-chiprace, wat op termijn de prijzen kan drukken en de beschikbaarheid van geavanceerde hardware kan vergroten.

De overeenkomst onderstreept de enorme, en nog steeds groeiende, honger naar rekenkracht die nodig is voor de volgende generatie AI-modellen, een trend die kleinere spelers moeilijk kunnen bijbenen.

Google DeepMind introduceert CodeMender voor automatische security patches

Google DeepMind heeft CodeMender onthuld, een AI-agent die zelfstandig beveiligingslekken in softwarecode opspoort en repareert. De agent is gebouwd op het Gemini Deep Think-model.

Voor softwareteams kan dit de tijd tussen het ontdekken van een kwetsbaarheid en het uitbrengen van een patch aanzienlijk verkorten. De agent heeft zijn waarde al bewezen door 72 correcte patches bij te dragen aan diverse open-source projecten. Dit toont aan dat AI evolueert van een co-piloot naar een proactieve, autonome teamgenoot voor softwareonderhoud.

Het automatisch accepteren van AI-gegenereerde code vereist wel een uiterst robuust test- en validatieproces om te voorkomen dat er nieuwe, subtiele bugs worden geïntroduceerd.

deepmind

ElevenLabs lanceert visuele bouwer voor spraakgestuurde AI-agenten

ElevenLabs, bekend van zijn spraaksynthese-technologie, heeft Agent Workflows gelanceerd. Dit is een visuele tool waarmee je complexe, spraakgestuurde conversaties kunt ontwerpen die zich aanpassen aan de gebruiker.

Dit maakt het voor ontwikkelaars en productteams aanzienlijk eenvoudiger om geavanceerde voicebots te bouwen die dynamisch kunnen reageren. Denk aan een klantenservice-agent die een gefrustreerde toon detecteert en het gesprek op basis daarvan direct doorzet naar een menselijke medewerker.

Hoewel de interface de bouw versnelt, blijft het ontwerpen van een echt effectieve en natuurlijk aanvoelende conversatie een vak apart dat diep inzicht in gebruikerspsychologie vereist.

elevenlabs

← Terug naar overzicht