HP's AI weekly - week 42

Verzonden op 17-10-2025 07:44

Slechts 250 documenten nodig om een taalmodel te 'vergiftigen'

Onderzoek van Anthropic, gepubliceerd op 10 oktober 2025, toont aan dat er slechts 250 kwaadaardige documenten nodig zijn om een groot taalmodel te 'vergiftigen' en een achterdeur in te bouwen. Dit aantal bleek effectief voor modellen van 600 miljoen tot 13 miljard parameters.

Dit is een alarmerende bevinding. Eerdere aannames gingen uit van een percentage van de trainingsdata (bv. 0,1%), wat voor grote modellen miljoenen documenten zou betekenen. Nu blijkt het om een absoluut, en relatief klein, aantal te gaan.

Voor organisaties die modellen finetunen op eigen of externe data, benadrukt dit het risico van 'data poisoning'. Een aanvaller kan een 'trigger' (een specifiek woord of zin) inbouwen die het model ongewenst gedrag laat vertonen, zoals het negeren van veiligheidsinstructies.

De onderzoekers merkten wel op dat verdere training op schone data en veiligheidsafstemming dit effect kunnen verminderen, maar het onderstreept de noodzaak voor strengere datakwaliteitscontroles.

anthropic · arxiv

Google en Amazon lanceren AI-platforms voor de werkplek

Google lanceerde op 10 oktober 2025 'Gemini Enterprise', een platform waarmee bedrijven zonder code AI-agenten kunnen bouwen. Opvallend genoeg kwam Amazon op dezelfde dag met het vergelijkbare 'Quick Suite'.

De strijd om de zakelijke AI-markt verschuift hiermee van wie het beste model heeft, naar wie de minste frictie biedt voor integratie in dagelijkse processen.

Voor jouw organisatie betekent dit dat je medewerkers nu zelf agenten kunt laten bouwen die taken automatiseren over systemen als Salesforce en Microsoft 365. Google's Enterprise-tier kost $30 per gebruiker per maand.

De belofte van 'no-code' is groot, maar de effectiviteit van deze agenten zal sterk afhangen van de kwaliteit en toegankelijkheid van je interne data. Zonder een goede databasis blijft het een worsteling.

Actie-tip: Wijs deze week een specifiek, afgebakend proces aan (bv. het onboarden van een nieuwe klant) en bouw een prototype-agent in een van deze platforms om te zien waar je in de praktijk tegenaan loopt.

google · amazon

OpenAI gaat eigen AI-chips ontwikkelen met Broadcom

OpenAI kondigde op 14 oktober 2025 een strategische samenwerking aan met Broadcom om eigen, op maat gemaakte AI-chips te ontwikkelen. Het doel is om 10 gigawatt aan rekenkracht te realiseren.

Deze stap volgt op eerdere deals met AMD en Nvidia en is cruciaal voor OpenAI om de immense en kostbare vraag naar rekenkracht voor toekomstige modellen te beheersen. Ze treden hiermee in de voetsporen van Google en Amazon, die al langer eigen chips ontwerpen.

Door controle te krijgen over de hardwarestack kan OpenAI de prestaties en kosten van zijn modellen optimaliseren. Dit kan voor jouw organisatie op termijn leiden tot lagere API-kosten en krachtigere AI-diensten.

De eerste chips komen pas in de tweede helft van 2026 online. De vraag is of OpenAI kan concurreren met Nvidia's jarenlange voorsprong in hardware-optimalisatie.

Anthropic lanceert Claude Haiku 4.5: sneller en drie keer goedkoper

Anthropic heeft op 16 oktober 2025 Claude Haiku 4.5 gelanceerd. Dit is de kleinste en snelste variant in hun nieuwste modellenfamilie, die de prestaties van het duurdere Sonnet 4-model van enkele maanden geleden evenaart.

De trend is duidelijk: de kosten voor capabele AI dalen in hoog tempo. Voor $1 per miljoen input-tokens biedt Haiku 4.5 nu een alternatief dat voorheen aanzienlijk duurder was.

Voor bedrijven die AI-agenten op schaal willen inzetten, is dit een belangrijke ontwikkeling. Je kunt nu meerdere Haiku-agenten parallel laten draaien voor routinetaken, gecoördineerd door een krachtiger model als Sonnet 4.5, wat de totale operationele kosten drukt.

Het model is per direct beschikbaar via de Claude API en in de Claude Code-ontwikkeltool, waar het de 'Explore'-subagent standaard aandrijft voor snellere interactie.

anthropic

Google's video-AI Veo 3.1 krijgt meer creatieve controle

Google heeft op 16 oktober 2025 Veo 3.1 uitgerold, een upgrade van zijn video-AI die zich richt op meer controle voor makers. De update volgt kort op de virale lancering van OpenAI's Sora 2.

Waar Sora 2 vooral de aandacht trok met hyperrealisme, focust Google op praktische tools voor filmmakers. Nieuwe functies zoals 'scene extension' en het genereren van transities tussen een start- en eindframe geven je meer regie over het eindresultaat.

Je kunt nu ook tot drie referentie-afbeeldingen gebruiken om de consistentie van een personage of stijl over meerdere scènes te behouden. De vraag is of deze nuttige functies opwegen tegen de 'wow'-factor van de concurrentie.

De nieuwe modellen zijn per direct beschikbaar in Google's ecosysteem, waaronder de filmmaker-tool Flow en via de Gemini API in Vertex AI.

blog

OpenAI opent de deur voor erotiek in ChatGPT

OpenAI CEO Sam Altman kondigde op 15 oktober 2025 aan dat ChatGPT vanaf december 2025 'erotische' conversaties zal toestaan voor geverifieerde volwassen gebruikers. De stap is onderdeel van een breder plan om de AI-assistent een meer menselijke persoonlijkheid te geven.

Hiermee betreedt OpenAI de lucratieve, maar complexe markt van AI-companions, waar concurrenten als xAI's Grok al actief zijn. Het bedrijf wil de 'te restrictieve' houding loslaten om de gebruikerservaring te verbeteren.

Voor de 800 miljoen wekelijkse gebruikers betekent dit meer vrijheid, maar het roept ook vragen op over de risico's van emotionele afhankelijkheid en de grens tussen intimiteit en illusie. OpenAI stelt dat de modus niet wordt geactiveerd tenzij een gebruiker er expliciet om vraagt.

De aanpassing wordt ondersteund door nieuwe systemen voor leeftijdsverificatie en een recent opgerichte adviesraad voor 'welzijn en AI'.

theverge

Slack transformeert tot een open AI-ecosysteem

Slack heeft zijn klassieke Slackbot geüpgraded tot een volwaardige AI-assistent en opent zijn platform voor diepe integraties met modellen van OpenAI, Anthropic en Perplexity. De nieuwe functies zijn in bèta voor 70.000 gebruikers.

Dit verandert Slack van een chat-app in een centrale hub waar je direct vanuit een gesprek taken kunt laten uitvoeren door verschillende AI-agenten. Je kunt nu bijvoorbeeld een projectplan laten opstellen of data uit Salesforce en Google Drive laten ophalen.

Voor organisaties betekent dit dat workflows direct kunnen starten waar de communicatie plaatsvindt. Het elimineert de noodzaak om constant te wisselen tussen applicaties en verlaagt de drempel om AI te gebruiken voor dagelijkse taken.

De nieuwe Slackbot, die draait op de beveiligde cloud van Amazon, gebruikt geen gebruikersdata om zijn modellen te trainen.

slack · theverge

Karpathy lanceert 'nanochat': train je eigen ChatGPT-kloon voor $100

AI-onderzoeker Andrej Karpathy heeft op 13 oktober 2025 'nanochat' gelanceerd, een open-source code-repository waarmee je een complete, kleine versie van een ChatGPT-achtig model kunt trainen en draaien voor ongeveer $100.

Dit project maakt de volledige levenscyclus van een taalmodel – van pretraining tot een werkende chat-interface – toegankelijk voor een breed publiek. Het is geschreven in slechts 8.000 regels code en bedoeld als educatief en hackbaar alternatief voor complexe frameworks.

Voor ontwikkelaars en onderzoekers biedt dit een unieke kans om te experimenteren met het bouwen van eigen modellen zonder enorme budgetten. Hoewel een $100-model beperkt is, leert het al wel simpele taken en wordt het coherenter naarmate je meer investeert.

Actie-tip: Als je een ontwikkelaar bent, probeer dit weekend nanochat te draaien op een cloud GPU. Het proces van vier uur geeft je een fundamenteel begrip van wat er nodig is om een LLM van de grond af op te bouwen.

github

AI van Google en Yale ontdekt nieuwe aanpak voor kankertherapie

Onderzoekers van Google en Yale University hebben met een op Gemma gebaseerd AI-model een voorheen onbekend mechanisme ontdekt om kankercellen zichtbaarder te maken voor het immuunsysteem. De ontdekking is inmiddels succesvol in levende cellen getest.

Het model, C2S-Scale 27B, analyseert cellulaire data als een taal en voorspelde dat het bestaande medicijn 'silmitasertib' de zichtbaarheid van tumoren voor immuuncellen met ongeveer 50% kon verhogen.

Dit is een van de eerste concrete voorbeelden waarbij een AI niet alleen bestaande kennis analyseert, maar een volledig nieuwe, experimenteel gevalideerde wetenschappelijke hypothese genereert. Het laat zien dat AI een rol kan spelen in fundamentele ontdekkingen.

Google stelt daarnaast dat 'biologische modellen duidelijke schaalwetten volgen', wat suggereert dat grotere AI-modellen in de toekomst tot nog meer doorbraken in de geneeskunde kunnen leiden.

blog

Figure AI onthult 'massaproductie' humanoïde robot Figure 03

Figure AI heeft zijn derde generatie humanoïde robot, Figure 03, onthuld. Het model is specifiek ontworpen voor massaproductie en kan huishoudelijke taken uitvoeren zoals de was vouwen en de vaatwasser inruimen.

TIME Magazine noemde de robot al een van de beste uitvindingen van 2025. In tegenstelling tot eerdere prototypes, is Figure 03 afgewerkt met een zachte, wasbare stof en uitgerust met verbeterde camera's en tactiele sensoren in de vingertoppen.

Het bedrijf, dat $1 miljard ophaalde bij investeerders als Nvidia en Jeff Bezos, bouwt een fabriek die initieel 12.000 robots per jaar kan produceren. Het AI-systeem 'Helix' leert nieuwe taken door menselijke acties te observeren, zoals het leren vouwen van handdoeken na het bekijken van 80 uur aan videobeelden.

Toch is er een realiteitscheck: CEO Brett Adcock geeft toe dat de robot nog niet klaar is voor thuisgebruik en hoopt dit in 2026 te realiseren. Tijdens een demo bleef de robot bijvoorbeeld wasgoed laten vallen.

figure · time

← Terug naar overzicht