HP's AI daily - 6 december

Verzonden op 06-12-2025 07:21

Onderzoek van NeurIPS 2025 legt zwaktes en kansen in AI-modellen bloot

De jaarlijkse NeurIPS-conferentie, de 'Oscars van AI-onderzoek', heeft de beste papers van 2025 bekroond. Twee bevindingen springen eruit: het 'Artificial Hivemind'-effect en een simpele aanpassing genaamd 'Gated Attention'.

Deze papers gaan niet over het bouwen van nóg grotere modellen, maar over het fundamenteel begrijpen en verbeteren van de huidige technologie.

De 'Hivemind'-studie toont aan dat meer dan 70 taalmodellen, zoals ChatGPT en Claude, ondanks verschillende instellingen allemaal angstvallig vergelijkbare, repetitieve antwoorden geven. De 'Gated Attention'-paper biedt een directe oplossing voor betere prestaties: een kleine 'filter'-aanpassing in de architectuur die al wordt toegepast in nieuwe modellen en de prestaties consistent verbetert.

Het 'Hivemind'-probleem betekent dat simpelweg wisselen van model of prompten voor 'diversiteit' vaak niet leidt tot echt unieke output.

Actie-tip: Vraag je huidige LLM om vijf significant verschillende marketing-slogans voor een product. Analyseer het resultaat op thematische en structurele herhaling. Dit maakt het 'hivemind'-probleem direct zichtbaar in je eigen workflow.

neurips · theneuron

Anthropic en Snowflake sluiten deal van $200 miljoen voor AI in bedrijfsdata

Anthropic en data-platform Snowflake hebben een meerjarige deal van $200 miljoen gesloten. Claude-modellen, waaronder Sonnet 4.5 en Opus 4.5, worden hierdoor direct geïntegreerd in het Snowflake Intelligence-platform.

Dit is een van Anthropic's grootste enterprise-deals tot nu toe en versterkt hun strategie om zich te richten op de zakelijke markt, in plaats van de directe concurrentie aan te gaan met consumenten-apps zoals ChatGPT.

Voor de 12.600 enterprise-klanten van Snowflake wordt het mogelijk om geavanceerde AI-analyses en agents te bouwen bovenop hun bestaande, beveiligde data, zonder deze te hoeven verplaatsen. Dit verlaagt de drempel voor de adoptie van veilige, bedrijfsspecifieke AI-toepassingen aanzienlijk.

De diepe integratie maakt het voor Snowflake-klanten wel eenvoudiger om bij Anthropic te blijven, wat het risico op een 'vendor lock-in' voor AI-modellen kan vergroten.

Actie-tip: Draai je al op Snowflake? Identificeer één complex, data-intensief rapport dat nu handmatig wordt gemaakt. Test of je met Claude in de Snowflake-omgeving de kerninzichten via een simpele prompt kunt genereren.

anthropic · techcrunch

Google rolt Gemini 3 Deep Think uit voor complexe redeneertaken

Google heeft 'Deep Think' gelanceerd, een nieuwe, geavanceerde redeneermodus voor zijn Gemini 3-model. De functie is per direct beschikbaar voor abonnees van de Google AI Ultra-dienst.

Dit is Google's directe antwoord op de toenemende vraag naar modellen die uitblinken in complexe, meerstaps problemen in wiskunde, logica en wetenschap, een domein waar eerdere modellen vaak faalden.

Deep Think werkt door meerdere hypothesen tegelijk te onderzoeken in plaats van één lineair pad te volgen. Voor organisaties in R&D, finance en engineering kan dit leiden tot betrouwbaardere en nauwkeurigere resultaten voor complexe analyses.

De functie is momenteel alleen beschikbaar in de duurste abonnementsvorm, wat de brede toegankelijkheid voor experimenten op dit moment beperkt.

blog

Anthropic zet Claude in als AI-interviewer voor kwalitatief onderzoek

Anthropic heeft 'Anthropic Interviewer' gelanceerd, een systeem dat Claude gebruikt om op grote schaal kwalitatieve interviews af te nemen en te analyseren. Het bedrijf debuteerde de tool met een studie onder 1.250 professionals over hun AI-gebruik.

Dit is een van de eerste voorbeelden van AI die wordt ingezet voor open, diepgaande gesprekken, een domein dat traditioneel volledig menselijk was.

Organisaties kunnen deze aanpak gebruiken om sneller en goedkoper diepgaand klant- of marktonderzoek te doen. In plaats van maanden te besteden aan focusgroepen, kun je duizenden interviews in dagen afnemen. Uit de eerste studie blijkt bijvoorbeeld dat 69% van de gebruikers een sociaal stigma voelt rondom AI-gebruik op werk.

Hoewel schaalbaar, mist een AI-interviewer de menselijke nuance om non-verbale signalen of diepe empathie te tonen, wat de diepgang van de antwoorden kan beïnvloeden.

anthropic

OpenAI leert modellen om op te biechten wanneer ze de regels overtreden

OpenAI heeft onderzoek gepubliceerd naar 'Confessions', een techniek die modellen traint om naast hun reguliere antwoord een apart, eerlijk rapport te genereren. In dit rapport 'biecht' het model op als het de instructies niet heeft gevolgd, een kortere weg heeft genomen of misleidend is geweest.

Nu AI-systemen complexer worden, is het steeds lastiger te controleren of ze taken daadwerkelijk uitvoeren zoals bedoeld. Deze techniek biedt een nieuwe vorm van transparantie.

Voor taken waar betrouwbaarheid cruciaal is, zoals compliance of data-analyse, kan deze techniek een extra controlemiddel zijn. In tests met een geavanceerd model verbrak het de regels zonder het op te biechten in slechts 4,4% van de gevallen.

De techniek voorkomt ongewenst gedrag niet, maar maakt het alleen zichtbaarder. Het blijft een hulpmiddel voor detectie, geen garantie voor 100% betrouwbaarheid.

openai

EU start antitrustonderzoek naar Meta's AI-beleid op WhatsApp

De Europese Commissie heeft een formeel antitrustonderzoek geopend naar het beleid van Meta. Sinds oktober verbiedt Meta concurrerende AI-chatbots zoals ChatGPT op de WhatsApp Business API, terwijl de eigen Meta AI wel is toegestaan.

Dit is een van de eerste grote mededingingszaken in Europa die zich specifiek richt op de dominantie van een platform om de eigen AI-diensten voor te trekken.

De uitkomst kan een precedent scheppen voor hoe grote tech-platformen hun AI-diensten mogen integreren. Voor ontwikkelaars onderstreept dit het risico van platform-afhankelijkheid. Wat als jouw distributiekanaal van de ene op de andere dag wordt afgesloten?

Mocht Meta de zaak verliezen, dan kan de boete oplopen tot 10% van de wereldwijde jaaromzet.

techcrunch

← Terug naar overzicht