HP's AI daily - 9 september

Verzonden op 09-09-2025 10:02

Microsoft brengt met Florence-2 een compact en krachtig open-source vision-model uit

Microsoft heeft Florence-2 vrijgegeven, een vision-model dat uitblinkt in het begrijpen van afbeeldingen voor taken als objectdetectie, segmentatie en het genereren van beschrijvingen. In tegenstelling tot gigantische multimodale modellen is Florence-2 relatief klein en ontworpen om efficiënt te presteren op specifieke visuele taken.

Omdat het model open-source is (MIT-licentie), kun je het zelf hosten en finetunen voor specifieke toepassingen, zoals kwaliteitscontrole in productie of het automatisch categoriseren van productfoto's. Voor zeer gespecialiseerde toepassingen zal finetuning met je eigen data wel noodzakelijk zijn voor optimale resultaten.

huggingface · arxiv

Cohere lanceert Command R+, een directe concurrent voor GPT-4 Turbo in de zakelijke markt

Cohere heeft Command R+ gelanceerd, een 104 miljard parameter-model specifiek ontworpen voor zakelijke toepassingen als RAG en 'tool use'. Het model kan hierdoor beter en betrouwbaarder omgaan met je bedrijfsdata en externe systemen aanroepen.

Met een context window van 128k tokens en lagere prijzen dan GPT-4 Turbo, positioneert Cohere zich als een kosteneffectief alternatief voor complexe workflows. De prestatieclaims zijn echter gebaseerd op benchmarks; de werkelijke effectiviteit in jouw specifieke use-case vereist altijd eigen tests.

Actie-tip: Test Command R+ op een bestaande RAG-workflow die nu op een ander model draait. Evalueer de feitelijkheid van de antwoorden en de correctheid waarmee het model de bronnen citeert om een directe vergelijking in prestaties en kosten te maken.

cohere

Databricks stapt in de arena met DBRX, een nieuw open-source topmodel

Databricks heeft DBRX uitgebracht, een krachtig open-source taalmodel dat volgens hen de prestaties van modellen als Llama 2 70B en Mixtral overtreft. De Mixture-of-Experts (MoE) architectuur maakt het model efficiënt: van de 132 miljard parameters zijn er slechts 36 miljard actief tijdens een query.

Dit maakt DBRX een aantrekkelijke optie voor organisaties die een state-of-the-art model willen draaien op eigen infrastructuur, met meer controle en potentieel lagere kosten dan API-gebaseerde oplossingen. Ondanks de efficiëntie vereist het draaien van een model van deze schaal nog steeds aanzienlijke technische expertise en rekenkracht.

huggingface

Apple onthult onderzoeksresultaten van MM1 multimodale modellen

Apple heeft een research paper gepubliceerd over MM1, een familie van multimodale modellen tot 30 miljard parameters die zowel tekst als beeld begrijpen. Dit is een sterke indicatie van de AI-strategie van Apple, gericht op on-device en contextbewuste AI die naadloos integreert met hun ecosysteem.

Voor organisaties die apps ontwikkelen voor Apple-platformen, is dit een signaal om rekening te houden met geavanceerde, ingebouwde AI-functionaliteiten in toekomstige iOS- en macOS-versies. Dit is vooralsnog een onderzoeksresultaat, geen product. Het is dus onduidelijk wanneer en in welke vorm deze technologie beschikbaar komt voor ontwikkelaars.

arxiv

Google DeepMind traint AI-agent SIMA om te navigeren in 3D-werelden

Google DeepMind heeft SIMA (Scalable, Instructable, Multiworld Agent) gepresenteerd, een AI-agent die natuurlijke taalinstructies kan volgen in diverse 3D-omgevingen, zoals games. SIMA is getraind op de *principes* van navigeren en handelen, niet op de specifieke code van één game.

Dit is een stap richting meer generalistische AI-agenten die in complexe, onvoorspelbare digitale omgevingen kunnen opereren zonder voor elke taak een aparte API nodig te hebben. De huidige versie is echter een research-artefact en beheerst nog geen complexe, strategische taken; het is een fundament, geen afgebouwd product.

deepmind

Suno V3 maakt AI-gegenereerde muziek voor iedereen toegankelijk

Muziekgenerator Suno heeft versie 3 van zijn model voor iedereen gratis beschikbaar gemaakt. Met een simpele tekst-prompt genereert het model een compleet lied van twee minuten, inclusief zang en instrumenten. Dit demonstreert de snelle vooruitgang van generatieve AI in creatieve domeinen buiten tekst en beeld.

Voor marketing- of contentafdelingen kan dit een manier zijn om snel en goedkoop unieke achtergrondmuziek voor video's of podcasts te creëren. De vraag is wel hoe het zit met de auteursrechten op de output en de trainingsdata, een juridisch grijs gebied dat nog volop in ontwikkeling is.

← Terug naar overzicht