Verzonden op 03-06-2026 07:07
Clicky, een Mac-app die meekijkt en meeluistert tijdens je werkEen indie-ontwikkelaar heeft Clicky uitgebracht, een Mac-applicatie die naast je cursor meeloopt, je scherm ziet en reageert op gesproken opdrachten. Zeg 'clicky agent' en de app start een achtergrondagent voor de betreffende taak. De app is gebouwd op GPT Realtime 2.0. Wat Clicky onderscheidt van bestaande assistenten zoals Copilot of Raycast AI, is de combinatie van schermcontext, spraak en autonome agents in één lichtgewicht interface. Dat maakt de app bruikbaar als een soort altijd aanwezige werkassistent. Inmiddels is er ook een open-source variant beschikbaar: OpenClicky van ontwikkelaar Jason Kneen, voor wie liever zelf de onderliggende API-aanroepen beheert. Privacy is hier de evidente kanttekening. Een app die continu meekijkt en meeluistert vraagt om zorgvuldig nadenken over welke data er via de API naar OpenAI gaat. Test dit type tool niet op een machine met gevoelige bedrijfsdata zonder eerst de privacyinstellingen door te lopen. |
Anthropic dient IPO-aanvraag in bij SECAnthropic heeft vertrouwelijk een IPO-aanvraag ingediend bij de Amerikaanse beurstoezichthouder SEC, minder dan een week na het sluiten van een financieringsronde van 65 miljard dollar bij een waardering van 965 miljard dollar. Daarmee loopt Anthropic voor op OpenAI, dat ook een beursgang voorbereidt bij een verwachte waardering van 852 miljard dollar. Voor de markt betekent dit dat publieke aandelen in AI-labs binnenkort beschikbaar komen. Daardoor wordt de sector toegankelijk voor institutionele beleggers die nu nog buitenspel staan. De oorspronkelijke investering van Amazon van 8 miljard dollar is inmiddels gegroeid naar een geschatte waarde van 74,2 miljard dollar. Alleen al in het eerste kwartaal van 2026 boekte Amazon 12,3 miljard dollar aan overige inkomsten door de opwaartse herwaardering van die belangen. De aandelenkoers en het aantal aandelen zijn nog niet bepaald. Houd de SEC-filings in de gaten als je wilt weten wanneer er meer details beschikbaar komen.
|
Life-Harness haalt 88,5% prestatiewinst zonder modelaanpassingEen nieuw onderzoek beschrijft hoe je bestaande taalmodellen aanzienlijk beter laat presteren door de infrastructuur eromheen te verbeteren in plaats van het model zelf. De methode, genaamd Life-Harness, realiseert een prestatiewinst van 88,5% op bevroren LLM-agents door alleen de runtime-wrapper aan te passen. Dit is relevant voor organisaties die vastzitten aan een specifiek model vanwege kosten, licenties of compliance. Je hoeft dus niet te wachten op een nieuwe modelversie om betere resultaten te boeken. De benadering sluit aan op een bredere trend. JetBrains heeft eerder Mellum2 uitgebracht, een open-source codeermodel van 12 miljard parameters dat qua snelheid en resourcegebruik vergelijkbaar is met een model van 2,5 miljard parameters. Praktisch gezien betekent dit: onderzoek eerst je prompt-architectuur en agent-infrastructuur voordat je investeert in een duurder of groter model. Dat levert soms meer rendement op. |
JetBrains lanceert Mellum2, efficiënt open-source codeermodelJetBrains heeft Mellum2 uitgebracht, een open-source codeermodel met 12 miljard parameters dat qua rekenkracht en latency presteert als een model van 2,5 miljard parameters. Het model is beschikbaar voor fine-tuning. Voor ontwikkelteams die intern modellen willen draaien zonder hoge infrastructuurkosten is dit interessant. Een groot model met de voetafdruk van een klein model verlaagt de drempel voor inzet op eigen infrastructuur. De keerzijde: open-source modellen vragen intern beheer, updates en beveiligingsmonitoring. Dat is geen gratis lunch. Werk je al met coding-assistenten zoals GitHub Copilot of Cursor, dan loont het de moeite om Mellum2 op een afgebakende codebase te testen en de resultaten te vergelijken.
|
Klein model van 800.000 parameters scoort 100% op Sudoku waar grote modellen falenEen nieuw onderzoeksresultaat laat zien dat een model met slechts 800.000 parameters een score van 100% haalt op extreme Sudoku-puzzels, terwijl frontier-modellen daar op nul blijven steken. Het verschil zit niet in modelgrootte, maar in taakspecifieke architectuur en training. Dit bevestigt wat de Life-Harness-paper ook aantoont: voor specifieke, afgebakende taken hoef je niet naar de zwaarste modellen te grijpen. Een goed getraind klein model kan een groot generalistisch model ruimschoots verslaan. Voor organisaties die één terugkerend, goed gedefinieerd probleem willen automatiseren, pleit dit voor een investering in een toegewijd klein model in plaats van alles door een groot foundation-model te jagen. De vraag is wel hoeveel engineering-tijd het kost om zo'n gespecialiseerd model te bouwen en te onderhouden. Dat is zelden nul.
|