Verzonden op 26-05-2026 07:26
DeepMind lost 9 open wiskundige problemen van Erdős opGoogle DeepMind heeft met een AI-model negen open problemen opgelost die de wiskundige Paul Erdős heeft geformuleerd en die deels tientallen jaren onopgelost bleven. De kosten per opgelost probleem lagen op enkele honderden dollars. Dat is relevant voor organisaties die met formele verificatie, planning of optimalisatie werken: autonome redeneermodellen worden al ingezet op problemen waar mensen jarenlang niet uitkwamen. De verwachting dat AI alleen routinetaken overneemt, klopt niet meer. Maar dit soort resultaten geldt nog voor een smalle klasse problemen en vertaalt zich niet automatisch naar alledaagse bedrijfsvragen.
|
Karpathy's 65-regel config tilt Claude's codeernauwkeurigheid naar 94%Een configuratiebestand van 65 regels, samengesteld door Andrej Karpathy, brengt Claude's codeernauwkeurigheid omhoog van 65% naar 94%. Tegelijk meldde DHH dat GPT-5.5 het grootste deel van 30.000 regels nieuwe code in zijn project heeft geschreven. Dit zijn geen laboratoriumresultaten maar praktijkervaringen van bekende ontwikkelaars. Het patroon dat zich aftekent: de bottleneck zit niet meer in de capaciteit van het model, maar in hoe goed jij het model aanstuurt. Een 65-regel configuratie is laagdrempelig te testen. Zoek Karpathy's Claude-config op GitHub en draai hem een week als standaard in je eigen codeerworkflow. |
DeepSeek verlaagt prijs van V4 Pro permanent met 75%DeepSeek heeft de prijs van zijn V4 Pro model permanent verlaagd met ongeveer 75%. De outputtokens zijn daarmee minimaal 34 keer goedkoper dan bij GPT-5.5. Voor organisaties die API-kosten laten meewegen in hun modelkeuze is dit een concreet signaal om DeepSeek V4 Pro opnieuw te evalueren, zeker voor taken waarbij hoge volumes tekst worden verwerkt. Let op de gebruikelijke kanttekening bij Chinese modellen: dataprivacy en de locatie van verwerking verdienen aandacht als je met gevoelige bedrijfsdata werkt. |
Polsia claimt 8.000 bedrijven te runnen zonder menselijke medewerkersPolsia, een AI-platform opgericht door Ben Cera, heeft een financieringsronde van 30 miljoen dollar afgesloten bij een waardering van 250 miljoen dollar. Het bedrijf claimt meer dan 8.000 bedrijven autonoom te runnen en nadert een jaarlijkse omzet van 10 miljoen dollar, zonder menselijke medewerkers. De aankondiging trok 5 miljoen views, maar ook sceptici: de bedrijfsnaam Polsia is een anagram van 'AI Slops', wat weinig subtiel is. Onafhankelijke verificatie van de claims ontbreekt vooralsnog. Dit item is de moeite waard om te volgen, niet om nu te handelen. Maar het stelt wel een scherpe vraag: als een AI-systeem daadwerkelijk duizenden kleine bedrijven kan runnen, wat betekent dat dan voor de minimale personeelsbehoefte in jouw organisatie? |
Humanoid robot verliest pakket-marathon van stagiair, maar netBij een test in het magazijn van Figure AI sorteerde een menselijke stagiair in acht uur 12.924 pakketten. De humanoid robot van Figure deed er 12.732. Verschil: 192 pakketten. CEO Brett Adcock noemde het de laatste keer dat een mens zal winnen. De stagiair eindigde de test met een beschadigde onderarm. Voor logistieke organisaties is dit de meest concrete benchmark tot nu toe van wat huidige humanoid robots aankunnen in een ongecontroleerde magazijnomgeving. Het gat is klein en zal kleiner worden, want de robot had geen pauzes nodig en is de volgende dag gewoon inzetbaar.
|