©DeepSeek

AI-sensatie DeepSeek scoort weer met plaatjes-generator, beter dan OpenAI DALL-E
Het Chinese DeepSeek schudde de AI-wereld al op met zijn krachtige en goedkope AI-taalmodel. Nu is er ook een reeks beeldmodellen, die beter presteren dan OpenAI DALL-E 3.
Maandag ontstond paniek op de beurzen vanwege DeepSeek. De Chinese AI-app schoot naar de top in de App Store, met betere prestaties dan OpenAI's beste o1-model – en kennelijk ontwikkeld voor een fractie van de prijs. Nu slaat DeepSeek opnieuw toe, met een reeks beeldmodellen. DeepSeek noemt die 'Janus-Pro' en net als het taalmodel is ook dit model open source beschikbaar.
Janus-Pro kan bestaande afbeeldingen analyseren en omschrijven wat er te zien is en nieuwe afbeeldingen creëren. In de benchmark-tests GenEval en DPG-Bench presteert het nieuwste Janus-Pro-model, 7B, beter dan DALL-E 3 van OpenAI. Ook verslaat het PixArt-alpha, Emu3-Gen en Stable Diffusion XL.
Zegt niet alles, maar wel veel
Zo'n benchmark zegt natuurlijk lang niet alles: Janus-Pro kan alleen maar zeer kleine afbeeldingen analyseren, met een resolutie tot 384x384 pixels. Afbeeldingen genreren kan op maximaal 768x768 pixels. En dat genereren heeft echt nog de bekende limieten van AI: plaatjes zijn grotendeels correct maar hebben iets raars, zoals een vreemde lichtval, een plotseling afgesneden glas of een meterslange tong. En ook bij analyseren van ingewikkeldere afbeeldingen, schiet Janus-Pro 7B tekort, omdat dan een hoger niveau van redeneren nodig is.
Op die vlakken presteert de huidige versie van ChatGPT beter. En zeker GPT Vision, onderdeel van GPT 4, presteert momenteel beter dan Janus-Pro. De beeldmodellen van DeepSeek presteren zo goed in tests omdat ze veelzijdiger zijn dan concurrenten, maar concurrenten hebben weer specialistische beeldmodellen die beter presteren bij specifieke taken. Janus-Pro is niet zo goed in het genereren van afbeeldingen als specialistische modellen zoal Flux en MidJourney.
Janus-Pro is dus een multimodaal taalmodel dat zowel tekst kan generen en afbeeldingen kan analyseren en genereren. De verwachting is dat het model door de open source-gemeenschap snel verbeterd kan worden. Dan zal het model zich ook op het gebied van specifieke taken kunnen meten aan de bekende concurrenten.
Meer AI-nieuws en mis niets met onze Bright-app.