Spitzen-Sprachmodelle scheitern an Aufgaben, die Kleinkinder lösen
20. Januar 2026 um 10:37
Während multimodale LLMs heute Textaufgaben auf Doktorandenniveau lösen können, versagen sie bei visuellen Aufgaben, die Kleinkinder im Alter von drei bis fünf Jahren beherrschen.