Während multimodale LLMs heute Textaufgaben auf Doktorandenniveau lösen können, versagen sie bei visuellen Aufgaben, die Kleinkinder im Alter von drei bis fünf Jahren beherrschen.
GNU GRUB 2.14 ist die neue Major-Version des populären Multiboot-Bootloaders. GRUB 2.14 erscheint mehr als zwei Jahre nach der vorherigen Version, GRUB 2.12.
Mit Open Responses gibt es nun erstmals einen Vorschlag für einen Open-Source-Standard für ein herstellerunabhängiges JSON-API, über das Clients mit LLMs kommunizieren können.
In Memphis (Tennessee) geht mit Colossus 2 das erste Gigawatt-Rechenzentrum der Welt in Betrieb. Es dient vor allem dem Training von xAIs Sprachmodell Grok.
OpenAI hat bekanntgegeben, dass es künftig, beginnend in den USA, allen Nutzern, die die kostenlose Version oder das günstige Go-Abo nutzen, Werbung einblenden will.
Google launcht eine neue Kollektion spezialisierter Sprachmodelle unter dem Namen TranslateGemma, die aus und in 55 Sprachen übersetzt und auf Gemma 3 aufbaut.
Das deutsche KI-Start-up Black Forest Labs veröffentlicht mit Flux.2[klein] sein bisher schnellstes Modell, das hochwertige Bilder in weniger als einer Sekunde erzeugt oder bearbeitet.
Das VideoLAN-Projekt hat die Versionen 3.0.22 und 3.0.23 des VLC Players bereitgestellt, um mehrere Schwachstellen in der Medienverarbeitung zu beheben.
Google schafft eine Möglichkeit, seinen Chatbot Gemini mit anderen Apps wie Gmail, Google Photos, Youtube und der Websuche zu verbinden, die bei Fragen an den Bot persönliche Informationen…
Die britische Marktforschungsagentur Coleman Parkes hat im Auftrag von Camunda, einem Hersteller von Lösungen im Bereich der agentenbasierten Automatisierung, eine Umfrage unter 1150 Personen aus…
Der bekannte Designer Jony Ive, der früher für Apple gearbeitet hat und dessen Start-up io OpenAI im vergangenen Jahr für 6,5 Milliarden Dollar übernahm, will nun zusammen mit dem neuen…