LIM Center, Aleje Jerozolimskie 65/79, 00-697 Warsaw, Poland
+48 (22) 364 58 00
ts@ts2.pl

Tag: Benchmark

Grok 4: L’IA “di livello dottorato” di Elon Musk supera OpenAI e Google sui principali benchmark

L’azienda xAI ha lanciato Grok 4 durante un evento in streaming serale, presentando l’IA come la più intelligente del mondo e descrivendola come un livello post-laurea simile a un PhD. Nei test Ultimo Esame dell’Umanità (HLE), Grok 4 base ottiene 25,4% di accuratezza, superando Gemini 2.5 Pro di Google (~21,6%) e GPT-4 di OpenAI (~21,0%).…
Leggi tutto