Slušaj vest

Najnovije istraživanje Univerziteta u Tel Avivu ukazuje na fenomen koji naučnici nazivaju “digitalna demencija” kod veštačke inteligencije (AI). Rezultati pokazuju da performanse AI modela opadaju kako verzije “stare.”

shutterstock-1144681148.jpg
Foto: Shutterstock

U okviru ovog istraživanja, naučnici su testirali gotovo sve vodeće velike jezičke modele veštačke inteligencije koristeći Montrealsku skalu za procenu kognitivnih sposobnosti (Montreal Cognitive Assessment Scale).

Ova skala se inače koristi za detekciju Alchajmerove bolesti kod ljudi. Maksimalni broj poena na testu je 30, a rezultat od 26 ili više smatra se normalnim.

shutterstock_AI (1).jpg
Foto: Shutterstock

Rezultati testa:

  • GPT-4o je postigao najbolji rezultat od 26 poena, što ga stavlja na prag “normalnog.”
  • GPT-4 je bio blizu sa 25 poena.
  • Gemini 1.0, s druge strane, postigao je samo 16 poena.

Ovi rezultati pokazuju značajnu razliku između novih i starih verzija AI modela, pri čemu starije verzije beleže lošije rezultate.

shutterstock-1096541144.jpg
Foto: Shutterstock

Studija je takođe otkrila da svi modeli imaju značajne probleme u zadacima koji zahtevaju:

  • Vizuelno-prostorne sposobnosti
  • Izvršne funkcije
  • Empatiju i interpretaciju složenih vizuelnih scena

Ovi nedostaci ukazuju na ključne slabosti koje ograničavaju upotrebu veštačke inteligencije u kliničkim i drugim profesionalnim okruženjima.

shutterstock_AI (3).jpg
Foto: Shutterstock

Naučnici smatraju da trenutna “digitalna demencija” kod AI modela ukazuje na to da oni nisu spremni da zamene lekare ili druge stručnjake u bliskoj budućnosti. Ova istraživanja ističu važnost daljeg razvoja AI kako bi se prevazišli postojeći problemi i unapredile njene sposobnosti.

Izvor: Benchmark/Kurir/DarkoMulic