За два роки з моменту випуску ChatGPT для публічного використання, штучний інтелект став набагато доступнішим. Однак дослідники з Ізраїлю виявили, що ці програми мають когнітивні проблеми, схожі на старіння в людей. Тести, проведені на версіях ChatGPT, Gemini та Claude, показали, що їхні відповіді не завжди надійні.
Дослідження показало, що LLM мають серйозні проблеми з просторовими навичками, такими як малювання годинника або куба. Наприклад, ChatGPT 4o набрав 26 з 30 можливих балів на когнітивному тесті, що свідчить про незначне порушення, а версія Gemini набрала лише 16 балів, що є серйозним порушенням для людей.
Крім того, LLM не здатні проявляти емпатію, що схоже на симптоми деменції. Однак з кожним новим поколінням моделей ці порушення зменшуються. Попри це, навіть найновіші версії штучного інтелекту не можуть зрівнятися з людським мозком.
У майбутньому, можливо, побачимо LLM, що здатні пройти когнітивні тести на найвищий бал. Однак наразі будь-які поради від чат-ботів слід сприймати з обережністю.
Це дослідження було опубліковане в журналі BMJ.