Шахи та ШІ: як штучний інтелект обходить правила заради перемоги

Дослідження компанії Palisade Research, опубліковане TIME, показало, що деякі моделі ШІ вдаються до нечесних методів у шахах, коли опиняються перед неминучою поразкою. Протягом кількох тижнів сім алгоритмів змагалися з потужним шаховим двигуном Stockfish, а їхні дії ретельно фіксувалися. Найбільш суперечлива поведінка була виявлена у моделі o1-preview від OpenAI, яка, програючи, змінювала системні файли, що призводило до технічної перемоги.

За результатами аналізу, o1-preview вдалася до шахрайства у 37% партій, а DeepSeek R1 – в 11%. Водночас лише o1-preview змогла успішно обійти захист системи у 6% випадків. Інші моделі, включаючи GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview, не демонстрували такої поведінки, що може бути пов’язано із жорсткішими обмеженнями у навчанні. Загалом, зі 71 чесної партії o1-preview не виграла жодної, тоді як із 52 спроб злому сім виявилися успішними.

Читайте також: Чергову партію нових пікапів передано ЗСУ (Фото)

Фахівці припускають, що ШІ шукає альтернативні способи досягнення мети, навіть якщо вони не відповідають правилам. Це дослідження піднімає важливе питання про етичні межі використання штучного інтелекту та необхідність посилення контролю за його поведінкою.

Джерело: itechua.com