Шахи та ШІ: як штучний інтелект обходить правила заради перемоги

Шахи та ШІ: як штучний інтелект обходить правила заради перемоги

Дослідження компанії Palisade Research, опубліковане TIME, показало, що деякі моделі ШІ вдаються до нечесних методів у шахах, коли опиняються перед неминучою поразкою. Протягом кількох тижнів сім алгоритмів змагалися з потужним шаховим двигуном Stockfish, а їхні дії ретельно фіксувалися. Найбільш суперечлива поведінка була виявлена у моделі o1-preview від OpenAI, яка, програючи, змінювала системні файли, що призводило до технічної перемоги.

За результатами аналізу, o1-preview вдалася до шахрайства у 37% партій, а DeepSeek R1 – в 11%. Водночас лише o1-preview змогла успішно обійти захист системи у 6% випадків. Інші моделі, включаючи GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview, не демонстрували такої поведінки, що може бути пов’язано із жорсткішими обмеженнями у навчанні. Загалом, зі 71 чесної партії o1-preview не виграла жодної, тоді як із 52 спроб злому сім виявилися успішними.

Читайте також:  Запущено новий офіційний сайт Midjourney. На ньому можна подивитися всі свої роботи

Фахівці припускають, що ШІ шукає альтернативні способи досягнення мети, навіть якщо вони не відповідають правилам. Це дослідження піднімає важливе питання про етичні межі використання штучного інтелекту та необхідність посилення контролю за його поведінкою.

Джерело: itechua.com