Покоління фанатів “Зоряного шляху” задавалися питанням, як це – встановити перший контакт з новим видом, уникнути незручних соціальних взаємодій за допомогою екстреної телепортації або випробувати варп-швидкість на космічному кораблі (тільки не перевищуйте варп 10, що б ви не робили!). Хоча багато неймовірних технологій, описаних у франшизі, залишаються у царині наукової фантастики, деякі інновації, натхненні “Зоряним шляхом”, стали реальністю. Завдяки команді інженерів з Університету Пенсильванії ми можемо додати до цього списку голопалубу.
Щоб внести ясність, і тому що ми були так само розчаровані, як і ви, ми не говоримо про голографічне середовище, де люди можуть досліджувати і взаємодіяти з персонажами – ми все ще далекі від цього. Але система Holodeck (так, саме так вона називається), створена командою Penn Engineering та їхніми співробітниками, може створити практично будь-яке 3D-середовище, яке ви тільки можете собі уявити. Потрібно лише попросити.
“Ми можемо використовувати мову, щоб керувати ним, – пояснив у своїй заяві співавтор проєкту Юе Ян (Yue Yang). “Ви можете легко описати будь-яке середовище, яке хочете, і навчити втілених агентів ШІ [штучного інтелекту]”.
Система голопалуби, зображена в серіалах “Зоряного шляху”, таких як “Наступне покоління” та “Вояджер”, – це віртуальне середовище, яке можна безкінечно налаштовувати, здатне перетворювати досить прості словесні команди на повноцінні симульовані світи. Насправді, такі типи середовищ – хоч і в менших масштабах – мають важливе застосування в навчанні роботів.
Однак створення віртуального світу — процес трудомісткий. “Художники вручну створюють ці середовища [і] можуть витратити тиждень на створення одного середовища”, – каже Ян. Проблема полягає в тому, що для того, щоб навчити робота орієнтуватися в реальному житті, потрібно випробувати його в різних середовищах. Генеративний ШІ, який вибухнув в останні місяці, здавався очевидним рішенням.
“Системи генеративного ШІ, такі як ChatGPT, навчаються на трильйонах слів, а генератори зображень, такі як Midjourney і DALLE, – на мільярдах зображень”, – говорить Кріс Каллісон-Берч, доцент кафедри комп’ютерних та інформаційних наук Пенсильванського університету.
Holodeck, по суті, залучає до розмови велику мовну модель (LLM) – систему, яка живить чат-ботів, таких як ChatGPT, – що дозволяє їй підбирати параметри середовища, які потрібні користувачеві. Система отримує доступ до цифрової бібліотеки з мільйонами готових об’єктів під назвою Objaverse, з якої вона може вибрати відповідні меблі, а модуль дизайну макета обмежує просторову конфігурацію так, щоб об’єкти опинилися на логічних місцях у кімнаті.
На практиці це означає, що якщо ви замовляєте дизайн квартири людини, яка має кота, Holodeck подбає про те, щоб у готовому приміщенні були всі необхідні меблі, включно з котячим деревом.
Команда порівняла Holodeck з більш раннім інструментом під назвою ProcTHOR, згенерувавши 120 сцен і попросивши студентів обрати свої вподобання в сліпому тесті. Holodeck перевершив свого конкурента в усіх відношеннях. Система також добре впоралася з завданням створити більш незвичні простори – від наукових лабораторій до винних погребів.
Але, за словами співавтора Holodeck, доцента Марка Яцкара, “головне випробування Holodeck – допомогти роботам безпечніше взаємодіяти з навколишнім середовищем, підготувавши їх до заселення місць, де вони ніколи раніше не були”.
Віртуальне навчання часто обмежується переважно житловими приміщеннями, але існує безліч дивних нових світів, в яких роботам може знадобитися орієнтуватися. Використання Holodeck для створення середовища, а не попереднього інструменту, мало помітний позитивний ефект – наприклад, робот, попередньо навчений на 100 віртуальних музичних кімнатах, створених Holodeck, зміг знайти піаніно в 30 відсотках випадків, тоді як після навчання з ProcTHOR – лише в 6 відсотках.
Можливо, ви не зможете використати його для написання голороману про Діксон Хілл, але цей Holodeck незабаром може мати великий вплив на світ робототехніки.