Google створив ШІ, який дозволяє роботам розуміти світ і діяти самостійно

Google представив нову модель штучного інтелекту, яка дозволяє роботам не просто виконувати команди, а реально “розуміти” середовище та приймати рішення. Йдеться про Gemini Robotics-ER 1.6 — систему, яка може аналізувати простір, планувати дії і навіть визначати, чи завершене завдання.

Про це повідомляє NNews із посиланням на Google DeepMind.

Що змінилося у підході до роботів

Раніше більшість роботів працювали за жорсткими сценаріями: команда → дія. Новий підхід базується на так званому “втіленому мисленні” (embodied reasoning).

Тепер робот:

аналізує, що бачить
планує послідовність дій
адаптується до змін
сам перевіряє результат

Фактично це перехід від “виконавця” до системи, яка мислить у процесі.

Як це працює на практиці

Gemini Robotics-ER 1.6 покращує просторове мислення — робот може:

визначати об’єкти та їхнє розташування
рахувати предмети
розуміти взаємозв’язки між ними

Читайте також: Браузер Opera GX навчився підробляти історію переглядів на випадок смерті користувача

Одна з ключових функцій — робота з кількома камерами. Наприклад, робот одночасно аналізує зображення з “очей” і з камери на маніпуляторі, складаючи цілісну картину навіть якщо частина об’єктів перекрита.

Це схоже на те, як людина дивиться на предмет під різними кутами, щоб краще його зрозуміти.

Роботи навчилися читати прилади

Найпрактичніше нововведення — здатність читати показники у реальному світі.

Роботи тепер можуть:

зчитувати манометри
аналізувати дисплеї
визначати значення стрілок і шкал

Технологію тестували разом із Boston Dynamics на роботах типу Spot, які використовуються для інспекцій.

Точність зчитування зросла з 23% до приблизно 93% — це вже рівень, придатний для промислового використання.

Чому це важливо для автоматизації

Одна з головних проблем роботів — вони не “розуміють”, чи правильно виконали завдання. Нова модель вирішує це:

робот оцінює результат
вирішує, повторити дію чи перейти далі
зменшує кількість помилок у процесах

Читайте також: Втома від інформації: понад 50% українців скоротили споживання новин

Також система краще дотримується правил безпеки — уникає небезпечних дій і коректніше працює з об’єктами.

Що це означає для майбутнього

Цей крок наближає роботів до повністю автономної роботи в реальному середовищі — на виробництві, складах, енергетиці.

Фактично йдеться про подолання ключового бар’єра між цифровим ШІ та фізичним світом.

Якщо раніше робот “бачив”, але не розумів — тепер він починає інтерпретувати і діяти за ситуацією.

Цікавий факт

Модель може “зумити” частину зображення, знайти стрілку на приладі та самостійно обчислити значення — по суті, виконуючи міні-розрахунок прямо під час аналізу картинки.