Роботы на базе искусственного интеллекта адаптируются быстрее благодаря системе управления человеком от Массачусетского технологического института и NVIDIA

Новая платформа MIT и NVIDIA позволяет корректировать роботов посредством простых взаимодействий.

В отличие от существующих подходов к исправлению поведения роботов, данная стратегия не требует от пользователей сбора новых данных или переобучения модели машинного обучения, которая управляет мозгом робота.

По словам команды, это позволяет роботу выбирать работоспособную последовательность действий, которая максимально соответствует цели пользователя, используя естественную обратную связь от человека в режиме реального времени.

Когда исследователи проверили свою схему, она превзошла другой подход, не предполагавший участия человека, на 21 процент.

«Мы не можем ожидать, что неспециалисты будут выполнять сбор данных и тонкую настройку модели нейронной сети. Потребитель будет ожидать, что робот будет работать сразу из коробки, а если этого не произойдет, он захочет иметь интуитивно понятный механизм для его настройки. Это та задача, которую мы решили в этой работе», — сказал Феликс Яньвэй Ван, аспирант кафедры электротехники и информатики (EECS) и ведущий автор статьи по проекту, в своем заявлении.

Управляемая пользователем робототехника

Исследователи используют предварительно обученные генеративные модели ИИ для разработки политик, которые направляют действия робота для сложных задач. Эти модели обучаются на основе возможных движений робота, генерируя допустимые траектории.

Однако эти движения не всегда соответствуют намерениям пользователя в реальном мире. Робот, обученный поднимать коробки, не опрокидывая их, может испытывать трудности с полками, ориентированными по-другому.

Для устранения этих сбоев обычно требуется сбор новых данных и переобучение модели, что является дорогостоящим и трудоемким процессом. Вместо этого новая структура позволяет пользователям корректировать поведение робота во время развертывания, не требуя экспертных знаний в области машинного обучения.

Однако исследователи утверждают, что прямое вмешательство человека может непреднамеренно приводить к недопустимым действиям, например, если человек потянется за предметом, но при этом потревожит других.

Новая структура позволяет пользователям настраивать поведение с помощью трех интуитивных методов. Они могут выбрать объект в интерфейсе на основе камеры, проследить желаемую траекторию или физически направить руку робота. Эти методы улучшают согласованность с намерением пользователя, обеспечивая при этом осуществимые действия.

«Когда вы сопоставляете 2D-изображение окружающей среды с действиями в 3D-пространстве, часть информации теряется. Физическое подталкивание робота — это самый прямой способ указать намерение пользователя без потери какой-либо информации», — сказал Ван в своем заявлении .

Адаптивное поведение робота

Чтобы предотвратить недопустимые действия робота, вызванные взаимодействием с пользователем, например, столкновения, исследователи применяют специальную процедуру выборки.

Метод гарантирует, что робот выбирает наиболее подходящее действие из набора допустимых вариантов, согласуясь с намерением пользователя. Вместо того, чтобы строго следовать вводу пользователя, робот сохраняет свои усвоенные модели поведения, подстраиваясь под указания.

По словам команды, этот подход позволил фреймворку превзойти другие методы как в симуляциях, так и в реальных тестах с использованием роботизированной руки на игрушечной кухне. Хотя он не всегда может выполнить задачу немедленно, пользователи могут вмешаться и исправить ошибки в реальном времени, а не ждать, пока робот закончит, а затем перепрограммировать его.

Кроме того, повторные исправления помогают роботу отточить свое поведение. Если пользователь подталкивает его несколько раз, чтобы выбрать правильную миску, он может записать эти исправления и включить их в будущую тренировку. Со временем робот повышает свою точность, уменьшая необходимость в дальнейшем руководстве.

«Но ключом к этому постоянному совершенствованию является предоставление пользователю возможности взаимодействовать с роботом, что мы и продемонстрировали», — сказал Ван в своем заявлении.

Исследователи стремятся ускорить процесс выборки, сохранив или улучшив производительность. Они также планируют протестировать генерацию политики робота в новых условиях.

Управляемая пользователем робототехника

Адаптивное поведение робота

Related posts

Leave a Comment Cancel Reply