DeepMind представила модель Gemini Robotics On‑Device, которая позволяет роботам выполнять задачи локально, без облака и подключения к интернету.
Модель управляет движением роботов и позволяет дорабатывать их поведение через естественные языковые команды. По словам Google, локальная версия почти не уступает облачной и заметно превосходит конкурентов, хотя конкретные компании не называет.
В демонстрации роботы успешно справились с распаковкой сумок и складыванием одежды. Модель обучалась на платформах ALOHA, затем адаптировалась для работы с двухручным роботом Franka FR3 и гуманоидом Apollo от Apptronik. Franka смогла корректно взаимодействовать с ранее незнакомыми объектами и на сборочной линии.
Google выпустила SDK для Gemini Robotics, позволяющий разработчикам обучать модели на новых задачах через 50–100 демонстраций в симуляторе MuJoCo. Это шаг к автономным роботам, способным действовать в условиях ограниченного соединения.
Фото: Google DeepMind