170
Google DeepMind представил две новые ИИ-модели специально для роботов
— Технологии&Авто

Google DeepMind запускает две новые модели искусственного интеллекта, которые помогут роботам «выполнять более широкий спектр реальных задач, чем когда-либо ранее». Первая, под названием Gemini Robotics, — это модель «зрение-речь-действие», способная понимать новые ситуации, даже если она не была на них обучена.
Gemini Robotics
Gemini Robotics построена на Gemini 2.0, пишет The Verge. Эта модель достигла прогресса в трех ключевых сферах, которые, по мнению Google DeepMind, важны для создания полезных роботов: обобщенность, интерактивность и ловкость.
Кроме возможности обобщать новые сценарии, Gemini Robotics лучше взаимодействует с людьми и окружающей средой. Она также способна выполнять более точные физические задачи, такие как складывание листа бумаги или снятие крышки с бутылки.
«Это позволяет нам создавать роботов, более дееспособных, более отзывчивых и устойчивых к изменениям в окружающей среде», — говорит Каролина Парада, старший директор и руководитель отдела робототехники в Google DeepMind.
Gemini Robotics-ER
По словам Google DeepMind, Gemini Robotics-ER — это усовершенствованная визуальная языковая модель, способная «понять наш сложный и динамичный мир».
Как объясняет Парада, когда упаковываете ланч-бокс, а перед вами на столе лежат продукты, вам нужно знать, где что лежит, а также как открыть ланч-бокс, как взять продукты и куда их положить. Именно такие соображения должны выполнять Gemini Robotics-ER.
Эта модель разработана для робототехников для подключения к имеющимся низкоуровневым контроллерам — системе, управляющей движениями робота — что позволяет им использовать новые возможности, предоставляемые Gemini Robotics-ER.
По материалам: dev.ua
Поделиться новостью