Компания Nvidia объявила о новых инфраструктурных и AI-моделях, работая над созданием базовой технологии для физического AI, включая роботов и автономные транспортные средства, которые могут воспринимать реальный мир и взаимодействовать с ним.

Об этом пишет TechCrunch.

Гигант полупроводниковой отрасли объявил об Alpamayo-R1, открытая модель языка видения для исследований в области автономного вождения, на конференции NeurIPS AI в Сан-Диего, Калифорния. Компания утверждает, что это первая модель языка видения, ориентированная на автономное вождение. Модели визуальной речи могут обрабатывать как текст, так и изображения, позволяя транспортным средствам «видеть» свое окружение и принимать решения на основе того, что они воспринимают.

Эта новая модель базируется на модели Cosmos-Reason от Nvidia, модели размышления, которая обдумывает решение перед тем, как ответить. Nvidia сначала выпустила семейство моделей Cosmos в январе 2025 года. Дополнительные модели были выпущены в августе.

Технология, такая как Alpamayo-R1, критически важна для компаний, стремящихся достичь 4-го уровня автономного вождения, что означает полную автономность в определенной области и при определенных обстоятельствах, отметила Nvidia в своем блоге.

Nvidia надеется, что этот тип модели размышления предоставит автономным транспортным средствам «здравый смысл», чтобы лучше подходить к принятию нюансированных решений во время вождения, как это делают люди.

Эта новая модель доступна на GitHub и Hugging Face.

Наряду с новой моделью видения, Nvidia также скачала на GitHub новые пошаговые инструкции, ресурсы для инференции и рабочие процессы после обучения — вместе они называются Cosmos Cookbook — чтобы помочь разработчикам лучше использовать и обучать модели Cosmos для их конкретных случаев использования. Пособие включает курацию данных, генерацию синтетических данных и оценку моделей.

Эти объявления появились в то время, когда компания на полной скорости продвигается в направлении физического ИИ как нового направления для своих передовых графических процессоров ИИ.

Соучредитель и генеральный директор Nvidia Дженсен Хуанг неоднократно заявлял, что следующей волной ИИ будет физический ИИ. Билл Далли, главный научный сотрудник Nvidia, поддержал это мнение в разговоре с TechCrunch летом, подчеркнув важность физического ИИ в робототехнике.

«Я думаю, что в конечном итоге роботы станут огромным игроком в мире, и мы хотим по сути создавать мозги для всех роботов, — сказал тогда Далли. — Для этого нам нужно начать разрабатывать ключевые технологии».

