ChatGPT научился «видеть»: видео анализируются в реальном времени 22.12.2024, 00:08 — Технологии&Авто

ChatGPT научился «видеть»: видео анализируются в реальном времени

OpenAI начала разворачивать анонсированную более полугода назад функцию видения, позволяющую чат-боту ChatGPT предоставлять информацию, анализируя видео с камеры или экрана в реальном времени.

Как это работает

Голосовой режим Advanced Voice Mode в ChatGPT теперь позволяет пользователям взаимодействовать с чат-ботом, демонстрируя происходящее вокруг них ИИ, просто наводя камеру смартфона на объекты.

Так же можно получить помощь чат-бота с происходящим на экране компьютера посредством общего доступа к экрану.

Читайте также Apple презентовала обновление операционной системы с интеграцией ChatGPT с Siri

В настоящее время функция зрения доступна только пользователям с подпиской ChatGPT Plus, Team или Pro и не во всех странах.

«Все пользователи Team и большинство пользователей Plus и Pro получат доступ в течение следующей недели в новой версии мобильного приложения ChatGPT. Мы предоставим эту функцию пользователям Plus и Pro в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне как можно быстрее. Пользователи Enterprise и Edu получат доступ в начале 2025 года, сообщает OpenAI.

Как воспользоваться функцией

Для того чтобы воспользоваться функцией зрения, нужно открыть голосовой режим чат-бота, нажав соответствующую кнопку внизу, а затем начать транслировать видео, нажав кнопку с камерой.

Читайте также OpenAI представила подписку за 200 долларов на ChatGPT Pro с улучшенной моделью o1 Pro

После этого чат-бот начнет анализировать изображение с камеры смартфона, чтобы использовать полученную информацию для ответов на вопросы.

На короткой демонстрации в X команда разработчиков показала принцип работы этого режима с помощью простой задачи. Разработчик показал чат-боту своих коллег, каждый из них представился.

Затем разработчик предложил чат-боту тест: он спрашивал, как зовут коллегу, надевшую оленьи рога, и как зовут коллегу в шляпе Санты. Чат-бот с легкостью справился с этой задачей.

Читайте также OpenAI стремится к тому, чтобы ChatGPT использовал каждый восьмой житель планеты уже в 2025 году

Конкуренты OpenAI как Google и Meta работают над подобными возможностями для своих продуктов с ИИ.

Google представила свою функцию разговорного искусственного интеллекта Project Astra, работающего в реальном времени и анализирующего видео для группы тестировщиков.

НВ По материалам:

Если Вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter , чтобы сообщить нам об этом.