0 800 307 555
0 800 307 555

Google выпустила открытую ИИ-модель, работающую локально на ноутбуках с 16 ГБ памяти

Технологии&Авто
29
Google представила открытую ИИ-модель Gemma 4 12B
Google представила открытую ИИ-модель Gemma 4 12B
Google представила открытую ИИ-модель Gemma 4 12B с 11,95 млрд параметров, которая способна работать локально на ноутбуках с 16 ГБ видео- или унифицированной памяти.
Модель распространяется по лицензии Apache 2.0 и доступна для загрузки через Hugging Face, Kaggle и Google AI Edge Gallery.

Новая архитектура

Одной из главных особенностей Gemma 4 12B стала новая архитектура Unified. В отличие от большинства мультимодальных моделей, она не использует отдельные энкодеры для обработки изображений и аудио. Вместо этого визуальные данные и звуковые волны напрямую передаются в языковую модель через упрощенные промежуточные модули.
По словам Google, такой подход позволяет снизить задержки, снизить требования к памяти и упростить дальнейшее дообучение модели.
Gemma 4 12B поддерживает контекстное окно объемом до 256 тысяч токенов, режим пошагового размышления, системные инструкции и вызов внешних функций для создания агентов. Несмотря на компактный размер, Google утверждает, что по ряду тестов модель приближается к производительности большей Gemma 4 26B.
Одной из главных особенностей Gemma 4 12B стала новая архитектура Unified
Одной из главных особенностей Gemma 4 12B стала новая архитектура Unified

Аудио и видео

Модель также поддерживает работу по аудио и видео. В то же время существует ограничение: длина аудиозаписи не может превышать 30 секунд, а видео ограничено 60 секундами при обработке со скоростью один кадр в секунду.

Локальный запуск ИИ

Google позиционирует Gemma 4 12B как решение для локального запуска ИИ без подключения к облачным сервисам. Компания считает, что модель может быть полезна для организаций с повышенными требованиями к конфиденциальности данных, автономных агентов и сценариев, где постоянный доступ в интернет недоступен или нежелателен.
Gemma 4 12B уже совместима с популярными инструментами развертывания, включая vLLM, SGLang, MLX и llama.cpp. Для пользователей Google Cloud также доступна интеграция через Model Garden, Cloud Run и Google Kubernetes Engine.
Если Вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter , чтобы сообщить нам об этом.

Поделиться новостью

Подпишитесь на нас