0 800 307 555
0 800 307 555

Google запускает Gemini 3.5 Live Translate: перевод голоса в реальном времени

Технологии&Авто
69
Полноценный запуск для бизнеса ожидается в конце года
Полноценный запуск для бизнеса ожидается в конце года
Google представила новую модель Gemini 3.5 Live Translate, позволяющую осуществлять голосовой перевод в режиме реального времени. Система способна автоматически распознавать более 70 языков и воспроизводить переводы с максимально сохраненными характеристиками голоса — интонацией, темпом и высотой.

Как это работает

В отличие от традиционных решений, ожидающих завершения фразы, новый алгоритм обрабатывает аудио непрерывно в потоковом режиме. Это позволяет сократить задержку между речью и переводом до нескольких секунд и сделать диалог более естественным, без длинных пауз. Система также адаптирована к работе в шумной среде и не требует сложной ручной настройки.
Для защиты от злоупотреблений и дезинформации все сгенерированные аудио маркируются цифровым водяным знаком SynthID, невидимым для пользователя, но позволяющим идентифицировать контент.
В настоящее время инструмент доступен в виде публичной предыдущей версии для разработчиков через Gemini Live API и Google AI Studio. Его уже интегрируют платформы типа Agora, LiveKit и Vision Agents, что упрощает создание сервисов без построения сложной инфраструктуры потоковой связи. Технологию тестирует сервис Grab, который использует ее для обработки миллионов звонков между клиентами и водителями.

Когда функция станет доступной

В корпоративном сегменте функция сначала появится в закрытом тестировании для пользователей Google Workspace в сервисе Google Meet. Она позволит переводить разговоры в более чем 2000 языковых комбинаций во время видеовстреч, значительно расширив возможности по сравнению с предыдущей версией. Полноценный запуск для бизнеса ожидается в конце года.
Для обычных пользователей обновление будет доступно в приложении Google Translate на iOS и Android. При использовании наушников перевод будет передаваться непосредственно собеседнику, а на Android также появится прослушивающий режим, позволяющий получать перевод через динамик смартфона без дополнительных устройств.
Если Вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter , чтобы сообщить нам об этом.

Поделиться новостью

Подпишитесь на нас