OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT

27.03.2025, 22:34 — Технології&Авто

258

OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT

OpenAI представила нову функцію генерації зображень на базі моделі GPT-4o, доступну для користувачів ChatGPT. Функція стане стандартною для всіх версій ChatGPT, і дозволяє створювати високоякісні зображення без необхідності окремого вибору моделі, як це було з DALL-E.

Генерація зображень на основі GPT-4o відрізняється від попередніх версій завдяки покращеній здатності точніше відтворювати текст, логотипи та інші складні елементи. Завдяки великій мультимодальній моделі, GPT-4o також може працювати з текстом, зображеннями, аудіо і відео, що дозволяє створювати зображення з різними об’єктами та сценаріями за допомогою лише одного запиту.

Читайте також

Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek

Для користувачів з безоплатним доступом залишаються колишні ліміти генерації (до трьох зображень на день), однак нова система демонструє кращу точність при створенні текстових елементів на зображеннях, у порівнянні з попередніми моделями. Оновлена система генерує зображення поетапно, зверху вниз і зліва направо, що дозволяє забезпечити більш детальне і коректне відображення всіх елементів.

Нова функція також дозволяє редагувати завантажені зображення, створюючи нові варіанти, використовуючи наявні зображення як візуальні натхнення.

Оскільки GPT-4o є «омніомодальною» моделлю, що працює з текстом, зображенням, аудіо та відео, вона здатна краще розуміти промпти користувачів, коли потрібно створити кілька об’єктів на зображенні.

Однак у моделі є певні обмеження:

Через підвищену деталізацію створення зображення може займати до однієї хвилини.
Довгі зображення, такі як постери, можуть обрізатися надто щільно, особливо в нижній частині.
Якщо в запиті недостатньо контексту, модель може «додумувати» деталі.
При створенні складних концепцій, наприклад, повної періодичної таблиці, модель може неточно відтворювати більше ніж 10−20 об’єктів одночасно.
Символи можуть відображатися некоректно або спотворюватися.
Виправлення окремих деталей (наприклад, орфографічних помилок) не завжди працює без побічних змін у зображенні.
Модель може некоректно відображати дрібні деталі.

OpenAI активно працює над поліпшенням цих аспектів у найближчі місяці.

Завдяки вдосконаленим заходам безпеки система блокуватиме можливість створення шкідливих зображень, таких як сексуальні підробки, а також запити на генерацію CSAM.

Усі зображення, створені за допомогою цієї технології, матимуть метадані C2PA, що позначатимуть їх як створені OpenAI.

За матеріалами:

Букви

Місце для вашої реклами

Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Також за темою

ТОП-10 бестселерів на європейському ринку нових авто

Сьогодні 07:21

336

ПартнерськаДопомога українцям за кордоном у 2026 році: про ці зміни варто знати

21.07 10:15