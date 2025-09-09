0 800 307 555
ру
0 800 307 555
Место для вашей рекламы

OpenAI исследовала, почему даже самые лучшие модели ИИ галлюцинируют

Технологии&Авто
15
OpenAI исследовала, почему даже самые лучшие модели ИИ галлюцинируют
OpenAI исследовала, почему даже самые лучшие модели ИИ галлюцинируют
OpenAI представила результаты масштабного исследования о том, почему большие языковые модели искусственного интеллекта, например GPT-5, продолжают галлюцинировать, и можно ли что-то с этим сделать.
Авторы сравнивают нейросети с учениками на экзамене: если ответ «не знаю» приносит ноль баллов, выгоднее рискнуть и выдать хоть какой-нибудь ответ. Такая методика поощряет галлюцинации, потому что при ней остается небольшой шанс, что ИИ угадает правильный ответ.
По мнению авторов, причина кроется в самой системе оценки. Популярные бенчмарки — от MMLU до SWE-bench — используют бинарный принцип «верно/неверно». В результате модели вынуждены угадывать, а не честно признавать неуверенность. Это хорошо видно из таблицы ниже:
OpenAI исследовала, почему даже самые лучшие модели ИИ галлюцинируют
Хотя у GPT-5-Thinking-mini заметно более низкая доля ошибок, по метрике точности она немного уступает более старой o4-mini и в тестах, основанных только на точности, оказывается позади.
«После тысяч тестовых вопросов модель угадывания в конечном итоге выглядит лучше в рейтинге, чем аккуратная модель, допускающая неопределенность», — пишет OpenAI.
Читайте также
В OpenAI предлагают доработать систему оценок: за уверенную ложь давать больший штраф, чем за честное «я не знаю», а за правильное выражение неопределенности начислять частичные баллы. Авторы считают, что такое перераспределение баллов снизит стимул к угадыванию.
В компании также отмечают, что удалось значительно сократить количество галлюцинаций в GPT-5, хотя модель все еще не идеальна. Ранее пользователи жаловались, что ответы ИИ стали более короткими и неудовлетворительными, даже при запросах о творческих задачах.

👉🏻 Не пропускайте главного — присоединяйтесь к нам в Telegram, Facebook и Instagram.

По материалам:
УНІАН
Место для вашей рекламы
Если Вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter , чтобы сообщить нам об этом.
Поделиться новостью
Также по теме
Подпишитесь на нас
Также по теме
Рассчитывайте на
0 800 307 555звонки бесплатны
multi app
О насРедакцияРедакционная политикаПолитика ИИЭкспертыРекламаСпецпроектыПравила пользованияКонфиденциальностьКонтакты
© 2000–2025 Общество с ограниченной ответственностью «Файненс.юа», свидетельство на знак для товаров и услуг № 37423 от 16.02.2004, ЕДРПОУ 22929966. Адрес: ул. Николая Гринченко, 4В, Киев, Украина. График работы: Пн–Пт 9:00–18:00.
ООО «Файненс.юа» – независимый финансовый портал. Материалы с пометками «Р», «Партнёрская», «Промо», «Акция», «Мнение», «Спецпроект», «Партнёрский проект» – это реклама в понимании Закона Украины «О рекламе». За содержание рекламы ответственность несёт рекламодатель. Информация на данной странице не является рекламой банковских услуг. Проверенную банком информацию о продуктах и услугах можно посмотреть на официальном сайте соответствующего банка. Использование материалов и данных с сайта разрешено только с гиперссылкой https://finance.ua.
Мы не взимаем плату за услуги подбора и сравнения финансовых предложений в каталогах и не предоставляем услуги кредитования, размещения депозитов и страхования. Ваши личные данные на сайте защищены шифрованием AES-256.
DMCA.com Protection Status
Cloudflare
Trustpilot
Payment systems