545
Claude, ChatGPT та Gemini перевірили на точність під час висвітлення гарячих новин
— Фондовий ринок

Популярні чат-боти Claude, ChatGPT та Gemini перевірили на точність під час висвітлення гарячих новин про війну в Ірані. Тест провело видання Tom’s Guide. Результати показали тривожну тенденцію: чим упевненіше штучний інтелект формулює відповіді, тим вищий ризик, що частина інформації може бути вигаданою.
Найгірший результат показав Gemini. Хоча бот давав детальні та впевнені пояснення, він найчастіше припускався так званих «галюцинацій». Дослідники виявили вигадані імена іранських посадовців, неправильні дати та неточні цифри. Фактично система намагалася заповнювати прогалини у знаннях правдоподібною, але недостовірною інформацією.
ChatGPT продемонстрував середній результат. Він правильно вибудовував загальну картину подій і подавав інформацію структуровано, але іноді додавав деталі, які не підтверджені офіційними джерелами. У деяких випадках припущення або аналітичні оцінки подавалися так, ніби це вже встановлені факти.
Найкраще під час тесту показав себе Claude. Цей чат-бот чітко відокремлював підтверджені факти від припущень, часто посилався на джерела та відмовлявся коментувати питання про закриті військові операції. Експерти зазначають, що під час війни, коли інформація швидко змінюється, здатність ШІ визнавати межі своїх знань стає критично важливою.
За матеріалами: itechua
Поділитися новиною
Також за темою
iPhone Fold може отримати зовсім іншу назву — деталі
Помста за «Дружбу»: Угорщина каже, що не поверне гроші Ощадбанку
НБУ запроваджує нові вимоги до капіталу банків
Яка функція iPhone рятує фото від розмитого фокусу
Українці активно змінюють мобільних операторів: у кого найбільший приплив
У центрі Києва виставили на продаж ділянку за 15 млн гривень — подробиці
