620
Claude, ChatGPT и Gemini проверили на точность при освещении горячих новостей
— Фондовый рынок

Популярные чат-боты Claude, ChatGPT и Gemini проверили на точность при освещении горячих новостей о войне в Иране. Тест провело издание Tom’s Guide. Результаты показали тревожную тенденцию: чем увереннее искусственный интеллект формулирует ответы, тем выше риск, что часть информации может быть выдумана.
Самый худший результат показал Gemini. Хотя бот давал детальные и уверенные объяснения, он чаще всего допускал так называемые «галлюцинации». Исследователи обнаружили вымышленные имена иранских должностных лиц, неверные даты и неточные цифры. Фактически система пыталась восполнять пробелы в знаниях правдоподобной, но недостоверной информацией.
ChatGPT показал средний результат. Он правильно выстраивал общую картину событий и подавал структурированную информацию, но иногда добавлял детали, не подтвержденные официальными источниками. В некоторых случаях предположения или аналитические оценки подавались так, будто это уже установленные факты.
Лучше всего во время теста показал себя Claude. Этот чат-бот четко отделял подтвержденные факты предположений, часто ссылался на источники и отказывался комментировать вопросы о закрытых военных операциях. Эксперты отмечают, что во время войны, когда информация быстро меняется, способность ИИ признавать пределы своих знаний становится критически важной.
По материалам: itechua
Поделиться новостью
Также по теме
ТОП-10 украинских банков по доходу (инфографика)
В Киеве один из крупнейших долгостроев ушел с аукциона за 560 млн гривен — детали
Ощадбанк предложит новые возможности с 20 апреля
Новый логистический маршрут через молдавские порты
ВАКС разрешил экстрадицию Дубилета-старшего по делу ПриватБанка о хищении 8,2 млрд грн
Соучредитель «Новой почты» раскритиковал введение новых налогов
