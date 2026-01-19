Microsoft, Meta и Amazon будут платить «Википедии» за обучение ИИ Сегодня 03:34 — Технологии&Авто

Фонд Wikimedia Enterprise объявил о подписании платных лицензионных соглашений с Microsoft, Meta, Amazon, Perplexity и Mistral AI.

Это расширяет взимание платы с крупных технологических компаний за использование контента Википедии для обучения моделей ИИ, лежащих в основе ассистентов типа Microsoft Copilot и ChatGPT.

Что это значит

Хотя ранее эти же компании без разрешения массово собирали данные с Wikipedia, новые соглашения означают, что большинство ведущих разработчиков ИИ теперь присоединились к программе Wikimedia Enterprise — коммерческой дочерней структуре фонда, продающей доступ к API с 65 миллионами статей Wikipedia на более высоких скоростях и в больших объемах, чем бесплатные публичные API. Фонд не раскрыл финансовые условия сделок.

Детали договоренностей

Новые партнеры присоединились к Google, который подписал соглашение с Wikimedia Enterprise еще в 2022 году, а также к меньшим компаниям, включая Ecosia, Nomic, Pleias, ProRata и Reef Media. Полученные доходы помогают компенсировать инфраструктурные расходы неприбыльной организации, которая иначе возлагается на небольшие публичные пожертвования, наблюдая, как ее контент становится базовыми учебными данными для моделей ИИ.

«Wikipedia является критически важной составляющей работы этих технологических компаний, и им нужно найти способ финансово ее поддерживать. Нам понадобилось определенное время, чтобы понять, какой набор функций и возможностей стоит предложить, чтобы перевести эти компании с бесплатной платформы на коммерческую, но все наши партнеры из Big Tech четко осознают необходимость Wikipedia'. Лейн Беккер в комментарии Reuters.

Проблемы Wikipedia

Переход к платному лицензированию произошел после многих лет роста инфраструктурных расходов, вызванных тем, что компании из сферы ИИ массово собирали контент Wikipedia в промышленных масштабах. В апреле 2025 года фонд сообщил, что объем пропускной способности, использованной для скачивания мультимедийного контента, вырос на 50% по сравнению с январем 2024 года. При этом боты обеспечивали 65% самых дорогих запросов в базовую инфраструктуру, хотя составляли лишь 35% от общего количества просмотров страниц.

В октябре Фонд Викимедиа раскрыл , что после обновления систем обнаружения ботов человеческий трафик на Wikipedia снизился примерно на 8% в годовом измерении. Выяснилось, что значительная часть ранее считавшихся человеческими посещений на самом деле была автоматизированными сборщиками данных, созданными для обхода детекции. Падение трафика грозит разрушить цикл обратной связи, поддерживаемый Wikipedia в течение четверти века: читатели заходят на сайт, часть из них становится редакторами или донорами, и контент постепенно улучшается.

В настоящее время многие чат-боты и поисковые сводки отвечают на вопросы, используя контент Wikipedia, не приводя пользователей непосредственно на сайт. Основатель Wikipedia Джимми Уэйлс в комментарии Associated Press заявил , что он в целом приветствует обучение моделей ИИ на данных Wikipedia.

«Лично я очень рад, что модели ИИ учатся на данных Wikipedia, потому что они курированы людьми. Я бы не очень хотел пользоваться ИИ, который учился только на X — это был бы, знаете, очень злой ИИ. Но есть предел относительно бесплатного доступа. Компаниям, вероятно, стоит скинуться и заплатить свою справедливую долю расходов, которые на нас возлагают», — сказал Вейлз.

