Alibaba выпустила модель искусственного интеллекта, которая может превосходить DeepSeek-V3 — Finance.ua
0 800 307 555
0 800 307 555

Alibaba выпустила модель искусственного интеллекта, которая может превосходить DeepSeek-V3

Технологии&Авто
324
Alibaba выпустила модель искусственного интеллекта, которая может превосходить DeepSeek-V3
Alibaba выпустила модель искусственного интеллекта, которая может превосходить DeepSeek-V3
Китайская технологическая компания Alibaba в среду, 29 января, выпустила новую версию своей модели искусственного интеллекта Qwen 2.5, которая, по ее словам, превзошла высоко оцененную модель DeepSeek-V3.
Об этом сообщает Reuters.
Время выпуска Qwen 2.5-Max пришлось на первый день Лунного Нового года (Китайского Нового года), когда большинство китайцев отдыхают от работы и проводят время со своими семьями.
«Qwen 2.5-Max превосходит… почти по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1−405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat, со ссылкой на передовые модели искусственного интеллекта с открытым исходным кодом OpenAI и Meta.
Выпуск 10 января искусственного интеллекта DeepSeek на базе модели DeepSeek-V3, а также выпуск 20 января его модели R1 поразили Кремниевую долину и привели к падению акций технологических компаний, поскольку якобы низкие затраты китайского стартапа на разработку и эксплуатацию побудили инвесторов усомниться в планах крупных затрат компаний в области искусственного интеллекта в США
Однако успех DeepSeek привел к тому, что ее внутренние конкуренты начали активно совершенствовать собственные модели искусственного интеллекта.
Через два дня после выпуска DeepSeek-R1 владелец TikTok ByteDance выпустил обновление своей флагманской модели II, которая, по его словам, превзошла поддерживаемую Microsoft модель OpenAI o1 в AIME — эталонном тесте, измеряющем, насколько хорошо модели II понимают и реагируют на сложные инструкции.
Это перекликается с заявлением DeepSeek о том, что ее модель R1 конкурирует с o1 от OpenAI по нескольким показателям производительности.
Предшественник DeepSeek V3, DeepSeek-V2, спровоцировал ценовую войну моделей II в Китае после своего выпуска в мае прошлого года.
Тот факт, что DeepSeek-V2 имел открытый исходный код и был беспрецедентно дешевым — всего 1 юань (0,14 долл. США) за 1 миллион токенов (или единиц обрабатываемых моделью II) — привел к тому, что облачное подразделение Alibaba объявило о снижении цен до 97% на ряде моделей.
Другие китайские технологические компании последовали примеру, включая Baidu и самую дорогую интернет-компанию страны Tencent.
Лян Вэньфэн, основатель DeepSeek, заявил в интервью китайскому СМИ Waves в июле, что стартап «не беспокоят» ценовые войны и что его главной целью является достижение AGI (искусственного интеллекта общего назначения).
В то время как в крупных китайских технологических компаниях, таких как Alibaba, работают сотни тысяч сотрудников, DeepSeek действует как исследовательская лаборатория, в которой работают преимущественно молодые выпускники и докторанты ведущих китайских университетов.
В своем июльском интервью Лян заявил, что, по его мнению, крупнейшие технологические компании Китая могут не соответствовать будущему индустрии искусственного интеллекта, сравнив их высокие затраты и вертикальную структуру с бережным ведением дел и свободным стилем управления DeepSeek.
«Большие фундаментальные модели требуют постоянных инноваций, возможности технологических гигантов имеют свои пределы», — отметил Вэньфэн.
По материалам:
Діло
Если Вы заметили ошибку, выделите необходимый текст и нажмите Ctrl+Enter , чтобы сообщить нам об этом.

Поделиться новостью

Подпишитесь на нас