Alibaba випустила модель штучного інтелекту, яка може перевершувати DeepSeek-V3 — Finance.ua
0 800 307 555
0 800 307 555

Alibaba випустила модель штучного інтелекту, яка може перевершувати DeepSeek-V3

Технології&Авто
326
Alibaba випустила модель штучного інтелекту, яка може перевершувати DeepSeek-V3
Alibaba випустила модель штучного інтелекту, яка може перевершувати DeepSeek-V3
Китайська технологічна компанія Alibaba в середу, 29 січня, випустила нову версію своєї моделі штучного інтелекту Qwen 2.5, яка, за її словами, перевершила високо оцінену модель DeepSeek-V3.
Про це повідомляє Reuters.
Час випуску Qwen 2.5-Max припав на перший день Місячного Нового року (Китайського Нового року), коли більшість китайців відпочивають від роботи і проводять час зі своїми сім’ями.
«Qwen 2.5-Max перевершує… майже за всіма показниками GPT-4o, DeepSeek-V3 і Llama-3.1−405B», — йдеться в оголошенні хмарного підрозділу Alibaba, опублікованому в офіційному акаунті WeChat, з посиланням на передові моделі штучного інтелекту з відкритим вихідним кодом OpenAI та Meta.
Випуск 10 січня штучного інтелекту DeepSeek на базі моделі DeepSeek-V3, а також випуск 20 січня його моделі R1 вразили Кремнієву долину і призвели до падіння акцій технологічних компаній, оскільки нібито низькі витрати китайського стартапу на розробку та експлуатацію спонукали інвесторів засумніватися у великих планах витрат провідних компаній у галузі штучного інтелекту в США.
Однак успіх DeepSeek також призвів до того, що її внутрішні конкуренти почали активно вдосконалювати власні моделі штучного інтелекту.
Через два дні після випуску DeepSeek-R1 власник TikTok ByteDance випустив оновлення своєї флагманської моделі ІІ, яка, за його словами, перевершила підтримувану Microsoft модель OpenAI o1 в AIME — еталонному тесті, який вимірює, наскільки добре моделі ІІ розуміють і реагують на складні інструкції.
Це перегукується із заявою DeepSeek про те, що її модель R1 конкурує з o1 від OpenAI за декількома показниками продуктивності.
Попередник моделі DeepSeek V3, DeepSeek-V2, спровокував цінову війну моделей ІІ у Китаї після свого випуску у травні минулого року.
Той факт, що DeepSeek-V2 мав відкритий вихідний код і був безпрецедентно дешевим — всього 1 юань (0,14 дол. США) за 1 мільйон токенів (або одиниць даних, що обробляються моделлю ІІ), — привів до того, що хмарний підрозділ Alibaba оголосив про зниження цін до 97% на низку моделей.
Інші китайські технологічні компанії наслідували приклад, включаючи Baidu і найдорожчу інтернет-компанію країни Tencent.
Лян Веньфен, засновник DeepSeek, заявив в інтерв’ю китайському ЗМІ Waves у липні, що стартап «не турбують» цінові війни і що його головною метою є досягнення AGI (штучного інтелекту загального призначення).
Тоді як у великих китайських технологічних компаніях, таких як Alibaba, працюють сотні тисяч співробітників, DeepSeek діє як дослідницька лабораторія, в якій працюють переважно молоді випускники та докторанти провідних китайських університетів.
У своєму липневому інтерв’ю Лян заявив, що, на його думку, найбільші технологічні компанії Китаю можуть не відповідати майбутньому індустрії штучного інтелекту, порівнявши їхні високі витрати та вертикальну структуру з дбайливим веденням справ та вільним стилем управління DeepSeek.
«Великі фундаментальні моделі вимагають постійних інновацій, можливості технологічних гігантів мають свої межі», — зазначив Веньфен.
За матеріалами:
Діло
Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Підпишіться на нас