Alibaba випустила модель штучного інтелекту, яка може перевершувати DeepSeek-V3

29.01.2025, 12:40 — Технології&Авто

582

Alibaba випустила модель штучного інтелекту, яка може перевершувати DeepSeek-V3

Китайська технологічна компанія Alibaba в середу, 29 січня, випустила нову версію своєї моделі штучного інтелекту Qwen 2.5, яка, за її словами, перевершила високо оцінену модель DeepSeek-V3.

Про це повідомляє Reuters.

Час випуску Qwen 2.5-Max припав на перший день Місячного Нового року (Китайського Нового року), коли більшість китайців відпочивають від роботи і проводять час зі своїми сім’ями.

Читайте також

ШІ-модель DeepSeek обійшла ChatGPT і обвалила акції техгігантів

«Qwen 2.5-Max перевершує… майже за всіма показниками GPT-4o, DeepSeek-V3 і Llama-3.1−405B», — йдеться в оголошенні хмарного підрозділу Alibaba, опублікованому в офіційному акаунті WeChat, з посиланням на передові моделі штучного інтелекту з відкритим вихідним кодом OpenAI та Meta.

Випуск 10 січня штучного інтелекту DeepSeek на базі моделі DeepSeek-V3, а також випуск 20 січня його моделі R1 вразили Кремнієву долину і призвели до падіння акцій технологічних компаній, оскільки нібито низькі витрати китайського стартапу на розробку та експлуатацію спонукали інвесторів засумніватися у великих планах витрат провідних компаній у галузі штучного інтелекту в США.

Однак успіх DeepSeek також призвів до того, що її внутрішні конкуренти почали активно вдосконалювати власні моделі штучного інтелекту.

Читайте також

Інвестори вивели $457 млн з Bitcoin-ETF на тлі паніки через китайський ШІ DeepSeek

Через два дні після випуску DeepSeek-R1 власник TikTok ByteDance випустив оновлення своєї флагманської моделі ІІ, яка, за його словами, перевершила підтримувану Microsoft модель OpenAI o1 в AIME — еталонному тесті, який вимірює, наскільки добре моделі ІІ розуміють і реагують на складні інструкції.

Це перегукується із заявою DeepSeek про те, що її модель R1 конкурує з o1 від OpenAI за декількома показниками продуктивності.

Попередник моделі DeepSeek V3, DeepSeek-V2, спровокував цінову війну моделей ІІ у Китаї після свого випуску у травні минулого року.

Той факт, що DeepSeek-V2 мав відкритий вихідний код і був безпрецедентно дешевим — всього 1 юань (0,14 дол. США) за 1 мільйон токенів (або одиниць даних, що обробляються моделлю ІІ), — привів до того, що хмарний підрозділ Alibaba оголосив про зниження цін до 97% на низку моделей.

Читайте також

OpenAI обіцяє «набагато кращі» ШІ-моделі у відповідь на розробки DeepSeek

Інші китайські технологічні компанії наслідували приклад, включаючи Baidu і найдорожчу інтернет-компанію країни Tencent.

Лян Веньфен, засновник DeepSeek, заявив в інтерв’ю китайському ЗМІ Waves у липні, що стартап «не турбують» цінові війни і що його головною метою є досягнення AGI (штучного інтелекту загального призначення).

Тоді як у великих китайських технологічних компаніях, таких як Alibaba, працюють сотні тисяч співробітників, DeepSeek діє як дослідницька лабораторія, в якій працюють переважно молоді випускники та докторанти провідних китайських університетів.

У своєму липневому інтерв’ю Лян заявив, що, на його думку, найбільші технологічні компанії Китаю можуть не відповідати майбутньому індустрії штучного інтелекту, порівнявши їхні високі витрати та вертикальну структуру з дбайливим веденням справ та вільним стилем управління DeepSeek.

«Великі фундаментальні моделі вимагають постійних інновацій, можливості технологічних гігантів мають свої межі», — зазначив Веньфен.

За матеріалами:

Діло

Місце для вашої реклами

Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Також за темою

CEO JPMorgan попередив про скорочення банкірів через стрімкий розвиток ШІ

Сьогодні 05:03

ПартнерськаІнвестиції в ТЦ — від 1000 грн. S1 REIT відкрила продажі нового фонду

14.05 15:06

361