546
OpenAI выпустила gpt-oss — свои первые за 6 лет открытые ИИ-модели
— Технологии&Авто

OpenAI представила две новые большие языковые модели (LLM) — более мощную gpt-oss-120b и более легкую gpt-oss-20b, которые можно свободно использовать и модифицировать. Это первый подобный релиз за последние шесть лет после выхода модели GPT-2 в 2019 году, отмечает TechCrunch.
Ключевые характеристики и возможности:
- gpt-oss-120b содержит 120 миллиардов параметров, для ее работы требуется графический процессор (GPU) с 80 ГБ видеопамяти;
- gpt-oss-20b имеет 20 миллиардов параметров и может работать на устройствах GPU, имеющих 16 ГБ видеопамяти.
Согласно синтетическим тестам, производительность gpt-oss-120b сравнима с моделью o4-mini, а gpt-oss-20b — с o3-mini. При этом обе модели уступают флагманскому o3-pro.
Обе модели поддерживают цепочку рассуждений (CoT), что позволяет им решать сложные задачи, разбивая их на более мелкие шаги. Разработчикам доступна полная цепочка размышлений для налаживания и понимания логики работы.
В компании объяснили, что открытые модели смогут отправлять сложные запросы более мощным облачным моделям. Это позволит разработчикам подключать открытую модель к закрытой, если первая не может выполнить определенную задачу, например обработать изображение.
Хотя на ранних этапах своего существования OpenAI занималась разработкой открытых моделей, впоследствии компания избрала закрытый подход. Эта стратегия позволила ей построить крупный бизнес, продавая доступ к своим моделям через API.
Сотрудничество с AWS
Параллельно с анонсом OpenAI, Amazon объявила, что новые модели будут доступны на ее облачной платформе Amazon Web Services (AWS). Впервые модели OpenAI появятся на AWS. Это важный конкурентный шаг, поскольку к этому моменту AWS в основном сотрудничала с главным конкурентом OpenAI, компанией Anthropic. Этот шаг позволит AWS укрепить свои позиции на рынке ИИ, где Microsoft, ключевой партнер OpenAI, занимает лидирующие позиции.
OpenAI готовится к своему следующему большому релизу — модели GPT-5. Ожидается, что она будет представлена как комплексная система искусственного интеллекта, которая объединяет разные модели и способна выполнять различные функции, а не только одну задачу.
По материалам: Ain.Ua
Поделиться новостью