467
Власник TikTok розкрив подробиці своєї альтернативи GPT
— Технології&Авто
Китайський технологічний гігант ByteDance, що є власником TikTok, планує запустити велику мовну модель (LLM) під назвою LEGO.
У дослідженні ArXiv вчені описали модель, що здатна вловлювати дрібні деталі у тексті, відео, аудіо та зображеннях.
Конструкція LEGO включає різні кодери та адаптери для різних типів інформації, як відео, зображення та аудіо. Кожен тип інформації проходить через свій власний кодер і адаптер.
Дослідники стверджують, що навчена ними модель демонструє точну ідентифікацію та локалізацію конкретних регіонів на зображеннях або моментів у відео.
«Завдяки навчанню на різноманітних мультимодальних і деталізованих наборах даних LEGO досягає кращого сприйняття мультимодальних вхідних даних і демонструє покращену продуктивність у завданнях, які вимагають глибокого розуміння. У майбутній роботі ми прагнемо розширити LEGO, щоб включити додаткові модальності введення та виведення, досліджуючи складніші методи», — йдеться у висновках дослідників.
За матеріалами: НВ
Поділитися новиною
Також за темою
Названо ТОП-5 кросоверів, якими найбільше задоволені власники (фото)
Time назвав найкращі винаходи 2025 року (відео)
Google Chrome автоматично вимикатиме сповіщення від неактивних сайтів
На ринок виходить електрокросовер Hyundai Elexio (фото)
Стартап Reflection AI планує створити відкриту альтернативу OpenAI та китайським ШІ-гігантам
BYD представила бюджетний гібридний седан із запасом ходу 2000 км (фото)