Власник TikTok розкрив подробиці своєї альтернативи GPT

25.01.2024, 23:07 — Технології&Авто

487

Китайський технологічний гігант ByteDance, що є власником TikTok, планує запустити велику мовну модель (LLM) під назвою LEGO.

У дослідженні ArXiv вчені описали модель, що здатна вловлювати дрібні деталі у тексті, відео, аудіо та зображеннях.

Конструкція LEGO включає різні кодери та адаптери для різних типів інформації, як відео, зображення та аудіо. Кожен тип інформації проходить через свій власний кодер і адаптер.

Читайте також

OpenAI офіційно запустила маркетплейс чат-ботів GPT Store

Дослідники стверджують, що навчена ними модель демонструє точну ідентифікацію та локалізацію конкретних регіонів на зображеннях або моментів у відео.

«Завдяки навчанню на різноманітних мультимодальних і деталізованих наборах даних LEGO досягає кращого сприйняття мультимодальних вхідних даних і демонструє покращену продуктивність у завданнях, які вимагають глибокого розуміння. У майбутній роботі ми прагнемо розширити LEGO, щоб включити додаткові модальності введення та виведення, досліджуючи складніші методи», — йдеться у висновках дослідників.

За матеріалами:

НВ

Місце для вашої реклами

Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Також за темою

Покарання за неправильне паркування на місцях для осіб з інвалідністю хочуть посилити

Сьогодні 12:12

ПартнерськаБанківська реклама, яку подивляться всі: що зробили ПУМБ і Banda

26.03 12:15

27431

Volkswagen представив найдоступніший електрокросовер (фото, відео)