Чи здатний штучний інтелект замінити фрілансерів Сьогодні 07:13 — Технології&Авто

Чи здатний штучний інтелект замінити фрілансерів

Три роки минуло з моменту виходу ChatGPT, але чи готовий він замінити дизайнера, програміста чи аналітика? Дослідження, проведене Scale AI та Центром безпеки ШІ, кидає виклик оптимістичним заявам технологічних гігантів. Науковці протестували ChatGPT, Gemini та Claude на сотнях реальних проєктів із фріланс-платформ, і результати виявилися вражаючими.

Про це пише Washington Post

Деталі дослідження

Дослідники Remote Labor Index відмовилися від штучних прикладів. Вони взяли проєкти, за які реальні люди отримували гроші: 3D-анімацію продуктів, транскрибування музики, створення веб-ігор та форматування наукових праць.

Читайте також Чого найбільше бояться інвестори, які вклалися в штучний інтелект

Результат вразив: найкраща система ШІ впоралася лише з 2,5% проєктів. Для порівняння, майже половина завдань була виконана з низькою якістю, а третина — взагалі залишилася незавершеною.

ШІ часто створював пошкоджені файли або просто ігнорував ключові вимоги замовника. Навіть коли результат виглядав привабливо на перший погляд, детальний аналіз виявляв критичні недоліки.

У проєкті з дизайну інтер’єру ШІ створив правдоподібний план поверху, але він був повністю технічно неправильним та не містив необхідної деталізації.

Читайте також Який штучний інтелект найнадійніший

З аналітикою даних ШІ впорався також не без проблем. При створенні панелі візуалізації даних про щастя ШІ накладав текст на графіки, плутав кольори та «губив» цілі країни.

Розробка ігор також не піддалася штучному інтелекту. Створена гра була придатною до використання, але ШІ повністю проігнорував задану тему (пивоваріння), створивши абстрактний продукт.

Джейсон Хаузенлой, один із авторів дослідження, виділяє два головні обмеження сучасних систем, зокрема відсутність довгострокової пам’яті та проблеми з візуальним розумінням.

ШІ не вміє вчитися на помилках у межах одного проєкту, що триває тижні, і не запам’ятовує фідбек замовника. Чат-боти намагаються створити 3D-моделі через написання коду, а не через роботу з візуальними інтерфейсами, як це робить людина. Як результат — навушники в рекламному ролику змінюють вигляд у кожному кадрі.

Попри низькі показники, позитивна динаміка все ж існує. Нова модель Gemini 3 Pro, протестована у листопаді 2025 року, виконала 1,3% завдань, тоді як її попередня версія ледь дотягувала до 0,8%.

Тенденція до автономії ШІ зберігається. Компанії вже зараз відчувають, що один працівник із доступом до чат-бота може зробити більше, ніж раніше.

Проте повна заміна фахівця поки залишається науковою фантастикою.

Для економії це вигідно: створення гри людиною коштувало дослідникам $1485, тоді як запуск Claude Sonnet обійшовся менше ніж у $30. Але різниця в якості поки що залишається аргументом на користь людської праці.

Главком За матеріалами:

Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.