Вчені Берклі створили допитливий ШІ
Фахівці Каліфорнійського університету в Берклі розробили для ШІ «модель природженої допитливості», яка справляється з завданням в тих випадках, коли навчання з підкріпленням не дає бажаних результатів.
Штучний інтелект, оснащений якоюсь цифровою формою допитливості, здатний поліпшити найпотужніші сучасні алгоритми машинного навчання та пристосувати їх до вирішення нагальних проблем. ШІ, створений командою каліфорнійських вчених, на прикладі відеоігри навчається максимально повно розбиратися у віртуальній реальності.
Один з основних методів машинного навчання — навчання з підкріпленням — використовує принцип позитивного закріплення для формування стереотипів поведінки алгоритму. Цей метод, наприклад, застосовувався при створенні знаменитої AlphaGo — програми, яка перемогла людину в чемпіонаті з гри в го. Однак, у навчання з підкріпленням є і обмеження. Часто машині потрібно дуже багато часу на те, щоб чогось навчитися, і процес ускладнюється, якщо потрібний відгук неможливо дати негайно. Наприклад, в комп’ютерних іграх, в яких винагорода за дію настає не відразу або виражена в неочевидній формі. Тут і може допомогти цікавість.
В експерименті, проведеному на основі двох класичних ігор, Mario Bros. і VizDoom, штучна допитливість прискорила процес навчання. Навіть без нагороди ШІ навчився переміщатися тривимірними лабіринтами і уникати небезпек, оскільки ці вміння дозволяють задовольнити цікавість у дослідженні світу гри, повідомляє MIT Technology Review.
«У реальному світі винагорода буває далеко не завжди, — каже Пулкіт Агравал, один з авторів дослідження. — Діти постійно пробують щось нове, і це теж різновид цікавості. Так вони вчаться нових навичок».
За матеріалами: hightech.fm
Поділитися новиною