ШІ допомагає агентству Reuters збирати новини


ШІ допомагає агентству Reuters збирати новини

Reuters спільно з Alibaba використовує ШІ під назвою Tracer для відбору новин через Twitter і перевірки їх справжності. В майбутньому подібні програми можуть допомогти журналістам впоратися із зростаючим інформаційним потоком, пише MIT Technology Review.

Новинні агентства, щоб вижити в епоху інтернету, намагаються впроваджувати останні технології написання заміток і пошуку інформації за допомогою штучного інтелекту. Так, служба новин Associated Press використовує програму, яка повідомляє про події, вставляючи заголовки в заздалегідь підготовлені шаблони, на кшталт: «Компанія X про прибуток у розмірі Y в Z кварталі».

Однак Reuters пішло далі. Нещодавно агентство впровадило ШІ під назвою Tracer, який повинен повністю автоматизувати підбір новин і заодно перевіряти їх на справжність. Це не означає, що журналісти перестануть бути потрібними — радше, програма допоможе їм «переварити» зростаючий з кожним днем інформаційний потік.

Над Tracer працюють програмісти з відділу Reuters Research and Development спільно з Alibaba. Щодня ШІ аналізує близько 12 млн твітів, що становить приблизно 2% від загальної кількості постів. Половина з них відбирається абсолютно випадково, інші беруться зі списку облікових записів Twitter, відібраних журналістами Reuters. До них відносяться інші новинні організації, великі компанії, впливові люди в індустріях, знаменитості і так далі.

На наступному етапі Tracer повинен визначити, коли сталася подія. З точки зору алгоритму, — це час, коли про подію починають говорити кілька людей відразу. Тому для цього використовуються кластерні алгоритми машинного навчання. Безумовно, крім реальних новин в ці кластери потрапляє всякий спам, реклама і звичайний чат. Тому Tracer повинен зробити додатковий відсів.

Для цього він повинен визначити тему розмови, після чого порівнює її з базою даних тем, зібраних журналістами з «офіційних» акаунтів, таких як CNN, BBCBreaking, nytimes, BreakingNews. На цьому етапі алгоритм також визначає місце події, використовуючи базу даних міст і ключові слова.

Як тільки розмова або чутка потенційно ідентифікується програмою як новина, важливо з’ясувати, чи є вона справжньою. Для цього Tracer шукає джерело, перевіряючи посилання з самого раннього твіту в розмові. Потім «пробиває» їх за базою даних «фейкових ЗМІ» на кшталт National Report або The Onion.

Нарешті, система пише заголовок з коротким описом і поширює новину по всій міжнародній редакції Reuters.

За словами розробників, Tracer виявився досить точним. З 12 млн твітів, які він аналізує, приблизно 80% — це «шум». Решта поділяються на 6 тисяч кластерів, які класифікуються як окремі типи новинних подій. Всі обчислення проводяться на 13 серверах, що використовують 10 різних алгоритмів.

  • i

    Якшо Ви помітили помилку, виділіть необхідну частину тексту й натисніть Ctrl+Enter, щоб повідомити про це нам.

Дивись також
Топ новини
Обговорюють

Читають

В Контексті Finance.ua
Опитування