ШІ допомагає агентству Reuters збирати новини — Finance.ua
0 800 307 555
0 800 307 555

ШІ допомагає агентству Reuters збирати новини

Технології&Авто
150
Reuters спільно з Alibaba використовує ШІ під назвою Tracer для відбору новин через Twitter і перевірки їх справжності. В майбутньому подібні програми можуть допомогти журналістам впоратися із зростаючим інформаційним потоком, пише MIT Technology Review.
Новинні агентства, щоб вижити в епоху інтернету, намагаються впроваджувати останні технології написання заміток і пошуку інформації за допомогою штучного інтелекту. Так, служба новин Associated Press використовує програму, яка повідомляє про події, вставляючи заголовки в заздалегідь підготовлені шаблони, на кшталт: «Компанія X про прибуток у розмірі Y в Z кварталі».
Однак Reuters пішло далі. Нещодавно агентство впровадило ШІ під назвою Tracer, який повинен повністю автоматизувати підбір новин і заодно перевіряти їх на справжність. Це не означає, що журналісти перестануть бути потрібними — радше, програма допоможе їм «переварити» зростаючий з кожним днем інформаційний потік.
Над Tracer працюють програмісти з відділу Reuters Research and Development спільно з Alibaba. Щодня ШІ аналізує близько 12 млн твітів, що становить приблизно 2% від загальної кількості постів. Половина з них відбирається абсолютно випадково, інші беруться зі списку облікових записів Twitter, відібраних журналістами Reuters. До них відносяться інші новинні організації, великі компанії, впливові люди в індустріях, знаменитості і так далі.
На наступному етапі Tracer повинен визначити, коли сталася подія. З точки зору алгоритму, — це час, коли про подію починають говорити кілька людей відразу. Тому для цього використовуються кластерні алгоритми машинного навчання. Безумовно, крім реальних новин в ці кластери потрапляє всякий спам, реклама і звичайний чат. Тому Tracer повинен зробити додатковий відсів.
Для цього він повинен визначити тему розмови, після чого порівнює її з базою даних тем, зібраних журналістами з «офіційних» акаунтів, таких як CNN, BBCBreaking, nytimes, BreakingNews. На цьому етапі алгоритм також визначає місце події, використовуючи базу даних міст і ключові слова.
Як тільки розмова або чутка потенційно ідентифікується програмою як новина, важливо з’ясувати, чи є вона справжньою. Для цього Tracer шукає джерело, перевіряючи посилання з самого раннього твіту в розмові. Потім «пробиває» їх за базою даних «фейкових ЗМІ» на кшталт National Report або The Onion.
Нарешті, система пише заголовок з коротким описом і поширює новину по всій міжнародній редакції Reuters.
За словами розробників, Tracer виявився досить точним. З 12 млн твітів, які він аналізує, приблизно 80% — це «шум». Решта поділяються на 6 тисяч кластерів, які класифікуються як окремі типи новинних подій. Всі обчислення проводяться на 13 серверах, що використовують 10 різних алгоритмів.
За матеріалами:
hightech.fm
Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Підпишіться на нас