Оцифровка статистики, або Перша їжа для Bigdata — Finance.ua
0 800 307 555
0 800 307 555

Оцифровка статистики, або Перша їжа для Bigdata

Казна та Політика
544
Хоча збір статистики – це аж ніяк не даремне заняття в сучасному світі, але тільки в тому випадку, якщо вона коректно оброблено і подано.
Тоді сухі цифри конвертуються в живі гроші.
Вперше з моменту оголошення незалежності України чиновники, нарешті, глобально перейнялися, які дані про життєдіяльність держави вони подають його громадянам, бізнесменам і журналістам.
Кабмін доопрацював проект постанови про правила публікації відкритих даних. Про це у Facebook повідомив директор департаменту інформаційних технологій при Мінекономрозвитку Єгор Стефанович.
Зараз відомство погоджує документ з іншим міністерствами, а у вересні розраховує на його затвердження урядом.
Постанова – це наступний крок після прийняття в квітня 2015 закону про доступ до публічної інформації у формі відкритих даних. У лютому його вніс до парламенту президент Петро Порошенко.
Оцифровка статистики, або Перша їжа для Bigdata
Що таке відкриті дані
Впровадження відкритих даних в Україні – це ініціатива ООН. Такими даними можна назвати статистику, реєстри, звіти, цифри, рішення, документи, що стосуються всіх сфер життєдіяльності держави.
Основним контролером процесу оприлюднення відомостей стало, згідно з прийнятим законом, Держагентство з питань електронного уряду. Згідно з проектом постанови Кабміну, щорічно до 15 лютого держоргани повинні будуть відзвітувати перед цим агентством про публікації даних.
У цього нововведення є три глобальні цілі: забезпечення прозорості діяльності держорганів, боротьба з корупцією і створення підмоги для запуску інноваційних сервісів в Україні.
Згідно з проектом постанови, відомства будуть зобов’язані регулярно викладати відкриті дані на своїх сайтах і дублювати їх на єдиний держпортал відкритих даних в чітких форматах.
Всього в проекті вказано 290 масивів даних, які повинні будуть зробити загальнодоступними міністерства. Керівник робочої групи з відкритих даних при Кабміні Денис Гурський повідомив ЕП, що це тільки початок.
“Мій KPI (Key Performance Indicators або по-простому – фронт робіт. – Авт.) – 30 тис наборів даних через рік”, – підкреслює він. Зараз, за його словами, на сайтах міністерств і держорганів практично нічого немає, тому багатьом доведеться викладати дані заново в необхідних форматах.
Основне майбутнє джерело інформації про Україну – єдиний портал відкритих даних – вже створений і працює в тестовому режимі. Їм став створений в 2011 році за підтримки громадської ініціативи Social Boost, “Майкрософт Україна” та фонду “Відродження” сайт data.gov.ua.
Оцифровка статистики, або Перша їжа для Bigdata
Не корисна інформація
Відповідно до прийнятого закону, відкриті дані можна буде вільно копіювати, публікувати, поширювати і доповнювати, в тому числі – в комерційних цілях.
Як підмітив засновник одеського коворкінг-центру “Термінал 42”, екс-директор компанії “Яндекс Україна” Сергій Петренко, важливо, що міністерства тепер зобов’яжуть публікувати дані в машинному форматі.
Він пригадує, що при роботі “Яндекса” з державою по ряду проектів формат видачі інформації був основним головним болем. Особливо багато складнощів виникало з сервісом “Яндекс. Розклади”.
Якщо дані про розклад поїздів можна було взяти в електронному вигляді в доступному джерелі, то з розкладом приміських електричок була біда.
В Україні шість залізниць, і дані в розкладі електричок регулярно змінюються. В результаті, зміни в розкладу доводилося вносити вручну: на факс надходили телеграми, дані з яких оцифровувати. З колегою погоджується представник компанії “A + S в Україні” Дмитро Беспалов.
“У транспортних інженерів є приказка:“Даних багато не буває”. Однак тут ще важливий пункт – правильний формат даних. У нас був досвід: дані начебто є, і вони для нас відкриті, але формат їх такий, що отримати з них потрібну інформацію ніяк не вийде”, – підкреслює він.
За його словами, варто говорити не стільки про відкритість даних, скільки про їх стандартизацію. “Тоді і інфраструктуру можна планувати”, – говорить експерт.
У проекті постанови написано, що дані повинні не тільки відображатися на сайті, але і бути готовими до того, щоб стати частиною нових сторонніх додатків і послуг. “На таких даних можна будувати журналістські розслідування і за пару днів організовувати стартапи”, – говорить Гурський.
Оцифровка статистики, або Перша їжа для Bigdata
Нові сервіси та Bigdata
Заступник директора дослідницької компанії GfK Ukraine Гліб Вишлінський прогнозує, що першими споживачами добре структурованих держданих стануть професійні аналітики.
“Наша компанія зможе завантажити базу ЄДРПОУ та проводити опитування підприємств, телефонуючи на випадково обрані номери, а не виколупувати їх по рядку. На сайті Держстату дані будуть в таблицях з рядами даних, а не у вордівських файлах. Це тільки перші приклади,що приходять в голову” , – розповідає він.
Заступник директора дата-центру “Парковий” Денис Бурдук припускає, що після відкриття даних почнуть з’являтися платні аналітичні сервіси.
На його думку, такі дані також є масивом для BigData-алгоритмів – програм, які швидко аналізують мільйони, здавалося б, незв’язаних даних і видають несподівані взаємозв’язку і прогнози щодо розвитку галузей.
Згідно з прогнозами дослідників європейського проекту за великими відритими даними Bigopendata.eu, до 2020 року відкриті дані принесуть Європі 206 млрд євро. У першу чергу – завдяки прийняттю рішень, підкріплених точними відомостями, а також за рахунок збільшення ефективності бізнес-процесів.
Оцифровка статистики, або Перша їжа для Bigdata
Не все так просто
Публікація відкритих даних – це процес, який таїть в собі безліч підводних каменів. Наприклад, чи зможуть держоргани готувати дані, чи будуть їх регулярно оновлювати, і скільки на це піде державних коштів.
Вишлінський вважає, що нічого складного в цьому немає: зібрати дані в xls зможе навіть чиновник із зарплатою 3 тис грн.
Петренко звертає увагу на ще один важливий нюанс: чи впорається ресурс data.gov.ua з великим навантаженням. Він бажає виконавцям проекту удачі.
Бурдук додає, що портал повинен буде на гідному рівні забезпечити безпеку зберігання і обробки даних, адже від них залежатиме безперервність роботи багатьох додатків.
Беспалов турбується про те, що деякі дані, які будуть надавати відомства, виявляться марними, оскільки будуть неповними.
“Наприклад, нам дали дані про перспективні забудовах в Києві. Пишуть: ххх кв м житла. Розташування: вулиця Дегтярівська. Відмінно! Ця вулиця близько 3 км в довжину, і в неї потрапляє, напевно, 12-15 транспортних районів. Куди ж віднести ці метри? Але дані начебто є. Все в таблицях, все красиво”, – відзначає він.
Те ж, за його словами, може вийти з масивами даних по ДТП, які також потрапили в розряд відкритих. У них може бути вказана дата події на перетині тих чи інших вулиць. Щоб аналізувати ці відомості, потрібні координати точок, час, учасники, попередні причини.
“Я буду радий помилитися і побачити дані у повному вигляді”, – резюмує Беспалов.
Стас Юрасов
За матеріалами:
Економічна Правда
Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Підпишіться на нас