Data-інтенсив у Рівному: активістів вчили працювати з відкритими даними

Дата: 01.03.2019

Що таке «відкриті дані» і у чому їх цінність, яка правильна їх структура та як мислити, аби ці дані проаналізувати? На ці питання дали відповідь під час інтенсиву по роботі з відкритими даними «RivneOpenData», який відбувся 28 лютого. Захід організовано в рамках проекту «Залучення громади Рівного до впровадження реформ», що реалізується об’єднанням громадських організацій «Рада реформ Рівного».

Під час RivneOpenData учасники обговорили, чому відкриті дані – це важливо, побачили, що таке набори даних, а також на практиці навчились “чистити” та візуалізувати дані.

«Цінність даних в їх якості. І тоді цю якість можна перетворити у будь що: гроші – для бізнесу, рішення – для влади та сервіси – для громадянина», – розповідає тренер, аналітик даних Громадянської мережі ОПОРА Андрій Савчук.

Спочатку учасники data-інтенсиву працювали з даними Державної служби статистики України та аналізували інформацію про смертність та народжуваність в Україні та Рівненській області, зокрема. Для очистки та структурування даних з сайту Держстату користувалися спеціальною програмою OpenRefine. За словами тренера, це найпростіша річ, яку може використовувати користувач без спеціальної підготовки.

«Найбільшою проблемою даних є те, що вони не уніфіковані», – каже Андрій Савчук. Наприклад, коли «Рівне» пишеться по-різному: «Рівне», «Ровно», «Ривне» і такі дані не можна проаналізувати в якісній статистиці. Тому, за допомогою OpenRefine та спеціальних кластерів можна привести дані до єдиного вигляду.

Потім вчилися працювати з даними у програмі Excel, за допомогою базових функцій для того, щоб зробити певні узагальнення (для прикладу, що більшість українців помирають із системою кровообігу). Також окремо аналізували дані, пов’язані зі злочинністю у Рівненській області

Крім цього, учасники інтенсивну спробували попрацювати з мовою R. Зокрема, завантажили результати зовнішнього незалежного оцінювання за 2018 рік з розрізом по дев’яти основним предметам. А це понад 10 тисяч рядків. Так, спільно побачили успіхи школярів з кожного предмету, успішність  рівненських шкіл та порівняли загальне уявлення активістів з реальними результатами. Крім  цього, ці результати учасники візуалізували за допомогою окремої бібліотеки.

«Сподобалась статистика по даних. От наприклад, я з міста Костополя і у нас зовсім по-іншому подається інформація про рівень шкіл. Однак побачила, що школа, яка вважається накращою – має найгірші показники зно», – говорить учасниця інтенсиву Ірина.

Учасник інтенсиву Віктор, який є представником молодіжної ради Рівного наголошує на важливості роботи з відкритими даними: «Ми живемо у світі, де багато інформації. І нам потрібно вміти її згрупувати і вміти з цією інформацією працювати».

«У нашій спеціальності [обліковець] робота з відкритими даними потрібна. Проте в університеті не навчають, як структурувати цю інформацію. Немає й спеціалістів. Відповідно, ці тренінги необхідні для того, щоб дати такі можливості і використовувати у своїй роботі. Вважаю, що такі курси потрібно інтегровувати у навчальну програму університету. Для економістів, бухгалтерів потрібен курс по роботі з відкритими даними, обробці та аналізі великого масиву інформації», – на завершення додає Віктор.

За коментарями звертайтеся:

Володимир Якшин,

Громадянська мережа ОПОРА

тел.:  098 66 31 923

e-mail: rivne@opora.org.ua

 

Ця діяльність реалізовується коаліцією громадських організацій «Рада реформ Рівного» в рамках Програми сприяння громадській активності «Долучайся!», що фінансується Агентством США з міжнародного розвитку (USAID) та здійснюється Pact в Україні. Зміст цієї публікації є винятковою відповідальністю «Ради реформ Рівного»  i не обов’язково відображає погляди USAID або уряду США.