Урок 14
Тема: Візуалізація рядів і трендів даних. Інфографіка.
Ви дізнаєтеся:
v що таке візуалізація та як зробити її ефективною;
v що таке інфографіка й коли її доцільно використовувати;
v як обрати найкращу техніку візуалізації числових даних;
v як будувати лінію тренду на діаграмі;
v які інструменти використовують для візуалізації;
v які існують розповсюджені помилки візуалізації даних
Що таке візуалізація та як
зробити її ефективною?
Візуалізація - це подання відомостей, даних, фактів у візуальній формі
(мал. 11.1).
Візуалізація даних має кілька переваг:
- акцентування
уваги на різних аспектах даних;
- аналіз
великого набору даних зі складною структурою;
- зменшення
інформаційного перевантаження людини й утримування її уваги;
- однозначність
і ясність виведених даних;
- виділення
взаємозв’язків і відносин, що містяться в інформаційних даних;
- естетична
привабливість.
Успіх візуалізації безпосередньо залежить від
правильності її застосування, а саме - від вибору типу графічного подання
даних, його правильного використання й оформлення.
Вибір можна здійснити за таким алгоритмом (мал. 11.2).
Цілі візуалізації — це реалізація
основної ідеї інформаційних даних, це те, заради чого потрібно показати вибрані
дані, якого ефекту потрібно досягти, - виявлення взаємозв’язку між даними,
показ розподілу даних, композиції або порівняння даних (мал. 11.3).
Взаємозв’язки між даними — це те, як вони
залежать одне від одного. За їх допомогою можна виявити наявність або відсутність залежностей між
змінними. Якщо основна ідея інформаційних даних містить фрази «відноситься до»,
«знижується / підвищується при», то потрібно прагнути показати саме
взаємозв’язки між даними.
Розподіл даних - те, як вони
розташовуються щодо чого-небудь, скільки об’єктів потрапляє в певні послідовні
області числових значень. Основна ідея при цьому міститиме фрази «в діапазоні
від x до y», «концентрація», «частотність», «розподіл».
Композиція даних — об’єднання даних з
метою аналізу загальної картини загалом, порівняння компонентів, складових,
відсоток від деякого цілого. Ключовими фразами для композиції є «становить x
%», «частка», «відсоток від цілого».
Порівняння даних — об’єднання даних з
метою порівняння деяких показників, виявлення того, як об’єкти співвідносяться
один з одним. Також це порівняння компонентів, що змінюються з плином часу.
Ключові фрази для ідеї при порівнянні - «більше / менше ніж», «дорівнює», «змінюється», підвищується / знижується».
Після визначення мети візуалізації потрібно визначити тип даних.
Вони можуть за своїм типом і структурою бути дуже різнорідними (мал. 11.4).
Безперервні числові дані (мал. 11.5, а)
містять інформацію залежності однієї числової величини від іншої, наприклад,
графіки функцій, як-от y = 2x.
Безперервні тимчасові (мал. 11.5, б)
описують дані про події, що відбуваються на будь-якому проміжку часу, як-от
графік температури, вимірюваної кожного дня.
Дискретні дані (мал. 11.5, в) можуть містити
залежності категорійних величин, наприклад, графік кількості продажів товарів у
різних магазинах.
Географічні дані (мал. 11.5, г)
містять різну інформацію, пов’язану з місцем розташування, геологією та іншими
географічними показниками, яскравий приклад - це звичайна географічна карта.
Логічні дані (мал. 11.5, д) показують
логічне розташування компонентів відносно один одного, наприклад, генеалогічне
дерево сім’ї.
а) б) в)
г) д)
Що таке інфографіка й коли її доцільно використовувати?
Інформаційна графіка, або інфографіка, (англ. Information graphics; infographics) -
це графічне візуальне подання інформаційних даних або знань, призначених для
швидкого й чіткого відображення комплексних даних.
Інфографіка — це графічне подання складної інформації.
Вона необхідна, коли складні дані потрібно доступно викласти широкій аудиторії.
Для створення інфографіки дотримуються таких кроків (мал. 11.6).
Існують вісім основних типів інфографіки (табл. 11.1).
Самостійне завдання.
Вправа 1. Секрети успіху інфографіки
Завдання. Розгляньте
інфографіку Чому ваш мозок жадає інфографіки за
посиланням https://neomam.com/interactive/13reasons/
. Виділіть серед наведених причин популярності інфорграфіки такі п’ять
причин, які ви можете віднести до власних переваг.
1. У браузері відкрийте посилання https://neomam.com/interactive/13reasons/.
2. За потреби увімкніть автоматичний переклад
веб-сторінок у браузері.
3. Розгляньте блоки інфографіки за допомогою
смуги прокрутки вікна.
4. Виділіть серед наведених причин популярності
інфорграфіки п’ять причин, які є найважливішими для вас. Створіть список
причин, додайте до нього статистичні дані, подані на сайті, що вказують на їх
підґрунтя.
5. Розмістіть список на спільному ресурсі у
класі.
Зразок виконання вправи 1. Секрети успіху інфографіки
(Перегляньте уважно відео за
посиланням https://www.youtube.com/watch?v=0AgeQ6wKvjg
або QR кодом
Як обрати найкращу техніку візуалізації числових даних?
При виборі типу графіка для візуалізації потрібно
розуміти тип даних та мету, якої потрібно досягти. Це можуть бути такі цілі:
порівняти
значення: стовпчаста діаграма, лінійний графік, графік розсіювання;
зрозуміти
композицію (виділити складові): стовпчаста
діаграма, кругова діаграма;
оцінити
розподіл даних: лінійний графік,
графік розсіювання, стовпчаста діаграма, гістограма;
зрозуміти
тенденцію: лінійний графік, стовпчаста діаграма;
зрозуміти
відношення між даними: лінійний
графік, графік розсіювання (табл. 11.3, складена на основі діаграм Джина
Желязни).
Таблиця 11.3
Самостійне завдання.
Вправа 2. Побудова діаграми.
Зразок виконання вправи 2. Побудова діаграми
(Перегляньте уважно відео за
посиланням https://www.youtube.com/watch?v=h5BM8_3lRnw
або QR кодом
Як будувати лінію тренду на діаграмі?
Для відображення змін даних або передбачення чи тенденції
цих змін можна побудувати спеціальний графік, який називають лінією тренду.
Лінії тренду можна додати до ряду даних у плоских
діаграмах з областями без
накопичення, графіках, гістограмах, стовпчастих,
біржових, точкових і бульбашкових діаграмах.
Вибір функції для побудови лінії тренду зазвичай
визначається характером зміни даних у часі. Такі зміни можна описати однією з
відомих математичних функцій.
Для побудови лінії тренду для деяких даних потрібно
побудувати діаграму, до якої додати лінію, що згладжує наявні дані. У табличному
процесорі Microsoft Excel для цього можна скористатись інструментом Лінія
тренду вкладки Макет, яка з’являється, коли виділити область побудованої діаграми. У
списку вказівок можна обрати потрібну функцію наближення, а також вказати Додаткові
параметри лінії тренду. Серед таких параметрів варто обрати такі:
«показувати
рівняння на діаграмі», яке є математичною моделлю для знаходження
прогнозованого значення;
«помістити
на діаграму величину достовірності…», за значення вказаного показника можна
оцінити ступінь точності наближення - значення, близьке до 1,- висока ступінь
довіри, а до 0 - мінімальна.
Самостійне завдання.
Вправа 3. Попит на IT-спеціалістів
Зразок виконання вправи 3. Попит на IT-спеціалістів
або QR кодом
Які інструменти використовують для візуалізації?
Прості засоби візуалізації включено до сучасних табличних процесорів. Вони
не охоплюють усього різноманіття технік, але для простих задач й оперативного
подання даних цілком підходять.
Але для побудови якісних візуалізацій краще використовувати спеціалізовані
інструменти, тим більше, що серед них є вільні й досить прості у використанні.
Розглянемо деякі з них (табл. 11.4)
Самостійне завдання.
Вправа 4. Інфографіка в
сервісі Piktochart.
Зразок виконання вправи 4. Інфографіка
в сервісі Piktochart.
(Перегляньте уважно відео за
посиланням https://www.youtube.com/watch?v=pjI2YFgv9PY
або QR кодом
Які існують розповсюджені помилки візуалізації даних?
Розповсюджені такі помилки візуалізації даних і швидкі способи їх виправлення
(табл. 11.5).
Крім того, потрібно:
використовувати
один колір для кожної окремої категорії даних;
упорядковувати
набори даних відповідно до логічної ієрархії;
використовувати
виділення або підсвічування важливої інформації;
використовувати
значки для позначень та вилучати підписи, які не є необхідними;
не
використовувати комбінацій із занадто контрастних кольорів, таких як
червоний/зелений або синій/жовтий;
не
додавати додаткові зображення, пояснення, тіні, орнаменти, які не є
необхідними, оскільки вони відволікають увагу;
не
використовувати більш ніж 6 кольорів в одному наборі;
не
використовувати нестандартні шрифти та їх видозміни (напівжирний текст, курсив,
підкреслювання).