Data Science Visualization Course

Дмитро Гузенко
3 — 4 листопада

З 10:00 до 18:00

Software & Computer Museum

вул. Саксаганського 40/85

Facebook

Аналітики даних, топ менеджери, керівники та Data Scientists — ці категорії фахівців як ніхто інший розуміють цінність візуалізації даних.

3 та 4 листопада Data Analyst Дмитро Гузенко проведе дводенний курс Data Science Visualization.
Дмитро має більше 20-років досвіду роботи в галузі автоматизації бізнес-процесів та впровадження систем ERP, 10-річний досвід роботи в системному аналізі та архітектурі бізнес-моделей, 3-річна експертиза управління даними для підвищення ефективності роботи компанії.
Має досвід роботи в галузі архітектури рішень, найкращих практик аналізу бізнес-аналізу для підвищення цінності для інвесторів.

Зміст курсу:

  • Введення в візуалізацію даних
  • Кращі практики та методи візуалізації
  • Порівняння безкоштовних платформ для візуалізації даних
  • Воркшоп в групах: моделювання візуалізації на підставі вимог бізнесу
  • Практична робота: розробка та публікація візуалізацій, виконаних з використанням MS Power BI Desktop, QlikView Personal Edition, Tableau Desktop Public Edition
  • Практична робота: розробка візуалізації з R, бібліотеки ggplot, ggplot2, RGL, Plotly
  • Практична робота: розробка візуалізації з Python, бібліотеки matplotlib, plotly, bokeh
На курсі ви знайдете відповіді на запитання:
  • Практики і підходи для якісної візуалізації. Яких помилок слід уникати? Як зробити так, щоб дані говорили самі за себе і показували необхідні бізнесу інсайти?
  • Що означає термін Self BI?
  • Як зробити візуалізацію швидко, без програмування і надати доступ іншим до створеної візуалізації, в рамках організації або навіть за її межами?
  • Як зробити це такими інструментами, за використання яких компанії б не довелося платити гроші, або вартість була б дуже доступною?

Курс розроблений таким чином, щоб дати практичні навички роботи всім учасниками і навчити працювати з трьома системами: Microsoft Power BI, QlikView і Tableau.
Це визнані лідери в області візуалізації. Вміння користуватися ними є необхідною навичкою для сучасного фахівця.

Курс побудований на вивченні офіційно безкоштовних продуктів, доступних кожному:

  • MS Power BI Desktop
  • QlikView Personal Edition
  • Tableau Desktop Public Edition

Також для проектів Data Science і машинного навчання необхідний більш глибокий аналіз даних, який реалізується за допомогою R та Python. Частина курсу присвячена вивченню деяких базових можливостей для візуалізації з використанням популярних бібліотек R та Python.

Для кого розроблено курс:

  • Для керівників і топ менеджерів, які хочуть розуміти свої дані і розробляти дешборди і звіти самостійно;
  • Професіоналів ІТ, бізнес аналітиків і аналітиків даних, які прагнуть зрозуміти можливості, переваги і обмеження 3-х найпопулярніших систем для візуалізації: Power BI, QlikView, Tableau;
  • Data Scientists, розробників, які хочуть прискорити і спростити процес взаємодії з замовниками, швидше реагувати на зміну бізнес вимог, витрачати менше часу на отримання цінного продукту і отримувати більше інсайтів з мінімальними затратами.
Вимоги до учасників:
  • Базові знання про структури даних;
  • Базове знання англійської мови;
  • Уміння та досвід роботи з Excel;
  • Наявність ноутбука;
  • Виконання першої лабораторної роботи по установці ПО відповідно до наданої інструкції.

Програма курсу

3 листопада

Блок 1. Введення в візуалізацію даних

  • Історія візуалізації, приклади історично значущих робіт з візуалізації
  • Загальні архітектури систем обробки, аналізу та візуалізації даних
  • Прогнозування і візуалізація в проектах Data Science
  • Загальні вимоги до систем розробки візуалізацій
  • Порівняння кращих систем для візуалізацій
  • Типові помилки
  • Кращі практики та керівництва для розробки якісних візуалізацій

Блок 2. Планування і виконання проектів з візуалізації даних

  • Підходи до організації проектів візуалізації
  • Практика: робота в групах, розробка прототипу візуалізації згідно бізнес вимог

Блок 3. Робота з Microsoft Power BI для візуалізації даних

  • Про продукти Power BI
  • Встановлення, налаштування системи
  • Імпорт даних з різних джерел
  • Попередня обробка даних
  • Об’єднання даних і розробка моделі
  • Практика: Імпорт і попередня обробка даних

Блок 4.

  • Використання додаткових функцій у роботі з даними
  • Розробка звіту з використанням стандартних елементів
  • Розробка звітів з використанням розширених візуальних можливостей
  • Публікація звітів для співробітників організації
  • Публікація звітів в інтернеті для загального доступу
  • Практика: публікація звітів
4 листопада

Блок 5. Робота з системою QlikView Personal Edition для візуалізації даних

  • Про продукти QlikView
  • Встановлення, налаштування системи
  • Імпорт даних з різних джерел
  • Попередня обробка даних
  • Об’єднання даних і розробка моделі
  • Практика: Імпорт і попередня обробка даних
  • Використання додаткових функцій по роботі з даними
  • Розробка звітів
  • Публікація звітів в інтернеті для загального доступу
  • Практика: Розробка і публікація звітів

Блок 6. Робота з системою Tableau Desktop Public Edition для візуалізації даних

  • Про продукти Tableau
  • Встановлення, налаштування системи
  • Імпорт даних з різних джерел
  • Попередня обробка даних
  • Об’єднання даних і розробка моделі
  • Практика: Імпорт і попередня обробка даних
  • Використання додаткових функцій у роботі з даними
  • Розробка звітів
  • Публікація звітів
  • Практика: Розробка і публікація звітів

Блок 7. Використання мови R для візуального аналізу даних

  • Налаштування Power BI для використання R
  • Можливості дослідження за допомогою R
  • Важливі функції для аналізу даних з бібліотек ggplot, ggplot2, RGL, plotly
  • Практика: побудова звітів Power BI з використанням функцій мови R

Блок 8. Використання мови Python для візуального аналізу даних

  • Налаштування Power BI для використання Python
  • Можливості дослідження за допомогою Python
  • Важливі функції для аналізу даних з бібліотек matplotlib, plotly, bokeh
  • Практика: побудова звітів Power BI з використанням функцій мови Python
  • Висновок і подальші кроки