Workshop: Data Science at Readdle

Борис Таровик та Іван Будніков

Борис Таровик, RnD Engineer в Readdle
Іван Будніков Machine Learning Engineer в Readdle

23 червня

з 10:00 до 19:00

Creative Quarter

Площа Спортивна 1А, Gulliver

Facebook

Workshop: Data Science at Readdle – сумісний проект Data Science UA та Readdle, під час якого ми разом з Іваном Будніковим та Борисом Таровиком розглянемо аспекти роботи Data Scientist’а, життєвий цикл ML-проекту, основні ML-алгоритми, приклади нейронних мереж у продуктах Google, Readdle, Prisma та багато іншого!

Учасники воркшопу зможуть побудувати ML-алгоритм для оцінки цін на нерухомість, використовуючи sklearn/numpy та нейронну мережу для задач computer vision за допомогою tensorflow.

Участь у воркшопі безкоштовна за попередньою реєстрацією (ви повинні отримати лист з підтвердженням реєстрації на подію)

Необхідне програмне забезпечення:

  • Python3, numpy, sklearn, tensorflow, skimage

Для кого цей курс:

  • зацікавленим у Data Science, Machine Learning
  • студентам математичних та інженерних факультетів
  • розробникам/QA

Спiкери

Борис Таровик

RnD Engineer, Readdle

Іван Будніков

Machine Learning Engineer, Readdle

Програма курсу

Вступ

  • Інформатика, великі дані, машинне навчання – що це означає?
  • Машинне навчання порівняно із звичайними алгоритмами – у чому різниця?
  • Типи ML – контрольовані, армовані, неконтрольованi

Знання, які вам потрібно мати, щоб стати Data Scientist

  • теорія проти практики
  • корисні курси, статті, теми

Відмінності у роботі Data Scientist та розробника програмного забезпечення

  • що таке data scientist’s debug
  • думати частіше про код, ніж писати його

Наука даних у продуктовій компанії порівняно проти фрiлансу

  • продукт завжди про якість та замовників
  • наука даних – це не лише нейронні мережі

Життєвий цикл розробки ML рішення

  • Видобуток даних. Важливість хороших даних. Джерела даних, розмітка даних
  • Чистка даних. Розширення даних. Навчання/валідація/тестове розбиття
  • Використання ML-алгоритму
  • Показники результатів – помилки навчання, перевірки та тестування
  • Недостатня обробка та перевиконання – що це і як з цим боротися
  • Підсумкова оцінка
  • Оптимізація мережі для релiзу
  • Релiз. Короткий огляд майбутнього вдосконалення алгоритму: централізоване після тренінгу, децентралізоване після тренінгу, комбіноване.

Огляд найпростіших ML алгоритмів

  • K-means
  • PCA
  • LDA
  • Лінійна регресія
  • Нейронні мережі. Що це, звідки воно взялося. Позначення блоку. Деякі подальші вдосконалення
  • Звивисті сітки
  • Періодичні мережі
  • LSTM

Практична частина 1: створення найпростішого рішення для оцінки вартості житла з використанням sklearn/numpy

Робочі приклади рішень нейронних мереж у виробництві

  • Readdle
  • Prisma
  • Google

Практична частина 2: створення нейронної мережі для вирішення проблеми з комп’ютерним зором, використовуючи tensorflow

Іноді справи йдуть не так

  • уроки, які ми вивчили
  • практична рекомендація